Áú»¢¶Ä²©

Esta es una traducci¨®n de la p¨¢gina de documentaci¨®n original en espa?ol. Ay¨²danos a mejorarla.

5 Escalado

Descripci¨®n general

Con los escalados puedes crear escenarios personalizados para enviar notificaciones o ejecutar comandos remotos.

En t¨¦rminos pr¨¢cticos significa que:

  • Los usuarios pueden ser informados sobre nuevos problemas inmediatamente.
  • Las notificaciones se pueden repetir hasta que se resuelva el problema.
  • El env¨ªo de una notificaci¨®n puede retrasarse.
  • Las notificaciones se pueden escalar a otro grupo de usuarios "superior".
  • Los comandos remotos se pueden ejecutar inmediatamente o cuando no haya ning¨²n problema. resuelto durante un largo per¨ªodo.

Las acciones se escalan seg¨²n el paso de escalamiento. Cada paso tiene una duraci¨®n en el tiempo.

Puede definir tanto la duraci¨®n predeterminada como una duraci¨®n personalizada de un paso individual. La duraci¨®n m¨ªnima de un paso de escalado es 60 segundos.

Puede iniciar acciones, como enviar notificaciones o ejecutar comandos, desde cualquier paso. El primer paso es para acciones inmediatas. Si quiere retrasar una acci¨®n, puede asignarla a un paso posterior. Para cada paso, se pueden definir varias acciones.

El n¨²mero de pasos de escalado no est¨¢ limitado.

Los escalados se definen cuando se configura una operaci¨®n. Los escalados solo se admiten para operaciones problem¨¢ticas, no para la recuperaci¨®n.

Aspectos diversos del comportamiento de escalada

Consideremos lo que sucede en diferentes circunstancias si una acci¨®n contiene varios pasos de escalada.

³§¾±³Ù³Ü²¹³¦¾±¨®²Ô Comportamiento
El host en cuesti¨®n entra en mantenimiento despu¨¦s de que se env¨ªa la notificaci¨®n de problema inicial Dependiendo de la ³¦´Ç²Ô´Ú¾±²µ³Ü°ù²¹³¦¾±¨®²Ô Pausar operaciones para problemas suprimidos en acci¨®n ³¦´Ç²Ô´Ú¾±²µ³Ü°ù²¹³¦¾±¨®²Ô, todos los pasos de escalada restantes se ejecutan con un retraso causado por el per¨ªodo de mantenimiento o sin retraso. Un periodo de mantenimiento no cancela operaciones.
El per¨ªodo de tiempo definido en la condici¨®n de acci¨®n Per¨ªodo de tiempo finaliza despu¨¦s de que se env¨ªa la notificaci¨®n inicial Se ejecutan todos los pasos de escalamiento restantes. La condici¨®n Per¨ªodo de tiempo no puede detener las operaciones; tiene efecto respecto a cu¨¢ndo se inician/no inician acciones, no operaciones.
Un problema comienza durante el mantenimiento y contin¨²a (no se resuelve) despu¨¦s de que finaliza el mantenimiento Dependiendo de la ³¦´Ç²Ô´Ú¾±²µ³Ü°ù²¹³¦¾±¨®²Ô Pausar operaciones para problemas suprimidos en acci¨®n ³¦´Ç²Ô´Ú¾±²µ³Ü°ù²¹³¦¾±¨®²Ô, todos los pasos de escalamiento se ejecutan desde el momento en que finaliza el mantenimiento o inmediatamente.
Un problema comienza durante un mantenimiento sin datos y contin¨²a (no se resuelve) despu¨¦s de que finaliza el mantenimiento Debe esperar a que se dispare el disparador, antes de que se ejecuten todos los pasos de escalamiento.
Las diferentes escaladas siguen en estrecha sucesi¨®n y se superponen La ejecuci¨®n de cada nueva escalada reemplaza la escalada anterior, pero por lo menos para un paso de escalada que siempre se ejecuta en la escalada anterior. Este comportamiento es relevante en acciones sobre eventos que se crean con CADA evaluaci¨®n de problema del disparador.
Durante una escalada en curso (como el env¨ªo de un mensaje), en funci¨®n de cualquier tipo de evento:
- la acci¨®n est¨¢ deshabilitada
Basado en el evento desencadenante:
- el desencadenante est¨¢ deshabilitado
- el host o elemento est¨¢ deshabilitado
Basado en un evento interno acerca de los disparadores:
- el disparador est¨¢ deshabilitado
Basado en un evento interno sobre los elementos/reglas de descubrimiento de bajo nivel:
- el elemento est¨¢ deshabilitado<br >- el host est¨¢ deshabilitado
Se env¨ªa el mensaje en curso y luego se env¨ªa un mensaje m¨¢s sobre la escalada. El mensaje de seguimiento tendr¨¢ el texto de cancelaci¨®n al principio del cuerpo del mensaje (NOTA: Escalamiento cancelado) nombrando el motivo (por ejemplo, NOTA: Escalado cancelado: acci¨®n '<Nombre de la acci¨®n>' deshabilitada). De esta forma se informa al destinatario que se cancela el escalamiento y no se ejecutar¨¢n m¨¢s pasos. Este mensaje se env¨ªa a todos los que recibieron las notificaciones antes. El motivo de la cancelaci¨®n tambi¨¦n se registra en el archivo de registro del servidor (a partir de Nivel de depuraci¨®n 3=Advertencia).

Tenga en cuenta que el mensaje Escalaci¨®n cancelada tambi¨¦n se env¨ªa si las operaciones han finalizado, pero las operaciones de recuperaci¨®n est¨¢n configuradas y a¨²n no se ejecutan.
Durante una escalada en curso (como el env¨ªo de un mensaje), la acci¨®n se elimina No se env¨ªan m¨¢s mensajes. La informaci¨®n se registra en el archivo de registro del servidor (a partir de Nivel de depuraci¨®n 3=Advertencia), por ejemplo: escalaci¨®n cancelada: ID de acci¨®n: 334 eliminado

Ejemplos de escalamiento

Ejemplo 1

Env¨ªo de una notificaci¨®n repetida una vez cada 30 minutos (5 veces en total) a un grupo de "Administradores de MySQL". Para configurar:

  • En la pesta?a Operaciones, establezca la Duraci¨®n del paso de operaci¨®n predeterminada en "30 m" (30 minutos).
  • Establezca los Pasos de escalado para que sea del "1" al "5".
  • Seleccione el grupo "Administradores de MySQL" como destinatarios del mensaje.

Las notificaciones se enviar¨¢n a las 0:00, 0:30, 1:00, 1:30, 2:00 horas despu¨¦s de que el problema comienza (a menos, por supuesto, que el problema se resuelva antes).

Si el problema se resuelve y se configura un mensaje de recuperaci¨®n, se enviar¨¢ a aquellos que recibieron al menos un mensaje de problema dentro de este escenario de escalada.

Si el iniciador que gener¨® un escalado activo es desactivado, Áú»¢¶Ä²© env¨ªa un mensaje informativo al respecto a todos aquellos que ya han recibido notificaciones.

Ejemplo 2

Env¨ªo de una notificaci¨®n retrasada sobre un problema de larga duraci¨®n. A configurar:

  • En la pesta?a Operaciones, establezca la Duraci¨®n del paso de operaci¨®n predeterminada en "10h" (10 horas).
  • Establezca los Pasos de escalado para que sea de "2" a "2".

Solo se enviar¨¢ una notificaci¨®n en el Paso 2 del escenario de escalado, o 10 horas despu¨¦s de que comience el problema.

Puede personalizar el texto del mensaje con algo como "El problema tiene m¨¢s de 10 horas".

Ejemplo 3

Escalando el problema al Jefe.

En el primer ejemplo anterior configuramos el env¨ªo peri¨®dico de mensajes a los administradores de MySQL. En este caso, los administradores obtendr¨¢n cuatro mensajes antes de que el problema se escale al administrador de la base de datos. Tenga en cuenta que el administrador recibir¨¢ un mensaje s¨®lo en caso de que el problema no se. haya reconocido, supuestamente nadie est¨¢ trabajando en ello.

Detalles de la Operaci¨®n 2:

Tenga en cuenta el uso de la macro {ESC.HISTORY} en el mensaje personalizado. La macro contendr¨¢ informaci¨®n sobre todos los pasos ejecutados previamente en esta escalada, como notificaciones enviadas y comandos ejecutados.

Ejemplo 4

Un escenario m¨¢s complejo. Despu¨¦s de m¨²ltiples mensajes a los administradores de MySQL y escalamiento al administrador, Áú»¢¶Ä²© intentar¨¢ reiniciar MySQL base de datos. Suceder¨¢ si el problema existe durante 2:30 horas y se no ha sido reconocido.

Si el problema persiste, despu¨¦s de otros 30 minutos, Áú»¢¶Ä²© enviar¨¢ un mensaje a todos los usuarios invitados.

Si esto no ayuda, despu¨¦s de otra hora, Áú»¢¶Ä²© reiniciar¨¢ el servidor con la base de datos MySQL (segundo comando remoto) usando comandos IPMI.

Ejemplo 5

Una escalada con varias operaciones asignadas a un paso y usando intervalos personalizados. La duraci¨®n predeterminada del paso de operaci¨®n es de 30 minutos.

Las notificaciones se enviar¨¢n de la siguiente manera:

  • A los administradores de MySQL a las 0:00, 0:30, 1:00, 1:30 despu¨¦s de que comience el problema.
  • Al administrador de la base de datos a las 2:00 y 2:10. (y no a las 3:00; viendo que los pasos 5 y 6 se superponen con la siguiente operaci¨®n, la duraci¨®n del paso personalizado m¨¢s corto de 10 minutos en la siguiente operaci¨®n anula la duraci¨®n del paso m¨¢s largo de 1 hora que se intent¨® configurar aqu¨ª).
  • A los administradores de Áú»¢¶Ä²© a las 2:00, 2:10, 2:20 despu¨¦s de que comience el problema (la duraci¨®n del paso personalizado es de 10 minutos en funcionamiento).
  • A los usuarios invitados a las 4:00 horas despu¨¦s del inicio del problema (la duraci¨®n del paso predeterminada es de 30 minutos y regresa entre los pasos 8 y 11).