韓誥傭痔

Table of Contents

3 Escalonamento
- Vis?o geral
  - Aspectos diversos sobre escalonamento
- Exemplos de escalonamento
  - Exemplo 1
  - Exemplo 2
  - Exemplo 3
  - Exemplo 4
  - Exemplo 5

3 Escalonamento

Vis?o geral

Com o recurso de escalonamento voc那 pode criar cen芍rios personalizados de quando enviar uma mensagem ou executar um comando remoto.

Situa??es comuns de utiliza??o:

Usu芍rios precisam ser informados sobre novos incidentes imediatamente
Notifica??es precisam ser reenviadas enquanto o incidente n?o for resolvido
O envio de uma notifica??o precisa ser atrasado
As notifica??es precisam ser escalonadas para um grupo mais especializado
Comandos remotos podem ser executados imediatamente, entretanto, s車谷 desejada a execu??o autom芍tica se o incidente n?o for resolvido em determinado tempo
Mensagens de recupera??o precisam ser enviadas

A??es s?o escaladas usando os passos de escalonamento. Cada passo pode ter sua pr車pria dura??o.

Voc那 pode definir tanto a dura??o padr?o quanto a dura??o de um passo em espec赤fico, o tempo m赤nimo em ambos os casos 谷 de 60 segundos.

A a??o pode come?ar com uma opera??o simples de envio de notifica??o ou execu??o de comando remoto. O primeiro passo 谷 para a??es imediatas, se voc那 precisa atrasar a opera??o, atribua a ela um n迆mero de passo superior ao 1. Para cada passo diferentes opera??es podem ser definidas.

N?o existe limite de passos de escalonamento.

O escalonamento 谷 definido durante a configura??o das opera??es.

Aspectos diversos sobre escalonamento

Vamos considerar que uma mesma a??o contenha diversos passos de escalonamento para diferentes situa??es.

Situa??o	Comportamento
O host em quest?o entra em manuten??o ap車s a notifica??o do in赤cio do incidente ser enviada	Todos os escalonamentos restantes ser?o executados. O processo de manuten??o programada n?o para as opera??es, afeta somente o in赤cio / fim das a??es e se uma a??o j芍 est芍 em execu??o ela n?o ser芍 afetada pela manuten??o.
O Intervalo* definido na condi??o da a??o termina ap車s a notifica??o inicial ser enviada*	Todos os passos subsequentes de escalonamento s?o executados. A condi??o de Intervalo n?o termina com as opera??es; esta condi??o afeta o in赤cio das a??es, n?o das opera??es.
Um incidente inicia durante um per赤odo de manuten??o e continua como n?o solucionado ap車s o final da manuten??o	Todos os passos de escalonamento s?o executados a partir do momento final da manuten??o.
Um problema inicia durante um per赤odo de manuten??o sem coleta de dados e continua como n?o resolvido ap車s a manuten??o terminar	Ser芍 necess芍rio aguardar que a trigger seja disparada, antes que os processos de escalonamento sejam executados.
Diferentes escalonamentos com estreita sucess?o e sobreposi??o	A execu??o de cada novo escalonamento substitui o anterior, mas pelo menos um passo de escalonamento sempre ser芍 executado no escalonamento anterior. Este comportamento 谷 relevante em a??es sobre eventos que s?o criados em todas as mudan?as para o estado de incidente em triggers.
Uma a??o 谷 desabilitada durante o processo de escalonamento (durante o processo de envio de mensagem por exemplo)	A mensagem atual e a pr車xima mensagem do escalonamento ainda ser?o enviadas. A mensagem seguinte ter芍 o seguinte texto no in赤cio do corpo: NOTE: Escalation cancelled: action '<Action name>' disabled. Isso ocorre para que o destinat芍rio saiba o motivo pelo qual o escalonamento n?o ser芍 executado.

Exemplos de escalonamento

Exemplo 1

Enviando uma notifica??o repetida a cada 30 minutos (at谷 um m芍ximo de 5) para o grupo 'MySQL Administrators':

Na aba Opera??es, defina a Dura??o padr?o do passo da opera??o para '1800' segundos (30 minutos)
Defina os passos do escalonamento de '1' ate '5'
Selecione o grupo 'MySQL Administrators' como destinat芍rio da mensagem

Nofifica??es ser?o enviadas, contando a partir do momento que o incidente inicia, 角s 00:00, 0:30, 1:00, 1:30, 2:00 horas (a n?o sere que o incidente seja resolvido antes).

Se o problema for resolvido e uma mensagem de recupera??o for configurada, esta ser芍 enviada a todos que receberam pelo menos uma das mensagens do escalonamento.

Se a trigger que gerou o escalonamento for desabilitada, o 韓誥傭痔 enviar芍 uma mensagem sobre isso para todos que j芍 receberam alguma notifica??o.

Exemplo 2

Enviando uma notifica??o com atraso, informando um longo per赤odo de problema:

Na aba de Opera??es, defina a Dura??o padr?o do passo da opera??o para '36000' segundos (10 horas)
Defina os passos do escalonamento de '2' ate '2'

A notifica??o ir芍 aguardar at谷 que o cen芍rio 2 ocorra (neste caso 10 horas ap車s o in赤cio do incidente).

Voc那 pode customizar esta mensagem, por exemplo, para algo como: 'O incidente j芍 ocorre a mais de 10 horas'.

Exemplo 3

Escalando o problema para o chefe.

No primeiro exemplo acima n車s configuramos o envio peri車dico de mensagens para o grupo 'MySQL administrators'. Agora vamos configurar para que os Administradores recebam quatro mensagens de notifica??o antes do problema ser escalado para o gerente de bancos de dados. Observe que o gerente s車 receber芍 a mensagem se o problema n?o tiver sido reconhecido tamb谷m (o que indica, teoricamente, que ningu谷m est芍 tratando o incidente).

Observe o uso da macro {ESC.HISTORY} na mensagem, ela conter芍 informa??es sobre todos os passos que j芍 ocorreram. Neste caso as notifica??es enviadas e os comandos executados.

Exemplo 4

Um cen芍rio mais complexo. Ap車s m迆ltiplas mensagens ao grupo 'MySQL administrators' e ter escalado o problema ao gerente, o 韓誥傭痔 ir芍 tentar reiniciar o banco de dados MySQL. Isso ir芍 ocorrer se o problema j芍 existir a mais de 2:30 horas e n?o tiver sido reconhecido.

Se o problema ainda existir, ap車s outros 30 minutos, o 韓誥傭痔 ir芍 enviar uma mensagem para todos os usu芍rios convidados.

Se isso n?o ajudar, ap車s outra hora, o 韓誥傭痔 ir芍 reiniciar o servidor com o banco MySQL (um segundo comando) usando o protocolo IPMI.

Exemplo 5

Um escalonamento com diversas opera??es associadas a um passo e dura??es diferentes. A opera??o padr?o 谷 de 30 minutos.

As notifica??es ser?o enviadas conforme descrito a seguir:

Para o grupo 'MySQL administrators' 角s 0:00, 0:30, 1:00, 1:30 ap車s o problema come?ar
Para o grupo 'Database manager' 角s 2:00 e 2:10 (n?o 角s 3:00; vendo que os passos 5 e 6 se sobrep?e com a pr車xima opera??o, a menor dura??o de passo configurada 谷 de 600 segundos e por isso o passo corrente teve o passo sobreposto)
Para o grupo '韓誥傭痔 administrators' 角s 2:00, 2:10, 2:20 ap車s o problema iniciar (a dura??o customizada de 600 segundos funcionou)
Para o grupo 'Convidados' 4:00 horas ap車s o problema iniciar (a dura??o padr?o de 30 minutos retornando entre os passos 8 e 11)