Áú»¢¶Ä²©

12 Defini??es de host inalcan?¨¢vel/inacess¨ªvel

Vis?o geral

Diversos par?metros de configura??o definem como o Áú»¢¶Ä²© Server ir¨¢ agir quando uma verifica??o de agente (Áú»¢¶Ä²©, SNMP, IPMI, JMX) falhar e um host passar a se tornar inacess¨ªvel.

Interface inacess¨ªvel

Uma interface de host ¨¦ tratada como inacess¨ªvel ap¨®s uma falha na verifica??o (rede error, timeout) pelos agentes Áú»¢¶Ä²©, SNMP, IPMI ou JMX. Observe que o Áú»¢¶Ä²© as verifica??es ativas do agente n?o influenciam a disponibilidade da interface de forma alguma.

A partir desse momento, UnreachableDelay define com que frequ¨ºncia uma interface ¨¦ verificado novamente usando um dos itens (incluindo regras LLD) neste situa??o de inacessibilidade e tais verifica??es j¨¢ ser?o realizadas por pollers inacess¨ªveis (ou pollers IPMI para verifica??es de IPMI). Por padr?o ¨¦ 15 segundos antes da pr¨®xima verifica??o.

No log do servidor Áú»¢¶Ä²©, a inacessibilidade ¨¦ indicada por mensagens como esses:

O item do agente Áú»¢¶Ä²© "system.cpu.load[percpu,avg1]" no host "Novo host" falhou: primeiro erro de rede, aguarde 15 segundos
       Item do agente Áú»¢¶Ä²© "system.cpu.load[percpu,avg15]" no host "Novo host" falhou: outro erro de rede, aguarde 15 segundos

Observe que o item exato que falhou ¨¦ indicado e o tipo de item (agente Áú»¢¶Ä²©).

O par?metro Timeout tamb¨¦m afetar¨¢ o qu?o cedo um interface ¨¦ verificada novamente durante a inacessibilidade. Se o tempo limite for 20 segundos e UnreachableDelay 30 segundos, a pr¨®xima verifica??o ser¨¢ em 50 segundos segundos ap¨®s a primeira tentativa.

O par?metro UnreachablePeriod define por quanto tempo a inacessibilidade per¨ªodo ¨¦ total. Por padr?o, UnreachablePeriod ¨¦ de 45 segundos. UnreachablePeriod deve ser v¨¢rias vezes maior que UnreachableDelay, para que uma interface seja verificada mais de uma vez antes de uma interface fica indispon¨ªvel.

Alternando a interface de volta para dispon¨ªvel

Quando o per¨ªodo de inacessibilidade termina, a interface ¨¦ sondada novamente, diminuindo a prioridade para o item que tornou a interface inacess¨ªvel Estado. Se a interface inacess¨ªvel reaparecer, o monitoramento retorna ao normal automaticamente:

retomando as verifica??es do agente Áú»¢¶Ä²© no host "Novo host": conex?o restaurada

Uma vez que a interface se torna dispon¨ªvel, o host n?o pesquisa todos seus itens imediatamente por dois motivos:

  • Pode sobrecarregar o host.
  • O tempo de restaura??o da interface nem sempre corresponde ao item planejado hor¨¢rio da agenda de vota??o.

Assim, ap¨®s a disponibiliza??o da interface, os itens n?o s?o pesquisados imediatamente, mas eles est?o sendo remarcados para a pr¨®xima vota??o volta.

Interface indispon¨ªvel

Ap¨®s o t¨¦rmino do UnreachablePeriod e a interface n?o reaparecer, a interface ¨¦ tratada como indispon¨ªvel.

No log do servidor ¨¦ indicado por mensagens como estas:

desabilitando temporariamente as verifica??es do agente Áú»¢¶Ä²© no host "Novo host": interface indispon¨ªvel

E no frontend o ¨ªcone de disponibilidade do host vai de verde/cinza para amarelo/vermelho (o detalhes de interface inacess¨ªveis podem ser vistos na caixa de dicas que ¨¦ exibido quando um mouse ¨¦ posicionado no ¨ªcone de disponibilidade do host):

O par?metro UnavailableDelay define com que frequ¨ºncia uma interface ¨¦ verificado durante a indisponibilidade da interface.

Por padr?o, s?o 60 segundos (ent?o, neste caso, "desativando temporariamente", da mensagem de log acima, significar¨¢ desabilitar as verifica??es por um minuto).

Quando a conex?o com a interface ¨¦ restaurada, o monitoramento retorna ao normal automaticamente tamb¨¦m:

habilitando as verifica??es do agente Áú»¢¶Ä²© no host "Novo host": a interface ficou dispon¨ªvel