Como diz o ditado: “Quando o coração humano não é suficiente, a cobra engole o elefante”. Depois de atender aos requisitos básicos do artigo anterior, é necessário atender aos requisitos funcionais mais avançados.
1. Monitoramento simultâneo de vários locais e linhas
Vários locais de monitoramento referem-se ao monitoramento de sites e servidores em diferentes locais ao mesmo tempo, como monitoramento em vários pontos, como Guangzhou, Pequim, Chongqing, etc., e um alarme será emitido se uma falha for detectada em qualquer ponto. Multilinha refere-se ao uso de diferentes linhas (Telecom, China Unicom, China Railway Communications, etc.) para monitoramento simultâneo. Localização e linha são usadas juntas, como Guangzhou Telecom, Beijing Unicom, etc.
A Internet da China está artificialmente dividida em norte e sul. O sul é principalmente Telecom, e o norte é principalmente China Unicom (anteriormente China Netcom), bem como outras redes educacionais, China Railcom, etc. A velocidade de acesso de diferentes linhas de rede é mais lenta e instável do que a da mesma linha de rede. Por exemplo, o acesso da China Telecom à China Unicom é várias vezes mais lento do que o acesso da China Telecom à China Telecom, e a interconexão pode não funcionar de vez em quando. tempo. Juntamente com os diferentes locais, a situação é ainda mais complicada. Por exemplo, o ping da Guangzhou Telecom em Guangzhou geralmente leva 10 ms, o ping do Guangzhou China Unicom geralmente leva 30 ms, o ping da Beijing Telecom leva 20 ms e o ping da Beijing Netcom leva 60 ms. Em Guangzhou, frequentemente monitoramos que as linhas da Guangzhou Telecom não podem acessar as linhas da Guangzhou Unicom.
A maioria dos webmasters e administradores de rede não tem condições de monitorar vários locais e as próprias linhas podem ajudá-lo facilmente a resolver esse problema. Se o servidor do seu site for nacional, serão necessários vários locais e monitoramento de linha.
2. O alarme de falha suporta alarme principal e alarme secundário
Os servidores geralmente abrem vários serviços ao mesmo tempo, como serviços de site, serviços de e-mail, serviços FTP, serviços de banco de dados, etc. Os administradores de rede gostam de poder monitorar se esses serviços estão normais ao mesmo tempo. Se não houver priorização, quando o servidor apresentar falha na rede ou for reiniciado para manutenção, você receberá imediatamente alarmes de falha do site, alarmes de serviço de e-mail e alarmes de serviço FTP. Pior ainda, quando o servidor não puder ser restaurado por um curto período de tempo. tempo, as mensagens de alarme continuarão a fluir para você até que o servidor volte ao normal ou você trave.
Para serviços que monitoram o mesmo servidor, um objeto de monitoramento primário precisa ser definido. Quando o objeto de monitoramento primário falha, apenas os alarmes do objeto de monitoramento primário são enviados e outros objetos de monitoramento secundários suspendem o monitoramento e os alarmes. Por exemplo, Ping é usado como objeto de monitoramento principal. Se o Ping falhar e ocorrer Timeout, significa que o servidor travou ou está desconectado. Neste momento, apenas os alarmes de Ping do servidor são enviados para monitorar continuamente o Ping, porque ele não está mais. necessário continuar monitorando e alarmando outros serviços. Isto pode reduzir significativamente o número de mensagens de alarme e tornar o monitoramento mais razoável e eficiente.
3. Personalize as condições de alarme
O resultado geral do monitoramento é sucesso ou falha, como falha de ping, erro de acesso à página da web e falha de soquete. Quando ocorrem, são chamados de falhas, e as falhas são os alarmes de maior prioridade. Além disso, o atraso de retorno e o conteúdo também podem ser monitorados, como o atraso de retorno do Ping, o tempo de acesso à página web, o conteúdo obtido ao acessar a página web, etc. Os resultados retornados podem ser usados para personalizar as condições de alarme. Por exemplo, o atraso de retorno do monitoramento de Ping é geralmente entre 10-30 ms. Quando o atraso é maior que 100 ms, significa que pode haver um problema na rede ou no servidor. resposta lenta da rede e é necessário verificar imediatamente se há problemas como ser muito grande ou se a CPU do servidor estiver muito alta.
As condições de alarme personalizadas podem refinar ainda mais o conteúdo do monitoramento, conhecer com precisão o status do site e do servidor e ganhar mais tempo para resolver o problema antes que a falha ocorra.
4. Personalize o conteúdo da mensagem de alarme
Existem muitos conteúdos de mensagens de alarme, como nome do site de alarme, IP do servidor, linha monitorada, serviço monitorado, mensagem de erro, hora da ocorrência, etc. Você pode personalizar o conteúdo da mensagem de alarme para selecionar livremente o conteúdo do alarme recebido e modificá-lo para se adequar ao seu situação real. Isto é particularmente significativo para usar SMS para receber conteúdo de alarme. O conteúdo do SMS pode ter até 70 caracteres. É difícil compreender completamente o conteúdo da falha dentro de 70 caracteres. pode ser conhecido mesmo com conteúdo de caracteres limitado. Tempo, conteúdo de falha, como: "007电影网12:32 O monitoramento da linha de telecomunicações falhou pela primeira vez", conhecer claramente as informações de falha.
5. Receba relatórios resumidos por e-mail
Quando não há grandes problemas com o site e o servidor, ninguém tem preguiça de fazer login no back-end de gerenciamento do serviço de monitoramento online para verificar. Se você receber um e-mail de relatório resumido do monitoramento do servidor do site todos os dias, poderá obter uma compreensão geral do site e do status do servidor em dois ou três minutos.
6. Monitoramento passivo
Embora o monitoramento ativo não exija a instalação de códigos e programas e seja muito seguro e conveniente, falta muito conteúdo de monitoramento detalhado, como a incapacidade de obter o tamanho do disco rígido, uso da CPU, tráfego de rede, etc. muito útil, como a CPU está muito alta. Significa que há um problema com o site ou programa e o tráfego alto significa que ele pode ser atacado, etc.
SNMP (Simple Network Management Protocol) é comumente usado para monitoramento passivo. A maior parte do conteúdo de seu interesse pode ser monitorado por meio de SNMP. A maioria dos sistemas operacionais oferece suporte a SNMP, o que torna a ativação e o gerenciamento muito convenientes e seguros. A desvantagem do SNMP é que ele ocupa largura de banda e consome uma certa quantidade de CPU e memória. Quando a CPU está muito alta e o tráfego de rede é pesado, ele não pode ser monitorado de forma eficaz.
[Artigos relacionados ao autor]
Discutindo a necessidade de usar monitoramento de servidor de site online (1)
Discutindo a necessidade de usar monitoramento de servidor de site online (2)
O autor deste artigo: Aplicativos e serviços de Internet Zhongyu é original. Deixe a fonte do artigo ao reimprimi-lo.
Obrigado à Zhongyu Internet pela sua contribuição