Falhas comuns de servidor
1. Os principais motivos pelos quais o servidor não consegue iniciar:
Falha na rede elétrica ou na linha de energia (queda de energia ou mau contato)
Falha na fonte de alimentação ou módulo de alimentação
Falha de memória (geralmente acompanhada por som de alarme)
Falha da CPU (geralmente haverá um som de alarme)
Falha na placa-mãe
Conflitos de interrupção causados por outras placas plug-in
2. O servidor não pode ser iniciado?
Verifique se o cabo de alimentação e vários fios de E/S estão conectados corretamente.
Verifique se a placa-mãe está ligada após conectar o cabo de alimentação.
Defina o servidor para a configuração mínima (conecte apenas uma única CPU, memória mínima e conecte apenas o monitor e o teclado) e faça um curto-circuito direto no jumper do switch da placa-mãe para ver se ele pode iniciar.
Verifique a fonte de alimentação, desconecte todas as interfaces de alimentação, curto-circuite os fios verde e preto da porta de alimentação da placa principal da fonte de alimentação e veja se a alimentação está ligada.
Se for considerado que a fonte de alimentação está normal, você precisará usar o método de substituição para solucionar problemas. O método de substituição é começar com os acessórios mais fáceis de substituir (memória, CPU, placa-mãe) na configuração mínima.
3. O sistema reinicia com frequência?
Razões para reinicializações frequentes do sistema:
Falha de energia (julgamento e solução por método de substituição)
Falha de memória (pode ser detectada no relatório de erros do BIOS)
O tráfego de dados da porta de rede é muito grande (a pressão de trabalho é muito alta)
Falha de software (resolvida atualizando ou reinstalando o sistema operacional)
4. Determinar e tratar falhas de travamento do servidor:
As falhas de travamento do servidor são difíceis de determinar e geralmente são divididas em dois aspectos: software e hardware:
Falha de software
Falha de hardware
Falha de software
Primeiro, verifique o log do sistema operacional. Você pode usar o log do sistema para determinar algumas das causas da falha.
Causas de vírus de computador.
Uma falha causada por um bug ou vulnerabilidade no software do sistema. Esse tipo de falha precisa ser feita após julgar que o hardware está impecável e o fornecedor do software precisa fornecer ajuda.
Se o software for usado incorretamente ou a pressão de trabalho do sistema for muito alta, você pode pedir ao cliente para reduzir adequadamente a pressão de trabalho do servidor para ver se o problema pode ser resolvido.
Falha de hardware
Conflito de hardware
A falha de energia ou fonte de alimentação insuficiente pode ser determinada comparando e calculando todos os valores de potência de carga da fonte de alimentação do servidor.
Falha no disco rígido (verifique setores defeituosos examinando a superfície do disco rígido)
Falha de memória (pode ser avaliada pelo relatório de erro no BIOS da placa-mãe e pela mensagem de erro do sistema operacional)
Falha na placa-mãe (use o método de substituição para determinar)
Falha de CPU (usando método de substituição)
Falha na placa da placa (geralmente uma placa SCSI/RAID ou outro dispositivo PCI também pode causar falha no sistema e o método de substituição pode ser usado para determinar a solução)
Nota: Depois que a falha de travamento do sistema for resolvida, um determinado teste de cópia de pressão deve ser realizado dentro de um período de tempo para verificar se a falha foi completamente resolvida.
5. Ao instalar o sistema operacional, ele avisa que o disco rígido não pode ser encontrado?
Causa da falha:
Nenhum dispositivo de disco rígido físico
Problema de conexão do cabo do disco rígido
O driver do controlador de disco rígido não está instalado ou é inconsistente.
6. Como obter o driver?
Use o CD aleatório para criar o driver correspondente
[Página cortada]
7. Por que o driver do controlador de disco rígido não pode ser carregado mesmo com o driver correto?
Verifique se a função hostraid está habilitada.
8. Depois de instalar um disco rígido recém-adquirido na máquina, a máquina não passa no autoteste?
Remova o novo disco rígido e veja se a máquina consegue passar no autoteste;
Verifique se o número de ID do disco rígido recém-adicionado é o mesmo do disco rígido original. Se o número de ID do disco rígido for o mesmo, o autoteste falhará.
9. Como formatar um disco rígido SCSI?
Se houver sistema operacional: use a ferramenta de gerenciamento de disco para formatar;
Se não houver sistema operacional: Formate na interface de controle de gerenciamento SCSI;
Tomemos como exemplo a placa ADAPTEC Raid: ligue - quando a mensagem CTRL+A aparecer, pressione CTRL+A para entrar - selecione o canal A
- Verifique o SCSI UTILITY - O disco rígido será detectado - Verifique o disco rígido a ser detectado
-Selecione FORMAT para formatar totalmente o disco rígido
Selecione VERIFICAR para testar o disco rígido e verificar se há setores defeituosos.
Nota: Não interrompa ou falte energia ao formatar o disco rígido, caso contrário o disco será danificado.
10. Existe uma máquina de cartão RAID na série Aisino Quando um dos discos rígidos não funciona corretamente e ocorre um alarme RAID, mas o sistema pode funcionar normalmente, o que devo fazer?
Use um disco rígido novo, garantindo que a capacidade seja maior ou igual à do disco rígido que não está funcionando corretamente. É melhor substituí-lo por um disco rígido do mesmo modelo.
Falhas comuns relacionadas a placas RAID
Categoria 1: Há um problema com a própria placa RAID
As informações do RAID são frequentemente perdidas, o disco rígido fica off-line com frequência, o REBUILD não pode ser executado e o disco rígido não pode ser detectado durante a autoverificação de inicialização ou leva muito tempo.
Falha típica A:
Após concluir o RAID1 e instalar o sistema operacional, tudo estava normal. Porém, quando o sistema foi reiniciado pela segunda vez, um alarme soou. Após a inspeção, constatou-se que um disco rígido estava offline. mas ficou offline novamente após reiniciar. Suspeitou-se que o disco rígido estava com defeito e não houve problemas após a verificação do disco rígido. Finalmente, a placa RAID foi substituída e a falha foi resolvida.
Falha típica B:
A máquina geralmente congela e às vezes inicia muito lentamente. Observando o log do sistema, descobrimos que houve uma mensagem de erro quando o sistema foi iniciado: o dispositivo /devices/scsi/port0 não respondeu durante o tempo de espera da transmissão. Depois de substituir a placa RAID, ela voltou ao normal.
Categoria 2: Problemas com o próprio disco rígido
O desempenho é que o disco rígido está offline, o status na matriz RAID é MORTO ou, ao fazer REBUILD, o progresso não pode continuar após um determinado progresso.
Falhas típicas:
Após o disco rígido ficar offline, ao fazer REBUILD, aparece uma mensagem de erro ao atingir 20% e não é possível continuar. Depois de confirmar que o disco rígido offline, a caixa do disco rígido e o cabo SCSI estão funcionando normalmente, o disco rígido online é verificado e setores defeituosos são encontrados. Repare o disco rígido e refaça o REBUILD para restaurá-lo ao normal.
Categoria 3: Problemas de contato com caixas ou módulos de disco rígido
Esse tipo de problema geralmente se manifesta quando a placa RAID não detecta o disco rígido. Esse tipo de problema é relativamente simples, mas há alguns problemas que precisam ser observados ao lidar com máquinas relacionadas a caixas de disco rígido.
Falhas típicas:
O disco rígido não pode ser detectado na placa RIAD. Conectei o cabo SCSI à interface ULTRA160 na placa-mãe. A falha persistiu. Retirei a caixa do disco rígido (excluindo o suporte atrás da caixa do disco rígido). a falha persistiu. Substituí o disco rígido, mas ainda não funcionou. Finalmente, removi o suporte (parte que não pode ser trocada a quente) atrás da caixa do disco rígido e descobri que um pino na interface 80PIN no suporte traseiro estava dobrado. Endireitei o pino dobrado e o retornei ao normal.
11. Por que o número de identificação do disco rígido SCSI usado no servidor não pode ser definido como 7?
No controlador SCSI, ID=7 é definido como o controlador de disco rígido por padrão, portanto, o número de ID do disco rígido não pode ser definido como 7.
12. Por que não consigo passar no autoteste de inicialização?
Solução:
Desligue a máquina, abra o chassi e use a tampa do jumper "COMS CLEAR" para curto-circuitar os outros dois pinos do jumper "COMS CLEAR" (consulte o manual da placa-mãe para jumpers).
Ligue a máquina e execute o autoteste Após a conclusão do autoteste da máquina, ele informará que o CMOS foi limpo. Em seguida, desligue a máquina e reinicie o jumper.
Reinicie a máquina
13. Erro de slot de memória física
Solução:
Ligue o computador - pressione F2 para entrar em "SETUP" - "ADVANCED" - "MEMORY CONFIGURATION" e pressione Enter - "CLEAR DIMM ERRORS" e pressione Enter diretamente.
14. Por que o processador relata um erro ou apenas um processador é encontrado durante o autoteste?
Solução:
Ligue -> Pressione a tecla F2 para entrar em "SETUP"
1. Vá em "MAIN" --〉"PROCESSOR" --〉"CLEAR PROCESSOR ERRORS [ ]": Defina o valor desta opção como "YES";
2. Clique em “AVANÇADO” --> “RESET CONFIGURATION DATA [ ]”: Defina o valor desta opção para “SIM”;
3. Clique em “SERVIDOR” --> “PROCESSOR RESET [ ]”: Defina o valor desta opção para “SIM”;
4. Clique em "SERVER" --> "SYSTEM MANAGEMENT": Enter --> "CLEAR EVENTLOG [ ] ": Defina o valor desta opção como "YES"
5. Pressione F10 para salvar e sair.
[Página cortada]7. Por que o driver do controlador de disco rígido não pode ser carregado mesmo com o driver correto?
Verifique se a função hostraid está habilitada.
8. Depois de instalar um disco rígido recém-adquirido na máquina, a máquina não passa no autoteste?
Remova o novo disco rígido e veja se a máquina consegue passar no autoteste;
Verifique se o número de ID do disco rígido recém-adicionado é o mesmo do disco rígido original. Se o número de ID do disco rígido for o mesmo, o autoteste falhará.
9. Como formatar um disco rígido SCSI?
Se houver sistema operacional: use a ferramenta de gerenciamento de disco para formatar;
Se não houver sistema operacional: Formate na interface de controle de gerenciamento SCSI;
Tomemos como exemplo a placa ADAPTEC Raid: ligue - quando a mensagem CTRL+A aparecer, pressione CTRL+A para entrar - selecione o canal A
- Verifique o SCSI UTILITY - O disco rígido será detectado - Verifique o disco rígido a ser detectado
-Selecione FORMAT para formatar totalmente o disco rígido
Selecione VERIFICAR para testar o disco rígido e verificar se há setores defeituosos.
Nota: Não interrompa ou falte energia ao formatar o disco rígido, caso contrário o disco será danificado.
10. Existe uma máquina de cartão RAID na série Aisino Quando um dos discos rígidos não funciona corretamente e ocorre um alarme RAID, mas o sistema pode funcionar normalmente, o que devo fazer?
Use um disco rígido novo, garantindo que a capacidade seja maior ou igual à do disco rígido que não está funcionando corretamente. É melhor substituí-lo por um disco rígido do mesmo modelo.
Falhas comuns relacionadas a placas RAID
Categoria 1: Há um problema com a própria placa RAID
As informações do RAID são frequentemente perdidas, o disco rígido fica off-line com frequência, o REBUILD não pode ser executado e o disco rígido não pode ser detectado durante a autoverificação de inicialização ou leva muito tempo.
Falha típica A:
Após concluir o RAID1 e instalar o sistema operacional, tudo estava normal. Porém, quando o sistema foi reiniciado pela segunda vez, um alarme soou. Após a inspeção, constatou-se que um disco rígido estava offline. mas ficou offline novamente após reiniciar. Suspeitou-se que o disco rígido estava com defeito e não houve problemas após a verificação do disco rígido. Finalmente, a placa RAID foi substituída e a falha foi resolvida.
Falha típica B:
A máquina geralmente congela e às vezes inicia muito lentamente. Observando o log do sistema, descobrimos que houve uma mensagem de erro quando o sistema foi iniciado: o dispositivo /devices/scsi/port0 não respondeu durante o tempo de espera da transmissão. Depois de substituir a placa RAID, ela voltou ao normal.
Categoria 2: Problemas com o próprio disco rígido
O desempenho é que o disco rígido está offline, o status na matriz RAID é MORTO ou, ao fazer REBUILD, o progresso não pode continuar após um determinado progresso.
Falhas típicas:
Após o disco rígido ficar offline, ao fazer REBUILD, aparece uma mensagem de erro ao atingir 20% e não é possível continuar. Depois de confirmar que o disco rígido offline, a caixa do disco rígido e o cabo SCSI estão funcionando normalmente, o disco rígido online é verificado e setores defeituosos são encontrados. Repare o disco rígido e refaça o REBUILD para restaurá-lo ao normal.
Categoria 3: Problemas de contato com caixas ou módulos de disco rígido
Esse tipo de problema geralmente se manifesta quando a placa RAID não detecta o disco rígido. Esse tipo de problema é relativamente simples, mas há alguns problemas que precisam ser observados ao lidar com máquinas relacionadas a caixas de disco rígido.
Falhas típicas:
O disco rígido não pode ser detectado na placa RIAD. Conectei o cabo SCSI à interface ULTRA160 na placa-mãe. A falha persistiu. Retirei a caixa do disco rígido (excluindo o suporte atrás da caixa do disco rígido). a falha persistiu. Substituí o disco rígido, mas ainda não funcionou. Finalmente, removi o suporte (parte que não pode ser trocada a quente) atrás da caixa do disco rígido e descobri que um pino na interface 80PIN no suporte traseiro estava dobrado. Endireitei o pino dobrado e o retornei ao normal.
11. Por que o número de identificação do disco rígido SCSI usado no servidor não pode ser definido como 7?
No controlador SCSI, ID=7 é definido como o controlador de disco rígido por padrão, portanto, o número de ID do disco rígido não pode ser definido como 7.
12. Por que não consigo passar no autoteste de inicialização?
Solução:
Desligue a máquina, abra o chassi e use a tampa do jumper "COMS CLEAR" para curto-circuitar os outros dois pinos do jumper "COMS CLEAR" (consulte o manual da placa-mãe para jumpers).
Ligue a máquina e execute o autoteste Após a conclusão do autoteste da máquina, ele informará que o CMOS foi limpo. Em seguida, desligue a máquina e reinicie o jumper.
Reinicie a máquina
13. Erro de slot de memória física
Solução:
Ligue o computador - pressione F2 para entrar em "SETUP" - "ADVANCED" - "MEMORY CONFIGURATION" e pressione Enter - "CLEAR DIMM ERRORS" e pressione Enter diretamente.
14. Por que o processador relata um erro ou apenas um processador é encontrado durante o autoteste?
Solução:
Ligue -> Pressione a tecla F2 para entrar em "SETUP"
1. Vá em "MAIN" --〉"PROCESSOR" --〉"CLEAR PROCESSOR ERRORS [ ]": Defina o valor desta opção como "YES";
2. Clique em “AVANÇADO” --> “RESET CONFIGURATION DATA [ ]”: Defina o valor desta opção para “SIM”;
3. Clique em “SERVIDOR” --> “PROCESSOR RESET [ ]”: Defina o valor desta opção para “SIM”;
4. Clique em "SERVER" --> "SYSTEM MANAGEMENT": Enter --> "CLEAR EVENTLOG [ ] ": Defina o valor desta opção como "YES"
5. Pressione F10 para salvar e sair.