Pannes de serveur courantes
1. Les principales raisons pour lesquelles le serveur ne peut pas démarrer :
Panne de secteur ou de ligne électrique (panne de courant ou mauvais contact)
Panne d’alimentation ou de module d’alimentation
Défaillance de la mémoire (généralement accompagnée d'un son d'alarme)
Panne du processeur (il y aura généralement une alarme sonore)
Panne de la carte mère
Conflits d'interruption causés par d'autres cartes enfichables
2. Le serveur ne peut pas démarrer ?
Vérifiez si le cordon d'alimentation et les différents câbles d'E/S sont correctement connectés.
Vérifiez si la carte mère est sous tension après avoir connecté le cordon d'alimentation.
Réglez le serveur sur la configuration minimale (connectez uniquement un seul processeur, une mémoire minimale et connectez uniquement le moniteur et le clavier) et court-circuitez directement le cavalier du commutateur de la carte mère pour voir s'il peut démarrer.
Vérifiez l'alimentation, débranchez toutes les interfaces d'alimentation, court-circuitez les fils vert et noir du port d'alimentation de la carte mère de l'alimentation et voyez si l'alimentation est allumée.
S'il est jugé que l'alimentation est normale, vous devez utiliser la méthode de remplacement pour dépanner. La méthode de remplacement consiste à commencer par les accessoires les plus faciles à remplacer (mémoire, processeur, carte mère) dans la configuration minimale.
3. Le système redémarre fréquemment ?
Raisons des redémarrages fréquents du système :
Panne de courant (jugement et solution par méthode de remplacement)
Panne de mémoire (peut être détectée à partir du rapport d'erreur du BIOS)
Le trafic de données du port réseau est trop important (la pression de travail est trop élevée)
Panne logicielle (résolue par la mise à jour ou la réinstallation du système d'exploitation)
4. Détermination et gestion des pannes de serveur :
Les pannes de serveur sont difficiles à déterminer et sont généralement divisées en deux aspects : logiciel et matériel :
Panne logicielle
Panne matérielle
Panne logicielle
Vérifiez d'abord le journal système du système d'exploitation. Vous pouvez utiliser le journal système pour déterminer certaines des causes du crash.
Causes des virus informatiques.
Un crash causé par un bug ou une vulnérabilité du logiciel système. Ce type de panne doit être effectué après avoir jugé que le matériel est irréprochable et le fournisseur de logiciel doit fournir de l'aide.
Si le logiciel est mal utilisé ou si la pression de fonctionnement du système est trop élevée, vous pouvez demander au client de réduire de manière appropriée la pression de fonctionnement du serveur pour voir si le problème peut être résolu.
Panne matérielle
Conflit matériel
Une panne de courant ou une alimentation électrique insuffisante peut être déterminée en comparant et en calculant toutes les valeurs de puissance de charge de l'alimentation du serveur.
Panne de disque dur (vérifiez les secteurs défectueux en analysant la surface du disque dur)
Panne de mémoire (peut être jugée par le rapport d'erreur dans le BIOS de la carte mère et le message d'erreur du système d'exploitation)
Panne de la carte mère (utilisez la méthode de remplacement pour déterminer)
Panne du processeur (en utilisant la méthode de remplacement)
Défaillance de la carte mère (généralement, une carte SCSI/RAID ou un autre périphérique PCI peut également provoquer une panne du système, et la méthode de remplacement peut être utilisée pour déterminer la solution)
Remarque : Une fois le problème de crash du système résolu, un certain test de copie de pression doit être effectué dans un délai donné pour vérifier si le problème a été complètement résolu.
5. Lors de l'installation du système d'exploitation, un message indique que le disque dur est introuvable ?
Cause de l'échec :
Aucun périphérique de disque dur physique
Problème de connexion du câble du disque dur
Le pilote du contrôleur de disque dur n'est pas installé ou le pilote est incohérent.
6. Comment obtenir le pilote ?
Utilisez le CD aléatoire pour créer le pilote correspondant
[Page coupée]
7. Pourquoi le pilote du contrôleur de disque dur ne peut-il pas être chargé même avec le bon pilote ?
Vérifiez si la fonction hostraid est activée.
8. Après avoir installé un disque dur nouvellement acheté dans la machine, la machine ne réussit pas l'auto-test ?
Retirez le nouveau disque dur et voyez si la machine peut réussir l'auto-test ;
Vérifiez si le numéro d'identification du disque dur nouvellement ajouté est le même que celui du disque dur d'origine. Si le numéro d'identification du disque dur est le même, l'auto-test échouera.
9. Comment formater un disque dur SCSI ?
S'il existe un système d'exploitation : utilisez l'outil de gestion de disque pour formater ;
S'il n'y a pas de système d'exploitation : Formater sur l'interface de contrôle de gestion SCSI ;
Prenons l'exemple de la carte ADAPTEC Raid : mise sous tension - lorsque le message CTRL+A apparaît, appuyez sur CTRL+A pour entrer - sélectionnez le canal A
- Vérifiez UTILITAIRE SCSI - Le disque dur sera détecté - Vérifiez le disque dur à détecter
-Sélectionnez FORMAT pour formater complètement le disque dur
Sélectionnez VÉRIFIER pour tester le disque dur et vérifier s'il existe des secteurs défectueux.
Remarque : n'interrompez pas ou ne coupez pas de courant lors du formatage du disque dur, sinon le disque sera endommagé.
10. Il existe une machine à carte RAID dans la série Aisino. Lorsque l'un des disques durs ne fonctionne pas correctement et qu'une alarme RAID se produit, mais que le système peut fonctionner normalement, que dois-je faire ?
Utilisez un nouveau disque dur en vous assurant que la capacité est supérieure ou égale à celle du disque dur qui ne fonctionne pas correctement. Il est préférable de le remplacer par un disque dur du même modèle.
Défauts courants liés aux cartes RAID
Catégorie 1 : Il y a un problème avec la carte RAID elle-même
Les informations RAID sont souvent perdues, le disque dur est souvent hors ligne, la RECONSTRUCTION ne peut pas être effectuée et le disque dur ne peut pas être détecté lors de l'auto-vérification à la mise sous tension ou cela prend beaucoup de temps.
Défaut typique A :
Après avoir terminé RAID1 et installé le système d'exploitation, tout était normal. Cependant, lorsque le système a été redémarré pour la deuxième fois, une alarme a retenti. Après inspection, il a été constaté qu'un disque dur était hors ligne. Après la RECONSTRUCTION, il est revenu à la normale. mais il était de nouveau hors ligne après le redémarrage. On soupçonnait que le disque dur était défectueux et il n'y a eu aucun problème après vérification du disque dur. Finalement, la carte RAID a été remplacée et le problème a été résolu.
Défaut typique B :
La machine se bloque souvent et démarre parfois très lentement. En observant le journal système, nous avons constaté qu'il y avait un message d'erreur au démarrage du système : le périphérique /devices/scsi/port0 n'a pas répondu pendant le temps d'attente de transmission. Après avoir remplacé la carte RAID, elle est revenue à la normale.
Catégorie 2 : Problèmes avec le disque dur lui-même
La performance est que le disque dur est hors ligne, que l'état de la matrice RAID est MORT ou que lors d'une RECONSTRUCTION, la progression ne peut pas être poursuivie après une certaine progression.
Défauts typiques :
Une fois le disque dur hors ligne, lors de la REBUILD, un message d'erreur apparaît lorsque 20 % sont atteints et ne peut pas continuer. Après avoir confirmé que le disque dur hors ligne, le boîtier du disque dur et le câble SCSI fonctionnent tous normalement, le disque dur en ligne est vérifié et les secteurs défectueux sont détectés. Réparez le disque dur et refaites REBUILD pour le restaurer à la normale.
Catégorie 3 : Problèmes de contact avec les boîtiers ou modules de disque dur
Ce type de problème se manifeste souvent lorsque la carte RAID ne détecte pas du tout le disque dur. Ce type de problème est relativement simple, mais il convient de prêter attention à certains problèmes lorsqu'il s'agit de machines liées aux boîtiers de disque dur.
Défauts typiques :
Le disque dur n'est pas détecté dans la carte RIAD. J'ai connecté le câble SCSI à l'interface ULTRA160 de la carte mère. Le problème a persisté. J'ai retiré le boîtier du disque dur (à l'exclusion du support derrière le boîtier du disque dur) et je l'ai remplacé. le problème a persisté. J'ai remplacé le disque dur, mais cela n'a toujours pas fonctionné. Enfin, j'ai retiré le support (pièce non remplaçable à chaud) derrière le boîtier du disque dur et j'ai constaté qu'une broche de l'interface 80PIN sur le support arrière était pliée. J'ai redressé la broche pliée et je l'ai remise à la normale.
11. Pourquoi le numéro d'identification du disque dur SCSI utilisé sur le serveur ne peut-il pas être défini sur 7 ?
Dans le contrôleur SCSI, ID=7 est défini par défaut sur le contrôleur de disque dur, donc le numéro d'identification du disque dur ne peut pas être défini sur 7.
12. Pourquoi ne puis-je pas réussir l'autotest de mise sous tension ?
Solution:
Mettez la machine hors tension, ouvrez le châssis et utilisez le capuchon du cavalier "COMS CLEAR" pour court-circuiter les deux autres broches du cavalier "COMS CLEAR" (reportez-vous au manuel de la carte mère pour les cavaliers).
Allumez la machine et effectuez l'auto-test. Une fois l'auto-test de la machine terminé, il signalera que le CMOS a été effacé. Ensuite, coupez l'alimentation de la machine et réinitialisez le cavalier.
Redémarrez la machine
13. Erreur d'emplacement de mémoire physique
Solution:
Allumez l'ordinateur - appuyez sur F2 pour entrer "CONFIGURATION" - "AVANCÉ" - "CONFIGURATION DE LA MÉMOIRE" et appuyez sur Entrée - "EFFACER LES ERREURS DIMM" et appuyez directement sur Entrée.
14. Pourquoi le processeur signale-t-il une erreur ou un seul processeur est-il détecté lors de l'autotest ?
Solution:
Allumer -> Appuyez sur la touche F2 pour entrer dans "SETUP"
1. Allez dans « PRINCIPAL » --〉« PROCESSEUR » --〉« EFFACER LES ERREURS DU PROCESSEUR [ ] » : Définissez la valeur de cette option sur « OUI » ;
2. Cliquez sur « AVANCÉ » --> « RÉINITIALISER LES DONNÉES DE CONFIGURATION [ ] » : Définissez la valeur de cette option sur « OUI » ;
3. Cliquez sur « SERVEUR » --> « PROCESSOR RESET [ ] » : Définissez la valeur de cette option sur « OUI » ;
4. Cliquez sur « SERVEUR » -> « GESTION DU SYSTÈME » : Entrez --> « CLEAR EVENTLOG [ ] » : Définissez la valeur de cette option sur « OUI »
5. Appuyez sur F10 pour enregistrer et quitter.
[Page coupée]7. Pourquoi le pilote du contrôleur de disque dur ne peut-il pas être chargé même avec le bon pilote ?
Vérifiez si la fonction hostraid est activée.
8. Après avoir installé un disque dur nouvellement acheté dans la machine, la machine ne réussit pas l'auto-test ?
Retirez le nouveau disque dur et voyez si la machine peut réussir l'auto-test ;
Vérifiez si le numéro d'identification du disque dur nouvellement ajouté est le même que celui du disque dur d'origine. Si le numéro d'identification du disque dur est le même, l'auto-test échouera.
9. Comment formater un disque dur SCSI ?
S'il existe un système d'exploitation : utilisez l'outil de gestion de disque pour formater ;
S'il n'y a pas de système d'exploitation : Formater sur l'interface de contrôle de gestion SCSI ;
Prenons l'exemple de la carte ADAPTEC Raid : mise sous tension - lorsque le message CTRL+A apparaît, appuyez sur CTRL+A pour entrer - sélectionnez le canal A
- Vérifiez UTILITAIRE SCSI - Le disque dur sera détecté - Vérifiez le disque dur à détecter
-Sélectionnez FORMAT pour formater complètement le disque dur
Sélectionnez VÉRIFIER pour tester le disque dur et vérifier s'il existe des secteurs défectueux.
Remarque : n'interrompez pas ou ne coupez pas de courant lors du formatage du disque dur, sinon le disque sera endommagé.
10. Il existe une machine à carte RAID dans la série Aisino. Lorsque l'un des disques durs ne fonctionne pas correctement et qu'une alarme RAID se produit, mais que le système peut fonctionner normalement, que dois-je faire ?
Utilisez un nouveau disque dur en vous assurant que la capacité est supérieure ou égale à celle du disque dur qui ne fonctionne pas correctement. Il est préférable de le remplacer par un disque dur du même modèle.
Défauts courants liés aux cartes RAID
Catégorie 1 : Il y a un problème avec la carte RAID elle-même
Les informations RAID sont souvent perdues, le disque dur est souvent hors ligne, la RECONSTRUCTION ne peut pas être effectuée et le disque dur ne peut pas être détecté lors de l'auto-vérification à la mise sous tension ou cela prend beaucoup de temps.
Défaut typique A :
Après avoir terminé RAID1 et installé le système d'exploitation, tout était normal. Cependant, lorsque le système a été redémarré pour la deuxième fois, une alarme a retenti. Après inspection, il a été constaté qu'un disque dur était hors ligne. Après la RECONSTRUCTION, il est revenu à la normale. mais il était de nouveau hors ligne après le redémarrage. On soupçonnait que le disque dur était défectueux et il n'y a eu aucun problème après vérification du disque dur. Finalement, la carte RAID a été remplacée et le problème a été résolu.
Défaut typique B :
La machine se bloque souvent et démarre parfois très lentement. En observant le journal système, nous avons constaté qu'il y avait un message d'erreur au démarrage du système : le périphérique /devices/scsi/port0 n'a pas répondu pendant le temps d'attente de transmission. Après avoir remplacé la carte RAID, elle est revenue à la normale.
Catégorie 2 : Problèmes avec le disque dur lui-même
La performance est que le disque dur est hors ligne, que l'état de la matrice RAID est MORT ou que lors d'une RECONSTRUCTION, la progression ne peut pas être poursuivie après une certaine progression.
Défauts typiques :
Une fois le disque dur hors ligne, lors de la REBUILD, un message d'erreur apparaît lorsque 20 % sont atteints et ne peut pas continuer. Après avoir confirmé que le disque dur hors ligne, le boîtier du disque dur et le câble SCSI fonctionnent tous normalement, le disque dur en ligne est vérifié et les secteurs défectueux sont détectés. Réparez le disque dur et refaites REBUILD pour le restaurer à la normale.
Catégorie 3 : Problèmes de contact avec les boîtiers ou modules de disque dur
Ce type de problème se manifeste souvent lorsque la carte RAID ne détecte pas du tout le disque dur. Ce type de problème est relativement simple, mais il convient de prêter attention à certains problèmes lorsqu'il s'agit de machines liées aux boîtiers de disque dur.
Défauts typiques :
Le disque dur n'est pas détecté dans la carte RIAD. J'ai connecté le câble SCSI à l'interface ULTRA160 de la carte mère. Le problème a persisté. J'ai retiré le boîtier du disque dur (à l'exclusion du support derrière le boîtier du disque dur) et je l'ai remplacé. le problème a persisté. J'ai remplacé le disque dur, mais cela n'a toujours pas fonctionné. Enfin, j'ai retiré le support (pièce non remplaçable à chaud) derrière le boîtier du disque dur et j'ai constaté qu'une broche de l'interface 80PIN sur le support arrière était pliée. J'ai redressé la broche pliée et je l'ai remise à la normale.
11. Pourquoi le numéro d'identification du disque dur SCSI utilisé sur le serveur ne peut-il pas être défini sur 7 ?
Dans le contrôleur SCSI, ID=7 est défini par défaut sur le contrôleur de disque dur, donc le numéro d'identification du disque dur ne peut pas être défini sur 7.
12. Pourquoi ne puis-je pas réussir l'autotest de mise sous tension ?
Solution:
Mettez la machine hors tension, ouvrez le châssis et utilisez le capuchon du cavalier "COMS CLEAR" pour court-circuiter les deux autres broches du cavalier "COMS CLEAR" (reportez-vous au manuel de la carte mère pour les cavaliers).
Allumez la machine et effectuez l'auto-test. Une fois l'auto-test de la machine terminé, il signalera que le CMOS a été effacé. Ensuite, coupez l'alimentation de la machine et réinitialisez le cavalier.
Redémarrez la machine
13. Erreur d'emplacement de mémoire physique
Solution:
Allumez l'ordinateur - appuyez sur F2 pour entrer "CONFIGURATION" - "AVANCÉ" - "CONFIGURATION DE LA MÉMOIRE" et appuyez sur Entrée - "EFFACER LES ERREURS DIMM" et appuyez directement sur Entrée.
14. Pourquoi le processeur signale-t-il une erreur ou un seul processeur est-il détecté lors de l'autotest ?
Solution:
Allumer -> Appuyez sur la touche F2 pour entrer dans "SETUP"
1. Allez dans « PRINCIPAL » --〉« PROCESSEUR » --〉« EFFACER LES ERREURS DU PROCESSEUR [ ] » : Définissez la valeur de cette option sur « OUI » ;
2. Cliquez sur « AVANCÉ » --> « RÉINITIALISER LES DONNÉES DE CONFIGURATION [ ] » : Définissez la valeur de cette option sur « OUI » ;
3. Cliquez sur « SERVEUR » --> « PROCESSOR RESET [ ] » : Définissez la valeur de cette option sur « OUI » ;
4. Cliquez sur « SERVEUR » -> « GESTION DU SYSTÈME » : Entrez --> « CLEAR EVENTLOG [ ] » : Définissez la valeur de cette option sur « OUI »
5. Appuyez sur F10 pour enregistrer et quitter.