一般的なサーバー障害
1. サーバーが起動できない主な理由は次のとおりです。
主電源または電力線の障害(停電または接触不良)
電源装置または電源モジュールの障害
メモリ障害(通常はアラーム音を伴います)
CPU障害(通常はアラーム音が鳴ります)
マザーボードの故障
他のプラグインカードによる割り込み競合
2. サーバーが起動できませんか?
電源コードや各種入出力配線が正しく接続されているか確認してください。
電源コードを接続した後、マザーボードの電源が入っているかどうかを確認します。
サーバーを最小構成 (単一の CPU、最小限のメモリのみを接続し、モニターとキーボードのみを接続) に設定し、マザーボードのスイッチ ジャンパーを直接短絡して、サーバーが起動できるかどうかを確認します。
電源を確認し、すべての電源インターフェイスを取り外し、電源のメインボード電源ポートの緑と黒のワイヤを短絡し、電源がオンになっているかどうかを確認します。
電源が正常であると判断された場合は、交換方法を使用してトラブルシューティングを行う必要があります。交換方法は、最小構成で最も交換しやすいアクセサリ (メモリ、CPU、マザーボード) から開始します。
3. システムが頻繁に再起動しますか?
システムが頻繁に再起動される理由:
停電(交換方法による判断と解決)
メモリ障害 (BIOS エラー レポートから検出できます)
ネットワークポートのデータトラフィックが大きすぎます(仕事のプレッシャーが高すぎます)
ソフトウェアの障害 (オペレーティング システムの更新または再インストールで解決します)
4. サーバークラッシュ障害の特定と処理:
サーバーのクラッシュ障害は判断が難しく、一般にソフトウェアとハードウェアの 2 つの側面に分けられます。
ソフトウェアの障害
ハードウェア障害
ソフトウェアの障害
まず、オペレーティング システムのシステム ログを確認します。システム ログを使用して、クラッシュの原因の一部を特定できます。
コンピュータウイルスの原因。
システムソフトウェアのバグや脆弱性によって引き起こされるクラッシュ。この種の障害は、ハードウェアに問題がないと判断した後に発生する必要があり、ソフトウェアプロバイダーがサポートを提供する必要があります。
ソフトウェアが不適切に使用されている場合、またはシステムの動作圧力が高すぎる場合は、問題が解決できるかどうかを確認するために、サーバーの動作圧力を適切に下げるよう顧客に依頼できます。
ハードウェア障害
ハードウェアの競合
サーバー電源のすべての負荷電力値を比較計算することで、停電や電力供給不足を判断できます。
ハードドライブの障害 (ハードドライブの表面をスキャンして不良セクタを確認します)
メモリ障害 (マザーボード BIOS のエラーレポートとオペレーティング システムのエラー メッセージによって判断できます)
マザーボードの障害 (交換方法を使用して判断します)
CPU故障(交換方法を使用)
ボードカードの障害 (通常、SCSI/RAID カードまたはその他の PCI デバイスもシステムクラッシュの原因となる可能性があり、解決策を決定するには交換方法を使用できます)
注: システム クラッシュ障害が解決された後、障害が完全に解決されたかどうかを確認するために、一定の期間内に特定のプレッシャー コピー テストを実行する必要があります。
5. オペレーティング システムをインストールするときに、ハードディスクが見つからないというメッセージが表示されます。
失敗の原因:
物理ハードディスクデバイスがありません
ハードドライブケーブル接続の問題
ハードディスク コントローラのドライバがインストールされていないか、ドライバに一貫性がありません。
6. ドライバーを入手するにはどうすればよいですか?
ランダム CD を使用して、対応するドライバーを作成します
[カットページ]
7. 正しいドライバーを使用しているにもかかわらず、ハードディスク コントローラー ドライバーをロードできないのはなぜですか?
hostraid機能が有効になっているか確認してください。
8. 新しく購入したハードディスクをマシンに取り付けた後、マシンがセルフテストに合格しませんか?
新しいハードドライブを取り外し、マシンがセルフテストに合格できるかどうかを確認します。
新しく追加したハードディスクの ID 番号が元のハードディスクの ID 番号と同じであるかどうかを確認します。 ハードディスクの ID 番号が同じである場合、セルフテストは失敗します。
9. SCSI ハードドライブをフォーマットするにはどうすればよいですか?
オペレーティング システムがある場合: ディスク管理ツールを使用してフォーマットします。
オペレーティング システムがない場合: SCSI 管理制御インターフェイスでフォーマットします。
ADAPTEC Raid カードを例に挙げます。電源をオンにします - CTRL+A メッセージが表示されたら、CTRL+A を押して入力します - チャンネル A を選択します
- SCSI UTILITYを確認してください - ハードドライブが検出されます - 検出されるハードドライブを確認してください
-フォーマットを選択してハードドライブを完全にフォーマットします
VERIFY を選択してハードディスクをテストし、不良セクタがあるかどうかを確認します。
注: ハードディスクのフォーマット中は中断したり停電したりしないでください。そうしないと、ディスクが損傷します。
10. Aisino シリーズには RAID カード マシンがありますが、ハード ドライブの 1 つが正常に動作せず、RAID アラームが発生しても、システムは正常に動作します。
新しいハード ドライブを使用し、正常に動作しないハード ドライブと同じかそれ以上の容量を確保します。同じモデルのハード ドライブと交換することをお勧めします。
RAID カードに関連する一般的な障害
カテゴリ 1: RAID カード自体に問題がある
RAID 情報が頻繁に失われる、ハードディスクが頻繁にオフラインになる、REBUILD が実行できない、電源投入時のセルフチェックでハードディスクが検出されない、または時間がかかる。
典型的な故障 A:
RAID1 を完了し、オペレーティング システムをインストールした後は、すべてが正常でした。しかし、システムを 2 回目に再起動すると、アラームが鳴り、REBUILD 後にハードディスクがオフラインになっていることがわかりました。しかし、再起動すると再びオフラインになりました。 HDDの故障が疑われ、HDDを確認したところ問題はありませんでした。最終的に、RAID カードを交換して問題は解決しました。
典型的な故障 B:
マシンが頻繁にフリーズし、起動が非常に遅くなることがあります。システム ログを観察すると、システム起動時に次のエラー メッセージがあったことがわかりました。デバイス /devices/scsi/port0 は送信待機時間中に応答しませんでした。 RAIDカードを交換したら正常に戻りました。
カテゴリ 2: ハードドライブ自体の問題
パフォーマンスとしては、ハードディスクがオフラインであるか、RAID アレイのステータスが DEAD であるか、REBUILD を実行すると、一定の進行後に進行を続行できなくなることがあります。
典型的な故障:
ハードディスクがオフラインになった後、REBUILDを実行すると、20%に達するとエラーメッセージが表示され、続行できません。オフラインのハードディスク、ハードディスクボックス、SCSI ケーブルがすべて正常に動作していることを確認した後、オンラインのハードディスクを検証し不良セクタを発見し、ハードディスクを修復し、REBUILD をやり直して正常な状態に戻します。
カテゴリ 3: ハードドライブボックスまたはモジュールの接触の問題
この種の問題は、RAID カードがハードディスクをまったく検出しないという形で現れることがよくありますが、この種の問題は比較的単純ですが、ハードディスク ボックスに関連するマシンを扱う場合には注意が必要な問題がいくつかあります。
典型的な故障:
RIAD カードでハードドライブが検出されません。SCSI ケーブルをマザーボードの ULTRA160 インターフェイスに接続しましたが、ハードドライブボックス (ハードドライブボックスの後ろのブラケットを除く) を取り外して交換しました。障害は解決しませんでした。ハードドライブを交換しましたが、それでも動作しませんでした。最後に、ハードドライブボックスの後ろにあるブラケット(非ホットスワップ対応部品)を取り外したところ、後部ブラケットの80PINインターフェースのピンが曲がっていたので、曲がったピンをまっすぐにして正常に戻しました。
11. サーバーで使用されている SCSI ハードディスクの ID 番号を 7 に設定できないのはなぜですか?
SCSIコントローラでは、デフォルトでハードディスクコントローラにID=7が設定されているため、ハードディスクのID番号を7に設定することはできません。
12. 電源投入時セルフテストに合格できないのはなぜですか?
解決:
マシンの電源を切り、シャーシを開け、「COMS CLEAR」ジャンパのジャンパ キャップを使用して、「COMS CLEAR」ジャンパの他の 2 つのピンをショートします (ジャンパについてはマザーボードのマニュアルを参照してください)。
マシンの電源をオンにしてセルフテストを実行します。マシンのセルフテストが完了すると、CMOS がクリアされたことが報告されます。その後、マシンの電源をオフにしてジャンパをリセットします。
マシンを再起動します
13. 物理メモリスロットエラー
解決:
コンピュータの電源を入れます - F2 を押して「SETUP」 - 「ADVANCED」 - 「MEMORY CONFIGURATION」 と入力し、Enter を押します - 「CLEAR DIMM ERRORS」 を押して Enter を直接押します。
14. セルフテスト中にプロセッサーがエラーを報告したり、プロセッサーが 1 つしか見つからなかったりするのはなぜですか?
解決:
電源オン --> F2 キーを押して「SETUP」に入ります。
1. 「メイン」 -->「プロセッサ」 -->「プロセッサ エラー [ ] のクリア」に移動します。このオプションの値を「YES」に設定します。
2. [詳細設定] --> [設定データのリセット [ ]] をクリックします。このオプションの値を [はい] に設定します。
3. 「サーバー」 --> 「プロセッサーリセット [ ]」 をクリックします。このオプションの値を「はい」に設定します。
4. 「サーバー」をクリックします --> 「システム管理」: Enter --> 「CLEAR EVENTLOG [ ]」: このオプションの値を「YES」に設定します
5. F10 を押して保存し、終了します。
[カットページ]7. 正しいドライバーを使用しているにもかかわらず、ハードディスク コントローラー ドライバーをロードできないのはなぜですか?
hostraid機能が有効になっているか確認してください。
8. 新しく購入したハードディスクをマシンに取り付けた後、マシンがセルフテストに合格しませんか?
新しいハードドライブを取り外し、マシンがセルフテストに合格できるかどうかを確認します。
新しく追加したハードディスクの ID 番号が元のハードディスクの ID 番号と同じであるかどうかを確認します。 ハードディスクの ID 番号が同じである場合、セルフテストは失敗します。
9. SCSI ハードドライブをフォーマットするにはどうすればよいですか?
オペレーティング システムがある場合: ディスク管理ツールを使用してフォーマットします。
オペレーティング システムがない場合: SCSI 管理制御インターフェイスでフォーマットします。
ADAPTEC Raid カードを例に挙げます。電源をオンにします - CTRL+A メッセージが表示されたら、CTRL+A を押して入力します - チャンネル A を選択します
- SCSI UTILITYを確認してください - ハードドライブが検出されます - 検出されるハードドライブを確認してください
-フォーマットを選択してハードドライブを完全にフォーマットします
VERIFY を選択してハードディスクをテストし、不良セクタがあるかどうかを確認します。
注: ハードディスクのフォーマット中は中断したり停電したりしないでください。そうしないと、ディスクが損傷します。
10. Aisino シリーズには RAID カード マシンがありますが、ハード ドライブの 1 つが正常に動作せず、RAID アラームが発生しても、システムは正常に動作します。
新しいハード ドライブを使用し、正常に動作しないハード ドライブと同じかそれ以上の容量を確保します。同じモデルのハード ドライブと交換することをお勧めします。
RAID カードに関連する一般的な障害
カテゴリ 1: RAID カード自体に問題がある
RAID 情報が頻繁に失われる、ハードディスクが頻繁にオフラインになる、REBUILD が実行できない、電源投入時のセルフチェックでハードディスクが検出されない、または時間がかかる。
典型的な故障 A:
RAID1 を完了し、オペレーティング システムをインストールした後は、すべてが正常でした。しかし、システムを 2 回目に再起動すると、アラームが鳴り、REBUILD 後にハードディスクがオフラインになっていることがわかりました。しかし、再起動すると再びオフラインになりました。 HDDの故障が疑われ、HDDを確認したところ問題はありませんでした。最終的に、RAID カードを交換して問題は解決しました。
典型的な故障 B:
マシンが頻繁にフリーズし、起動が非常に遅くなることがあります。システム ログを観察すると、システム起動時に次のエラー メッセージがあったことがわかりました。デバイス /devices/scsi/port0 は送信待機時間中に応答しませんでした。 RAIDカードを交換したら正常に戻りました。
カテゴリ 2: ハードドライブ自体の問題
パフォーマンスとしては、ハードディスクがオフラインであるか、RAID アレイのステータスが DEAD であるか、REBUILD を実行すると、一定の進行後に進行を続行できなくなることがあります。
典型的な故障:
ハードディスクがオフラインになった後、REBUILDを実行すると、20%に達するとエラーメッセージが表示され、続行できません。オフラインのハードディスク、ハードディスクボックス、SCSI ケーブルがすべて正常に動作していることを確認した後、オンラインのハードディスクを検証し不良セクタを発見し、ハードディスクを修復し、REBUILD をやり直して正常な状態に戻します。
カテゴリ 3: ハードドライブボックスまたはモジュールの接触の問題
この種の問題は、RAID カードがハードディスクをまったく検出しないという形で現れることがよくありますが、この種の問題は比較的単純ですが、ハードディスク ボックスに関連するマシンを扱う場合には注意が必要な問題がいくつかあります。
典型的な故障:
RIAD カードでハードドライブが検出されません。SCSI ケーブルをマザーボードの ULTRA160 インターフェイスに接続しましたが、ハードドライブボックス (ハードドライブボックスの後ろのブラケットを除く) を取り外して交換しました。障害は解決しませんでした。ハードドライブを交換しましたが、それでも動作しませんでした。最後に、ハードドライブボックスの後ろにあるブラケット(非ホットスワップ対応部品)を取り外したところ、後部ブラケットの80PINインターフェースのピンが曲がっていたので、曲がったピンをまっすぐにして正常に戻しました。
11. サーバーで使用されている SCSI ハードディスクの ID 番号を 7 に設定できないのはなぜですか?
SCSIコントローラでは、デフォルトでハードディスクコントローラにID=7が設定されているため、ハードディスクのID番号を7に設定することはできません。
12. 電源投入時セルフテストに合格できないのはなぜですか?
解決:
マシンの電源を切り、シャーシを開け、「COMS CLEAR」ジャンパのジャンパ キャップを使用して、「COMS CLEAR」ジャンパの他の 2 つのピンをショートします (ジャンパについてはマザーボードのマニュアルを参照してください)。
マシンの電源をオンにしてセルフテストを実行します。マシンのセルフテストが完了すると、CMOS がクリアされたことが報告されます。その後、マシンの電源をオフにしてジャンパをリセットします。
マシンを再起動します
13. 物理メモリスロットエラー
解決:
コンピュータの電源を入れます - F2 を押して「SETUP」 - 「ADVANCED」 - 「MEMORY CONFIGURATION」 と入力し、Enter を押します - 「CLEAR DIMM ERRORS」 を押して Enter を直接押します。
14. セルフテスト中にプロセッサーがエラーを報告したり、プロセッサーが 1 つしか見つからなかったりするのはなぜですか?
解決:
電源オン --> F2 キーを押して「SETUP」に入ります。
1. 「メイン」 -->「プロセッサ」 -->「プロセッサ エラー [ ] のクリア」に移動します。このオプションの値を「YES」に設定します。
2. [詳細設定] --> [設定データのリセット [ ]] をクリックします。このオプションの値を [はい] に設定します。
3. 「サーバー」 --> 「プロセッサーリセット [ ]」 をクリックします。このオプションの値を「はい」に設定します。
4. 「サーバー」をクリックします --> 「システム管理」: Enter --> 「CLEAR EVENTLOG [ ]」: このオプションの値を「YES」に設定します
5. F10 を押して保存し、終了します。