Kegagalan server yang umum
1. Alasan utama mengapa server tidak dapat dijalankan:
Kegagalan listrik atau saluran listrik (listrik padam atau kontak buruk)
Kegagalan catu daya atau modul daya
Kegagalan memori (biasanya disertai bunyi alarm)
Kegagalan CPU (umumnya akan ada bunyi alarm)
Kegagalan motherboard
Konflik interupsi yang disebabkan oleh kartu plug-in lainnya
2. Server tidak dapat dijalankan?
Periksa apakah kabel daya dan berbagai kabel I/O tersambung dengan benar.
Periksa apakah motherboard dihidupkan setelah menyambungkan kabel daya.
Atur server ke konfigurasi minimum (hanya menghubungkan satu CPU, memori minimal, dan hanya menghubungkan monitor dan keyboard) dan langsung menghubungkan jumper saklar motherboard untuk melihat apakah dapat dimulai.
Periksa catu daya, cabut semua antarmuka daya, hubungan arus pendek kabel hijau dan hitam dari port catu daya mainboard dari catu daya, dan lihat apakah daya dihidupkan.
Jika dinilai catu daya normal, Anda perlu menggunakan metode penggantian untuk memecahkan masalah. Metode penggantian adalah memulai dengan aksesori yang paling mudah diganti (memori, CPU, motherboard) dalam konfigurasi minimal.
3. Sistem sering restart?
Alasan seringnya restart sistem:
Kegagalan daya (penilaian dan solusi dengan metode penggantian)
Kegagalan memori (dapat dideteksi dari laporan kesalahan BIOS)
Lalu lintas data port jaringan terlalu besar (tekanan kerja terlalu tinggi)
Kegagalan perangkat lunak (diselesaikan dengan memperbarui atau menginstal ulang sistem operasi)
4. Menentukan dan menangani kegagalan server crash:
Kegagalan server crash sulit ditentukan dan umumnya dibagi menjadi dua aspek: perangkat lunak dan perangkat keras:
Kegagalan perangkat lunak
Kegagalan perangkat keras
Kegagalan perangkat lunak
Pertama periksa log sistem sistem operasi. Anda dapat menggunakan log sistem untuk menentukan beberapa penyebab kerusakan.
Penyebab virus komputer.
Kegagalan yang disebabkan oleh bug atau kerentanan pada perangkat lunak sistem perlu dilakukan setelah menilai bahwa perangkat kerasnya sempurna, dan penyedia perangkat lunak perlu memberikan bantuan.
Jika perangkat lunak digunakan secara tidak benar atau tekanan kerja sistem terlalu tinggi, Anda dapat meminta pelanggan untuk mengurangi tekanan kerja server dengan tepat untuk melihat apakah masalah tersebut dapat diselesaikan.
Kegagalan perangkat keras
Konflik perangkat keras
Kegagalan daya atau catu daya tidak mencukupi dapat ditentukan dengan membandingkan dan menghitung semua nilai daya beban catu daya server.
Kegagalan hard drive (periksa bad sector dengan memindai permukaan hard drive)
Kegagalan memori (dapat dinilai dari laporan kesalahan di BIOS motherboard dan pesan kesalahan sistem operasi)
Kegagalan motherboard (gunakan metode penggantian untuk menentukan)
Kegagalan CPU (menggunakan metode penggantian)
Kegagalan kartu board (biasanya kartu SCSI/RAID atau perangkat PCI lainnya juga dapat menyebabkan sistem mogok, dan metode penggantian dapat digunakan untuk menentukan solusinya)
Catatan: Setelah kesalahan kerusakan sistem teratasi, pengujian penyalinan tekanan tertentu harus dilakukan dalam jangka waktu tertentu untuk memeriksa apakah kesalahan telah teratasi sepenuhnya.
5. Saat menginstal sistem operasi, muncul pesan bahwa hard disk tidak dapat ditemukan?
Penyebab kegagalan:
Tidak ada perangkat hard disk fisik
Masalah sambungan kabel harddisk
Driver pengontrol hard disk tidak diinstal atau driver tidak konsisten.
6. Bagaimana cara mendapatkan drivernya?
Gunakan CD acak untuk membuat driver yang sesuai
[Potong Halaman]
7. Mengapa driver pengontrol hard disk tidak dapat dimuat meskipun dengan driver yang benar?
Periksa apakah fungsi hostraid diaktifkan.
8. Setelah memasang hard disk yang baru dibeli ke dalam mesin, mesin gagal lulus uji mandiri?
Lepaskan hard drive baru dan lihat apakah mesin dapat lulus uji mandiri;
Periksa apakah nomor ID hard disk yang baru ditambahkan sama dengan nomor ID hard disk asli. Jika nomor ID hard disk sama, pengujian mandiri akan gagal.
9. Bagaimana cara memformat harddisk SCSI?
Jika ada sistem operasi: gunakan alat manajemen disk untuk memformat;
Jika tidak ada sistem operasi: Format pada antarmuka kontrol manajemen SCSI;
Ambil kartu ADAPTEC Raid sebagai contoh: nyalakan - ketika pesan CTRL+A muncul, tekan CTRL+A untuk masuk - pilih saluran A
- Cek SCSI UTILITY - Hardisk akan terdeteksi - Cek hardisk akan terdeteksi
-Pilih FORMAT untuk memformat hard drive sepenuhnya
Pilih VERIFY untuk menguji harddisk dan memeriksa apakah terdapat bad sector.
Catatan: Jangan ganggu atau matikan listrik saat memformat hard disk, jika tidak, disk akan rusak.
10. Ada mesin kartu RAID seri Aisino. Ketika salah satu hard drive tidak berfungsi dengan baik dan alarm RAID muncul, tetapi sistem dapat berjalan normal, apa yang harus saya lakukan?
Gunakan harddisk baru, pastikan kapasitasnya lebih besar atau sama dengan harddisk yang tidak berfungsi dengan baik. Sebaiknya ganti dengan harddisk dengan model yang sama.
Kesalahan umum terkait dengan kartu RAID
Kategori 1: Ada masalah dengan kartu RAID itu sendiri
Informasi RAID sering hilang, hard disk sering offline, REBUILD tidak dapat dilakukan, dan hard disk tidak dapat dideteksi saat power-on self-check atau memerlukan waktu lama.
Kesalahan khas A:
Setelah menyelesaikan RAID1 dan menginstal sistem operasi, semuanya normal. Namun, ketika sistem di-restart untuk kedua kalinya, alarm berbunyi. Setelah diperiksa, ditemukan bahwa hard disk sedang offline. tapi offline lagi setelah restart. Diduga harddisknya rusak, dan tidak ada masalah setelah dilakukan pengecekan harddisk. Akhirnya, kartu RAID diganti dan kesalahan teratasi.
Kesalahan khas B:
Mesin sering macet dan terkadang hidup sangat lambat. Mengamati log sistem, kami menemukan ada pesan kesalahan saat sistem dimulai: perangkat /devices/scsi/port0 tidak merespons selama waktu tunggu transmisi. Setelah mengganti kartu RAID, kembali normal.
Kategori 2: Masalah pada harddisk itu sendiri
Performanya adalah hard disk offline, status di array RAID DEAD, atau saat melakukan REBUILD, progres tidak dapat dilanjutkan setelah progres tertentu.
Kesalahan umum:
Setelah hardisk offline, pada saat melakukan REBUILD muncul pesan error saat mencapai 20% dan tidak dapat dilanjutkan. Setelah memastikan bahwa hard disk offline, kotak hard disk, dan kabel SCSI semuanya berfungsi normal, hard disk online diverifikasi dan ditemukan bad sector. Perbaiki hard disk dan ulangi REBUILD untuk mengembalikannya ke normal.
Kategori 3: Masalah kontak dengan kotak atau modul hard drive
Masalah seperti ini sering kali muncul ketika kartu RAID tidak mendeteksi hard disk sama sekali. Masalah seperti ini relatif sederhana, namun ada beberapa masalah yang perlu diperhatikan saat menangani mesin yang terkait dengan kotak hard disk.
Kesalahan umum:
Hard drive tidak dapat terdeteksi di kartu RIAD. Saya menghubungkan kabel SCSI ke antarmuka ULTRA160 pada motherboard. Kesalahan tetap ada. Saya mengeluarkan kotak hard drive (tidak termasuk braket di belakang kotak hard drive) dan menggantinya kesalahan tetap terjadi. Saya mengganti hard drive, tetapi tetap tidak berhasil. Akhirnya, saya melepas braket (bagian yang tidak dapat ditukar panas) di belakang kotak hard drive dan menemukan bahwa pin pada antarmuka 80PIN di braket belakang bengkok.
11. Mengapa nomor ID hard disk SCSI yang digunakan di server tidak bisa disetel ke 7?
Pada pengontrol SCSI, ID=7 diatur ke pengontrol hard disk secara default, sehingga nomor ID hard disk tidak dapat diatur ke 7.
12. Mengapa saya tidak dapat lulus uji mandiri penyalaan daya?
Larutan:
Matikan daya mesin, buka sasis, dan gunakan tutup jumper dari jumper "COMS CLEAR" untuk melakukan hubungan arus pendek pada dua pin lainnya dari jumper "COMS CLEAR" (lihat manual motherboard untuk jumper).
Nyalakan mesin dan lakukan self-test. Setelah mesin self-test selesai, akan dilaporkan bahwa CMOS telah dibersihkan.
Nyalakan ulang mesin
13. Kesalahan slot memori fisik
Larutan:
Nyalakan komputer - tekan F2 untuk masuk ke "SETUP" - "ADVANCED" - "MEMORY CONFIGURATION" dan tekan Enter - "CLEAR DIMM ERRORS" dan langsung tekan Enter.
14. Mengapa prosesor melaporkan kesalahan atau hanya satu prosesor yang ditemukan selama pengujian mandiri?
Larutan:
Nyalakan-->Tekan tombol F2 untuk masuk ke "SETUP"
1. Masuk ke "MAIN" --〉"PROCESSOR" --〉"CLEAR PROCESSOR ERRORS [ ]": Setel nilai opsi ini ke "YES";
2. Klik "ADVANCED " --> "RESET CONFIGURATION DATA [ ] ": Tetapkan nilai opsi ini ke " YES";
3. Klik "SERVER " --> "PROCESSOR RESET [ ] ": Tetapkan nilai opsi ini ke " YES";
4. Klik "SERVER " --> "SYSTEM MANAGEMENT ": Enter --> "CLEAR EVENTLOG [ ] ": Tetapkan nilai opsi ini ke " YES"
5. Tekan F10 untuk menyimpan dan keluar.
[Potong Halaman]7. Mengapa driver pengontrol hard disk tidak dapat dimuat meskipun dengan driver yang benar?
Periksa apakah fungsi hostraid diaktifkan.
8. Setelah memasang hard disk yang baru dibeli ke dalam mesin, mesin gagal lulus uji mandiri?
Lepaskan hard drive baru dan lihat apakah mesin dapat lulus uji mandiri;
Periksa apakah nomor ID hard disk yang baru ditambahkan sama dengan nomor ID hard disk asli. Jika nomor ID hard disk sama, pengujian mandiri akan gagal.
9. Bagaimana cara memformat harddisk SCSI?
Jika ada sistem operasi: gunakan alat manajemen disk untuk memformat;
Jika tidak ada sistem operasi: Format pada antarmuka kontrol manajemen SCSI;
Ambil kartu ADAPTEC Raid sebagai contoh: nyalakan - ketika pesan CTRL+A muncul, tekan CTRL+A untuk masuk - pilih saluran A
- Cek SCSI UTILITY - Hardisk akan terdeteksi - Cek hardisk akan terdeteksi
-Pilih FORMAT untuk memformat hard drive sepenuhnya
Pilih VERIFY untuk menguji harddisk dan memeriksa apakah terdapat bad sector.
Catatan: Jangan ganggu atau matikan listrik saat memformat hard disk, jika tidak, disk akan rusak.
10. Ada mesin kartu RAID seri Aisino. Ketika salah satu hard drive tidak berfungsi dengan baik dan alarm RAID muncul, tetapi sistem dapat berjalan normal, apa yang harus saya lakukan?
Gunakan harddisk baru, pastikan kapasitasnya lebih besar atau sama dengan harddisk yang tidak berfungsi dengan baik. Sebaiknya ganti dengan harddisk dengan model yang sama.
Kesalahan umum terkait dengan kartu RAID
Kategori 1: Ada masalah dengan kartu RAID itu sendiri
Informasi RAID sering hilang, hard disk sering offline, REBUILD tidak dapat dilakukan, dan hard disk tidak dapat dideteksi saat power-on self-check atau memerlukan waktu lama.
Kesalahan khas A:
Setelah menyelesaikan RAID1 dan menginstal sistem operasi, semuanya normal. Namun, ketika sistem di-restart untuk kedua kalinya, alarm berbunyi. Setelah diperiksa, ditemukan bahwa hard disk sedang offline. tapi offline lagi setelah restart. Diduga harddisknya rusak, dan tidak ada masalah setelah dilakukan pengecekan harddisk. Akhirnya, kartu RAID diganti dan kesalahan teratasi.
Kesalahan khas B:
Mesin sering macet dan terkadang hidup sangat lambat. Mengamati log sistem, kami menemukan ada pesan kesalahan saat sistem dimulai: perangkat /devices/scsi/port0 tidak merespons selama waktu tunggu transmisi. Setelah mengganti kartu RAID, kembali normal.
Kategori 2: Masalah pada harddisk itu sendiri
Performanya adalah hard disk offline, status di array RAID DEAD, atau saat melakukan REBUILD, progres tidak dapat dilanjutkan setelah progres tertentu.
Kesalahan umum:
Setelah hardisk offline, pada saat melakukan REBUILD muncul pesan error saat mencapai 20% dan tidak dapat dilanjutkan. Setelah memastikan bahwa hard disk offline, kotak hard disk, dan kabel SCSI semuanya berfungsi normal, hard disk online diverifikasi dan ditemukan bad sector. Perbaiki hard disk dan ulangi REBUILD untuk mengembalikannya ke normal.
Kategori 3: Masalah kontak dengan kotak atau modul hard drive
Masalah seperti ini sering kali muncul ketika kartu RAID tidak mendeteksi hard disk sama sekali. Masalah seperti ini relatif sederhana, namun ada beberapa masalah yang perlu diperhatikan saat menangani mesin yang terkait dengan kotak hard disk.
Kesalahan umum:
Hard drive tidak dapat terdeteksi di kartu RIAD. Saya menghubungkan kabel SCSI ke antarmuka ULTRA160 pada motherboard. Kesalahan tetap ada. Saya mengeluarkan kotak hard drive (tidak termasuk braket di belakang kotak hard drive) dan menggantinya kesalahan tetap terjadi. Saya mengganti hard drive, tetapi tetap tidak berhasil. Akhirnya, saya melepas braket (bagian yang tidak dapat ditukar panas) di belakang kotak hard drive dan menemukan bahwa pin pada antarmuka 80PIN di braket belakang bengkok.
11. Mengapa nomor ID hard disk SCSI yang digunakan di server tidak bisa disetel ke 7?
Pada pengontrol SCSI, ID=7 diatur ke pengontrol hard disk secara default, sehingga nomor ID hard disk tidak dapat diatur ke 7.
12. Mengapa saya tidak dapat lulus uji mandiri penyalaan daya?
Larutan:
Matikan daya mesin, buka sasis, dan gunakan tutup jumper dari jumper "COMS CLEAR" untuk melakukan hubungan arus pendek pada dua pin lainnya dari jumper "COMS CLEAR" (lihat manual motherboard untuk jumper).
Nyalakan mesin dan lakukan self-test. Setelah mesin self-test selesai, akan dilaporkan bahwa CMOS telah dibersihkan.
Nyalakan ulang mesin
13. Kesalahan slot memori fisik
Larutan:
Nyalakan komputer - tekan F2 untuk masuk ke "SETUP" - "ADVANCED" - "MEMORY CONFIGURATION" dan tekan Enter - "CLEAR DIMM ERRORS" dan langsung tekan Enter.
14. Mengapa prosesor melaporkan kesalahan atau hanya satu prosesor yang ditemukan selama pengujian mandiri?
Larutan:
Nyalakan-->Tekan tombol F2 untuk masuk ke "SETUP"
1. Masuk ke "MAIN" --〉"PROCESSOR" --〉"CLEAR PROCESSOR ERRORS [ ]": Setel nilai opsi ini ke "YES";
2. Klik "ADVANCED " --> "RESET CONFIGURATION DATA [ ] ": Tetapkan nilai opsi ini ke " YES";
3. Klik "SERVER " --> "PROCESSOR RESET [ ] ": Tetapkan nilai opsi ini ke " YES";
4. Klik "SERVER " --> "SYSTEM MANAGEMENT ": Enter --> "CLEAR EVENTLOG [ ] ": Tetapkan nilai opsi ini ke " YES"
5. Tekan F10 untuk menyimpan dan keluar.