Распространенные сбои сервера
1. Основные причины, по которым не может запуститься сервер:
Сбой в сети или линии электропередачи (отключение электроэнергии или плохой контакт)
Неисправность блока питания или модуля питания
Сбой памяти (обычно сопровождается звуковым сигналом)
Сбой процессора (обычно раздается звуковой сигнал)
Сбой материнской платы
Конфликты прерываний, вызванные другими сменными платами
2. Сервер не может запуститься?
Проверьте правильность подключения шнура питания и различных проводов ввода-вывода.
Проверьте, включена ли материнская плата после подключения шнура питания.
Установите для сервера минимальную конфигурацию (подключите только один процессор, минимальный объем памяти и подключите только монитор и клавиатуру) и замкните перемычку переключателя материнской платы напрямую, чтобы проверить, сможет ли он запуститься.
Проверьте источник питания, отсоедините все интерфейсы питания, закоротите зеленый и черный провода порта питания материнской платы и проверьте, включено ли питание.
Если будет установлено, что блок питания в порядке, для устранения неполадок необходимо использовать метод замены. Метод замены — начать с самых простых в замене аксессуаров (память, процессор, материнская плата) в минимальной конфигурации.
3. Система часто перезагружается?
Причины частых перезагрузок системы:
Сбой электропитания (оценка и решение методом замены)
Сбой памяти (можно обнаружить из отчета об ошибках BIOS)
Трафик данных сетевого порта слишком велик (слишком высокая рабочая нагрузка)
Программный сбой (решается обновлением или переустановкой операционной системы)
4. Определение и обработка сбоев сервера:
Сбои сервера сложно определить, и они обычно делятся на два аспекта: программный и аппаратный:
Сбой программного обеспечения
Аппаратный сбой
Сбой программного обеспечения
Сначала проверьте системный журнал операционной системы. Вы можете использовать системный журнал, чтобы определить некоторые причины сбоя.
Причины компьютерных вирусов.
Сбой, вызванный ошибкой или уязвимостью в системном программном обеспечении. Этот тип сбоя должен быть совершен после того, как будет установлено, что оборудование исправно, и поставщик программного обеспечения должен предоставить помощь.
Если программное обеспечение используется неправильно или рабочее давление системы слишком велико, вы можете попросить клиента соответствующим образом снизить рабочее давление сервера, чтобы посмотреть, можно ли решить эту проблему.
Аппаратный сбой
Аппаратный конфликт
Сбой питания или недостаточное электропитание можно определить путем сравнения и расчета всех значений мощности нагрузки блока питания сервера.
Сбой жесткого диска (проверьте наличие поврежденных секторов путем сканирования поверхности жесткого диска)
Сбой памяти (о чем можно судить по отчету об ошибке в BIOS материнской платы и сообщению об ошибке операционной системы)
Неисправность материнской платы (для определения используйте метод замены)
Сбой ЦП (методом замены)
Сбой платы платы (обычно карта SCSI/RAID или другое устройство PCI также может привести к сбою системы, и для определения решения можно использовать метод замены)
Примечание. После устранения сбоя системы в течение определенного периода времени необходимо выполнить определенное тестирование копирования под давлением, чтобы проверить, полностью ли устранена неисправность.
5. При установке операционной системы выдает сообщение, что жесткий диск не найден?
Причина неудачи:
Нет физического жесткого диска
Проблема с подключением кабеля жесткого диска
Драйвер контроллера жесткого диска не установлен или драйвер несовместим.
6. Как получить драйвер?
Используйте случайный компакт-диск для создания соответствующего драйвера.
[Вырезанная страница]
7. Почему не удается загрузить драйвер контроллера жесткого диска даже с правильным драйвером?
Проверьте, включена ли функция хострейда.
8. После установки в аппарат только что приобретенного жесткого диска аппарат не прошел самотестирование?
Извлеките новый жесткий диск и посмотрите, сможет ли машина пройти самотестирование;
Проверьте, совпадает ли идентификационный номер вновь добавленного жесткого диска с идентификационным номером исходного жесткого диска. Если идентификационный номер жесткого диска такой же, самотестирование завершится неудачей.
9. Как отформатировать жесткий диск SCSI?
Если есть операционная система: используйте для форматирования утилиту управления дисками;
Если операционная система отсутствует: Отформатируйте интерфейс управления управлением SCSI;
В качестве примера возьмем карту ADAPTEC Raid: включите питание — когда появится сообщение CTRL+A, нажмите CTRL+A для входа — выберите канал A
- Проверьте SCSI UTILITY. - Жесткий диск будет обнаружен. - Проверьте, какой жесткий диск должен быть обнаружен.
-Выберите ФОРМАТ, чтобы полностью отформатировать жесткий диск.
Выберите VERIFY, чтобы протестировать жесткий диск и проверить наличие поврежденных секторов.
Примечание. Не прерывайте работу и не отключайте питание при форматировании жесткого диска, иначе диск будет поврежден.
10. В серии Aisino имеется машина с картой RAID. Если один из жестких дисков не работает должным образом и возникает сигнал тревоги RAID, но система может работать нормально, что мне делать?
Используйте новый жесткий диск, убедившись, что его емкость больше или равна емкости жесткого диска, который работает неправильно. Лучше всего заменить его жестким диском той же модели.
Распространенные неисправности, связанные с картами RAID
Категория 1: Проблема с самой картой RAID.
Информация RAID часто теряется, жесткий диск часто отключается, REBUILD не может быть выполнен, а жесткий диск не может быть обнаружен во время самопроверки при включении питания или занимает много времени.
Типичная ошибка А:
После завершения RAID1 и установки операционной системы все было нормально. Однако при вторичной перезагрузке системы прозвучал сигнал тревоги. После проверки выяснилось, что жесткий диск отключен. После REBUILD он вернулся в нормальное состояние. но после перезапуска он снова был отключен от сети. Было подозрение, что винчестер неисправен, и после проверки винчестера проблем не возникло. Наконец, карта RAID была заменена, и неисправность устранена.
Типичная ошибка Б:
Машина часто зависает и иногда очень медленно запускается. Просматривая системный журнал, мы обнаружили, что при запуске системы появилось сообщение об ошибке: устройство /devices/scsi/port0 не ответило во время ожидания передачи. После замены RAID-карты все вернулось в норму.
Категория 2: Проблемы с самим жестким диском
Производительность такова, что жесткий диск находится в автономном режиме, статус в RAID-массиве DEAD или при выполнении REBUILD прогресс не может быть продолжен после определенного прогресса.
Типичные неисправности:
После того, как жесткий диск отключится, при выполнении REBUILD появляется сообщение об ошибке при достижении 20% и продолжить невозможно. Убедившись, что автономный жесткий диск, жесткий диск и кабель SCSI работают нормально, онлайновый жесткий диск проверяется и обнаруживаются поврежденные сектора. Восстановите жесткий диск и повторите REBUILD, чтобы восстановить его нормальное состояние.
Категория 3: Проблемы с контактами блоков или модулей жестких дисков.
Проблема такого рода часто проявляется в том, что карта RAID вообще не обнаруживает жесткий диск. Проблема такого рода относительно проста, но есть некоторые проблемы, на которые следует обратить внимание при работе с машинами, связанными с блоками с жесткими дисками.
Типичные неисправности:
Жесткий диск не обнаруживается на карте RIAD. Я подключил кабель SCSI к интерфейсу ULTRA160 на материнской плате. Неисправность не исчезла. Я вытащил блок жесткого диска (за исключением кронштейна позади блока жесткого диска) и заменил его. неисправность не исчезла. Я заменил жесткий диск, но он все равно не работал. Наконец, я снял кронштейн (деталь, не допускающую горячей замены) за корпусом жесткого диска и обнаружил, что штифт 80-контактного интерфейса на заднем кронштейне погнут. Я выпрямил согнутый штифт и вернул его в нормальное состояние.
11. Почему нельзя установить идентификационный номер жесткого диска SCSI, используемого на сервере, равным 7?
В контроллере SCSI по умолчанию ID=7 установлен для контроллера жесткого диска, поэтому идентификационный номер жесткого диска не может быть установлен равным 7.
12. Почему я не могу пройти самотестирование при включении?
Решение:
Выключите питание машины, откройте корпус и с помощью колпачка перемычки «COMS CLEAR» закоротите два других контакта перемычки «COMS CLEAR» (перемычки см. в руководстве по материнской плате).
Включите аппарат и выполните самотестирование. После завершения самотестирования появится сообщение о том, что CMOS очищена. Затем выключите питание аппарата и сбросьте перемычку.
Перезагрузите машину.
13. Ошибка слота физической памяти.
Решение:
Включите компьютер — нажмите F2, чтобы войти в «НАСТРОЙКИ» — «ДОПОЛНИТЕЛЬНЫЕ» — «КОНФИГУРАЦИЯ ПАМЯТИ», нажмите Enter — «ОЧИСТИТЬ ОШИБКИ DIMM» и сразу нажмите Enter.
14. Почему процессор сообщает об ошибке или при самотестировании обнаруживается только один процессор?
Решение:
Включение -> Нажмите клавишу F2, чтобы войти в «НАСТРОЙКА».
1. Перейдите к «ГЛАВНОМУ» --〉 «ПРОЦЕССОР» --〉 «ОЧИСТИТЬ ОШИБКИ ПРОЦЕССОРА [ ]»: установите значение этой опции на «ДА»;
2. Нажмите «ДОПОЛНИТЕЛЬНО» --> «СБРОС ДАННЫХ КОНФИГУРАЦИИ [ ]»: установите значение этой опции на «ДА»;
3. Нажмите «СЕРВЕР» --> «СБРОС ПРОЦЕССОРА [ ]»: установите значение этой опции на «ДА»;
4. Нажмите «СЕРВЕР» --> «УПРАВЛЕНИЕ СИСТЕМОЙ»: введите -> «ОЧИСТИТЬ ЖУРНАЛ СОБЫТИЙ [ ]»: установите значение этой опции на «ДА».
5. Нажмите F10, чтобы сохранить изменения и выйти.
[Вырезанная страница]7. Почему не удается загрузить драйвер контроллера жесткого диска даже с правильным драйвером?
Проверьте, включена ли функция хострейда.
8. После установки в аппарат только что приобретенного жесткого диска аппарат не прошел самотестирование?
Извлеките новый жесткий диск и посмотрите, сможет ли машина пройти самотестирование;
Проверьте, совпадает ли идентификационный номер вновь добавленного жесткого диска с идентификационным номером исходного жесткого диска. Если идентификационный номер жесткого диска такой же, самотестирование завершится неудачей.
9. Как отформатировать жесткий диск SCSI?
Если есть операционная система: используйте для форматирования утилиту управления дисками;
Если операционная система отсутствует: Отформатируйте интерфейс управления управлением SCSI;
В качестве примера возьмем карту ADAPTEC Raid: включите питание — когда появится сообщение CTRL+A, нажмите CTRL+A для входа — выберите канал A
- Проверьте SCSI UTILITY. - Жесткий диск будет обнаружен. - Проверьте, какой жесткий диск должен быть обнаружен.
-Выберите ФОРМАТ, чтобы полностью отформатировать жесткий диск.
Выберите VERIFY, чтобы протестировать жесткий диск и проверить наличие поврежденных секторов.
Примечание. Не прерывайте работу и не отключайте питание при форматировании жесткого диска, иначе диск будет поврежден.
10. В серии Aisino имеется машина с картой RAID. Если один из жестких дисков не работает должным образом и возникает сигнал тревоги RAID, но система может работать нормально, что мне делать?
Используйте новый жесткий диск, убедившись, что его емкость больше или равна емкости жесткого диска, который работает неправильно. Лучше всего заменить его жестким диском той же модели.
Распространенные неисправности, связанные с картами RAID
Категория 1: Проблема с самой картой RAID.
Информация RAID часто теряется, жесткий диск часто отключается, REBUILD не может быть выполнен, а жесткий диск не может быть обнаружен во время самопроверки при включении питания или занимает много времени.
Типичная ошибка А:
После завершения RAID1 и установки операционной системы все было нормально. Однако при вторичной перезагрузке системы прозвучал сигнал тревоги. После проверки выяснилось, что жесткий диск отключен. После REBUILD он вернулся в нормальное состояние. но после перезапуска он снова был отключен от сети. Было подозрение, что винчестер неисправен, и после проверки винчестера проблем не возникло. Наконец, карта RAID была заменена, и неисправность устранена.
Типичная ошибка Б:
Машина часто зависает и иногда очень медленно запускается. Просматривая системный журнал, мы обнаружили, что при запуске системы появилось сообщение об ошибке: устройство /devices/scsi/port0 не ответило во время ожидания передачи. После замены RAID-карты все вернулось в норму.
Категория 2: Проблемы с самим жестким диском
Производительность такова, что жесткий диск находится в автономном режиме, статус в RAID-массиве DEAD или при выполнении REBUILD прогресс не может быть продолжен после определенного прогресса.
Типичные неисправности:
После того, как жесткий диск отключится, при выполнении REBUILD появляется сообщение об ошибке при достижении 20% и продолжить невозможно. Убедившись, что автономный жесткий диск, жесткий диск и кабель SCSI работают нормально, онлайновый жесткий диск проверяется и обнаруживаются поврежденные сектора. Восстановите жесткий диск и повторите REBUILD, чтобы восстановить его нормальное состояние.
Категория 3: Проблемы с контактами блоков или модулей жестких дисков.
Проблема такого рода часто проявляется в том, что карта RAID вообще не обнаруживает жесткий диск. Проблема такого рода относительно проста, но есть некоторые проблемы, на которые следует обратить внимание при работе с машинами, связанными с блоками с жесткими дисками.
Типичные неисправности:
Жесткий диск не обнаруживается на карте RIAD. Я подключил кабель SCSI к интерфейсу ULTRA160 на материнской плате. Неисправность не исчезла. Я вытащил блок жесткого диска (за исключением кронштейна позади блока жесткого диска) и заменил его. неисправность не исчезла. Я заменил жесткий диск, но он все равно не работал. Наконец, я снял кронштейн (деталь, не допускающую горячей замены) за корпусом жесткого диска и обнаружил, что штифт 80-контактного интерфейса на заднем кронштейне погнут. Я выпрямил согнутый штифт и вернул его в нормальное состояние.
11. Почему нельзя установить идентификационный номер жесткого диска SCSI, используемого на сервере, равным 7?
В контроллере SCSI по умолчанию ID=7 установлен для контроллера жесткого диска, поэтому идентификационный номер жесткого диска не может быть установлен равным 7.
12. Почему я не могу пройти самотестирование при включении?
Решение:
Выключите питание машины, откройте корпус и с помощью колпачка перемычки «COMS CLEAR» закоротите два других контакта перемычки «COMS CLEAR» (перемычки см. в руководстве по материнской плате).
Включите аппарат и выполните самотестирование. После завершения самотестирования появится сообщение о том, что CMOS очищена. Затем выключите питание аппарата и сбросьте перемычку.
Перезагрузите машину.
13. Ошибка слота физической памяти.
Решение:
Включите компьютер — нажмите F2, чтобы войти в «НАСТРОЙКИ» — «ДОПОЛНИТЕЛЬНЫЕ» — «КОНФИГУРАЦИЯ ПАМЯТИ», нажмите Enter — «ОЧИСТИТЬ ОШИБКИ DIMM» и сразу нажмите Enter.
14. Почему процессор сообщает об ошибке или при самотестировании обнаруживается только один процессор?
Решение:
Включение -> Нажмите клавишу F2, чтобы войти в «НАСТРОЙКА».
1. Перейдите к «ГЛАВНОМУ» --〉 «ПРОЦЕССОР» --〉 «ОЧИСТИТЬ ОШИБКИ ПРОЦЕССОРА [ ]»: установите значение этой опции на «ДА»;
2. Нажмите «ДОПОЛНИТЕЛЬНО» --> «СБРОС ДАННЫХ КОНФИГУРАЦИИ [ ]»: установите значение этой опции на «ДА»;
3. Нажмите «СЕРВЕР» --> «СБРОС ПРОЦЕССОРА [ ]»: установите значение этой опции на «ДА»;
4. Нажмите «СЕРВЕР» --> «УПРАВЛЕНИЕ СИСТЕМОЙ»: введите -> «ОЧИСТИТЬ ЖУРНАЛ СОБЫТИЙ [ ]»: установите значение этой опции на «ДА».
5. Нажмите F10, чтобы сохранить изменения и выйти.