「人間の心が足りなければ、蛇は象を飲み込む」という諺があるように、前回の基本的な要件を満たした後は、より高度な機能要件を満たす必要があります。
1. 複数拠点・複数回線の同時監視
複数の監視拠点とは、広州、北京、重慶などの複数の拠点で監視するなど、異なる場所にあるWebサイトやサーバーを同時に監視することを指し、いずれかの拠点で障害が検出された場合はアラームが発行されます。複数回線とは、同時に監視するために異なる回線 (電信、チャイナユニコム、中国鉄道通信など) を使用することを指します。 Guangzhou Telecom、Beijing Unicom など、場所と回線が併用されます。
中国のインターネットは人工的に北と南に分かれており、南は主に電信、北は主にチャイナユニコム(旧チャイナネットコム)とその他の教育ネットワーク、中国鉄道などがある。異なるネットワーク回線のアクセス速度は、同じネットワーク回線のアクセス速度よりも遅く、より不安定です。たとえば、チャイナ テレコムからチャイナ ユニコムへのアクセスは、チャイナ テレコムからチャイナ テレコムへのアクセスよりも数倍遅く、相互接続が機能しない場合があります。時間。場所が異なることも相まって、状況はさらに複雑になります。たとえば、広州の広州電信への ping には通常 10 ミリ秒、広州チャイナユニコムへの ping には通常 30 ミリ秒、北京電信への ping には 20 ミリ秒、北京網通への ping には 60 ミリ秒かかります。広州では、広州電信回線が広州聯通回線にアクセスできないことを頻繁に監視しています。
ほとんどの Web マスターやネットワーク管理者は、複数の場所や回線自体を監視する条件を持っていません。オンライン監視は、この問題を簡単に解決するのに役立ちます。 Webサイトのサーバーが全国にある場合、複数の拠点と回線の監視が必要になります。
2. 障害アラームはメジャー アラームとマイナー アラームをサポートします
通常、サーバーは、Web サイト サービス、電子メール サービス、FTP サービス、データベース サービスなどの複数のサービスを同時に開きます。ネットワーク管理者は、これらのサービスが正常であるかどうかを同時に監視できることを好みます。優先順位が設定されていない場合、サーバーにネットワーク障害が発生したとき、またはメンテナンスのために再起動されたときに、Web サイト障害アラーム、電子メール サービス アラーム、および FTP サービス アラームがすぐに受信されます。サーバーが短期間復元できない場合は、さらに悪いことに。サーバーが正常に戻るかクラッシュするまで、アラーム メッセージは送信され続けます。
同じサーバを監視するサービスの場合は、プライマリ監視オブジェクトを定義する必要があります。プライマリ監視オブジェクトに障害が発生した場合、プライマリ監視オブジェクトのアラームのみが送信され、他のセカンダリ監視オブジェクトは監視とアラームを停止します。たとえば、Ping が主な監視オブジェクトとして使用され、Ping が失敗してタイムアウトが発生した場合は、サーバーがクラッシュしたか切断されたことを意味します。これは、Ping が継続的に監視されなくなったためです。他のサービスの監視と警告を継続するために必要です。これにより、アラーム メッセージの数が大幅に削減され、監視がより合理的かつ効率的になります。
3. アラーム条件をカスタマイズする
一般的な監視結果は、Ping の失敗、Web ページのアクセス エラー、ソケットの失敗などの成功または失敗であり、これらが発生した場合は障害と呼ばれ、障害が最も優先度の高いアラームとなります。また、Pingの返信遅延やWebページにアクセスした時間、Webページにアクセスして取得したコンテンツなど、返信遅延や内容も監視できます。返された結果は、アラーム条件をカスタマイズするために使用できます。たとえば、Ping 監視の応答遅延は通常 10 ~ 30 ミリ秒です。遅延が 100 ミリ秒を超える場合は、ネットワークまたはサーバーに問題がある可能性があります。ネットワークの応答が遅い場合は、トラフィックが大きすぎるか、サーバーの CPU が高すぎるなどの問題が発生していないかをすぐに確認する必要があります。
カスタマイズされたアラーム条件により、監視内容をさらに絞り込み、Web サイトとサーバーの状態を正確に把握し、障害が発生する前に問題を解決する時間を増やすことができます。
4. アラームメッセージの内容をカスタマイズする
アラームメッセージの内容は、アラームWebサイト名、サーバIP、監視回線、監視サービス、エラーメッセージ、発生時刻など多数あります。 アラームメッセージの内容は、受信したアラーム内容を自由に選択し、状況に合わせてカスタマイズすることができます。実際の状況。これは、SMS を使用してアラームの内容を受信する場合に特に意味があります。SMS の内容は 70 文字以内であるため、障害の内容を完全に理解することは困難です。また、障害が発生するように内容をカスタマイズする必要もあります。 「007电影网12:32 初めて通信回線の監視に失敗しました」など、限られた文字内容でも障害情報が分かります。
5. 概要レポートを電子メールで受信する
Web サイトとサーバーに大きな問題がない場合、オンライン監視サービス管理バックエンドにログインして確認するのが面倒な人はいません。 Webサイトのサーバー監視の概要レポートメールを毎日受信できれば、2~3分でWebサイトやサーバーの状態を大まかに把握できます。
6. パッシブモニタリング
アクティブ監視はコードやプログラムのインストールが不要で非常に安全で便利ですが、ハードディスクのサイズやCPU使用率、ネットワークトラフィックなどが取得できないなど、詳細な監視内容が多くありません。非常に便利です。たとえば、CPU が高すぎる場合は、Web サイトまたはプログラムに問題があることを意味し、トラフィックが多い場合は攻撃される可能性があることを意味します。
SNMP (Simple Network Management Protocol) はパッシブ監視によく使用され、関心のあるコンテンツのほとんどは SNMP を通じて監視できます。ほとんどのオペレーティング システムは SNMP をサポートしているため、アクティベーションと管理が非常に便利で安全になります。 SNMP の欠点は、帯域幅を占有し、一定量の CPU とメモリを消費するため、CPU が高すぎてネットワーク トラフィックが重い場合、効果的に監視できなくなることです。
【著者関連記事】
オンラインWebサイトサーバー監視の必要性を議論する(1)
オンラインWebサイトサーバー監視の必要性を議論する(2)
この記事の著者:Zhongyu Internet Applications and Services がオリジナルです。転載する場合は、出典を明記してください。
Zhongyu Internet のご協力に感謝します