俗語說“人心不足蛇吞象”,在上篇滿足基本要求後,需要滿足更高級的功能要求。
1、多個地點和線路同時監控
多個監控地點是指同時在不同地方對網站和伺服器進行監控,如在廣州、北京、重慶等多個點同時進行監控,任何一個點監控到故障都會告警。多線路是指以不同線路(電信、聯通、鐵通等)同時進行監控。地點和線路是組合一起使用,如廣州電信、北京聯通等。
中國互聯網人為的劃分為南北,南方主要是電信、北方主要是聯通(以前的網通),還有其它教育網、鐵通等。不同網路線路存取速度比同一網路線路的要慢且不穩定,如電信存取聯通要比電信存取電信慢幾倍,並不時會出現互聯不通的情況。再加上地點不同,情況更複雜。如在廣州Ping廣州電信一般是10ms,Ping廣州聯通一般是30ms,Ping北京電信是20ms,Ping北京網通是60ms。我們在廣州經常會監控到廣州電信線路不能存取廣州聯通線路的情況。
大部分站長和網管自己沒條件進行多個地點和線路監控,線上監控輕易幫你解決這個問題。如你的網站伺服器是面向全國的,更需要多地點和線路監控。
2、故障告警支援主要告警及次要告警
伺服器一般同時開啟多種服務,如網站服務、郵件服務、FTP服務、資料庫服務等,網管們喜歡能同時監控這些服務是否正常。如果不分主次的話,當伺服器發生網路故障或維護重啟時候,你會立即收到網站故障警告、郵件服務警告、FTP服務告警,更慘是這台伺服器短時不能恢復時候,告警訊息源源不絕發給你, 直到伺服器恢復正常或你崩潰為止。
對於監控同一台伺服器的服務,需要定義一個主要監控對象,當主要監控對象發生故障,只發送主要監控對象的告警,其它次要的監控對象暫停監控和告警。例如用Ping來做主要監控對象,如果Ping不通出現Timeout,表示伺服器已經當機或斷網,這時只發送伺服器Ping告警持續監控Ping,因為再繼續監控和告警其它服務已經沒有必要。這樣能大幅減少警告訊息數量,又讓監控更加合理、更有效率。
3、自訂告警條件
一般的監控到的結果是成功或失敗,如Ping不通、訪問網頁出錯、連接不到Socket,發生時這些稱之為故障,故障是最優先的告警。除此之外,還能監控到回傳的延遲、內容等,如Ping回傳的延遲、造訪網頁的時間、造訪網頁所取到的內容等。利用回傳的結果可以自訂警告條件,如Ping監控的回傳延遲一般是10-30ms之間,當延遲大於100ms時候,表示網路或伺服器可能出現問題,造成網路回應慢,需要立即檢查是否有流量過大或伺服器CPU太高等問題。
自訂告警條件能更細緻監控內容,精確知道網站和伺服器狀態,在故障準備發生前爭取到更多時間去解決問題。
4、自訂告警訊息內容
警告訊息內容非常多,如警告網站名稱、伺服器ip、監控的線路、監控的服務、出錯訊息、發生時間等,自訂警告訊息內容能自由選擇收到的警告內容,修改為完全適合自己的實際要求。這點對於用簡訊接受警告內容特別有意義,簡訊內容最多是70個字符,要在70個字符完全知道故障內容比較困難,更需要能自訂內容, 調整為在有限字符內容下也能知道故障時間、故障內容,如:“007電影網12:32電信線路監控第到1次失敗”,清晰明了的知道故障訊息。
5、透過郵件接收匯總報表
當網站和伺服器沒多大問題時候,大家都懶得登入線上監控服務管理後台查看。如果每天能收到一封網站伺服器監控的總報表郵件,花個兩三分鐘就大致了解網站和伺服器狀態。
6.被動監控
主動監控雖然能不需要安裝代碼和程序,非常安全和方便,但缺少很多細緻的監控內容,如無法獲取硬碟大小、CPU的使用率、網路的流量等,這些監控內容非常有用,如CPU太高表示有網站或程式出問題,流量太高表示可能被攻擊等。
被動監控常用的是SNMP(簡單網路管理協定),透過SNMP能監控到大部分你感興趣的內容。大部分作業系統支援SNMP,開通管理非常方便,也非常安全。 SNMP缺點是比較佔用頻寬,會消耗一定的CPU和內存,在CPU太高和網路流量大情況下,無法有效進行監控。
【作者相關文章】
談線上網站伺服器監控之使用的必要性(一)
談線上網站伺服器監控之使用的必要性(二)
本文作者:中域互聯應用與服務原創,轉載留下文章出處。
感謝中域互聯的投稿