
介紹
Kardio是一個簡單的工具,可以配置為在任何端點上執行健康檢查。 Kardio的UI富含UI,根據休息端點,TCP端口等的響應顯示狀態和可用性。它還與Slack和Email集成在一起以進行警告。
在美國T-Mobile,Inc。我們運行了幾個龐大的多租戶運輸儀編排平台,這些平台依靠監視工具,例如Prometheus,Grafana等。如果在主要監視系統的任何部分中的性能降低,則需要。我們啟動了Kardio作為平台上服務的簡單狀態UI,後來隨著平台的增長和採用Kubernetes,添加了更多功能。
Quickstart
對於Kardio的快速測試,請在快速啟動時按照這些步驟操作
功能
健康檢查
Kardio有能力對Web服務進行健康檢查:
- 自動發現並執行在Kubernetes和Marathon上部署的服務的健康檢查
- 對手動配置的服務進行健康檢查
高可用性
Kardio支持高可用性(HA)模式,並具有兩個節點群集,並以主動性配置為單位。 HA模式旨在(如果需要)在多個區域工作。
多區域/多環境支持
卡爾迪奧(Kardio)有能力在多個區域運行。 Kardio儀表板顯示了每個可用環境/區域的數據。
RBAC
Kardio使用LDAP集成支持基於角色的訪問控制/限制。有關更多信息,請參見RBAC集成
功能亮點
- 服務的健康狀況每分鐘提供最新信息。
- 支持兩個服務區域。
- 支持多種環境。
- 為單個服務執行多個狀態檢查。
- 可以(以Java)為任何服務編寫自定義健康檢查。
- 公告可以在主頁上發布。
- 從儀表板頂部的自定義源顯示實時數據,例如總交易,TPS,總容器運行,運行容器,正常運行時間,等等。
- 用戶可以通過電子郵件和Slack訂閱狀態更改警報。
- 每年,月和日期的可用性百分比在儀表板中顯示。
- 用戶可以輕鬆地搜索列表中的特定應用程序,服務或組件。
- 最近24小時內具有健康狀況變化的服務在最近的事件中突出顯示,更改細節作為相應服務的消息顯示。
- 登錄用戶可以為其訪問的應用程序和服務添加/編輯消息。例如,用戶可以為特定服務添加諸如“維護應用程序以進行維護”之類的消息。
- 管理頁面使用戶可以管理Kardio配置。
- 通過LDAP集成啟用了Marathon應用程序和管理頁面的基於角色的訪問。
- 歷史頁面顯示了過去7天的服務健康歷史。
- Kardio支持Prometheus Push Gateway用於監視服務。
- 使用以下符號顯示健康狀況:
UI功能
Kardio UI具有以下組件。
- 計數器 -顯示總交易(HTTP請求),每秒的當前請求,運行總容器,當前運行容器,運行的服務數量和所有群集的正常運行時間和正常運行時間單獨和合併。
- 儀表板 -環境和地區都可以看到群集中的所有服務。
- 歷史記錄 -將顯示每種服務狀態的最後7天,並顯示出故障和時間戳的原因。
- API儀表板 -服務,容器,RPS和潛伏期的趨勢將顯示在圖中。將顯示基於平台,環境,應用程序的過濾器,並以將圖在PDF文件中導出的選項。
- Admin Console-身份驗證基於LDAP,Admins具有添加/修改/刪除計數器,環境和消息的能力。管理員可以添加任何端點以監視並提醒用戶,還包括每個環境之上的釋放通知。
安裝
有關安裝說明並從源構建,請遵循“設置指南”
公告博客文章
介紹Kardio
執照
Kardio根據Apache 2.0許可證的條款開源,並根據Apache 2.0許可證第7條的任何形式發行任何保證或條件。