
導入
Kardioは、任意のエンドポイントでヘルスチェックを実行するように構成できるシンプルなツールです。 Kardioは、RESTエンドポイント、TCPポートなどからの応答に基づいて、ステータスと可用性を示すリッチUIを持っています。また、Slackと電子メールと統合されています。
T-Mobile、USA、Inc。では、いくつかの大規模なマルチテナントコンテナオーケストレーションプラットフォームを運営しており、これらのプラットフォームはPrometheus、Grafanaなどの監視ツールに依存しています。主要な監視システムのどの部分でもパフォーマンスが低下した場合に必要です。プラットフォーム上のサービスのシンプルなステータスUIとしてKardioを開始し、後にプラットフォームが成長し、Kubernetesを採用するにつれてさらに機能を追加しました。
クイックスタート
Kardioのクイックテスト駆動については、クイックスタートの手順に従ってください
機能
健康チェック
Kardioには、Webサービスの健康チェックを実行する機能があります。
- KubernetesとMarathonに展開されているサービスの自動discoverとHealth Checksを実行する
- 手動で構成されたサービスのヘルスチェックを実行します
高可用性
Kardioは、アクティブパッシブ構成の2ノードクラスターを備えた高可用性(HA)モードをサポートしています。 HAモードは、必要に応じて複数の地域で動作するように設計されています。
マルチリージョン/マルチ環境サポート
Kardioには、複数の地域で実行する機能があります。 Kardioダッシュボードには、利用可能なすべての環境/地域のデータが表示されます。
RBAC
Kardioは、LDAP統合を使用した役割ベースのアクセス制御/制限をサポートしています。詳細については、RBAC統合を参照してください
機能のハイライト
- サービスの健康状態には、1分あたりの最新情報が提供されます。
- サービスのために2つの地域をサポートします。
- 複数の環境をサポートします。
- 単一のサービスに対して複数のステータスチェックが実行されます。
- カスタムヘルスチェックは、あらゆるサービスに対して(Javaで)記述できます。
- 発表はホームページに公開できます。
- トータルトランザクション、TPS、総コンテナの実行、実行中のコンテナ、アップタイムなど、ダッシュボードの上部にあるカスタムソースからリアルタイムデータを表示します。
- ユーザーは、電子メールとSlackを介してステータス変更アラートを購読できます。
- 各サービスの可用性率は、毎年、月、日付がダッシュボードに表示されます。
- ユーザーは、特定のアプリケーション、サービス、またはコンポーネントのリストを簡単に検索できます。
- 過去24時間の健康状態の変化を伴うサービスは、最近のイベントで強調されており、変更の詳細は対応するサービスのメッセージとして表示されます。
- ログインしているユーザーは、アクセスできるアプリケーションとサービスのメッセージを追加/編集できます。たとえば、ユーザーは、特定のサービスのために「アプリケーションがメンテナンスのためにダウンしている」などのメッセージを追加できます。
- 管理ページを使用すると、ユーザーはKardio構成を管理できます。
- LDAP統合を介して、Marathonアプリケーションと管理者ページにロールベースのアクセスが有効になっています。
- 履歴ページには、過去7日間のサービスヘルス履歴が表示されます。
- Kardioは、監視サービスのためにPrometheus Push Gatewayをサポートしています。
- 健康状態は、次のシンボルを使用して表示されます。
UI機能
Kardio UIには次のコンポーネントがあります。
- カウンター -総トランザクション(HTTPリクエスト)、現在のリクエスト、1秒あたりのリクエスト、総コンテナの実行、現在の実行コンテナ数、実行中数、およびすべてのクラスターのパーセンテージでの稼働時間が個別に個別に組み合わされています。
- ダッシュボード -クラスターに展開されているすべてのサービスは、環境と地域によって表示されます。
- 履歴 -環境ごとの各サービスの最後の7日間のステータスは、障害とタイムスタンプの理由で表示されます。
- APIダッシュボード -一定期間にわたるサービス、コンテナ、RP、およびレイテンシの傾向がグラフに表示されます。プラットフォーム、環境、アプリケーションに基づいたフィルターは、PDFファイルでグラフをエクスポートするオプションとともに表示されます。
- Admin Console-認証はLDAPに基づいており、管理者はカウンター、環境、メッセージを追加/変更/削除する機能を備えています。管理者は、エンドポイントを追加して監視し、ユーザーに警告し、各環境の上にリリース通知も含めることができます。
インストール
インストールの指示とソースから構築するには、セットアップガイドに従ってください
発表ブログ投稿
Kardioの紹介
ライセンス
Kardioは、Apache 2.0ライセンスの条件の下でオープンソーリングされており、Apache 2.0ライセンスのセクション7に従って、いかなる種類の保証も条件もなくリリースされます。