
การแนะนำ
Kardio เป็นเครื่องมือง่ายๆที่สามารถกำหนดค่าให้ทำการตรวจสุขภาพในจุดสิ้นสุดใด ๆ คาร์ดิโอมีสถานะ UI ที่มีการแสดงและความพร้อมใช้งานตามคำตอบจากจุดสิ้นสุดของพอร์ต TCP ฯลฯ นอกจากนี้ยังรวมเข้ากับ Slack และอีเมลเพื่อแจ้งเตือน
ที่ T-Mobile, USA, Inc. เราใช้แพลตฟอร์มการประสานงานคอนเทนเนอร์หลายตัวขนาดใหญ่หลายแห่งและแพลตฟอร์มเหล่านี้ขึ้นอยู่กับเครื่องมือตรวจสอบเช่น Prometheus, Grafana ฯลฯ ระบบตรวจสอบสถานะที่เป็นแบบสแตนด์อโลน จำเป็นในกรณีที่มีประสิทธิภาพลดลงในส่วนใดส่วนหนึ่งของระบบการตรวจสอบหลัก เราเริ่มต้นคาร์ดิโอเป็น UI สถานะง่ายๆสำหรับบริการบนแพลตฟอร์มของเราและต่อมาได้เพิ่มคุณสมบัติเพิ่มเติมเมื่อแพลตฟอร์มของเราเติบโตและนำมาใช้ Kubernetes
เร็ว
สำหรับการทดสอบไดรฟ์ Kardio อย่างรวดเร็วให้ทำตามขั้นตอนในการเริ่มต้นอย่างรวดเร็ว
ฟังก์ชั่น
การตรวจสุขภาพ
คาร์ดิโอมีความสามารถในการตรวจสอบสุขภาพของบริการเว็บ:
- การค้นพบอัตโนมัติและดำเนินการตรวจสอบสุขภาพสำหรับบริการที่ปรับใช้กับ Kubernetes และ Marathon
- ทำการตรวจสุขภาพสำหรับบริการที่กำหนดค่าด้วยตนเอง
ความพร้อมสูง
Kardio รองรับโหมดความพร้อมใช้งานสูง (HA) พร้อมคลัสเตอร์สองโหนดในการกำหนดค่าที่ใช้งานอยู่ โหมด HA ได้รับการออกแบบให้ทำงานในหลายภูมิภาคหากจำเป็น
การสนับสนุนด้านสิ่งแวดล้อมหลายภูมิภาค/หลาย
คาร์ดิโอมีความสามารถในการทำงานในหลายภูมิภาค แผงควบคุม Kardio จะแสดงข้อมูลสำหรับทุกสภาพแวดล้อม/ภูมิภาคที่มีอยู่
RBAC
Kardio สนับสนุนการควบคุม/ข้อ จำกัด การเข้าถึงตามบทบาทโดยใช้การรวม LDAP ดูการรวม RBAC สำหรับข้อมูลเพิ่มเติม
คุณสมบัติไฮไลท์
- สถานะสุขภาพของบริการมีข้อมูลที่ทันสมัยต่อนาที
- รองรับสองภูมิภาคสำหรับบริการ
- รองรับสภาพแวดล้อมที่หลากหลาย
- การตรวจสอบสถานะหลายรายการจะดำเนินการสำหรับบริการเดียว
- การตรวจสอบสุขภาพแบบกำหนดเองสามารถเขียน (ใน Java) สำหรับบริการใด ๆ
- ประกาศสามารถเผยแพร่ในหน้าแรก
- แสดงข้อมูลแบบเรียลไทม์จากแหล่งที่มาที่กำหนดเองที่ด้านบนของแดชบอร์ดเช่นธุรกรรมทั้งหมด, TPS, คอนเทนเนอร์ทั้งหมด, การรัน, คอนเทนเนอร์ที่ทำงาน, เวลาทำงาน ฯลฯ ฯลฯ
- ผู้ใช้สามารถสมัครรับการแจ้งเตือนการเปลี่ยนสถานะผ่านทางอีเมลและ Slack
- เปอร์เซ็นต์ความพร้อมใช้งานของแต่ละบริการต่อปีเดือนและวันที่จะแสดงในแผงควบคุม
- ผู้ใช้สามารถค้นหารายการสำหรับแอปพลิเคชันบริการหรือส่วนประกอบเฉพาะได้อย่างง่ายดาย
- บริการที่มีการเปลี่ยนแปลงสถานะสุขภาพใน 24 ชั่วโมงที่ผ่านมาจะถูกเน้นในเหตุการณ์ล่าสุดโดยมีรายละเอียดการเปลี่ยนแปลงที่แสดงเป็นข้อความสำหรับบริการที่เกี่ยวข้อง
- ผู้ใช้เข้าสู่ระบบสามารถเพิ่ม/แก้ไขข้อความสำหรับแอปพลิเคชันและบริการที่พวกเขามีการเข้าถึง ตัวอย่างเช่นผู้ใช้สามารถเพิ่มข้อความเช่น“ แอปพลิเคชันลดลงสำหรับการบำรุงรักษา” สำหรับบริการเฉพาะ
- หน้าผู้ดูแลระบบช่วยให้ผู้ใช้สามารถจัดการการกำหนดค่า Kardio
- การเข้าถึงตามบทบาทถูกเปิดใช้งานสำหรับแอปพลิเคชันมาราธอนและหน้าผู้ดูแลระบบผ่านการรวม LDAP
- หน้าประวัติแสดงประวัติสุขภาพบริการในช่วงเจ็ดวันที่ผ่านมา
- Kardio สนับสนุน Prometheus Push Gateway สำหรับการตรวจสอบบริการ
- สถานะสุขภาพจะแสดงโดยใช้สัญลักษณ์ต่อไปนี้:
คุณสมบัติ UI
Kardio UI มีส่วนประกอบดังต่อไปนี้
- เคาน์เตอร์ - แสดงธุรกรรมทั้งหมด (คำขอ HTTP), คำขอปัจจุบันต่อวินาที, คอนเทนเนอร์ทั้งหมดรัน, คอนเทนเนอร์ที่รันปัจจุบัน, จำนวนบริการที่ทำงานและเวลาทำงานเป็นเปอร์เซ็นต์ของกลุ่มทั้งหมดและรวมกัน
- Dashboard - บริการทั้งหมดที่ปรับใช้ในคลัสเตอร์จะสามารถมองเห็นได้โดยสภาพแวดล้อมและภูมิภาค
- ประวัติ - 7 วันสุดท้ายของสถานะของแต่ละบริการโดยสภาพแวดล้อมจะแสดงด้วยเหตุผลสำหรับความล้มเหลวและการประทับเวลา
- API Dashboard - แนวโน้มของบริการคอนเทนเนอร์ RPS และเวลาแฝงในช่วงเวลาหนึ่งจะแสดงในกราฟ ตัวกรองตามแพลตฟอร์มสภาพแวดล้อมแอปพลิเคชันจะแสดงพร้อมตัวเลือกในการส่งออกกราฟในไฟล์ PDF
- คอนโซลผู้ดูแลระบบ - การตรวจสอบสิทธิ์ขึ้นอยู่กับ LDAP และผู้ดูแลระบบจะมีความสามารถในการเพิ่ม/แก้ไข/ลบเคาน์เตอร์สภาพแวดล้อมและข้อความ ผู้ดูแลระบบสามารถเพิ่มจุดสิ้นสุดใด ๆ ในการตรวจสอบและเพื่อแจ้งเตือนผู้ใช้รวมถึงการแจ้งเตือนการเปิดตัวที่ด้านบนของแต่ละสภาพแวดล้อมเช่นกัน
การติดตั้ง
สำหรับคำแนะนำในการติดตั้งและสร้างจากแหล่งที่มาโปรดติดตามคู่มือการตั้งค่า
โพสต์บล็อกประกาศ
แนะนำ Kardio
ใบอนุญาต
คาร์ดิโอเปิดแหล่งที่มาภายใต้เงื่อนไขของใบอนุญาต Apache 2.0 และได้รับการปล่อยตัวตามที่เป็นจริงโดยไม่มีการรับประกันหรือเงื่อนไขใด ๆ ตามมาตรา 7 ของใบอนุญาต Apache 2.0