kserve
v0.14.0
KServe 提供了 Kubernetes 自訂資源定義,用於服務預測和產生機器學習 (ML) 模型。它旨在透過使用標準化資料平面協定為 Tensorflow、XGBoost、ScikitLearn、PyTorch、Huggingface Transformer/LLM 模型提供高抽象介面來解決生產模型服務用例。
它封裝了自動縮放、網路、運行狀況檢查和伺服器配置的複雜性,為您的 ML 部署帶來 GPU 自動縮放、縮放到零和金絲雀部署等尖端服務功能。它為生產 ML 服務提供了一個簡單、可插入且完整的故事,包括預測、預處理、後處理和可解釋性。 KServe 正在多個組織中使用。
如欲了解更多詳情,請瀏覽 KServe 網站。
自 v0.7 起,KFServing 已更名為 KServe。
要了解有關 KServe、如何使用各種支援的功能以及如何參與 KServe 社區的更多信息,請關注 KServe 網站文件。此外,我們還編制了一系列演示和演示,以深入了解各種細節。
KServe 是 Kubeflow 的重要插件元件,請從 Kubeflow KServe 文件了解更多。請參閱以下有關在 AWS 或 OpenShift Container Platform 上執行的指南。