kserve
v0.14.0
KServe 提供了 Kubernetes 自定义资源定义,用于服务预测和生成机器学习 (ML) 模型。它旨在通过使用标准化数据平面协议为 Tensorflow、XGBoost、ScikitLearn、PyTorch、Huggingface Transformer/LLM 模型提供高抽象接口来解决生产模型服务用例。
它封装了自动缩放、网络、运行状况检查和服务器配置的复杂性,为您的 ML 部署带来 GPU 自动缩放、缩放到零和金丝雀部署等尖端服务功能。它为生产 ML 服务提供了一个简单、可插入且完整的故事,包括预测、预处理、后处理和可解释性。 KServe 正在多个组织中使用。
欲了解更多详情,请访问 KServe 网站。
自 v0.7 起,KFServing 已更名为 KServe。
要了解有关 KServe、如何使用各种支持的功能以及如何参与 KServe 社区的更多信息,请关注 KServe 网站文档。此外,我们还编制了一系列演示和演示,以深入了解各种细节。
KServe 是 Kubeflow 的重要插件组件,请从 Kubeflow KServe 文档了解更多信息。查看以下有关在 AWS 或 OpenShift Container Platform 上运行的指南。