BentoML下载 - BentoML源代码下载

BentoML

其他源码

v1.3.14

下载

统一模型服务框架

？使用任何开源或自定义 AI 模型构建模型推理 API 和多模型服务系统。加入我们的 Slack 社区！

什么是 BentoML？

BentoML 是一个 Python 库，用于构建针对 AI 应用程序和模型推理进行优化的在线服务系统。

？轻松构建适用于任何 AI/ML 模型的 API。只需几行代码和标准 Python 类型提示即可将任何模型推理脚本转换为 REST API 服务器。
？ Docker 容器让一切变得简单。不再有依赖地狱！使用简单的配置文件管理您的环境、依赖项和模型版本。 BentoML 自动生成 Docker 镜像，确保可重复性，并简化您部署到不同环境的方式。
？最大化 CPU/GPU 利用率。利用内置服务优化功能（例如动态批处理、模型并行性、多阶段管道和多模型推理图编排）构建高性能推理 API。
？完全可定制。通过自定义业务逻辑、模型推理和多模型组合，轻松实现您自己的 API 或任务队列。支持任何 ML 框架、模式和推理运行时。
准备生产。在本地开发、运行和调试。使用 Docker 容器或 BentoCloud 无缝部署到生产环境。

入门

安装 BentoML：

 # Requires Python≥3.9
pip install -U bentoml

在service.py文件中定义 API。

 from __future__ import annotations

import bentoml

@ bentoml . service (
    resources = { "cpu" : "4" }
)
class Summarization :
    def __init__ ( self ) -> None :
        import torch
        from transformers import pipeline

        device = "cuda" if torch . cuda . is_available () else "cpu"
        self . pipeline = pipeline ( 'summarization' , device = device )

    @ bentoml . api ( batchable = True )
    def summarize ( self , texts : list [ str ]) -> list [ str ]:
        results = self . pipeline ( texts )
        return [ item [ 'summary_text' ] for item in results ]

在本地运行服务代码（默认在 http://localhost:3000 提供服务）：

pip install torch transformers  # additional dependencies for local run

bentoml serve service.py:Summarization

现在，您可以通过浏览器在 http://localhost:3000 或使用 Python 脚本运行推理：

 import bentoml

with bentoml . SyncHTTPClient ( 'http://localhost:3000' ) as client :
    summarized_text : str = client . summarize ([ bentoml . __doc__ ])[ 0 ]
    print ( f"Result: { summarized_text } " )

部署您的第一个 Bento

要部署 BentoML 服务代码，首先创建一个bentofile.yaml文件来定义其依赖项和环境。在此处查找 Bentofile 选项的完整列表。

 service : ' service:Summarization ' # Entry service import path
include :
  - ' *.py ' # Include all .py files in current directory
python :
  packages : # Python dependencies to include
    - torch
    - transformers
docker :
  python_version : " 3.11 "

然后，选择以下方式之一进行部署：

？ Docker容器

运行bentoml build将必要的代码、模型、依赖项配置打包到 Bento 中 - BentoML 中的标准化可部署工件：

bentoml build

确保 Docker 正在运行。生成用于部署的 Docker 容器映像：

bentoml containerize summarization:latest

运行生成的图像：

docker run --rm -p 3000:3000 summarization:latest

☁️ 便当云

BentoCloud 为快速、可靠的 GenAI 采用提供计算基础设施。它有助于利用云计算资源加快 BentoML 开发流程，并简化您在生产中部署、扩展和操作 BentoML 的方式。

注册 BentoCloud 进行个人访问；对于企业用例，请联系我们的团队。

 # After signup, run the following command to create an API token:
bentoml cloud login

# Deploy from current directory:
bentoml deploy .

Bentocloud-ui

有关详细说明，请阅读 Hello World 示例。

示例

法学硕士：Llama 3.2、Mixtral、Solar 和 Mistral。
图像生成：Stable Diffusion 3 Medium、Stable Video Diffusion、Stable Diffusion XL Turbo、ControlNet 和 LCM LoRA。
嵌入：SentenceTransformers 和 ColPali
音频：ChatTTS、XTTS、WhisperX、Bark
计算机视觉：YOLO 和 ResNet
高级示例：函数调用、LangGraph、CrewAI

查看完整列表以获取更多示例代码和用法。

高级主题

模型构成
工作人员和模型并行化
自适应批处理
GPU推理
分布式服务系统
并发和自动缩放
模型加载和模型存储
可观察性
BentoCloud部署

请参阅文档以获取更多教程和指南。

社区

参与并加入我们的 Slack 社区，这里有数千名 AI/ML 工程师互相帮助，为项目做出贡献，并讨论构建 AI 产品。

要报告错误或提出功能请求建议，请使用 GitHub Issues。

贡献

为该项目做出贡献的方式有很多种：

报告错误并对与您相关的问题“竖起大拇指”。
调查问题并审查其他开发人员的拉取请求。
通过提交 GitHub 拉取请求，为项目贡献代码或文档。
查看贡献指南和开发指南以了解更多信息。
在此处的#bentoml-contributors频道中分享您的反馈并讨论路线图计划。

感谢我们所有出色的贡献者！

使用情况跟踪和反馈

BentoML 框架收集匿名使用数据，帮助我们的社区改进产品。仅报告 BentoML 的内部 API 调用。这不包括任何敏感信息，例如用户代码、模型数据、模型名称或堆栈跟踪。这是用于使用情况跟踪的代码。您可以通过--do-not-track CLI 选项选择退出使用情况跟踪：

bentoml [command] --do-not-track

或者通过设置环境变量：

 export BENTOML_DO_NOT_TRACK=True

执照

阿帕奇许可证 2.0

展开

附加信息

版本 v1.3.14
类型其他源码
更新时间 2024-12-03
大小 35.66MB
来自于 Github

BentoML

统一模型服务框架

什么是 BentoML？

入门

部署您的第一个 Bento

示例

高级主题

社区

贡献

使用情况跟踪和反馈

执照

waymo open dataset

SmartTube

Sunamu

MySchedule.py

viptools for eslam

VITAident

chat.petals.dev

GPT Prompt Templates

GPTyped

waymo open dataset

SmartTube

Sunamu

waymo open dataset

wp functions

termwind