使用 3 管道设计,这就是您将在本课程中学习构建的内容↓
培训管道:
训练管道使用 Beam 作为无服务器 GPU 基础设施进行部署。
-> 在modules/training_pipeline
目录下找到。
注意:如果您没有达到最低硬件要求,请不要担心。我们将向您展示如何将培训管道部署到 Beam 的无服务器基础设施并在那里培训法学硕士。
实时特征管道:
使用 GitHub 操作中内置的 CI/CD 管道,流式传输管道自动部署在 AWS EC2 计算机上。
-> 在modules/streaming_pipeline
目录下找到。
使用 LangChain 创建一条链的推理管道:
推理管道使用 Beam 作为无服务器 GPU 基础设施和 RESTful API进行部署。此外,它还包含在用于演示目的的 UI 下,并在 Gradio 中实现。
-> 在modules/financial_bot
目录下找到。
注意:如果您没有达到最低硬件要求,请不要担心。我们将向您展示如何将推理管道部署到 Beam 的无服务器基础设施并从那里调用 LLM。
我们使用GPT3.5
生成财务问答数据集,以微调我们的开源 LLM,使其专注于使用财务术语和回答财务问题。使用大型 LLM(例如GPT3.5
生成训练较小 LLM(例如 Falcon 7B)的数据集被称为蒸馏微调。
→ 要了解我们如何生成财务问答数据集,请查看 Pau Labarta 撰写的这篇文章。
→ 要查看财务问答数据集的完整分析,请查看 Alexandru Razvant 编写的课程的数据集分析小节。
在深入学习模块之前,您必须为课程设置一些额外的外部工具。
注意:您可以在每个模块中进行设置,因为我们将在每个模块中指出您需要的内容。
financial news data source
按照本文档向您展示如何创建免费帐户并生成本课程所需的 API 密钥。
注意: 1x Alpaca 数据连接是免费的。
serverless vector DB
前往 Qdrant 并创建一个免费帐户。
然后,按照本文档了解如何生成本课程中所需的 API 密钥。
注意:我们将仅使用 Qdrant 的免费增值计划。
serverless ML platform
前往 Comet ML 并创建一个免费帐户。
之后,按照本指南生成您在课程中需要的 API 密钥和新项目。
注意:我们将仅使用 Comet ML 的免费增值计划。
serverless GPU compute | training & inference pipelines
前往 Beam 并创建一个免费帐户。
之后,您必须按照他们的安装指南安装其 CLI 并使用您的 Beam 凭据进行配置。
要了解有关 Beam 的更多信息,请参阅以下介绍指南。
注意:您有大约 10 个免费计算小时。之后,您只需为您使用的内容付费。如果您有 Nvidia GPU >8 GB VRAM 并且不想部署训练和推理管道,则可以选择使用 Beam。
使用 Poetry 时,我们在 Poetry 虚拟环境中定位 Beam CLI 时遇到问题。为了解决这个问题,在安装 Beam 后,我们创建一个指向 Poetry 二进制文件的符号链接,如下所示:
export COURSE_MODULE_PATH= < your-course-module-path > # e.g., modules/training_pipeline
cd $COURSE_MODULE_PATH
export POETRY_ENV_PATH= $( dirname $( dirname $( poetry run which python ) ) )
ln -s /usr/local/bin/beam ${POETRY_ENV_PATH} /bin/beam
cloud compute | feature pipeline
转到 AWS,创建一个帐户并生成一对凭证。
之后,下载并安装 AWS CLI v2.11.22 并使用您的凭证进行配置。
注意:您只需为您使用的内容付费。您将仅部署一个t2.small
EC2 VM,每小时仅需~$0.023
。如果您不想部署功能管道,则可以选择使用 AWS。
每个模块都有其依赖项和脚本。在生产设置中,每个模块都有其存储库,但在这个用例中,出于学习目的,我们将所有内容放在一个地方:
因此,请分别查看每个模块的自述文件,了解如何安装和使用它:
我们强烈鼓励您克隆此存储库并复制我们所做的一切,以充分利用本课程。
在每个模块的视频讲座、文章和自述文件中,您都会找到分步说明。
快乐学习!
GitHub 代码(在 MIT 许可下发布)和视频讲座(在 YouTube 上发布)完全免费。永远都会是。
Medium 课程在 Medium 的付费墙下发布。如果您已经拥有它,那么它们是免费的。否则,您必须每月支付 5 美元的费用才能阅读这些文章。
如果您在课程期间有任何疑问或问题,我们鼓励您在此存储库中创建一个问题,您可以在其中深入解释您需要的所有内容。
或者,您也可以在 LinkedIn 上联系老师:
点击这里观看视频?
点击这里观看视频?
点击这里观看视频?
点击这里观看视频?
点击这里观看视频?
To understand the entire code step-by-step, check out our articles
↓
本课程是根据 MIT 许可证发布的开源项目。因此,只要您分发我们的许可证并认可我们的工作,您就可以安全地克隆或分叉该项目并将其用作您想要的任何内容(例如大学项目、大学学位项目等)的灵感来源。
保罗·拉巴塔·巴霍 |高级 ML 和 MLOps 工程师 主要老师。视频课程中的那个人。 领英 推特/X YouTube 现实世界的机器学习通讯 真实世界的机器学习网站 | |
亚历山德鲁·拉兹万特 |高级机器学习工程师 二厨。幕后工程师。 领英 神经跳跃 | |
保罗·尤斯汀 |高级 ML 和 MLOps 工程师 主厨。那些随机出现在视频课程中的人。 领英 推特/X 解码机器学习通讯 个人网站 | ML 和 MLOps 中心 |