genai with confluent下载 - genai with confluent源代码下载

genai with confluent

Ai源码

1.0.0

下载

使用 Confluence 生成 AI

这是使用 Confluence Cloud 的实时生成式 AI 演示。这个想法受到 Eden Marco（LangChain- 使用 LangChain 开发 LLM 支持的应用程序）领导的 Udemy 培训的影响。 Eden Marco 给了我升级链接。 Eden Marco 对 Python 中的 Lngchain LLM 开发做了很好的介绍。我采用了破冰的想法，并将其转移到使用 Confluence 和 AI 运行 Data in Motion 的真实用例中。

该存储库将部署：

Confluence Cloud基础集群
完全托管的 Salesforce CDC 连接器
Flink SQL 池
2 主题与模式
- salesforce_contacts - 适用于 CDC Connector (Salesforce)
- salesforce_myleads - 使用 Flink SQL 转换的格式

替代演示架构

请将此存储库克隆到您的桌面上：

 cd $HOME # or what-ever directory you want to use
git clone https://github.com/ora0600/genai-with-confluent.git
cd genai-with-confluent/terraform/

先决条件

演示执行是完全自动化的，但在执行之前，您需要在此处设置一些内容：

Salesforce 开发人员登录

创建 Salesforce 开发人员帐户在此处注册配置 Salesforce CDC，请参阅此处使用屏幕截图关注我的设置高级步骤：

切换到设置菜单，单击滚轮（右上角）
在 Lightning 的快速搜索框中搜索更改数据捕获（左侧上方字段）
选择实体联系人和领导并移动到右侧（选定的实体）。对应的CDC名称是ContactChangeEvent和LeadChangeEvent
搜索应用程序并单击“应用程序管理器”，然后单击“新建连接的应用程序”（右上角）
输入应用程序的值，然后保存，单击继续
单击“管理消费者详细信息”，等待通过电子邮件发送代码并复制消费者密钥和密码
相关信息是消费者密钥和消费者秘密
单击管理并通过编辑策略进行更改，然后选择 IP 放宽：放宽 IP 限制
在您的个人设置中，在“快速查找”框中输入“重置”，然后选择“重置我的安全令牌”。单击重置安全令牌。新的安全令牌将发送到您 Salesforce 个人设置中的电子邮件地址。
新的安全令牌通过电子邮件发送
搜索 oauth 并在 OAuth 和 openID Connect 下进行设置将允许 OAuth 用户名-密码流设置为启用
将连接的应用程序添加到配置文件系统管理员：搜索配置文件，单击配置文件，编辑系统管理员并启用连接的应用程序

您需要 Salesforce CDC Connector 的所有参数，因此请安全存储它们。

汇流云

您需要一个 Confluence Cloud 的工作帐户。注册 Confluence Cloud 非常简单，首次试用时您将获得 400 美元的免费预算。如果您没有可用的 Confluence Cloud 帐户，请注册 Confluence Cloud。

工具

在桌面上安装 terraform。按照安装指南进行操作
安装 iterm 2，参见
Terraform 的本地安装（详细信息如下）
本地安装Confluence CLI，安装cli
在 MacOS 上安装 Python3：Downland 并按照说明进行操作
- 安装我们需要的所有python模块；

pip3 install confluent_kafka
pip3 install requests
pip3 install fastavro
pip3 install avro
pip3 install jproperties
pip3 install langchain
pip3 install openai
pip3 install langchain_openai
pip3 install -U langchain-community
pip3 install google-search-results
pip3 install Flask
pip3 install langchain_core
pip3 install pydantic

来自 Confluence Cloud Cluster 和 Salesforce 的 API 密钥

对于 Confluence Cloud：通过 CLI 在 Confluence Cloud 中创建 API 密钥：

    confluent login
    confluent api-key create --resource cloud --description " API for terraform "
    # It may take a couple of minutes for the API key to be ready.
    # Save the API key and secret. The secret is not retrievable later.
    # +------------+------------------------------------------------------------------+
    # | API Key    | <your generated key>                                             |
    # | API Secret | <your generated secret>                                          |
    # +------------+------------------------------------------------------------------+

通过使用您的数据执行以下命令，将 Confluence Cloud 的所有参数复制到terraform.tfvars文件中：

cat > $PWD /terraform/terraform.tfvars << EOF
confluent_cloud_api_key = "{Cloud API Key}"
confluent_cloud_api_secret = "{Cloud API Key Secret}"
sf_user= "salesforce user"
sf_password = "password"
sf_cdc_name = "LeadChangeEvent"
sf_password_token = "password token"
sf_consumer_key = "consumer key of connected app"
sf_consumer_secret = "consumer secret of connect app"
EOF

Terraform 将获取所有这些参数并为您进行配置，并最终部署所有融合的云资源，包括服务帐户和角色绑定。

我们使用的生成式 AI API

我们使用langchain LLM版本0.1 Langchain Docu

暗示：

现在，这需要花钱。不幸的是，API 不是免费的。我花费 10 美元用于开放 AI，10 美元用于 ProxyCurl API，SERP API 仍处于免费状态。

首先我们需要一个允许我们使用 OpenAI 的密钥。按照此处的步骤创建帐户，然后仅创建 API 密钥。

下一个任务：创建 proxycurl api 密钥。 ProxyCurl 将用于抓取 Linkedin。注册 proxyurl 并以 10 美元购买积分（或任何您认为足够的东西，也许您开始更多更少），请按照以下步骤操作

为了能够在 Google 中搜索正确的 linkedin 配置文件 URL，我们需要此处的 SERP API 的 API 密钥。

现在，通过执行以下命令将所有密钥放入env-vars文件中：

cat > $PWD /terraform/env.vars << EOF
export PYTHONPATH=/YOURPATH
export OPENAI_API_KEY=YOUR openAI Key
export PROXYCURL_API_KEY=YOUR ProxyURL Key
export SERPAPI_API_KEY=Your SRP API KEy
EOF

恭喜你准备工作已经完成。我知道，这是一个巨大的设置。

使用 Confluence Cloud、Salesforce 和 langchain LLM 执行生成式 AI 演示

现在是简单的部分。只需执行 terraform 即可。执行 terraform，所有 Confluence 云资源将自动部署：

 cd terraform
terraform init
terraform plan
terraform apply

这需要一段时间。将提供 Confluence 云资源。如果这样做，iterm2 终端将自动打开并执行三个服务。

替代终端

好的，现在您需要将新的潜在客户添加到 Salesforce 中。这是最后一个手动步骤。

替代终端

生成式人工智能将从 Kafka 集群中获取新的领导者，并通过从 Linkedin 获取信息并自动实时执行提示来执行 LLM 操作。替代终端

该提示将被视为Chatgpt的任务，我们制定了C>hatgpt应制定以下内容：

鉴于我希望您创建有关某人的 Linkedin 信息 {linkedin_information}：

简短的总结
关于他们的两个有趣的事实
他们可能感兴趣的主题
2 个富有创意的破冰活动，与他们展开对话

开放式模型

我们在此演示中运行chatgpt-3.5-turbo模型。该模型的代币有限，但是目前最快、最古老的模型。当然还有最便宜的。如果您尝试使用 Kai Waehner 作为 Lead，那么您会发现当前模型的代币不够。你能做的就是改变模型。这是最简单的方法，另一种方法是将内容分割成块。请查看当前型号以检查每个型号的代币数量。

测试

我从我的测试开始：

在 Salesforce 中输入 Carsten Mützlitz 作为新领导：完成任务大约需要 x 秒，并将成功完成
Kai Waehner 加入 Salesforce 担任新主管
- Chatgpt 将因超出令牌限制而中断
- 在ice_breaker.py第135行中将模型更改为model_name="gpt-4-turbo"并重新启动客户端。
- 凯·瓦纳重新上场
- 现在，对于这种情况，令牌不再是问题

在我看来，这个简单的演示并不是检索增强生成 (RAG) 模式的用例。我们从给定的 API 获取所有信息，将数据存储到向量数据库中是没有意义的。通过API实时加载信息比新鲜数据要高效得多。为您的用例使用正确的模型，在我们的例子中，它应该是具有更高数量代币的快速模型。