doc understanding gpt langchain
1.0.0
概述
该电报机器人旨在以各种格式分析文档,例如PDF,DOCX和TXT文件。它利用OpenAI的GPT(生成预训练的变压器)的力量提供智能响应。
要使用此机器人,您需要遵循以下步骤:
获取Openai代币
为语言模型获取OpenAI API令牌。
创建电报机器人
使用Botfather在电报上创建一个新的机器人,并获取机器人令牌。
配置环境
将OpenAI和Telegram Bot令牌粘贴到.env
文件中的适当字段中。
激活环境
运行pipenv shell
以激活Pipenv环境。 PIPFILE已经包含所有所需的依赖项。
设置环境变量
运行config.py
文件,以确保正确设置所有必需的环境变量。
后端:包含core.py
,在其中定义了run_llm
函数。
config:保留config.py
,其中定义文件夹路径。确保根据需要更新它们。
数据:存储用户通过电报发送的文件在data/output/
文件夹中。它还创建本地矢量数据库索引。
local_vector_store.py:负责创建本地矢量存储和生成嵌入。
main.py:主应用程序。
运行以下命令:
python3 main.py
转到您的电报机器人并发送/start
命令以启动机器人。
要分析文档,请指定您要使用邮件中的“分析”和“文档”来分析文档。
上传您要分析的文档。
询问您对文档的任何问题或疑问。
注意:只要脚本运行,机器人将继续响应。