Chat your Data 是一个使用 Next.js、React 和 OpenAI 构建的应用程序。该项目允许用户与基于人工智能的聊天机器人进行通信,该机器人为用户的查询提供相关答案。该应用程序使用自然语言处理(NLP)技术来理解用户的查询并提供准确的响应。
在安装 Chat your Data 之前,请确保您的系统上已安装 Node.js。安装 Node.js 后,请按照以下步骤安装应用程序:
yarn install
来安装项目依赖项。.env
文件,并根据需要配置环境变量。首先,从.env.example
创建一个新的.env
文件,并添加在此处找到的 OpenAI API 密钥。
cp .env.example .env
需要保留LangChain 0.0.22版本。任何更高的东西都会重构代码并破坏。致力于 ChatModel 的重构
数据摄取分两步进行。
首先,您应该下载书籍/源代码并将其格式化为可读的内容并将其转换为md
格式。将该源添加到项目文件夹并更新ingest.ts
中的FILENAME
以匹配文件名。
接下来,安装依赖项并运行摄取脚本:
yarn && yarn ingest
这将解析数据、分割文本、创建嵌入、将它们存储在向量存储中,然后将其保存到data/
目录。
我们将其保存到一个目录中,因为我们只想运行一次(昂贵的)数据摄取过程。
Next.js 服务器依赖于data/
目录的存在。请确保在继续下一步之前运行此命令。
要启动“聊天您的数据”应用程序,请在终端中运行以下命令:
yarn dev
应用程序启动后,您可以通过在 Web 浏览器中导航到http://localhost:3000
来访问它。
项目中可以使用以下脚本:
dev
:启动开发服务器。build
:构建生产就绪的应用程序。start
:启动生产就绪应用程序。lint
:使用 ESLint 对项目文件进行 Lint 处理。download
:下载聊天机器人运行所需的数据。ingest
:将下载的数据摄取到聊天机器人中。 运行 Hometown Chatbot 应用程序需要以下依赖项:
@emotion/react
@emotion/styled
@microsoft/fetch-event-source
@mui/material
dotenv
hnswlib-node
langchain
next
openai
react
react-dom
react-markdown
remark-gfm
sharp
ws
出于开发目的,需要以下 devDependency:
@types/adm-zip
@types/node
@types/react
@types/react-dom
@types/ws
cohere-ai
ts-node
tsx
typescript
欢迎贡献“聊天您的数据”。如果您发现任何错误或问题,请在项目的 GitHub 存储库上提出。您还可以通过提交拉取请求来为项目做出贡献。
Hometown Chatbot 是根据MIT 许可证授权的开源软件。
委托给 Vercel
这个回购协议大量借用了
如果您想谈论自己的数据,您需要:
data/
目录,其中包含矢量存储。pages/api/util.ts
中使用的提示 - 现在这告诉聊天机器人仅响应有关LangChain的问题,因此为了使其能够处理您的数据,您需要相应地更新它。服务器应该同样工作吗?