Chat your Data 是一個使用 Next.js、React 和 OpenAI 建構的應用程式。該專案允許用戶與基於人工智慧的聊天機器人進行通信,該機器人為用戶的查詢提供相關答案。該應用程式使用自然語言處理(NLP)技術來理解用戶的查詢並提供準確的回應。
在安裝 Chat your Data 之前,請確保您的系統上已安裝 Node.js。安裝 Node.js 後,請按照以下步驟安裝應用程式:
yarn install
來安裝專案依賴項。.env
文件,並根據需要配置環境變數。首先,從.env.example
建立一個新的.env
文件,並新增在此處找到的 OpenAI API 金鑰。
cp .env.example .env
需保留LangChain 0.0.22版本。任何更高的東西都會重構程式碼並破壞。致力於 ChatModel 的重構
資料攝取分兩步驟進行。
首先,您應該下載書籍/原始程式碼並將其格式化為可讀的內容並將其轉換為md
格式。將該來源新增至專案資料夾並更新ingest.ts
中的FILENAME
以符合檔案名稱。
接下來,安裝相依性並執行攝取腳本:
yarn && yarn ingest
這將解析資料、分割文字、建立嵌入、將它們儲存在向量儲存中,然後將其儲存到data/
目錄。
我們將其保存到目錄中,因為我們只想運行一次(昂貴的)資料攝取過程。
Next.js 伺服器依賴data/
目錄的存在。請確保在繼續下一步之前執行此命令。
若要啟動“聊天您的資料”應用程序,請在終端機中執行以下命令:
yarn dev
應用程式啟動後,您可以透過在 Web 瀏覽器中導航到http://localhost:3000
來存取它。
專案中可以使用以下腳本:
dev
:啟動開發伺服器。build
:建立生產就緒的應用程式。start
:啟動生產就緒應用程式。lint
:使用 ESLint 檢查專案檔。download
:下載聊天機器人運作所需的資料。ingest
:將下載的資料攝取到聊天機器人。 運行 Hometown Chatbot 應用程式需要以下相依性:
@emotion/react
@emotion/styled
@microsoft/fetch-event-source
@mui/material
dotenv
hnswlib-node
langchain
next
openai
react
react-dom
react-markdown
remark-gfm
sharp
ws
出於開發目的,需要以下 devDependency:
@types/adm-zip
@types/node
@types/react
@types/react-dom
@types/ws
cohere-ai
ts-node
tsx
typescript
歡迎貢獻「聊天您的數據」。如果您發現任何錯誤或問題,請在專案的 GitHub 儲存庫上提出。您也可以透過提交拉取請求來為專案做出貢獻。
Hometown Chatbot 是根據MIT 許可證授權的開源軟體。
委託給 Vercel
這個回購協議大量借用了
如果您想談論自己的數據,您需要:
data/
目錄,其中包含向量儲存。pages/api/util.ts
中使用的提示 - 現在這告訴聊天機器人只回應有關LangChain的問題,因此為了讓它處理您的數據,您需要相應地更新它。伺服器應該同樣工作嗎?