ChatGPT 等大型語言模型 (LLM) 的一個重要應用是將其部署為聊天代理,以回應跨多個領域的人類查詢。雖然目前的法學碩士能夠熟練地回答一般性問題,但他們在複雜的診斷場景(例如法律、醫療或其他專業諮詢)方面往往表現不佳。這些場景通常需要以任務為導向的對話(TOD),其中人工智慧聊天代理必須主動提出問題並引導使用者實現特定目標或完成任務。先前的微調模型在 TOD 中表現不佳,而當前法學碩士中對話能力的全部潛力尚未充分開發。在本文中,我們介紹了 DiagGPT(診斷對話 GPT),這是一種將法學碩士擴展到更多 TOD 場景的創新方法。除了指導使用者完成任務外,DiagGPT 還可以有效管理整個對話開發過程中所有主題的狀態。此功能增強了使用者體驗,並提供了更靈活的TOD互動。我們的實驗表明,DiagGPT 在與使用者進行 TOD 方面表現出了出色的性能,展示了其在各個領域實際應用的潛力。
我們建立了一個新的資料集,LLM-TOD(大型語言模型資料集的任務導向的對話)。它用於定量評估基於LLM的任務導向對話模型的表現。資料集包含20 個數據,每個數據代表不同的主題:臨床、餐廳、飯店、醫院、火車、警察、巴士、景點、機場、酒吧、圖書館、博物館、公園、健身房、電影院、辦公室、理髮店、麵包店、動物園、和銀行。
.
├── chatgpt # implementation of base chatgpt
├── data
│ └── LLM-TOD # LLM-TOD dataset
├── demo.py # DiagGPT for demo test
├── diaggpt # simple version of DiagGPT for quantitative experiments
├── diaggpt_medical # full version of DiagGPT in the medical consulting scenario
│ ├── embedding # file store, retrieval, etc.
│ ├── main.py # main code of implementation
│ ├── prompts # all prompts in DiagGPT
│ ...
├── evalgpt # implementation of GPT evaluation
├── exp.py # code of quantitative experiments
├── exp_output # experiment results
├── openai_api_key.txt # openai key
├── requirements.txt # dependencies
├── usergpt # simulation of the user for quantitative experiments
...
pip install -r requirements.txt
touch openai_api_key.txt # put your openai api key in it
python demo.py # demo test
python exp.py # run quantitative experiments
這是一個非常簡單的醫療診斷場景中聊天機器人聊天過程的演示。我們模擬了病人看病的過程。 (一些患者/用戶輸入是由 GPT-4 產生的。)
在這個過程中,醫生不斷地收集患者的資訊並一步步分析
目前,專案現有功能非常初步。只是展示LLM的課題管理能力的演示版本,無法滿足實際專業諮詢的需求。
實驗的主要目的是展示 GPT-4 的潛力,但需要注意的是,這不是一個完全完善的應用程式或產品,而是一個實驗項目。 GPT-4 在複雜的現實業務場景中可能無法發揮最佳效能。我們鼓勵您改進它並將其應用到各種場景中,我們很高興聽到您的結果!
如果您發現此存儲庫有用,請引用以下論文:
@misc{cao2023diaggpt,
title={DiagGPT: An LLM-based and Multi-agent Dialogue System with Automatic Topic Management for Flexible Task-Oriented Dialogue},
author={Lang Cao},
year={2023},
eprint={2308.08043},
archivePrefix={arXiv},
primaryClass={cs.CL}
}