ConversAI是一种创新的对话式 AI 框架,旨在帮助用户跨各种文档格式和 Web 内容进行智能交互。 ConversAI 利用先进的自然语言处理 (NLP) 技术,实现无缝文本提取和查询功能,使其成为研究人员、学生、专业人士以及经常与文本信息交互的任何人的宝贵工具。
在信息过载的时代,高效的数据处理至关重要。 ConversAI 通过利用最先进的技术将非结构化数据转化为可操作的见解来应对这一挑战。无论是从 PDF 中提取有意义的信息、从 YouTube 视频中获取文字记录,还是从多个网页中收集数据,ConversAI 都提供了一个用户友好的界面,可以简化这些复杂的任务。
凭借其模块化设计,ConversAI 不仅仅是一个工具,更是一个可以扩展和定制以满足不同用户需求的平台。
在运行 ConversAI 之前,请确保已安装以下依赖项:
apt-get update && apt-get upgrade -y
apt-get install poppler-utils -y
此外,您需要为 GROQ API 设置环境变量:
GROQ_API_KEY
。克隆存储库:
git clone https://github.com/rauhanahmed/ConversAI.git
cd ConversAI
安装所需的软件包:
pip install -r requirements.txt
要启动该应用程序,请运行以下命令:
python app.py
Gradio 界面将在您的默认 Web 浏览器中打开。
如果GPU不可用,请修改config.ini
文件如下:
在[EMBEDDINGS]
部分下,更改:
device = cuda
到:
device = cpu
在[EASYOCR]
部分下,更改:
gpu = true
到:
gpu = false
这些调整将确保应用程序在 CPU 资源上平稳运行。
使用该界面后,请务必单击“清除”按钮以重置字段。这一点至关重要,因为此版本中尚未实现会话管理,并且未能清除输入可能会导致后续交互过程中意外的数据持久化。
这是项目目录树的综合视图:
ConversAI/
├── app.py # Main application file
├── config.ini # Configuration file
├── params.yaml # Prompts for the application
├── requirements.txt # Required Python packages
├── src/ # Source code directory
│ ├── components/ # Component modules
│ │ ├── loaders/ # Data loaders
│ │ │ ├── pdfLoader.py
│ │ │ ├── websiteCrawler.py
│ │ │ └── youtubeLoader.py
│ │ ├── rag/ # Retrieval-Augmented Generation components
│ │ │ └── RAG.py
│ │ └── vectors/ # Vector storage and processing
│ │ └── vectorstore.py
│ ├── utils/ # Utility functions and classes
│ │ ├── exceptions.py
│ │ ├── functions.py
│ │ ├── logging.py
│ ├── pipelines/ # Pipeline logic for data processing
│ │ └── completePipeline.py
└── README.md # Project documentation
ConversAI 不仅仅是一个工具;更是一个工具。它是一个全面的解决方案,用于管理多种文档格式和网络资源并从中提取见解。凭借其强大的功能和用户友好的界面,ConversAI 有望使信息检索和处理比以往更容易、更高效。
当然!以下是更新的部分,其中包含您的贡献和致谢:
该项目是在 Tech Consulting Partners 担任人工智能工程师时开发的。我从头开始构建了 ConversAI,实现了高级文档检索方法、重新排序技术、混合搜索方法、与大型语言模型 (LLM) 的多重集成以及许多其他复杂功能。
后端包括用户管理功能、复杂的数据存储解决方案(包括S3存储管理)、数据库管理和矢量数据库。部署策略利用强大的 API、Docker 容器、CI/CD 实践、模型监控和云平台部署。
这个开源原型是迈向更全面的公益项目的基石,展示了先进人工智能技术在日常应用中的巨大潜力。我衷心感谢技术咨询合作伙伴将这一举措委托给我,并在整个开发过程中提供了宝贵的支持。
该项目根据 MIT 许可证获得许可 - 有关详细信息,请参阅许可证文件。
我们希望您喜欢使用 ConversAI!如有任何问题或反馈,请通过项目存储库或电子邮件联系。