IncarnaMind下载 - IncarnaMind源代码下载

IncarnaMind

其他源码

1.0.0

下载

？ incarnamind

？简而言之

Uncarnamind使您可以与您的个人文件聊天？（PDF，TXT）使用大型语言模型（LLM）（例如GPT）（架构概述）。虽然OpenAI最近推出了用于GPT模型的微调API，但它并不能使基本概括的模型能够学习新数据，并且响应可能容易出现事实幻觉。利用我们的滑动窗口块机制和集合回收刀可以在地面真相文档中有效查询细粒度和粗粒的信息，以增强LLMS。

随时使用它，我们欢迎任何反馈和新功能建议吗？

新更新

开源和本地LLMS支持

推荐模型：我们主要使用Llama2系列模型进行了测试，并建议使用Llama2-70B-Chat（Full或GGGUF版本）进行最佳性能。可以随意尝试其他LLM。
系统要求：它需要超过35GB的GPU RAM来运行GGGUF量化版本。

替代开源LLMS选项

RAM不足：如果您受GPU RAM的限制，请考虑使用the.ai api。它支持Llama2-70B-Chat和大多数其他开源LLM。另外，您将获得25美元的免费使用。
即将到来的：将来将发布较小且成本效益的微调模型。

如何使用GGGUF模型

有关获取和使用量化的GGUF LLM（类似于GGML）的说明，请参阅此视频（从10:45到12:30）。

这是我测试过的不同模型的比较表，仅参考：

指标	GPT-4	GPT-3.5	克劳德2.0	Llama2-70B	LLAMA2-70B-GGUF	Llama2-70b-api
推理	高的	中等的	高的	中等的	中等的	中等的
速度	中等的	高的	中等的	非常低	低的	中等的
GPU RAM	N/A。	N/A。	N/A。	很高	高的	N/A。
安全	低的	低的	低的	高的	高的	低的

演示

demo.mp4

应对挑战

固定块：传统的抹布工具依靠固定的块大小，从而将其适应性限制在处理不同的数据复杂性和上下文中。
精度与语义：当前的检索方法通常集中于语义理解或精确检索，但很少两者兼而有之。
单案限制：许多解决方案一次只能一次查询一个文档，从而限制多文件信息检索。
稳定性：Incarnamind与Openai GPT，人类Claude，Llama2和其他开源LLM兼容，可确保稳定的解析。

关键功能

自适应块：我们的滑动窗口块技术可以动态调整窗口的大小和位置，以基于数据复杂性和上下文平衡细粒度和粗粒的数据访问。
多文件对话质量质量检查：同时支持多个文档跨多个文档的简单和多跳的查询，从而打破了单文件限制。
文件兼容性：支持PDF和TXT文件格式。
LLM模型兼容性：支持OpenAI GPT，人类Claude，Llama2和其他开源LLM。

？建筑学

高级体系结构

滑动窗口块

入门

1。安装

安装很简单，您只需要运行几个命令即可。

1.0。先决条件

3.8≤Python<3.11与Conda
一个/全部OpenAI API键，拟人化的Claude API键，ai api键或ginggingface toekn用于元llama模型
当然，您自己的文件。

1.1。克隆存储库

git clone https://github.com/junruxiong/IncarnaMind
cd IncarnaMind

1.2。设置

创建conda虚拟环境：

conda create -n IncarnaMind python=3.10

激活：

conda activate IncarnaMind

安装所有要求：

pip install -r requirements.txt

如果您想运行量化的本地LLM，请安装Llama-CPP。

对于NVIDIA GPU支持，请使用cuBLAS

CMAKE_ARGS= " -DLLAMA_CUBLAS=on " FORCE_CMAKE=1 pip install llama-cpp-python==0.1.83 --no-cache-dir

对于苹果金属（ M1/M2 ）支持，请使用

CMAKE_ARGS= " -DLLAMA_METAL=on "  FORCE_CMAKE=1 pip install llama-cpp-python==0.1.83 --no-cache-dir

在configparser.ini文件中设置您的一个/所有API键：

[tokens]
OPENAI_API_KEY = (replace_me)
ANTHROPIC_API_KEY = (replace_me)
TOGETHER_API_KEY = (replace_me)
# if you use full Meta-Llama models, you may need Huggingface token to access.
HUGGINGFACE_TOKEN = (replace_me)

（可选）在configparser.ini文件中设置自定义参数：

[parameters]
PARAMETERS 1 = (replace_me)
PARAMETERS 2 = (replace_me)
...
PARAMETERS n = (replace_me)

2。用法

2.1。上传并处理您的文件

将所有文件（请正确命名每个文件以最大化性能命名）中的/数据目录，然后运行以下命令摄入所有数据：（您可以在运行命令之前删除/数据目录中的示例文件）

python docs2db.py

2.2。跑步

为了开始对话，请运行一个命令：

python main.py

2.3。聊天并问任何问题

等待脚本需要下面的输入。

Human:

2.4。其他的

当您开始聊天时，系统将自动生成一个incarnamind.log文件。如果要编辑日志记录，请在configparser.ini文件中进行编辑。

[logging]
enabled = True
level = INFO
filename = IncarnaMind.log
format = %(asctime)s [%(levelname)s] %(name)s: %(message)s

限制

当前版本不支持引用，但很快就会发布。
有限的异步功能。

即将到来的功能

前端UI接口
微调小尺寸开源LLM
OCR支持
异步优化
支持更多文档格式

？致谢

特别感谢Langchain，Chroma DB，Lastgpt，Llama-CPP对开源社区的宝贵贡献。他们的作品在使哥伦布项目成为现实方面发挥了作用。

？引用

如果您想引用我们的工作，请使用以下Bibtex条目：

 @misc { IncarnaMind2023 ,
  author = { Junru Xiong } ,
  title = { IncarnaMind } ,
  year = { 2023 } ,
  publisher = { GitHub } ,
  journal = { GitHub Repository } ,
  howpublished = { url{https://github.com/junruxiong/IncarnaMind} }
}

？执照

Apache 2.0许可证

展开

附加信息

版本 1.0.0
类型其他源码
更新时间 2025-02-27
大小 49.32MB
来自于 Github