Download de IncarnaMind - download do código -fonte IncarnaMind

IncarnaMind

Outro código-fonte

1.0.0

Baixar

? Encarnamind

? Em poucas palavras

O Incarnamind permite que você converse com seus documentos pessoais? (PDF, TXT) usando modelos de idiomas grandes (LLMS) como GPT (Visão geral da arquitetura). Embora o OpenAI tenha lançado recentemente uma API de ajuste fino para modelos GPT, ele não permite que os modelos básicos pré-terem aprenda novos dados, e as respostas podem ser propensas a alucinações factuais. Utilize nosso mecanismo de chunking de janelas deslizantes e o Ensemble Retriever permite uma consulta eficiente de informações de granulação fina e grossa em seus documentos da verdade para aumentar o LLMS.

Sinta -se à vontade para usá -lo e recebemos algum feedback e novas sugestões de recursos?

Novas atualizações

Suporte de código aberto e LLMS local

Modelo recomendado: testamos principalmente com os modelos da série LLAMA2 e recomendamos o uso do LLAMA2-70B-CAT (versão completa ou GGUF) para um desempenho ideal. Sinta -se à vontade para experimentar outros LLMs.
Requisitos do sistema: Requer mais de 35 GB de RAM da GPU para executar a versão quantizada do GGUF.

Opções alternativas de llms de código aberto

RAM insuficiente: se você é limitado pela GPU RAM, considere usar a API juntas.ai. Ele suporta LLAMA2-70B-CHAT e a maioria dos outros LLMs de código aberto. Além disso, você recebe US $ 25 em uso gratuito.
No próximo: modelos menores e econômicos e ajustados serão lançados no futuro.

Como usar os modelos GGUF

Para obter instruções sobre a aquisição e o uso do Quantized GGuf LLM (semelhante ao GGML), consulte este vídeo (de 10:45 às 12:30) ..

Aqui está uma tabela de comparação dos diferentes modelos que testei, apenas para referência:

Métricas	GPT-4	GPT-3.5	Claude 2.0	Llama2-70b	LLAMA2-70B-GGUF	LLAMA2-70B-API
Raciocínio	Alto	Médio	Alto	Médio	Médio	Médio
Velocidade	Médio	Alto	Médio	Muito baixo	Baixo	Médio
GPU RAM	N / D	N / D	N / D	Muito alto	Alto	N / D
Segurança	Baixo	Baixo	Baixo	Alto	Alto	Baixo

Demonstração

Demo.MP4

Desafios abordados

Chunking fixo : as ferramentas tradicionais de pano dependem de tamanhos de pedaços fixos, limitando sua adaptabilidade no manuseio da complexidade e contexto de dados variados.
Precisão vs. Semântica : Os métodos atuais de recuperação geralmente se concentram no entendimento semântico ou na recuperação precisa, mas raramente ambos.
Limitação de documentos únicos : Muitas soluções só podem consultar um documento de cada vez, restringindo a recuperação de informações de vários documentos.
Estabilidade : O Encarnamind é compatível com o OpenAI GPT, Claude antrópico, llama2 e outros LLMs de código aberto, garantindo análise estável.

Principais recursos

Chunking adaptável : Nossa técnica de chunking de janela deslizante ajusta dinamicamente o tamanho e a posição da janela para o RAG, equilibrando o acesso de dados de granulação fina e granulada com base na complexidade e no contexto de dados.
QA de conversação de vários documentos : suporta consultas simples e multi-hop em vários documentos simultaneamente, quebrando a limitação de documentos únicos.
Compatibilidade do arquivo : suporta formatos de arquivo pdf e txt.
Compatibilidade do modelo LLM : suporta o OpenAI GPT, Claude antrópico, LLAMA2 e outros LLMs de código aberto.

? Arquitetura

Arquitetura de alto nível

imagem

CHUNKING DE JANEIRA VIVIDO

imagem

Começando

1. Instalação

A instalação é simples, você só precisa executar alguns comandos.

1.0. Pré -requisitos

3,8 ≤ python <3,11 com conda
Uma/todas as chaves da API do OpenAI, key antropal da API Claude, juntas.
E, claro, seus próprios documentos.

1.1. Clone o repositório

git clone https://github.com/junruxiong/IncarnaMind
cd IncarnaMind

1.2. Configurar

Crie o ambiente virtual do conda:

conda create -n IncarnaMind python=3.10

Ativar:

conda activate IncarnaMind

Instale todos os requisitos:

pip install -r requirements.txt

Instale o LLAMA-CPP SEPERACLY se você quiser executar o LLMS local quantizado:

Para o suporte de GPUs NVIDIA , use cuBLAS

CMAKE_ARGS= " -DLLAMA_CUBLAS=on " FORCE_CMAKE=1 pip install llama-cpp-python==0.1.83 --no-cache-dir

Para suporte de metal de maçã ( M1/M2 ), use

CMAKE_ARGS= " -DLLAMA_METAL=on "  FORCE_CMAKE=1 pip install llama-cpp-python==0.1.83 --no-cache-dir

Configure suas teclas de uma/todas as API no arquivo configParser.ini :

[tokens]
OPENAI_API_KEY = (replace_me)
ANTHROPIC_API_KEY = (replace_me)
TOGETHER_API_KEY = (replace_me)
# if you use full Meta-Llama models, you may need Huggingface token to access.
HUGGINGFACE_TOKEN = (replace_me)

(Opcional) Configure seus parâmetros personalizados no arquivo configParser.ini :

[parameters]
PARAMETERS 1 = (replace_me)
PARAMETERS 2 = (replace_me)
...
PARAMETERS n = (replace_me)

2. Uso

2.1. Carregue e processe seus arquivos

Coloque todos os seus arquivos (nomeie cada arquivo corretamente para maximizar o desempenho) no diretório /dados e execute o seguinte comando para ingerir todos os dados: (Você pode excluir arquivos de exemplo no diretório /dados antes de executar o comando)

python docs2db.py

2.2. Correr

Para iniciar a conversa, execute um comando como:

python main.py

2.3. Conversar e fazer qualquer pergunta

Aguarde o script exigir sua entrada como a abaixo.

Human:

2.4. Outros

Quando você inicia um bate -papo, o sistema gera automaticamente um arquivo Incarnamind.log . Se você deseja editar o log, edite no arquivo configparser.ini .

[logging]
enabled = True
level = INFO
filename = IncarnaMind.log
format = %(asctime)s [%(levelname)s] %(name)s: %(message)s

Limitações

A citação não é suportada para a versão atual, mas será lançada em breve.
Capacidades assíncronas limitadas.

Próximos recursos

Interface da interface do usuário do frontend
LLMs de código aberto de tamanho pequeno de ajuste fino
Suporte de OCR
Otimização assíncrona
Apoie mais formatos de documentos

? Agradecimentos

Agradecimentos especiais a Langchain, Chroma DB, LocalGPT, LLAMA-CPP por suas contribuições inestimáveis para a comunidade de código aberto. Seu trabalho tem sido fundamental para tornar o projeto Incarnamind uma realidade.

? Citação

Se você deseja citar nosso trabalho, use a seguinte entrada do Bibtex:

 @misc { IncarnaMind2023 ,
  author = { Junru Xiong } ,
  title = { IncarnaMind } ,
  year = { 2023 } ,
  publisher = { GitHub } ,
  journal = { GitHub Repository } ,
  howpublished = { url{https://github.com/junruxiong/IncarnaMind} }
}