Download ThinkRAG - Download do código-fonte ThinkRAG

ThinkRAG

Código-Fonte de IA

1.0.0

Baixar

Inglês | Chinês Simplificado

Índice

?Introdução do Projeto
Principais características
? Suporte ao modelo
? Início rápido
Guia do usuário
?Arquitetura técnica
plano de desenvolvimento
? Contrato de licença

Pense RAG

O sistema de geração de aprimoramento de recuperação de modelos grandes ThinkRAG pode ser facilmente implantado em um laptop para obter respostas inteligentes a perguntas em uma base de conhecimento local.

O sistema é construído com base em LlamaIndex e Streamlit e foi otimizado para usuários domésticos em diversas áreas, como seleção de modelos e processamento de texto.

Principais características

ThinkRAG é um sistema aplicativo de modelo grande desenvolvido para profissionais, pesquisadores, estudantes e outros trabalhadores do conhecimento. Ele pode ser usado diretamente em laptops e os dados da base de conhecimento são salvos localmente no computador.

ThinkRAG possui os seguintes recursos:

Aplicação completa do framework LlamaIndex
O modo de desenvolvimento suporta armazenamento local de arquivos sem instalar nenhum banco de dados
Funciona em laptops sem suporte de GPU
Suporta modelos implantados localmente e uso offline

Em particular, ThinkRAG também fez muitas customizações e otimizações para usuários domésticos:

Use o divisor de texto Spacy para lidar melhor com caracteres chineses
Recursos aprimorados usando títulos chineses
Use modelos de prompt do Word em chinês para perguntas e respostas e processos de refinamento
Suporta grandes fabricantes de modelos nacionais por padrão, como Wisdom Spectrum, Dark Side of the Moon e Deep Search, etc.
Use um modelo de incorporação bilíngue, como o bge-large-zh-v1.5 da BAAI

Suporte de modelo

ThinkRAG pode usar todos os modelos suportados pelo quadro de dados LlamaIndex. Para obter informações sobre a lista de modelos, consulte a documentação relevante.

ThinkRAG está comprometido em criar um sistema aplicativo que seja diretamente utilizável, útil e fácil de usar.

Portanto, fizemos escolhas cuidadosas e compensações entre vários modelos, componentes e tecnologias.

Primeiro, usando modelos grandes, ThinkRAG suporta API OpenAI e todas as APIs LLM compatíveis, incluindo grandes fabricantes nacionais de modelos, como:

Zhipu
Tiro lunar
DeepSeek
…

Se você deseja implantar modelos grandes localmente, o ThinkRAG escolhe o Ollama, que é simples e fácil de usar. Podemos baixar modelos grandes para rodar localmente através do Ollama.

Atualmente, Ollama suporta a implantação localizada de quase todos os grandes modelos convencionais, incluindo Llama, Gemma, GLM, Mistral, Phi, Llava, etc. Para obter detalhes, visite o site oficial da Ollama abaixo.

O sistema também usa modelos incorporados e modelos reorganizados e suporta a maioria dos modelos do Hugging Face. Atualmente, o ThinkRAG usa principalmente os modelos da série BGE da BAAI. Os usuários domésticos podem visitar o site espelho para aprender e fazer download.

início rápido

Passo 1 Baixe e instale

Depois de baixar o código do Github, use pip para instalar os componentes necessários.

pip3 install -r requirements.txt

Para executar o sistema offline, primeiro baixe o Ollama do site oficial. Em seguida, use o comando Ollama para baixar modelos grandes como GLM, Gemma e QWen.

De forma síncrona, baixe o modelo de incorporação (BAAI/bge-large-zh-v1.5) e o modelo de reclassificação (BAAI/bge-reranker-base) de Hugging Face para o diretório localmodels.

Para etapas específicas, consulte o documento no diretório de documentos: HowToDownloadModels.md

Passo 2 Configuração do sistema

Para obter melhor desempenho, recomenda-se a utilização da API LLM de modelo comercial grande com centenas de bilhões de parâmetros.

Primeiro, obtenha a chave API do provedor de serviços LLM e configure as variáveis de ambiente a seguir.

ZHIPU_API_KEY = " "
MOONSHOT_API_KEY = " "
DEEPSEEK_API_KEY = " "
OPENAI_API_KEY = " "

Você pode pular esta etapa e configurar a chave API por meio da interface do aplicativo após o sistema estar em execução.

Se você optar por usar uma ou mais APIs LLM, exclua o provedor de serviços que você não usa mais no arquivo de configuração config.py.

Claro, você também pode adicionar outros provedores de serviços compatíveis com a API OpenAI no arquivo de configuração.

ThinkRAG é executado em modo de desenvolvimento por padrão. Neste modo, o sistema utiliza armazenamento de arquivos local e não é necessário instalar nenhum banco de dados.

Para mudar para o modo de produção, você pode configurar as variáveis de ambiente da seguinte maneira.

THINKRAG_ENV = production

No modo de produção, o sistema usa o banco de dados vetorial Chroma e o banco de dados de valores-chave Redis.

Se você não possui o Redis instalado, é recomendável instalá-lo por meio do Docker ou usar uma instância existente do Redis. Configure as informações de parâmetro da instância Redis no arquivo config.py.

Etapa 3 Execute o sistema

Agora você está pronto para executar o ThinkRAG.

Execute o seguinte comando no diretório que contém o arquivo app.py.

streamlit run app.py

O sistema será executado e abrirá automaticamente o seguinte URL no navegador para exibir a interface do aplicativo.

http://localhost:8501/

A primeira execução pode demorar um pouco. Se o modelo incorporado no Hugging Face não for baixado com antecedência, o sistema fará o download automaticamente do modelo e você precisará esperar mais.

Guia do usuário

1. Configuração do sistema

ThinkRAG suporta a configuração e seleção de modelos grandes na interface do usuário, incluindo: o URL base e a chave de API da API LLM de modelo grande, e você pode selecionar o modelo específico a ser usado, por exemplo: glm-4 do ThinkRAG.

O sistema detectará automaticamente se a API e a chave estão disponíveis. Se disponíveis, a instância do modelo grande atualmente selecionada será exibida em texto verde na parte inferior.

Da mesma forma, o sistema pode obter automaticamente os modelos baixados pelo Ollama, e o usuário pode selecionar o modelo desejado na interface do usuário.

Se você baixou o modelo incorporado e o modelo reorganizado para o diretório localmodels. Na interface do usuário, você pode alternar o modelo selecionado e definir os parâmetros do modelo reorganizado, como Top N.

Na barra de navegação esquerda, clique em Configurações avançadas (Configurações-Avançado). Você também pode definir os seguintes parâmetros:

Principais K
Temperatura
Alerta do sistema
Modo de resposta

Usando parâmetros diferentes, podemos comparar resultados de grandes modelos e encontrar a combinação de parâmetros mais eficaz.

2.Gerenciar base de conhecimento

ThinkRAG suporta o upload de vários arquivos, como PDF, DOCX, PPTX, etc., e também suporta o upload de URLs de páginas da web.

Clique no botão Procurar arquivos, selecione o arquivo em seu computador e clique no botão Carregar para carregar todos os arquivos carregados.

Em seguida, clique no botão Salvar e o sistema processará o arquivo, incluindo segmentação e incorporação de texto, e o salvará na base de conhecimento.

Da mesma forma, você pode inserir ou colar o URL da página da web, obter as informações da página da web e salvá-las na base de conhecimento após o processamento.

O sistema suporta o gerenciamento da base de conhecimento.

Conforme mostrado na figura acima, ThinkRAG pode listar todos os documentos da base de conhecimento em páginas.

Selecione os documentos a serem excluídos e o botão Excluir documentos selecionados aparecerá. Clique neste botão para excluir os documentos da base de conhecimento.

3. Perguntas e respostas inteligentes

Na barra de navegação esquerda, clique em Consulta e a página inteligente de perguntas e respostas aparecerá.

Após inserir a pergunta, o sistema irá pesquisar a base de conhecimento e fornecer uma resposta. Durante esse processo, o sistema utilizará tecnologias como recuperação e reorganização híbrida para obter conteúdo preciso da base de conhecimento.

Por exemplo, carregamos um documento Word na base de conhecimento: "David Says Process.docx".

Agora insira a pergunta: “Quais são as três características de um processo?”

Conforme mostrado na figura, o sistema demorou 2,49 segundos para dar uma resposta precisa: o processo é direcionado, repetitivo e processual. Ao mesmo tempo, o sistema também fornece 2 documentos relacionados recuperados da base de conhecimento.

Pode-se observar que o ThinkRAG implementa de forma completa e eficaz a função de geração aprimorada de recuperação de grandes modelos com base na base de conhecimento local.

Arquitetura técnica

ThinkRAG é desenvolvido usando a estrutura de dados LlamaIndex e usa Streamlit para o front-end. O modo de desenvolvimento e o modo de produção do sistema utilizam componentes técnicos diferentes respectivamente, conforme mostrado na tabela a seguir:

	modo de desenvolvimento	modo de produção
Estrutura RAG	LhamaIndex	LhamaIndex
estrutura de front-end	Streamlit	Streamlit
modelo incorporado	BAAI/bge-small-zh-v1.5	BAAI/bge-grande-zh-v1.5
reorganizar modelo	BAAI/bge-reclassificador-base	BAAI/bge-reclassificador-grande
divisor de texto	SentençaSplitter	SpacyTextSplitter
Armazenamento de conversas	SimpleChatStore	Redis
Armazenamento de documentos	SimpleDocumentStore	Redis
Armazenamento de índice	SimpleIndexStore	Redis
armazenamento de vetores	SimpleVectorStore	LanceDB

Esses componentes técnicos são projetados arquitetonicamente de acordo com seis partes: front-end, estrutura, modelo grande, ferramentas, armazenamento e infraestrutura.

Conforme mostrado abaixo:

plano de desenvolvimento

ThinkRAG continuará a otimizar as funções principais e a melhorar a eficiência e a precisão da recuperação, incluindo principalmente:

Otimize o processamento de documentos e páginas da web, suporte a base de conhecimento multimodal e recuperação multimodal
Construa um gráfico de conhecimento, aprimore a recuperação por meio do gráfico de conhecimento e execute o raciocínio com base no gráfico
Use agentes inteligentes para lidar com cenários complexos, chamando com precisão outras ferramentas e dados para concluir tarefas.

Ao mesmo tempo, melhoraremos ainda mais a arquitetura do aplicativo e aprimoraremos a experiência do usuário, incluindo principalmente:

Design: Interface do usuário com senso de design e excelente experiência do usuário
Front-end: baseado em tecnologias como Electron, React, Vite, etc., crie aplicativos clientes de desktop para fornecer aos usuários maneiras extremamente simples de baixar, instalar e executar.
Back-end: fornece interfaces por meio de FastAPI, bem como fila de mensagens e outras tecnologias para melhorar o desempenho geral e a escalabilidade

Você está convidado a participar do projeto de código aberto ThinkRAG e trabalhar em conjunto para criar produtos de IA que os usuários adoram!