local LLM with RAG - local LLM with RAG

local LLM with RAG

Código-Fonte de IA

1.0.0

Baixar

LLM local com RAG

Um mago experimentando - Leonardo AI

Este projeto é uma sandbox experimental para testar ideias relacionadas à execução de Large Language Models (LLMs) locais com Ollama para realizar Retrieval-Augmented Generation (RAG) para responder perguntas com base em amostras de PDFs. Neste projeto, também estamos usando o Ollama para criar embeddings com o texto nomic-embed para usar com o Chroma. Observe que os embeddings são recarregados sempre que o aplicativo é executado, o que não é eficiente e é feito aqui apenas para fins de teste.

Há também uma interface web criada usando Streamlit para fornecer uma maneira diferente de interagir com Ollama.

Captura de tela da IU da web Streamlit

Requisitos

Ollama versão 0.1.26 ou superior.

Configurar

Clone este repositório em sua máquina local.
Crie um ambiente virtual Python executando python3 -m venv .venv .
Ative o ambiente virtual executando source .venv/bin/activate no Unix ou MacOS, ou ..venvScriptsactivate no Windows.
Instale os pacotes Python necessários executando pip install -r requirements.txt .

Executando o Projeto

Nota: Na primeira vez que você executar o projeto, ele fará o download dos modelos necessários do Ollama para o LLM e embeddings. Este é um processo de configuração único e pode levar algum tempo dependendo da sua conexão com a Internet.

Certifique-se de que seu ambiente virtual esteja ativado.
Execute o script principal com python app.py -m <model_name> -p <path_to_documents> para especificar um modelo e o caminho para os documentos. Se nenhum modelo for especificado, o padrão é mistral. Se nenhum caminho for especificado, o padrão será Research localizada no repositório para fins de exemplo.
Opcionalmente, você pode especificar o modelo de incorporação a ser usado com -e <embedding_model_name> . Se não for especificado, o padrão é nomic-embed-text.

Isso carregará os PDFs e arquivos Markdown, gerará embeddings, consultará a coleção e responderá à pergunta definida em app.py .

Executando a IU Streamlit

Certifique-se de que seu ambiente virtual esteja ativado.
Navegue até o diretório que contém o script ui.py
Execute o aplicativo Streamlit executando streamlit run ui.py em seu terminal.

Isso iniciará um servidor web local e abrirá uma nova guia em seu navegador padrão, onde você poderá interagir com o aplicativo. A UI Streamlit permite selecionar modelos, selecionar uma pasta, fornecendo uma maneira mais fácil e intuitiva de interagir com o sistema RAG chatbot em comparação com a interface de linha de comando. A aplicação cuidará do carregamento de documentos, gerando embeddings, consultando o acervo e exibindo os resultados de forma interativa.

Tecnologias Utilizadas

Langchain: uma biblioteca Python para trabalhar com modelo de linguagem grande
Ollama: Uma plataforma para executar modelos de linguagem grande localmente.
Chroma: Um banco de dados vetorial para armazenar e recuperar embeddings.
PyPDF: uma biblioteca Python para leitura e manipulação de arquivos PDF.
Streamlit: Uma estrutura web para criação de aplicativos interativos para projetos de aprendizado de máquina e ciência de dados.

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2024-12-12
tamanho 18.51MB
Vindo de Github

Aplicativos Relacionados

TensorRT LLM

2024-11-10
Com meu passado

2024-02-21
Texto com Jesus

2023-08-17
Subir com carrinho de mão

2022-08-26
Corrida com Ryan

2022-08-21
Pássaros com sentimentos

2022-07-26

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
node telegram bot api

Código-Fonte de IA

v0.50.0
typebot.io

Código-Fonte de IA

v3.1.2
python wechaty getting started

Código-Fonte de IA

1.0.0
waymo open dataset

Outro código-fonte

December 2023 Update
termwind

Outras categorias

v2.3.0
wp functions

Outras categorias

1.0.0

Informações Relacionadas Todos