Este repositório contém código e recursos relacionados à Retrieval Augmented Generation (RAG), uma técnica projetada para resolver o problema de atualização de dados em Large Language Models (LLMs) como o Llama-2. Os LLMs muitas vezes carecem de conhecimento dos eventos recentes e de informações atualizadas. O RAG incorpora conhecimento externo de uma base de conhecimento nas respostas do LLM, permitindo respostas precisas e bem fundamentadas.
src
: Contém o código fonte para implementação da técnica RAG e interações com a base de conhecimento.data
: armazena conjuntos de dados e recursos relevantes para construir a base de conhecimento.db
: para gerenciar e armazenar incorporações de tokens ou representações vetoriais para pesquisas na base de conhecimento.requirements.txt
: pacotes Python necessários para executar o código neste repositório. RAG é uma abordagem inovadora que combina capacidades de Large Language Models (LLMs) com bases de conhecimento externas para melhorar a qualidade e a atualização das respostas geradas. Ele aborda o desafio das informações desatualizadas, recuperando conhecimento contextualmente relevante de fontes externas e incorporando-o ao conteúdo gerado pelo LLM.
Gradio é uma biblioteca Python que ajuda você a criar UIs rapidamente para seus modelos de aprendizado de máquina. Ele permite implantar modelos rapidamente e torná-los acessíveis por meio de uma interface amigável, sem extenso desenvolvimento de front-end.
Um aplicativo Gradio é iniciado quando o código gradio_chatbot.py
é executado. Ele contém elementos modificáveis, como modelo de incorporação, modelo de geração, prompt de sistema editável e parâmetros ajustáveis do LLM escolhido.
Para usar o código neste repositório, siga estas etapas:
Clone o repositório em sua máquina local.
Navegue até o diretório do repositório usando a linha de comando.
Instale os pacotes necessários usando o seguinte comando:
pip install -r requirements.txt
Execute o aplicativo chatbot usando o comando:
python src/gradio_chatbot.py
Assim que o aplicativo Gradio estiver instalado, carregue um documento (pdf ou csv), escolha os modelos (incorporação e geração), ajuste os parâmetros ajustáveis, mexa no prompt do sistema e pergunte o que precisar!