Descarga llm agent - Descarga del código fuente llm agent

llm agent

Otro código fuente

1.0.0

Descargar

memoria-a-largo-plazo-llm

LLM basado en RAG que utiliza memoria a largo plazo a través de una base de datos vectorial

Descripción

Este repositorio permite que el modelo de lenguaje grande utilice la memoria a largo plazo a través de una base de datos vectorial (este método se llama RAG (Generación Aumentada de Recuperación); es una técnica que permite a LLM recuperar datos de una base de datos externa). La aplicación está construida con mistral-7b-instruct-v0.2.Q4_K_M.gguf (usando el enlace LLAMA_cpp_python) y chromadb. El usuario puede solicitar en lenguaje natural agregar información a la base de datos, buscar información en la base de datos o en Internet utilizando la guía.

Características actuales:

agregar nueva memoria: agregar información (entre comillas) en lenguaje natural a la base de datos
memoria de consulta: solicitar información de una base de datos en lenguaje natural
búsqueda web (experimental): encontrar información en Internet en lenguaje natural

Diagrama:

Diagrama

Ejemplo:

 You > Hi
LOG: [Response]
Bot < Hello! How can I assist you today?
You > Please add information to db "The user name is Rustam Akimov"
LOG: [Adding to memory]
Bot < Done!
You > Can you find on the Internet who is Pavel Durov
LOG: [Extracting question]
LOG: [Searching]
LOG: [Summarizing]
Bot < According to the search results provided, Pavel Durov is a Russian entrepreneur who co-founded Telegram Messenger Inc.
You > Please find information in db who is Rustam Akimov
LOG: [Extracting question]
LOG: [Querying memory]
Bot < According to the input memories, your name is Rustam Akimov.

Uso:

Instalar requisitos.txt
Descargar mistral-7b-instruct-v0.2.Q4_K_M.gguf (Nota: puedes usar otros modelos)
Obtenga la clave API de Google y el ID del motor de búsqueda
Especificar variables en .env
Ejecute chat.py

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2024-11-28
tamaño 137.46KB
Proviene de Github

Aplicaciones relacionadas

agent zero

2024-11-14
TensorRT LLM

2024-11-10
RD Agent

2024-11-08
Qwen Agent

2024-11-06
datadog agent

2024-11-02
Agente Roswell

2022-08-01

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
waymo open dataset

Otro código fuente

December 2023 Update
SmartTube

Otro código fuente

24.71 Stable
Sunamu

Otro código fuente

Release 2.2.0
waymo open dataset

Otro código fuente

December 2023 Update
wp functions

Otras categorias

1.0.0
termwind

Otras categorias

v2.3.0

Información relacionada Todo