Configure e implemente fácilmente un servicio web de chatbot totalmente autohospedado basado en modelos de lenguajes grandes (LLM) de código abierto, como Mixtral o Llama 2, sin necesidad de conocimientos en aprendizaje automático.
? ¿O imagen docker
y llama.cpp
para realizar inferencias localmente.Para obtener más detalles sobre cómo usar Libre Chat, consulte la documentación en
Este proyecto es un trabajo en progreso, utilícelo con precaución.
Esos puntos de control son características en las que planeamos trabajar en el futuro; no dude en hacérnoslo saber en los problemas si tiene algún comentario o solicitud.
Si solo desea implementarlo rápidamente usando el modelo previamente entrenado Mixtral-8x7B-Instruct
, puede usar la ventana acoplable:
docker run -it -p 8000:8000
Puede configurar la implementación utilizando variables de entorno. Para esto, usar un docker compose
y un archivo .env
es más fácil, primero cree el archivo docker-compose.yml
version : " 3 "
services :
libre-chat :
image :
volumes :
# ️ Share folders from the current directory to the /data dir in the container
- ./chat.yml:/data/chat.yml
- ./models:/data/models
- ./documents:/data/documents
- ./embeddings:/data/embeddings
- ./vectorstore:/data/vectorstore
ports :
- 8000:8000
Y cree un archivo chat.yml
con su configuración en la misma carpeta que docker-compose.yml
llm :
model_path : ./models/mixtral-8x7b-instruct-v0.1.Q2_K.gguf
model_download :
temperature : 0.01 # Config how creative, but also potentially wrong, the model can be. 0 is safe, 1 is adventurous
max_new_tokens : 1024 # Max number of words the LLM can generate
# Always use input for the human input variable with a generic agent
prompt_variables : [input, history]
prompt_template : |
Your are an assistant, please help me
User: {input}
AI Assistant:
vector :
vector_path : null # Path to the vectorstore to do QA retrieval, e.g. ./vectorstore/db_faiss
# Set to null to deploy a generic conversational agent
vector_download : null
embeddings_path : ./embeddings/all-MiniLM-L6-v2 # Path to embeddings used to generate the vectors, or use directly from HuggingFace: sentence-transformers/all-MiniLM-L6-v2
embeddings_download :
documents_path : ./documents # Path to documents to vectorize
chunk_size : 500 # Maximum size of chunks, in terms of number of characters
chunk_overlap : 50 # Overlap in characters between chunks
chain_type : stuff # Or: map_reduce, reduce, map_rerank. More details:
search_type : similarity # Or: similarity_score_threshold, mmr. More details:
return_sources_count : 2 # Number of sources to return when generating an answer
score_threshold : null # If using the similarity_score_threshold search type. Between 0 and 1
info :
title : " Libre Chat "
version : " 0.1.0 "
description : |
Open source and free chatbot powered by [LangChain]( and [llama.cpp](
examples :
- What is the capital of the Netherlands?
- Which drugs are approved by the FDA to mitigate Alzheimer symptoms?
- How can I create a logger with timestamp using python logging?
favicon :
repository_url :
public_url :
contact :
name : Vincent Emonet
email : [email protected]
license_info :
name : MIT license
url :
Finalmente inicia tu servicio de chat con:
docker compose up
Este paquete requiere Python >=3.8, simplemente instálelo con pipx
o pip
pip install libre-chat
Puede iniciar fácilmente un nuevo servicio web de chat que incluye UI y API usando su terminal:
libre-chat start
Proporcione un archivo de configuración específico:
libre-chat start config/chat-vectorstore-qa.yml
Para reconstruir la tienda de vectores:
libre-chat build --vector vectorstore/db_faiss --documents documents
Obtenga un resumen completo de las opciones disponibles con:
libre-chat --help
O puede utilizar este paquete en scripts de Python:
import logging
import uvicorn
from libre_chat import ChatConf , ChatEndpoint , Llm
logging . basicConfig ( level = logging . getLevelName ( "INFO" ))
conf = ChatConf (
model_path = "./models/mixtral-8x7b-instruct-v0.1.Q2_K.gguf" ,
vector_path = None
llm = Llm ( conf = conf )
print ( llm . query ( "What is the capital of the Netherlands?" ))
# Create and deploy a FastAPI app based on your LLM
app = ChatEndpoint ( llm = llm , conf = conf )
uvicorn . run ( app )
Inspirado por:
Iconos de llamas creados por Freepik - Flaticon