Descarga gptq_for_langchain - Descarga del código fuente gptq_for

gptq_for_langchain

Otro código fuente

1.0.0

Descargar

Modelos GPTQ en LangChain

Introducción

Este repositorio proporciona un marco potencial con ejemplos prácticos para desarrollar aplicaciones impulsadas por modelos de lenguaje (LLM) de código abierto cuantificados junto con LangChain. Específicamente, esta guía se centra en la implementación y utilización de variantes GPTQ cuantificadas de 4 bits de varios LLM, como WizardLM y WizardLM-Mega. Si bien los recursos dedicados a este tema específico son limitados en línea, este repositorio tiene como objetivo cerrar esa brecha y ofrecer guías completas.

La ejecución de LLM localmente ofrece numerosas ventajas, siendo la privacidad un factor clave. Al mantener sus datos dentro de su propio hardware, puede aprovechar las capacidades de estos modelos sin depender de API externas, lo que garantiza un mayor control sobre sus datos y permite el desarrollo de aplicaciones interesantes.

Requisitos previos

Ubuntu 22.04/WSL2 Ubuntu para Windows
GPU Nvidia con al menos 6 GB de VRAM
- 6 GB de VRAM son suficientes para cargar modelos 7B de 4 bits
8 subprocesos de CPU
Se recomiendan 16 GB de RAM
Controladores de Nvidia ya instalados (el comando nvidia-smi debería funcionar)
Espacio suficiente en disco para paquetes, controladores y archivos de modelo (~30 GB, puede variar según el sistema)
Git LFS

Nota: Se agregará compatibilidad con Docker.

Modelos probados

Por ahora se admiten los siguientes modelos GPTQ:

asistenteLM-7B-GPTQ
WizardLM-7B-sin censura-GPTQ

Ponerse en marcha

Para comenzar a utilizar modelos GPTQ con langchain, hay algunos pasos importantes:

Configurar el entorno Python
Instale las versiones correctas de Pytorch y el kit de herramientas CUDA
Configurar correctamente quant_cuda
Descargue los modelos GPTQ de HuggingFace
Después de los pasos anteriores, puede ejecutar demo.py y usar LLM con LangChain tal como lo hace para los modelos OpenAI.

Creando el entorno conda

Instale Miniconda siguiendo las instrucciones del sitio oficial.

Para comprobar si conda se configuró correctamente

$ conda --version

Inicializa conda en tu shell

$ conda init

Cree un nuevo entorno conda, asegúrese de usar la versión de Python especificada porque solo se probó en 3.10.9

$ conda create -n wizardlm_langchain python=3.10.9

Una vez creado el nuevo entorno, actívelo.

$ conda activate wizardlm_langchain

Configurando el ambiente

Todo el proceso discutido anteriormente del 2 al 4 se automatiza utilizando el script setup.sh bash. No dudes en modificarlo según tu gusto.

$ bash ./setup.sh

Lo ideal es que todos los pasos se ejecuten sin errores si el entorno está configurado correctamente.

Si se enfrenta a la siguiente excepción mientras ejecuta la demostración:

 Exception: Error while deserializing header: HeaderTooLarge

Entonces significa que el modelo no se descargó por completo, por lo que puede intentar volver a descargarlo usando el comando git clone que se encuentra en setup.py .

Antes de ejecutar la demostración, es bueno desactivar y reactivar el entorno cuando lo configura por primera vez.

Ejecute la demostración:

$ python demo.py

El uso de setup.sh descargará de forma predeterminada el modelo WizardLM-7B-GPTQ, pero si desea utilizar otros modelos que se probaron con este proyecto, puede utilizar el script download_model.sh .

$ download_model.sh < HUGGING FACE MODEL NAME >
# Example
$ ./download_model.sh " TheBloke/WizardLM-7B-uncensored-GPTQ "

Nota: Si no puede descargar los modelos completos de HF, asegúrese de que Git LFS esté configurado correctamente. El comando git lfs install a veces puede hacer el trabajo.

Uso

Una vez que haya completado el proceso de configuración, podrá utilizar los modelos GPTQ con LangChain siguiendo estos pasos:

Asegúrese de agregar el directorio raíz del proyecto wizardlm_langchain a PYTHONPATH para poder usarlo globalmente

Consulte el script de ejemplo demo.py para comprender cómo usarlo.

Contribuyendo

Las contribuciones a este repositorio son bienvenidas. Si encuentra algún problema o tiene sugerencias para mejorar, no dude en abrir un problema o enviar una solicitud de extracción.

Al contribuir, cumpla con las siguientes pautas:

Bifurca el repositorio y crea una nueva rama para tu contribución.
Incluya documentación y comentarios cuando sea necesario.
Escriba mensajes de confirmación claros.
Pruebe sus cambios minuciosamente antes de enviar una solicitud de extracción.

Licencia

Este repositorio tiene la licencia pública GNU. Consulte el archivo de LICENCIA para obtener más información.

Expresiones de gratitud

Nos gustaría agradecer las contribuciones de la comunidad de código abierto y los desarrolladores de los modelos GPTQ originales utilizados en este repositorio. Un millón de gracias a oobabooga/text-generación-webui, su trabajo ha sido de gran ayuda para configurar modelos GPTQ con langchain.

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2024-12-07
tamaño 31.61KB
Proviene de Github

Aplicaciones relacionadas

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
socat 1.8.0.1_for_Windows

2024-11-10
Sistema de gestión de agencias inmobiliarias eimsHouse_for_access

2010-06-28
Sistema de gestión de agencias inmobiliarias eimsHouse_for_mssql

2009-11-24
Sistema de gestión de información empresarial EIMS_for_mssql

2009-11-24

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
waymo open dataset

Otro código fuente

December 2023 Update
SmartTube

Otro código fuente

24.71 Stable
Sunamu

Otro código fuente

Release 2.2.0
waymo open dataset

Otro código fuente

December 2023 Update
wp functions

Otras categorias

1.0.0
termwind

Otras categorias

v2.3.0

Información relacionada Todo