Descarga mengzi retrieval lm - Descarga de código fuente mengzi retrieval lm

mengzi retrieval lm

Otro código fuente

1.0.0

Descargar

Mengzi-Recuperación-LM

En Langboat Technology, nos centramos en mejorar los modelos previamente entrenados para hacerlos más ligeros y satisfacer las necesidades reales de la industria. Un enfoque basado en la recuperación (como RETRO, REALM y RAG) es crucial para lograr este objetivo.

Este repositorio es una implementación experimental del modelo de lenguaje de recuperación mejorada. Actualmente, solo admite la adaptación de recuperación en GPT-Neo.

Bifurcamos Huggingface Transformers y lm-evaluación-arnés para agregar soporte de recuperación. La parte de indexación se implementa como un servidor HTTP para desacoplar mejor la recuperación y el entrenamiento.

La mayor parte de la implementación del modelo se copia de RETRO-pytorch y GPT-Neo. Usamos transformers-cli para agregar un nuevo modelo llamado Re_gptForCausalLM basado en GPT-Neo y luego agregarle una parte de recuperación.

Cargamos el modelo instalado en EleutherAI/gpt-neo-125M usando la biblioteca de recuperación 200G.

Puede inicializar un modelo como este:

 from transformers import Re_gptForCausalLM
model = Re_gptForCausalLM . from_pretrained ( 'Langboat/ReGPT-125M-200G' )

Y evalúe el modelo así:

python main.py 
    --model retrieval 
    --model_args pretrained=model_path 
    --device 0 
    --tasks wikitext,lambada,winogrande,mathqa,pubmedqa  
    --batch_size 1

Calculamos la similitud utilizando la incrustación de Sentencia_Transformers como representación de texto. Puede inicializar un modelo Sentence-BERT de esta manera:

 from sentence_transformers import SentenceTransformer
model = SentenceTransformer ( 'all-MiniLM-L12-v2' )

Arquitectura

Arquitectura de la nube - Página 1 (1)

Uso

Ambiente

conda create -n mengzi-retrieval-fit python=3.7
conda activate mengzi-retrieval-fit
conda install pytorch torchvision torchaudio cudatoolkit=11.1 -c pytorch-lts -c nvidia
git clone https://github.com/Langboat/mengzi-retrieval-lm.git
cd mengzi-retrieval-lm
git submodule update --init --recursive
pip install -r requirement.txt
cd transformers/
pip install -e .
cd ..
python -c " from sentence_transformers import SentenceTransformer; model = SentenceTransformer('all-MiniLM-L12-v2') "

Descargar

Índice y base de datos

Usando IVF1024PQ48 como fábrica de índices faiss, cargamos el índice y la base de datos en el centro de modelos de huggingface, que se puede descargar usando el siguiente comando.

En download_index_db.py, puede especificar la cantidad de índices y bases de datos que desea descargar.

python -u download_index_db.py  --num 200

Modelo

Puede descargar manualmente el modelo instalado desde aquí: https://huggingface.co/Langboat/ReGPT-125M-200G

Configurar el servidor de índices

Comenzar

El servidor de índice se basa en FastAPI y Ray. Con Ray's Actor, las tareas computacionalmente intensivas se encapsulan de forma asincrónica, lo que nos permite utilizar de manera eficiente los recursos de CPU y GPU con una sola instancia de servidor FastAPI. Puede inicializar un servidor de índices de esta manera:

 cd index-server/
ray start --head
python -u api.py 
--config config_IVF1024PQ48.json 
--db_path ../db/models—Langboat—Pile-DB/snapshots/fd35bcce75db5c1b7385a28018029f7465b4e966

Tenga en cuenta que el recuento de fragmentos de configuración IVF1024PQ48.json debe coincidir con el número de índices descargados. Puede ver el número de índice descargado actualmente en db_path
Esta configuración se probó en el A100-40G, por lo que si tiene una GPU diferente, le recomendamos ajustarla a su hardware.
Después de implementar el servidor de índice, debe modificar request_server en lm-evaluación-harness/config.json y train/config.json.
Puede reducir encoder_actor_count en config_IVF1024PQ48.json para reducir los recursos de memoria necesarios.

· db_path: la ubicación de descarga de la base de datos desde huggingface. "../db/models—Langboat—Pile-DB/snapshots/fd35bcce75db5c1b7385a28018029f7465b4e966" es un ejemplo.

Este comando descargará la base de datos y los datos del índice de huggingface.

Cambie la carpeta de índice en el archivo de configuración (config IVF1024PQ48) para que apunte a la ruta de la carpeta de índice y envíe las instantáneas de la carpeta de la base de datos como la ruta de base de datos al script api.py.

Detener

Detenga el servidor de índice con el siguiente comando

ray stop

Tenga en cuenta que debe mantener el servidor de índice habilitado durante el entrenamiento, la evaluación y la inferencia.

Capacitación

Utilice train/train.py para implementar la capacitación; train/config.json se puede modificar para cambiar los parámetros de entrenamiento.

Puede inicializar el entrenamiento de esta manera:

 cd train
python -u train.py

Dado que el servidor de índice necesita utilizar recursos de memoria, es mejor implementar el servidor de índice y el entrenamiento del modelo en diferentes GPU.

Inferencia

Utilice train/inference.py como inferencia para determinar la pérdida de un texto y su perplejidad.

 cd train
python -u inference.py 
    --model_path Langboat/ReGPT-125M-200G 
    --file_name data/test_data.json

Test_data.json y train_data.json en la carpeta de datos son formatos de archivo actualmente admitidos; puede modificar sus datos a este formato.

Evaluaciones

Utilice lm-evaluación-arnés como método de evaluación

Establecimos el seq_len del lm-evaluación-arnés en 1025 como configuración inicial para la comparación de modelos porque el seq_len de nuestro entrenamiento de modelos es 1025.

 cd lm-evaluation-harness
python setup.py install

con recuperación

python main.py 
    --model retrieval 
    --model_args pretrained=Langboat/ReGPT-125M-200G 
    --device 0 
    --tasks wikitext  
    --batch_size 1

· model_path: la ruta del modelo adecuado

sin recuperación

python main.py 
	--model gpt2 
	--model_args pretrained=EleutherAI/gpt-neo-125M 
	--device 0 
	--tasks wikitext 
	--batch_size 1

Los resultados de la evaluación son los siguientes.

modelo	wikitexto palabra_perplejidad
EleutherAI/gpt-neo-125M	35.8774
Lancha/ReGPT-125M-200G	22.115
EleutherAI/gpt-neo-1.3B	17.6979
Lancha/ReGPT-125M-400G	14.1327

Citando a Mengzi Recuperación LM

 @software { mengzi-retrieval-lm-library ,
  title = { {Mengzi-Retrieval-LM} } ,
  author = { Wang, Yulong and Bo, Lin } ,
  url = { https://github.com/Langboat/mengzi-retrieval-lm } ,
  month = { 9 } ,
  year = { 2022 } ,
  version = { 0.0.1 } ,
}

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2024-12-08
tamaño 334.87KB
Proviene de Github

Aplicaciones relacionadas

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Retrieval based Voice Conversion WebUI

2024-11-01
LM confesión en línea producción de página web Código fuente PHP versión embellecida versión oficial

2022-11-01

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
waymo open dataset

Otro código fuente

December 2023 Update
SmartTube

Otro código fuente

24.71 Stable
Sunamu

Otro código fuente

Release 2.2.0
waymo open dataset

Otro código fuente

December 2023 Update
termwind

Otras categorias

v2.3.0
wp functions

Otras categorias

1.0.0

Información relacionada Todo