Este repositorio contiene todos los elementos necesarios para crear su propio LLM desde cero. Simplemente sigue las instrucciones. Inspirándome en el nanoGPT de Karpathy y el generador de Shakespeare, creé este repositorio para construir mi propio LLM. Tiene de todo, desde recopilación de datos para el modelo hasta archivo de arquitectura, tokenizador y archivo de tren.
Este repositorio contiene:
Antes de configurar SmallLanguageModel, asegúrese de tener instalados los siguientes requisitos previos:
Siga estos pasos para entrenar su propio tokenizador o generar resultados a partir del modelo entrenado:
Clona este repositorio:
git clone https://github.com/shivendrra/SmallLanguageModel-project
cd SLM-clone
Instalar dependencias:
pip install requirements.txt
Entrenar: Lea el archivo Training.md para obtener más información. Síguelo.
Las solicitudes de extracción son bienvenidas. Para cambios importantes, primero abra un problema para discutir lo que le gustaría cambiar. Asegúrese de actualizar las pruebas según corresponda.
Licencia MIT. Consulte License.md para obtener más información.