microGPT es una implementación ligera del modelo Transformador generativo preentrenado (GPT) para tareas de procesamiento del lenguaje natural. Está diseñado para ser simple y fácil de usar, lo que lo convierte en una excelente opción para aplicaciones a pequeña escala o para aprender y experimentar con modelos generativos.
300.000 iteraciones de entrenamiento
pip install -r requirements.txt
tokenizer/train_tokenizer.py
para generar el archivo tokenizer. El modelo tokenizará el texto basándose en él.datasets/prepare_dataset.py
para generar archivos de conjunto de datos.train.py
para comenzar a entrenar ~Modifique los archivos indicados anteriormente si desea cambiar sus parámetros.
Para editar los parámetros de generación del modelo, dirígete inference.py
a esta sección:
# Parameters (Edit here):
n_tokens = 1000
temperature = 0.8
top_k = 0
top_p = 0.9
model_path = 'models/microGPT.pth'
# Edit input here
context = "The magical wonderland of"
¿Está interesado en implementarla como una aplicación web? ¡Mira la implementación de microGPT!
Eficiencia desde cero: Desarrollado desde cero, microGPT representa un enfoque optimizado para el estimado modelo GPT. Muestra una eficiencia notable al tiempo que mantiene una ligera compensación en calidad.
Área de aprendizaje: diseñada para personas deseosas de profundizar en el mundo de la IA, la arquitectura de microGPT ofrece una oportunidad única para comprender el funcionamiento interno de los modelos generativos. Es una plataforma de lanzamiento para perfeccionar sus habilidades y profundizar su comprensión.
Potencia a pequeña escala: más allá del aprendizaje y la experimentación, microGPT es una opción adecuada para aplicaciones a pequeña escala. Le permite integrar la generación de lenguaje impulsada por IA en proyectos donde la eficiencia y el rendimiento son primordiales.
Capacidades de personalización: la adaptabilidad de microGPT le permite modificar y ajustar el modelo para adaptarlo a sus objetivos específicos, ofreciendo un lienzo para crear soluciones de IA adaptadas a sus necesidades.
Viaje de aprendizaje: utilice microGPT como trampolín para comprender los fundamentos de los modelos generativos. Su diseño y documentación accesibles proporcionan un entorno ideal para quienes son nuevos en la IA.
Laboratorio de experimentación: participe en experimentos ajustando y probando los parámetros de microGPT. La simplicidad y versatilidad del modelo proporcionan un terreno fértil para la innovación.
Si desea contribuir, siga estas pautas:
Al contribuir a este repositorio, usted acepta cumplir con nuestro Código de conducta y que sus contribuciones se publicarán bajo la misma Licencia que el repositorio.
Este modelo está inspirado en Andrej Karpathy. Construyamos GPT desde cero y Andrej Kaparthy nanoGPT con modificaciones para este proyecto.