microGPT é uma implementação leve do modelo Generative Pre-trained Transformer (GPT) para tarefas de processamento de linguagem natural. Ele foi projetado para ser simples e fácil de usar, o que o torna uma ótima opção para aplicações de pequena escala ou para aprender e experimentar modelos generativos.
300 mil iterações de treinamento
pip install -r requirements.txt
tokenizer/train_tokenizer.py
para gerar o arquivo tokenizer. O modelo irá tokenizar o texto com base nele.datasets/prepare_dataset.py
para gerar arquivos de conjunto de dados.train.py
para começar a treinar ~Modifique os arquivos indicados acima se desejar alterar seus parâmetros.
Para editar os parâmetros de geração do modelo, acesse inference.py
nesta seção:
# Parameters (Edit here):
n_tokens = 1000
temperature = 0.8
top_k = 0
top_p = 0.9
model_path = 'models/microGPT.pth'
# Edit input here
context = "The magical wonderland of"
Interessado em implantar como um aplicativo da web? Confira a implantação do microGPT!
Eficiência desde o início: Desenvolvido desde o início, o microGPT representa uma abordagem simplificada ao estimado modelo GPT. Ele apresenta uma eficiência notável, mantendo uma ligeira compensação em qualidade.
Learning Playground: Projetada para indivíduos ansiosos por mergulhar no mundo da IA, a arquitetura do microGPT oferece uma oportunidade única de compreender o funcionamento interno dos modelos generativos. É uma plataforma de lançamento para aprimorar suas habilidades e aprofundar sua compreensão.
Potência em pequena escala: além do aprendizado e da experimentação, o microGPT é uma opção adequada para aplicações de pequena escala. Ele permite que você integre a geração de linguagem baseada em IA em projetos onde a eficiência e o desempenho são fundamentais.
Capacidades de personalização: a adaptabilidade do microGPT permite que você modifique e ajuste o modelo para atender aos seus objetivos específicos, oferecendo uma tela para a criação de soluções de IA adaptadas às suas necessidades.
Jornada de aprendizagem: Use o microGPT como um trampolim para compreender os fundamentos dos modelos generativos. Seu design e documentação acessíveis fornecem um ambiente ideal para quem é novo na IA.
Laboratório de experimentação: participe de experimentos ajustando e testando os parâmetros do microGPT. A simplicidade e versatilidade do modelo proporcionam um terreno fértil para a inovação.
Se você gostaria de contribuir, siga estas diretrizes:
Ao contribuir para este repositório, você concorda em cumprir nosso Código de Conduta e que suas contribuições serão divulgadas sob a mesma licença do repositório.
Este modelo é inspirado no vídeo Andrej Karpathy Let's build GPT from scratch e Andrej Kaparthy nanoGPT com modificações para este projeto.