Download JustJoking.ai - Download do código-fonte JustJoking.ai

JustJoking.ai

Código-Fonte de IA

1.0.0

Baixar

JustJoking.ai

Neste projeto treinei um modelo de transformador para gerar piadas curtas. Então, com uma ligeira modificação no método de inferência, consegui usar o mesmo modelo de forma que, dada uma string inicial como entrada, o modelo tenta completá-la de forma humorística.

Existem dois notebooks fazendo a mesma tarefa.

Em Joke Generation.ipynb, usei o modelo GPT2-LM da biblioteca HuggingFace pré-treinada e apenas ajustamos esse modelo no conjunto de dados de piadas. Como estamos usando o aprendizado por transferência e ajustando os pesos, leva apenas cerca de 4 épocas para obter bons resultados.

Resultado da geração de piada Geração de piada de resultado

Resultado da conclusão da frase Conclusão da piada do resultado

Em Joke_Completion_Pure_TF2_Implementation.ipynb criei o modelo completo do transformador do zero. Como começa com pesos iniciais aleatórios, leva cerca de 10 épocas para obter um resultado decente deste modelo.

Resultados Conclusão da piada do resultado

Dados

Para nossa tarefa usaremos o conjunto de dados fornecido no Kaggle. É um csv contendo mais de 200.000 piadas curtas retiradas do Reddit.

Nota: Como o conjunto de dados foi simplesmente retirado de vários subreddits, um grande número de piadas no conjunto de dados são bastante racistas e sexistas. Visto que qualquer IA assume seus dados de treinamento como fonte única de conhecimento, deve-se esperar que às vezes nosso modelo gere piadas semelhantes.

Pré-processamento:

Depois de tokenizar nossa string de piada, adicionamos um start_token e um end_token no final da lista tokenizada. Além disso, como nossa string de piada pode ter comprimentos diferentes, também aplicamos preenchimento em todas as strings a um max_length especificado para que todos os tensores tenham formato semelhante em nossos lotes.

JustJoking.ai - Usando o modelo GPT2-LM Head

O código para isso pode ser encontrado no notebook Joke Generation.ipynb . Neste iremos importar o modelo GPT2Tokenizer e TFGPT2LMHead da biblioteca HuggingFace. O código é escrito em Tensorflow2. O notebook contém comentários que fornecem explicações para o código em locais adequados. Além disso, o HuggingFace Docs fornece uma boa documentação sobre quais são os parâmetros de entrada e o valor de retorno do modelo. Para a implementação baseada em PyTorch, consulte o repositório Humour.ai de Tanul Singh

JustJoking.ai – Construindo do zero usando TF2 API

O código para isso pode ser encontrado no notebook Joke_Completion_Pure_TF2_Implementation.ipynb . Levando o projeto um passo adiante para uma compreensão mais profunda de como as coisas estão funcionando, tentei construir um transformador sem biblioteca externa. Referi-me ao tutorial para Transformers fornecido pelo Tensorflow e coloquei algumas das explicações mencionadas em seu tutorial em meu notebook com mais explicações para que seja fácil entender o que está acontecendo.

Primeiro construí um tokenizer para nosso conjunto de dados e tokenizei as strings usando-o. Em seguida, construímos uma camada para Positional Encodings e MultiHeadAttention . Além disso, usei uma Lambda layer para criar as máscaras adequadas para nossos dados.

Então criei a construção de uma única decoder layer para nosso decodificador. A seguir está a arquitetura de uma única camada decodificadora.

Arquitetura da camada decodificadora

Assim que tivermos a função que fornece uma `camada decodificadora` pronta, construí uma função `decodificador` que aceita os tokens de entrada e a máscara como entrada, junto com um parâmetro do número da camada de decodificador que precisamos e retorna um modelo para o mesmo. Para nossa tarefa usaremos um decodificador de linguagem com 8 camadas decodificadoras. A seguir está a arquitetura do decodificador.

Arquitetura do decodificador

Para o modelo final transformer ele pega os tokens de entrada, passa-os pela camada lamda para obter a máscara e passa a máscara e os tokens para nosso decodificador de linguagem, cuja saída é então passada por uma camada densa. A seguir está a arquitetura do nosso modelo final.

Arquitetura da camada decodificadora

Se tudo isso parece intimidante, você pode consultar os cadernos para obter mais clareza. Tentei explicar detalhadamente o processo de construção do transformador no caderno.

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2024-12-30
tamanho 50MB
Vindo de Github

Aplicativos Relacionados

Câmera IA Mancai

2023-11-20
Um olhar IA

2023-10-24
Garota IA

2023-10-24
Desenho de IA

2023-10-24
Pintura de Yi Jian ai

2023-03-27
IA alienígena

2022-07-29

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
node telegram bot api

Código-Fonte de IA

v0.50.0
typebot.io

Código-Fonte de IA

v3.1.2
python wechaty getting started

Código-Fonte de IA

1.0.0
waymo open dataset

Outro código-fonte

December 2023 Update
termwind

Outras categorias

v2.3.0
wp functions

Outras categorias

1.0.0

Informações Relacionadas Todos