Isto foi feito para o CruzHacks 2020 por Garrett Webb e Chandni Nagda, por favor, não roube nosso trabalho, apenas nos pergunte. Foi postado no Devpost para o referido hackathon em https://devpost.com/software/what-would-trump-tweet-ds6wxl.
além disso, devido à proibição do Twitter de Donald Trump, isso não pode ser alimentado com nenhum dado novo, mas pode ser adaptado para uso na página do Twitter de outra pessoa.
Analise as bobagens de Trump usando a PNL do Microsoft Azure e o modelo de linguagem trigrama. Gere bobagens semelhantes para um determinado tópico.
Instale o que você precisa:
go on the internet and get python 3.xx (latest version)
sudo easy_install pip (mac only, or just install pip the way you would)
pip install nltk (or pip3)
pip install tweepy (or pip3)
pip install azure (or pip3)
pip install numpy (or pip3)
python3 (this will take you to the python interpereter CLI)
>> import nltk
>> nltk.download('punkt')
there may be more but it should tell you.
Basta criar seu próprio arquivo config.py com chaves de API para Twitter e Microsoft Azure Text Analytics. Defina o seguinte para o Microsoft Azure:
subscription_key = "whatever"
endpoint = "whatever"
filename = "whatever"
Defina o seguinte para o Twitter
auth = tweepy.OAuthHandler("whatever")
auth.set_access_token("whatever")
Em seguida, execute model.py com topic como argumento de linha de comando ou execute trumptweets .py e deixe-o ir (ele tweetará continuamente no intervalo de tempo que você definir). Aqui está um exemplo na linha de comando:
python3 model.py <keyword>
gerará um tweet para o consolepython3 trumptweets .py
irá gerar e enviar um tweet para o console, bem como publicá-lo no Twitter no intervalo de tempo especificado no código.Vá para https://twitter.com/R3alFakeDonald (nosso bot do Twitter) ou crie sua própria conta de desenvolvedor do Twitter e bot para ver sua loucura se desenrolar.
Inspiração
Curiosidade e Presidente Trump
O que isso faz
Analisa os tweets de Donald Trump e, dada uma frase-chave, constrói um modelo de linguagem para os tweets de Donald Trump sobre esse tópico, depois usa o modelo para gerar um tweet potencial e twitta-o para o Twitter.
Como eu construí
Primeiro, limpamos os dados do arquivo do Twitter de Donald e, em seguida, usamos a API de análise de texto do Microsoft Azure para obter as frases-chave de cada tweet. Depois disso, adicionamos funcionalidade para agrupar os tweets com base na aparência de uma determinada palavra no conjunto de frases-chave de um tweet gerado pelo Azure. Com esse subconjunto, geramos e executamos um modelo de linguagem no conjunto menor de dados mais relevantes. Isso fornece um tweet mais relacionado à palavra-chave que fornecemos ao sistema.
Desafios que encontrei
De longe, o maior desafio foi encontrar e incorporar um modelo de linguagem que funcionasse bem em um pequeno subconjunto de tweets. superamos isso usando NLTK e um modelo de linguagem trigrama. O próximo desafio foi usar isso para gerar um corpus customizado com base nos dados, e não com corpus pré-fornecidos nas bibliotecas. Outro desafio ainda foi usar a API Microsoft Azure Text Analytics e pensar nos limites de uso, com a nossa grande quantidade de tweets que estavam sendo analisados. Superamos isso simplesmente processando-os em lotes de 1.000 tweets a cada minuto para cumprir o limite de 1k/60s.
Realizações das quais me orgulho
Melhorar o modelo padrão de Rede Neural que gerava tweets incompreensíveis ao usar o Azure para relacioná-lo a um determinado tópico. Acredito que essa foi uma ideia muito boa para usar um pequeno conjunto de dados.
O que eu aprendi
Aprendi como usar NLTK, API de análise de texto do Microsoft Azure e Tweepy (API do Twitter) para criar um bot do Twitter totalmente funcional usando processamento de linguagem natural.
O que vem a seguir para o que Trump tweetaria
Para liberá-lo no mundo e possivelmente colocá-lo em uma instância de nuvem AWS ou Azure para execução indefinida.