Esto fue hecho para CruzHacks 2020 por Garrett Webb y Chandni Nagda. No robes nuestro trabajo, solo pregúntanos. Se publicó en Devpost para dicho hackathon en https://devpost.com/software/what-would-trump-tweet-ds6wxl.
Además, debido a la prohibición de Twitter de Donald Trump, esto no puede proporcionar ningún dato nuevo, pero podría adaptarse para su uso en la página de Twitter de otra persona.
Analice las tonterías de Trump utilizando Microsoft Azure PNL y el modelo de lenguaje de trigramas. Generar tonterías similares para un tema determinado.
Instala lo que necesitarás:
go on the internet and get python 3.xx (latest version)
sudo easy_install pip (mac only, or just install pip the way you would)
pip install nltk (or pip3)
pip install tweepy (or pip3)
pip install azure (or pip3)
pip install numpy (or pip3)
python3 (this will take you to the python interpereter CLI)
>> import nltk
>> nltk.download('punkt')
there may be more but it should tell you.
Simplemente cree su propio archivo config.py con claves API para Twitter y Microsoft Azure Text Analytics. Configure lo siguiente para Microsoft Azure:
subscription_key = "whatever"
endpoint = "whatever"
filename = "whatever"
Configura lo siguiente para Twitter
auth = tweepy.OAuthHandler("whatever")
auth.set_access_token("whatever")
Luego ejecute model.py con topic como argumento de línea de comando, o ejecute trumptweets .py y déjelo ir (twitteará continuamente en el intervalo de tiempo que establezca). Aquí hay un ejemplo en la línea de comando:
python3 model.py <keyword>
generará un tweet en la consolapython3 trumptweets .py
generará y enviará un tweet a la consola, así como también lo publicará en Twitter en el intervalo de tiempo que especifique en el código.Vaya a https://twitter.com/R3alFakeDonald (nuestro bot de Twitter) o cree su propia cuenta de desarrollador de Twitter y su bot para ver cómo se desarrolla su locura.
Inspiración
La curiosidad y el presidente Trump
que hace
Analiza los tweets de Donald Trump y, dada una frase clave, construye un modelo de lenguaje para los tweets de Donald Trump sobre ese tema, luego usa el modelo para generar un tweet potencial y lo envía a Twitter.
como lo construi
Primero, limpiamos los datos del archivo de Twitter de Donald y luego utilizamos la API de análisis de texto de Microsoft Azure para obtener frases clave de cada tweet. Después de eso, agregamos funcionalidad para subconjuntos de tweets según la apariencia de una palabra determinada en el conjunto de frases clave de un tweet generado por Azure. Con este subconjunto, generamos y ejecutamos un modelo de lenguaje en el conjunto más pequeño de datos más relevantes. Esto da un tweet más relacionado con la palabra clave que proporcionamos al sistema.
Desafíos que encontré
El mayor desafío, con diferencia, fue encontrar e incorporar un modelo de lenguaje que funcionara bien en un pequeño subconjunto de tweets. Superamos esto utilizando NLTK y un modelo de lenguaje de trigramas. El siguiente desafío fue usar esto para generar un corpus personalizado basado en los datos, y no con corpus proporcionados previamente en las bibliotecas. Otro desafío más fue usar la API de Microsoft Azure Text Analytics y pensar en los límites de uso, con la gran cantidad de tweets que se estaban analizando. Superamos esto simplemente procesándolos en lotes de 1000 tweets cada minuto para cumplir con el límite de 1k/60s.
Logros de los que estoy orgulloso
Mejorar el modelo estándar de Neural Net que daba tweets incomprensibles utilizando Azure para relacionarlos con un tema determinado. Creo que fue una muy buena idea para utilizar un pequeño conjunto de datos.
lo que aprendí
Aprendí a usar NLTK, la API de Microsoft Azure Text Analytics y Tweepy (API de Twitter) para crear un bot de Twitter completamente funcional utilizando el procesamiento del lenguaje natural.
¿Qué sigue para qué tuitearía Trump?
Liberarlo en el mundo y posiblemente ponerlo en una instancia de nube de AWS o Azure para que se ejecute indefinidamente.