Dies wurde für CruzHacks 2020 von Garrett Webb und Chandni Nagda erstellt. Bitte stehlen Sie nicht unsere Arbeit, fragen Sie uns einfach. Es wurde für diesen Hackathon bei Devpost unter https://devpost.com/software/what-would-trump-tweet-ds6wxl gepostet.
Aufgrund des Twitter-Verbots von Donald Trump kann dies auch nicht mit neuen Daten gefüttert werden, sondern könnte für die Verwendung auf der Twitter-Seite einer anderen Person angepasst werden.
Analysieren Sie Trumps Unsinn mit Microsoft Azure NLP und dem Trigram-Sprachmodell. Generieren Sie ähnlichen Unsinn für ein bestimmtes Thema.
Installieren Sie, was Sie benötigen:
go on the internet and get python 3.xx (latest version)
sudo easy_install pip (mac only, or just install pip the way you would)
pip install nltk (or pip3)
pip install tweepy (or pip3)
pip install azure (or pip3)
pip install numpy (or pip3)
python3 (this will take you to the python interpereter CLI)
>> import nltk
>> nltk.download('punkt')
there may be more but it should tell you.
Erstellen Sie einfach Ihre eigene config.py-Datei mit API-Schlüsseln für Twitter und Microsoft Azure Text Analytics. Legen Sie Folgendes für Microsoft Azure fest:
subscription_key = "whatever"
endpoint = "whatever"
filename = "whatever"
Legen Sie Folgendes für Twitter fest
auth = tweepy.OAuthHandler("whatever")
auth.set_access_token("whatever")
Führen Sie dann entweder „model.py“ mit „topic“ als Befehlszeilenargument aus oder führen Sie trumptweets “ aus und lassen Sie es los (es twittert kontinuierlich in dem von Ihnen festgelegten Zeitintervall). Hier ist ein Beispiel in der Befehlszeile:
python3 model.py <keyword>
gibt einen Tweet an die Konsole auspython3 trumptweets .py
generiert und gibt einen Tweet an die Konsole aus und postet ihn in dem von Ihnen im Code angegebenen Zeitintervall auf Twitter.Gehen Sie zu https://twitter.com/R3alFakeDonald (unserem Twitter-Bot) oder erstellen Sie Ihr eigenes Twitter-Entwicklerkonto und Ihren eigenen Bot, um zu sehen, wie sich Ihr Wahnsinn entfaltet.
Inspiration
Neugier und Präsident Trump
Was es bewirkt
Analysiert Donald Trumps Tweets und erstellt anhand einer Schlüsselphrase ein Sprachmodell für Donald Trumps Tweets zu diesem Thema, generiert dann anhand des Modells einen potenziellen Tweet und twittert ihn auf Twitter.
Wie ich es gebaut habe
Zuerst haben wir die Daten von Donalds Twitter-Archiv bereinigt und dann die Microsoft Azure Text Analysis API verwendet, um Schlüsselphrasen jedes Tweets zu ermitteln. Danach haben wir Funktionen hinzugefügt, um die Tweets basierend auf dem Auftreten eines bestimmten Wortes im Satz von Schlüsselphrasen eines von Azure generierten Tweets zu unterteilen. Mit dieser Teilmenge generieren wir dann ein Sprachmodell und führen es auf der kleineren Menge relevanterer Daten aus. Dadurch erhält ein Tweet einen engeren Bezug zu dem Schlüsselwort, das wir dem System bereitstellen.
Herausforderungen, denen ich begegnet bin
Die mit Abstand größte Herausforderung bestand darin, ein Sprachmodell zu finden und zu integrieren, das auf einer kleinen Teilmenge von Tweets gut funktioniert. Wir haben dies durch die Verwendung von NLTK und einem Trigramm-Sprachmodell überwunden. Die nächste Herausforderung bestand darin, damit ein benutzerdefiniertes Korpus basierend auf den Daten zu generieren und nicht mit vorab bereitgestellten Korpussen in den Bibliotheken. Eine weitere Herausforderung bestand darin, die Microsoft Azure Text Analytics-API zu verwenden und über Nutzungsbeschränkungen nachzudenken, da wir eine große Menge an Tweets analysierten. Wir haben dies überwunden, indem wir sie einfach in Stapeln von 1000 Tweets pro Minute verarbeitet haben, um die 1k/60s-Grenze einzuhalten.
Leistungen, auf die ich stolz bin
Verbesserung des Standard-Neural-Net-Modells, das unverständliche Tweets lieferte, indem Azure verwendet wurde, um sie einem bestimmten Thema zuzuordnen. Ich glaube, das war eine wirklich gute Idee für die Verwendung eines kleinen Datensatzes.
Was ich gelernt habe
Ich habe gelernt, wie man NLTK, die Microsoft Azure Text Analytics API und Tweepy (Twitter API) verwendet, um mithilfe natürlicher Sprachverarbeitung einen voll funktionsfähigen Twitter-Bot zu erstellen.
Was kommt als nächstes für „Was würde Trump twittern?“.
Um es auf die Welt loszulassen und es möglicherweise auf eine AWS- oder Azure-Cloud-Instanz zu übertragen, damit es auf unbestimmte Zeit ausgeführt werden kann.