Ini dibuat untuk CruzHacks 2020 oleh Garrett Webb dan Chandni Nagda, mohon jangan mencuri karya kami, tanyakan saja kepada kami. Itu telah diposting ke Devpost untuk hackathon tersebut di https://devpost.com/software/what-would-trump-tweet-ds6wxl.
Selain itu, karena larangan twitter oleh Donald Trump, data ini tidak dapat diisi dengan data baru, namun dapat diadaptasi untuk digunakan pada halaman twitter orang lain.
Analisis omong kosong Trump menggunakan Microsoft Azure NLP dan model bahasa trigram. Hasilkan omong kosong serupa untuk topik tertentu.
Instal apa yang Anda perlukan:
go on the internet and get python 3.xx (latest version)
sudo easy_install pip (mac only, or just install pip the way you would)
pip install nltk (or pip3)
pip install tweepy (or pip3)
pip install azure (or pip3)
pip install numpy (or pip3)
python3 (this will take you to the python interpereter CLI)
>> import nltk
>> nltk.download('punkt')
there may be more but it should tell you.
Cukup buat file config.py Anda sendiri dengan kunci API untuk twitter dan Microsoft Azure Text Analytics. Tetapkan yang berikut ini untuk Microsoft Azure:
subscription_key = "whatever"
endpoint = "whatever"
filename = "whatever"
Tetapkan yang berikut ini untuk Twitter
auth = tweepy.OAuthHandler("whatever")
auth.set_access_token("whatever")
Kemudian jalankan model.py dengan topik sebagai argumen baris perintah, atau jalankan trumptweets .py dan lepaskan (itu akan terus men-tweet pada interval waktu yang Anda tetapkan). Berikut ini contoh pada baris perintah:
python3 model.py <keyword>
akan menampilkan tweet ke konsolpython3 trumptweets .py
akan menghasilkan dan mengeluarkan tweet ke konsol serta mempostingnya ke twitter pada interval waktu yang Anda tentukan dalam kode.Kunjungi https://twitter.com/R3alFakeDonald (bot twitter kami) atau buat akun dan bot pengembang twitter Anda sendiri untuk melihat kegilaan Anda terungkap.
Inspirasi
Keingintahuan dan Presiden Trump
Apa fungsinya
Menganalisis tweet Donald Trump, dan memberikan frasa kunci, membangun model bahasa untuk tweet Donald Trump tentang topik tersebut, kemudian menggunakan model tersebut untuk menghasilkan tweet potensial, dan menge-tweetnya ke twitter.
Bagaimana saya membangunnya
Pertama, kami membersihkan data arsip twitter Donald, lalu menggunakan Microsoft Azure Text Analysis API untuk mendapatkan frasa kunci dari setiap tweet. Setelah itu, kami menambahkan fungsionalitas untuk mengelompokkan tweet berdasarkan kemunculan kata tertentu dalam kumpulan frasa kunci tweet yang dihasilkan oleh Azure. Dengan subset ini, kami kemudian membuat dan menjalankan model bahasa pada kumpulan data yang lebih relevan dan lebih kecil. Hal ini membuat tweet lebih erat kaitannya dengan kata kunci yang kami berikan ke sistem.
Tantangan yang saya hadapi
tantangan terbesar sejauh ini adalah menemukan dan menggabungkan model bahasa yang berjalan dengan baik pada sebagian kecil tweet. kami mengatasinya dengan menggunakan NLTK dan model bahasa trigram. Tantangan berikutnya adalah menggunakan ini untuk menghasilkan korpus khusus berdasarkan data, dan bukan dengan korpus yang telah disediakan sebelumnya di perpustakaan. Tantangan lainnya adalah menggunakan Microsoft Azure Text Analytics API dan memikirkan batas penggunaan, dengan banyaknya tweet kami yang sedang dianalisis. Kami mengatasinya hanya dengan memprosesnya dalam batch 1000 tweet setiap menit untuk memenuhi batas 1k/60s.
Prestasi yang saya banggakan
Meningkatkan model Neural Net standar yang memberikan tweet yang tidak dapat dipahami dengan menggunakan Azure untuk menghubungkannya dengan topik tertentu. Saya yakin, ini adalah ide yang sangat bagus untuk menggunakan kumpulan data yang kecil.
Apa yang saya pelajari
Saya belajar cara menggunakan NLTK, Microsoft Azure Text Analytics API, dan Tweepy (twitter API) untuk membuat bot twitter yang berfungsi penuh menggunakan Natural Language Processing.
Apa selanjutnya untuk Apa yang Akan Trump Tweet?
Untuk menyebarkannya ke seluruh dunia, dan mungkin menempatkannya di instans cloud AWS atau Azure agar dapat berjalan tanpa batas waktu.