?? Lesen Sie die koreanische Version
Die Arbeit mit der API von Twitter ist mühsam und weist viele Einschränkungen auf – glücklicherweise verfügt das Frontend (JavaScript) über eine eigene API, die ich rückentwickelt habe. Keine API-Ratenbegrenzungen. Keine Einschränkungen. Extrem schnell.
Sie können diese Bibliothek verwenden, um den Text der Tweets eines beliebigen Benutzers ganz einfach abzurufen.
Bevor Sie beginnen, stellen Sie sicher, dass Sie die folgenden Anforderungen erfüllt haben:
Wenn Sie die neueste Version verwenden möchten, installieren Sie sie von der Quelle. Um Twitter-Scraper aus dem Quellcode zu installieren, gehen Sie folgendermaßen vor:
Linux und macOS:
git clone https://github.com/bisguzar/twitter-scraper.git
cd twitter-scraper
sudo python3 setup.py install
Sie können auch mit PyPI installieren.
pip3 install twitter_scraper
Importieren Sie einfach twitter_scraper und rufen Sie Funktionen auf!
Sie können Tweets von Profilen abrufen oder Tweets anhand von Hashtags analysieren. get_tweets übernimmt den Benutzernamen oder Hashtag für den ersten Parameter als Zeichenfolge und die Anzahl der Seiten, die Sie scannen möchten, für den zweiten Parameter als Ganzzahl.
Python 3.7 .3 ( default , Mar 26 2019 , 21 : 43 : 19 )
[ GCC 8.2 .1 20181127 ] on linux
Type "help" , "copyright" , "credits" or "license" for more information .
> >> from twitter_scraper import get_tweets
>> >
>> > for tweet in get_tweets ( 'twitter' , pages = 1 ):
... print ( tweet [ 'text' ])
...
spooky vibe check
…
Für jeden Tweet wird ein Wörterbuch zurückgegeben. Schlüssel des Wörterbuchs;
Schlüssel | Typ | Beschreibung |
---|---|---|
tweetId | Zeichenfolge | Tweet-ID, besuchen Sie twitter.com/USERNAME/ID, um den Tweet anzuzeigen. |
Benutzer-ID | Zeichenfolge | Benutzer-ID des Tweets |
Benutzername | Zeichenfolge | Benutzername des Tweets |
tweetUrl | Zeichenfolge | URL des Tweets |
isRetweet | Boolescher Wert | True, wenn es sich um einen Retweet handelt, andernfalls False |
ist angepinnt | Boolescher Wert | True, wenn es sich um einen angehefteten Tweet handelt, andernfalls False |
Zeit | Datum/Uhrzeit | Veröffentlichungsdatum des Tweets |
Text | Zeichenfolge | Inhalt des Tweets |
Antworten | ganze Zahl | Anzahl der Antworten auf Tweets |
Retweets | ganze Zahl | Retweet-Anzahl des Tweets |
mag | ganze Zahl | Like-Anzahl der Tweets |
Einträge | Wörterbuch | Hat Hashtags, Videos, Fotos, URL-Schlüssel. Der Wert jedes Einzelnen ist Liste |
Sie können die Trends Ihrer Region einfach durch den Aufruf von get_trends()
abrufen. Es wird eine Liste von Zeichenfolgen zurückgegeben.
Python 3.7 .3 ( default , Mar 26 2019 , 21 : 43 : 19 )
[ GCC 8.2 .1 20181127 ] on linux
Type "help" , "copyright" , "credits" or "license" for more information .
> >> from twitter_scraper import get_trends
>> > get_trends ()
[ '#WHUTOT' , '#ARSSOU' , 'West Ham' , '#AtalantaJuve' , '#バビロニア' , '#おっさんずラブinthasky' , 'Southampton' , 'Valverde' , '#MMKGabAndMax' , '#23NParoNacional' ]
Sie können persönliche Informationen zu einem Profil abrufen, z. B. Geburtstag und Biografie, sofern vorhanden und öffentlich. Diese Klasse akzeptiert den Parameter „Benutzername“. Und kehrt von selbst zurück. Zugriff auf Informationen mit Klassenvariablen.
Python 3.7 .3 ( default , Mar 26 2019 , 21 : 43 : 19 )
[ GCC 8.2 .1 20181127 ] on linux
Type "help" , "copyright" , "credits" or "license" for more information .
> >> from twitter_scraper import Profile
>> > profile = Profile ( 'bugraisguzar' )
>> > profile . location
'Istanbul'
>> > profile . name
'Buğra İşgüzar'
>> > profile . username
'bugraisguzar'
to_dict ist eine Methode der Profile- Klasse. Gibt Profildaten als Python-Wörterbuch zurück.
Python 3.7 .3 ( default , Mar 26 2019 , 21 : 43 : 19 )
[ GCC 8.2 .1 20181127 ] on linux
Type "help" , "copyright" , "credits" or "license" for more information .
> >> from twitter_scraper import Profile
>> > profile = Profile ( "bugraisguzar" )
>> > profile . to_dict ()
{ 'name' : 'Buğra İşgüzar' , 'username' : 'bugraisguzar' , 'birthday' : None , 'biography' : 'geliştirici@peptr' , 'website' : 'bisguzar.com' , 'profile_photo' : 'https://pbs.twimg.com/profile_images/1199305322474745861/nByxOcDZ_400x400.jpg' , 'banner_photo' : 'https://pbs.twimg.com/profile_banners/1019138658/1555346657/1500x500' , 'likes_count' : 2512 , 'tweets_count' : 756 , 'followers_count' : 483 , 'following_count' : 255 , 'is_verified' : False , 'is_private' : False , user_id : "1019138658" }
Um zum Twitter-Scraper beizutragen, gehen Sie folgendermaßen vor:
git checkout -b <branch_name>
.git commit -m '<commit_message>'
git push origin <project_name>/<location>
Alternativ finden Sie in der GitHub-Dokumentation Informationen zum Erstellen einer Pull-Anfrage.
Vielen Dank an die folgenden Personen, die zu diesem Projekt beigetragen haben:
Wenn Sie mich kontaktieren möchten, können Sie mich unter @bugraisguzar erreichen.
Dieses Projekt verwendet die folgende Lizenz: MIT.