twitter scraper
1.0.0
??閱讀韓文版
Twitter 的 API 使用起來很煩人,而且有很多限制——幸運的是,他們的前端 (JavaScript) 有自己的 API,我對其進行了逆向工程。沒有 API 速率限制。沒有限制。極快。
您可以使用此庫輕鬆取得任何使用者的推文文字。
在開始之前,請確保您已滿足以下要求:
如果您想使用最新版本,請從來源安裝。若要從來源安裝 twitter-scraper,請依照下列步驟操作:
Linux 和 macOS:
git clone https://github.com/bisguzar/twitter-scraper.git
cd twitter-scraper
sudo python3 setup.py install
另外,您可以使用 PyPI 安裝。
pip3 install twitter_scraper
只需導入twitter_scraper並呼叫函數即可!
您可以取得個人資料的推文或從主題標籤解析推文, get_tweets將第一個參數上的使用者名稱或主題標籤作為字串,將第二個參數上的要掃描的頁面數作為整數。
Python 3.7 .3 ( default , Mar 26 2019 , 21 : 43 : 19 )
[ GCC 8.2 .1 20181127 ] on linux
Type "help" , "copyright" , "credits" or "license" for more information .
> >> from twitter_scraper import get_tweets
>> >
>> > for tweet in get_tweets ( 'twitter' , pages = 1 ):
... print ( tweet [ 'text' ])
...
spooky vibe check
…
它為每條推文傳回一個字典。字典的鍵;
鑰匙 | 類型 | 描述 |
---|---|---|
推文 ID | 細繩 | 推文識別符,請造訪 twitter.com/USERNAME/ID 查看推文。 |
使用者身分 | 細繩 | 推文的用戶 ID |
使用者名稱 | 細繩 | 推文的用戶名 |
推特網址 | 細繩 | 推文的網址 |
正在轉發 | 布林值 | 如果是轉發則為 True,否則為 False |
已固定 | 布林值 | 如果是固定推文則為 True,否則為 False |
時間 | 日期時間 | 推文發布日期 |
文字 | 細繩 | 推文內容 |
回覆 | 整數 | 推文回覆數 |
轉發 | 整數 | 推文轉發次數 |
喜歡 | 整數 | 推文按讚數 |
條目 | 字典 | 有主題標籤、影片、照片、網址鍵。每個值都是列表 |
您只需呼叫get_trends()
即可取得您所在區域的趨勢。它將返回一個字串列表。
Python 3.7 .3 ( default , Mar 26 2019 , 21 : 43 : 19 )
[ GCC 8.2 .1 20181127 ] on linux
Type "help" , "copyright" , "credits" or "license" for more information .
> >> from twitter_scraper import get_trends
>> > get_trends ()
[ '#WHUTOT' , '#ARSSOU' , 'West Ham' , '#AtalantaJuve' , '#バビロニア' , '#おっさんずラブinthasky' , 'Southampton' , 'Valverde' , '#MMKGabAndMax' , '#23NParoNacional' ]
您可以獲得個人資料的個人信息,例如生日和傳記(如果存在且公開)。此類別採用使用者名稱參數。並返回自身。使用類別變數存取資訊。
Python 3.7 .3 ( default , Mar 26 2019 , 21 : 43 : 19 )
[ GCC 8.2 .1 20181127 ] on linux
Type "help" , "copyright" , "credits" or "license" for more information .
> >> from twitter_scraper import Profile
>> > profile = Profile ( 'bugraisguzar' )
>> > profile . location
'Istanbul'
>> > profile . name
'Buğra İşgüzar'
>> > profile . username
'bugraisguzar'
to_dict是Profile類別的一個方法。以 Python 字典形式傳回設定檔資料。
Python 3.7 .3 ( default , Mar 26 2019 , 21 : 43 : 19 )
[ GCC 8.2 .1 20181127 ] on linux
Type "help" , "copyright" , "credits" or "license" for more information .
> >> from twitter_scraper import Profile
>> > profile = Profile ( "bugraisguzar" )
>> > profile . to_dict ()
{ 'name' : 'Buğra İşgüzar' , 'username' : 'bugraisguzar' , 'birthday' : None , 'biography' : 'geliştirici@peptr' , 'website' : 'bisguzar.com' , 'profile_photo' : 'https://pbs.twimg.com/profile_images/1199305322474745861/nByxOcDZ_400x400.jpg' , 'banner_photo' : 'https://pbs.twimg.com/profile_banners/1019138658/1555346657/1500x500' , 'likes_count' : 2512 , 'tweets_count' : 756 , 'followers_count' : 483 , 'following_count' : 255 , 'is_verified' : False , 'is_private' : False , user_id : "1019138658" }
要為 twitter-scraper 做出貢獻,請按照以下步驟操作:
git checkout -b <branch_name>
。git commit -m '<commit_message>'
git push origin <project_name>/<location>
或者,請參閱有關建立拉取請求的 GitHub 文件。
感謝以下人士為本計畫所做的貢獻:
如果您想聯繫我,可以透過@bugraisguzar 聯繫我。
此項目使用以下許可證:MIT。