twitter scraper
1.0.0
??阅读韩文版
Twitter 的 API 使用起来很烦人,并且有很多限制——幸运的是,他们的前端 (JavaScript) 有自己的 API,我对其进行了逆向工程。没有 API 速率限制。没有限制。极快。
您可以使用此库轻松获取任何用户的推文文本。
在开始之前,请确保您已满足以下要求:
如果您想使用最新版本,请从源安装。要从源安装 twitter-scraper,请按照下列步骤操作:
Linux 和 macOS:
git clone https://github.com/bisguzar/twitter-scraper.git
cd twitter-scraper
sudo python3 setup.py install
另外,您可以使用 PyPI 安装。
pip3 install twitter_scraper
只需导入twitter_scraper并调用函数即可!
您可以获取个人资料的推文或从主题标签解析推文, get_tweets将第一个参数上的用户名或主题标签作为字符串,将第二个参数上的要扫描的页面数作为整数。
Python 3.7 .3 ( default , Mar 26 2019 , 21 : 43 : 19 )
[ GCC 8.2 .1 20181127 ] on linux
Type "help" , "copyright" , "credits" or "license" for more information .
> >> from twitter_scraper import get_tweets
>> >
>> > for tweet in get_tweets ( 'twitter' , pages = 1 ):
... print ( tweet [ 'text' ])
...
spooky vibe check
…
它为每条推文返回一个字典。字典的键;
钥匙 | 类型 | 描述 |
---|---|---|
推文 ID | 细绳 | 推文标识符,访问 twitter.com/USERNAME/ID 查看推文。 |
用户身份 | 细绳 | 推文的用户 ID |
用户名 | 细绳 | 推文的用户名 |
推特网址 | 细绳 | 推文的网址 |
正在转发 | 布尔值 | 如果是转发则为 True,否则为 False |
已固定 | 布尔值 | 如果是固定推文则为 True,否则为 False |
时间 | 日期时间 | 推文发布日期 |
文本 | 细绳 | 推文内容 |
回复 | 整数 | 推文回复数 |
转发 | 整数 | 推文转发次数 |
喜欢 | 整数 | 推文点赞数 |
条目 | 字典 | 有主题标签、视频、照片、网址键。每个值都是列表 |
您只需调用get_trends()
即可获取您所在区域的趋势。它将返回一个字符串列表。
Python 3.7 .3 ( default , Mar 26 2019 , 21 : 43 : 19 )
[ GCC 8.2 .1 20181127 ] on linux
Type "help" , "copyright" , "credits" or "license" for more information .
> >> from twitter_scraper import get_trends
>> > get_trends ()
[ '#WHUTOT' , '#ARSSOU' , 'West Ham' , '#AtalantaJuve' , '#バビロニア' , '#おっさんずラブinthasky' , 'Southampton' , 'Valverde' , '#MMKGabAndMax' , '#23NParoNacional' ]
您可以获得个人资料的个人信息,例如生日和传记(如果存在且公开)。该类采用用户名参数。并返回自身。使用类变量访问信息。
Python 3.7 .3 ( default , Mar 26 2019 , 21 : 43 : 19 )
[ GCC 8.2 .1 20181127 ] on linux
Type "help" , "copyright" , "credits" or "license" for more information .
> >> from twitter_scraper import Profile
>> > profile = Profile ( 'bugraisguzar' )
>> > profile . location
'Istanbul'
>> > profile . name
'Buğra İşgüzar'
>> > profile . username
'bugraisguzar'
to_dict是Profile类的一个方法。以 Python 字典形式返回配置文件数据。
Python 3.7 .3 ( default , Mar 26 2019 , 21 : 43 : 19 )
[ GCC 8.2 .1 20181127 ] on linux
Type "help" , "copyright" , "credits" or "license" for more information .
> >> from twitter_scraper import Profile
>> > profile = Profile ( "bugraisguzar" )
>> > profile . to_dict ()
{ 'name' : 'Buğra İşgüzar' , 'username' : 'bugraisguzar' , 'birthday' : None , 'biography' : 'geliştirici@peptr' , 'website' : 'bisguzar.com' , 'profile_photo' : 'https://pbs.twimg.com/profile_images/1199305322474745861/nByxOcDZ_400x400.jpg' , 'banner_photo' : 'https://pbs.twimg.com/profile_banners/1019138658/1555346657/1500x500' , 'likes_count' : 2512 , 'tweets_count' : 756 , 'followers_count' : 483 , 'following_count' : 255 , 'is_verified' : False , 'is_private' : False , user_id : "1019138658" }
要为 twitter-scraper 做出贡献,请按照以下步骤操作:
git checkout -b <branch_name>
。git commit -m '<commit_message>'
git push origin <project_name>/<location>
或者,请参阅有关创建拉取请求的 GitHub 文档。
感谢以下人士为本项目做出的贡献:
如果您想联系我,可以通过@bugraisguzar 联系我。
该项目使用以下许可证:MIT。