?? 한국어 버전 읽기
Twitter의 API는 작업하기 짜증나고 많은 제한 사항이 있습니다. 다행히도 Twitter의 프런트엔드(JavaScript)에는 자체 API가 있어서 제가 리버스 엔지니어링했습니다. API 속도 제한이 없습니다. 제한이 없습니다. 매우 빠릅니다.
이 라이브러리를 사용하면 모든 사용자의 트윗 텍스트를 간단하게 얻을 수 있습니다.
시작하기 전에 다음 요구 사항을 충족하는지 확인하세요.
최신 버전을 사용하려면 소스에서 설치하세요. 소스에서 twitter-scraper를 설치하려면 다음 단계를 따르세요.
리눅스와 macOS:
git clone https://github.com/bisguzar/twitter-scraper.git
cd twitter-scraper
sudo python3 setup.py install
또한 PyPI를 사용하여 설치할 수도 있습니다.
pip3 install twitter_scraper
twitter_scraper를 가져오고 함수를 호출하기만 하면 됩니다!
프로필 트윗을 가져오거나 해시태그에서 트윗을 분석할 수 있습니다. get_tweets는 첫 번째 매개변수에서 사용자 이름 또는 해시태그를 문자열로, 두 번째 매개변수에서 스캔하려는 페이지 수를 정수로 가져옵니다.
Python 3.7 .3 ( default , Mar 26 2019 , 21 : 43 : 19 )
[ GCC 8.2 .1 20181127 ] on linux
Type "help" , "copyright" , "credits" or "license" for more information .
> >> from twitter_scraper import get_tweets
>> >
>> > for tweet in get_tweets ( 'twitter' , pages = 1 ):
... print ( tweet [ 'text' ])
...
spooky vibe check
…
각 트윗에 대한 사전을 반환합니다. 사전의 키;
열쇠 | 유형 | 설명 |
---|---|---|
트윗 ID | 끈 | 트윗의 식별자입니다. 트윗을 보려면 twitter.com/USERNAME/ID를 방문하세요. |
사용자 ID | 끈 | 트윗의 사용자 ID |
사용자 이름 | 끈 | 트윗의 사용자 이름 |
트윗 URL | 끈 | 트윗의 URL |
리트윗 | 부울 | 리트윗인 경우 True, 그렇지 않은 경우 False |
고정됨 | 부울 | 고정된 트윗이면 True, 그렇지 않으면 False |
시간 | 날짜시간 | 트윗 게시 날짜 |
텍스트 | 끈 | 트윗 내용 |
답글 | 정수 | 트윗의 답글 수 |
리트윗 | 정수 | 트윗의 리트윗 수 |
좋아한다 | 정수 | 트윗 개수 좋아요 |
항목 | 사전 | 해시태그, 비디오, 사진, URL 키가 있습니다. 각각의 값은 목록입니다. |
get_trends()
호출하면 해당 지역의 추세를 얻을 수 있습니다. 문자열 목록을 반환합니다.
Python 3.7 .3 ( default , Mar 26 2019 , 21 : 43 : 19 )
[ GCC 8.2 .1 20181127 ] on linux
Type "help" , "copyright" , "credits" or "license" for more information .
> >> from twitter_scraper import get_trends
>> > get_trends ()
[ '#WHUTOT' , '#ARSSOU' , 'West Ham' , '#AtalantaJuve' , '#バビロニア' , '#おっさんずラブinthasky' , 'Southampton' , 'Valverde' , '#MMKGabAndMax' , '#23NParoNacional' ]
생일, 약력 등 프로필의 개인 정보가 존재하고 공개된 경우 이를 얻을 수 있습니다. 이 클래스는 사용자 이름 매개변수를 사용합니다. 그리고 그 자체로 돌아옵니다. 클래스 변수를 사용하여 정보에 액세스합니다.
Python 3.7 .3 ( default , Mar 26 2019 , 21 : 43 : 19 )
[ GCC 8.2 .1 20181127 ] on linux
Type "help" , "copyright" , "credits" or "license" for more information .
> >> from twitter_scraper import Profile
>> > profile = Profile ( 'bugraisguzar' )
>> > profile . location
'Istanbul'
>> > profile . name
'Buğra İşgüzar'
>> > profile . username
'bugraisguzar'
to_dict는 Profile 클래스의 메소드입니다. 프로필 데이터를 Python 사전으로 반환합니다.
Python 3.7 .3 ( default , Mar 26 2019 , 21 : 43 : 19 )
[ GCC 8.2 .1 20181127 ] on linux
Type "help" , "copyright" , "credits" or "license" for more information .
> >> from twitter_scraper import Profile
>> > profile = Profile ( "bugraisguzar" )
>> > profile . to_dict ()
{ 'name' : 'Buğra İşgüzar' , 'username' : 'bugraisguzar' , 'birthday' : None , 'biography' : 'geliştirici@peptr' , 'website' : 'bisguzar.com' , 'profile_photo' : 'https://pbs.twimg.com/profile_images/1199305322474745861/nByxOcDZ_400x400.jpg' , 'banner_photo' : 'https://pbs.twimg.com/profile_banners/1019138658/1555346657/1500x500' , 'likes_count' : 2512 , 'tweets_count' : 756 , 'followers_count' : 483 , 'following_count' : 255 , 'is_verified' : False , 'is_private' : False , user_id : "1019138658" }
twitter-scraper에 기여하려면 다음 단계를 따르세요.
git checkout -b <branch_name>
.git commit -m '<commit_message>'
git push origin <project_name>/<location>
또는 끌어오기 요청 생성에 대한 GitHub 설명서를 참조하세요.
이 프로젝트에 기여해주신 다음 분들께 감사드립니다.
저에게 연락하고 싶으시면 @bugraisguzar로 연락주세요.
이 프로젝트는 MIT 라이선스를 사용합니다.