安裝
pip install wechatarticles
展示地址:
日更,獲取公眾號的最新文章鏈接,支持日更閱讀點讚評論正文
註:本項目僅供學習交流,嚴禁用於商業用途(此項目也沒辦法直接使用),無法達到開箱即用的程度。使用本專案需讀取文件+原始碼+動手實踐,參考範例程式碼( test
資料夾下)進行改寫。
提示:另外,已經有很多朋友(大佬)透過直接看源碼,已經基於這套項目,或者重寫,用於各自的需求。
實現思路一:
完整想法可以參考我的部落格: 記一次微信公眾號爬蟲的經歷(微信文章閱讀點讚的獲取)
實現思路二:
test_GetUrls.py
,最好不用。公開已爬取的公眾號歷史文章的永久鏈接,日期均截止commit時間,僅供測試與學習,歡迎各位關注這些優質公眾號。
計畫始於2017年,目前更新於2023年3月
專案程式碼進行調整,呼叫先前的介面請使用pip install wechatarticles
。
參數文件說明請見README
python
: 3.6.2、3.7.3 這裡有次數限制,不可一次取得太多url。解決方案多個帳號同時爬取test_WechatUrls.py
test_WechatInfo.py
test_GetUrls.py
test_Url2Html.py
可以看這個issue,十分感謝大佬簡潔的文字說明。
請參閱部落格與下方文檔
official_cookie和token手動取得方式請參閱這篇文檔
wechat_cookie和appmsg_token手動取得的介紹,可以參考這篇文檔
聯絡注意事項:
不(能)做自動登入微信公眾號、微信
不(能)做即時(取得參數、閱讀按讚、取得文章)
換一個公眾號、參數過期,均需手動更新,如何取得參數皆在文章中提及,請仔細查閱
不能做關鍵字搜尋(即微信搜一搜功能),例如搜尋所有包含「科技」兩個字的文章。
Q & A
專案能不能正常運作?
答:項目可正常運作。
xxx怎麼運作/啟動,需要取得哪些參數?
答:請看源碼,並手動運行看看輸出報錯。
xxx參數怎麼取得?
答:文件和部落格均描述的很清楚,請仔細閱讀。
我要xxxx,需要怎麼做?
答:看文檔,看源碼
網頁每日更新的方式怎麼做的?
答:不是萬能key。方案很簡單,就是類比點擊+代理軟體(Fiddler或Mitmproxy)攔截包,每日抓一次,如果你有更好的方案也歡迎告知。這部分未開源(如果有看到相關完整開源的可以提個issue學習一下),純粹是因為配環境+客製化太麻煩,而且存在一定的問題。懂的看到這裡能夠實現的就能實現,如果問我也不好回答你,太耗時耗力。
PC端微信與抓包軟體Fiddler是必裝的嗎?
答:不是。這只是我了解(認為)到,這兩個是相對最容易完成整個過程的。替代方案:可以抓手機端的微信(安卓和IOS均可,安卓的要root才能抓到閱讀點讚);抓包軟體Fiddler這個可替代的很多,只要能進行HTTPS抓包查看數據就行。
大量公眾號的文章怎麼抓?
答:本項目無法實現。沒很好的方案,參考5。切換一個公眾號的時間成本大概要3-5分鐘,視熟練度而異。
問問題的正常方式:
程式是實踐出真知,運行的正確與否可以直接試出來,沒必要耽誤兩個人的時間。如果運行出了問題,請按照以上流程進行提問,但前提是自己要運行過。請直接說問題or需求,不需要等我回覆再說。謝謝!大部分問題均可以交流,如果事無鉅細的提問,也接受付費教學。
微信讚賞碼