初心者に優しい、非常に興味深い Python クローラーの例
一般的な Web サイト クローラーの例には、コードの汎用性が高く、適時性が高いものもあります。プロジェクトのコードは比較的初心者に優しいものです。コメントを多く含む単純な Python コードを使用してください。
プロキシを持っていない、または設定方法がわかりませんか?中国のユーザーは、より高速なダウンロード速度を得るために、ミラー ウェアハウス コード クラウド Gitee にジャンプしてダウンロードできます。
#改成你的chromedriver的完整路径地址
chromedriver_path = "/Users/bird/Desktop/chromedriver.exe"
#改成你的微博账号
weibo_username = "改成你的微博账号"
#改成你的微博密码
weibo_password = "改成你的微博密码"
#改成你的chromedriver的完整路径地址
chromedriver_path = "/Users/bird/Desktop/chromedriver.exe"
#改成你的微博账号
weibo_username = "改成你的微博账号"
#改成你的微博密码
weibo_password = "改成你的微博密码"
#改成你的chromedriver的完整路径地址
chromedriver_path = "/Users/bird/Desktop/chromedriver.exe"
#改成你的微博账号
weibo_username = "改成你的微博账号"
#改成你的微博密码
weibo_password = "改成你的微博密码"
時々、あなたは本当に彼女のことを気にかけたいのに、忙しすぎて、彼女が十分に気にかけてくれないと不平を言い続けていることがあります。次回は時間通りに彼女にメッセージを送ろうと密かに決めていたのに、たとえ二言三言でもいいのに、また忘れてしまいました。あなたは不快に感じていますか? でも彼女はあなたが無責任だと感じています。
もう心配する必要はありません。Python を使用してガールフレンドに定期的にリマインダー メッセージを送信すれば、毎朝起床時に時間通りにメッセージを送信できます。 、昼に食べるとき、夕方に食べるとき、そして夜寝るとき、そしてそれは彼女が英語の単語を学ぶこともできます!
最も重要なことは、彼女の感情指数をリアルタイムで知ることができるので、彼女が理由もなく怒ることを心配する必要がなくなることです。
実際、壁紙の選択によって、風景が好きな人、星が好きな人、美しい人が好きな人、そして動物が好きな人がいます。しかし、ある日、美的疲労が発生し、壁紙を変更しようと決心すると、インターネット上の壁紙が低解像度であるか、透かしが入っていることに気づきます。
これは Mac 用の小さくて新鮮な壁紙アーティファクトです。Pap.er は Mac 用の最高の壁紙ソフトウェアかもしれません。5Kの超鮮明な壁紙が付属しており、さまざまなタイプの壁紙が豊富に揃っています。 Windows または Linux では、 5K の超鮮明な解像度の壁紙をスクロールダウンすることを検討できます。
# 跳转到当前目录
cd 目录名
# 先卸载依赖库
pip uninstall -y -r requirement.txt
# 再重新安装依赖库
pip install -r requirement.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
# 开始运行
python main.py
このプロジェクトは、私の3年生の時のコース設計から始まりました。いくつかの映画を検索する必要があることがよくありますが、どの映画が高評価でレビューが多いのかわかりません。使いやすくするために、元のプロジェクトが書き直されました。クローラー技術と可視化技術の実践と考えてください。主にランキングや映画キーワードから映画データをクローリングします。
getMovieInRankingList.py
を開き、 107行
に移動して、 executable_path=./chromedriver.exe
chromedriver ドライバーのパスに変更します。pip install -r requirement.txt
を実行して、プログラムに必要な依存関係パッケージをインストールします。python main.py
実行してプログラムを実行します。 クローラーに関して言えば、ほとんどの人は Scrapy ツールの使用を考えるでしょうが、それはまだ使用する段階にとどまっています。クローラーのメカニズムについての理解を深めるために、マルチスレッド クローラー プロセスを手動で実装し、同時に IP プロキシ プールを導入して基本的なクロール防止操作を実行できます。
今回はクロールに Tiantian Fund Network を使用しました。この Web サイトにはクロール防止メカニズムがあり、その数は十分に多く、マルチスレッド効果は明らかです。
000056, CCB Consumer Upgrade Hybrid, 2019-03-26, 1.7740, 1.7914, 0.98, 2019-03-27 15:00
000031,中国ルネッサンス混合,2019-03-26,1.5650,1.5709,0.38,2019-03-27 15:00
000048, 華夏二重債務強化債券C, 2019-03-26,1.2230,1.2236,0.05,2019-03-27 15:00
000008,ハーベスト CSI 500ETF リンク A,2019-03-26,1.4417,1.4552,0.93,2019-03-27 15:00
000024, モルガン・スタンレー二重利益強化債券A, 2019-03-26, 1.1670, 1.1674, 0.04, 2019-03-27 15:00
000054, 澎華二重債務利子増債債, 2019-03-26, 1.1697, 1.1693, -0.03, 2019-03-27 15:00
000016,中国ピュアボンドC,2019-03-26,1.1790,1.1793,0.03,2019-03-27 15:00
# 确保安装以下库,如果没有,请在python3环境下执行pip install 模块名
import requests
import random
import re
import queue
import threading
import csv
import json
WeChat のソーシャル履歴を理解するために、WeChat 個人データ レポートを生成することを考えたことはありますか?現在、Python に基づいて WeChat の友人に関する包括的なデータ分析を行っています。これには、ニックネーム、性別、年齢、地域、発言、個人の署名、アバター、グループ チャット、公式アカウントなどが含まれます。
その中で、友達の種類を分析するという点では、あなたの見知らぬ人、スター付きの友達、私の友達の輪を見ることを許可されていない友達、彼の友達の輪を見ることを許可されていない友達のデータが主にカウントされます。地域の分析に関しては、主に全国のすべての友達の分布をカウントし、友達の数が最も多い都道府県をさらに分析します。他の側面では、あなたの友人の男女比を数えたり、最も親しい友人を推測したり、あなたの特別な友人を分析したり、あなたと最も多くのグループチャットをした友人のデータを見つけたり、あなたの友人の性格特徴を分析したり、あなたの友人の特徴を分析したりすることができます。アバターが分析され、現実のアバターを使用している友人のデータがさらに検出されます。
現在、この分野のデータ分析に関する記事はインターネット上にたくさんありますが、実行するのは面倒ですが、このプログラムの操作は非常に簡単で、QRコードをスキャンしてログインするだけです。ステップ。
# 跳转到当前目录
cd 目录名
# 先卸载依赖库
pip uninstall -y -r requirement.txt
# 再重新安装依赖库
pip install -r requirement.txt
# 开始运行
python generate_wx_data.py
# 安装pyinstaller
pip install pyinstaller
# 跳转到当前目录
cd 目录名
# 先卸载依赖库
pip uninstall -y -r requirement.txt
# 再重新安装依赖库
pip install -r requirement.txt
# 更新 setuptools
pip install --upgrade setuptools
# 开始打包
pyinstaller generate_wx_data.py
近年、WeChat の人気により、ほとんどの人が QQ を頻繁に使用しなくなったため、私たちは QQ データについてあまり知りません。独自の QQ 履歴レポートを生成できれば、非常にうれしいと思います。
現在、QQ 関連のインターフェイスは比較的複雑であるため、インターネット上には QQ 用のデータ分析ツールがほとんどありません。このプログラムの操作は非常にシンプルで、優れたユーザー インタラクション インターフェイスを備えています。QR コードをスキャンするだけでログインして操作できます。
現在このプログラムによって取得されるデータには、QQ 詳細データ、携帯電話オンライン時間、非表示状態でのオンライン時間、QQ アクティブ時間、一方通行の友達の数、QQ プロパティ分析、グループ チャット分析、私が取得したグループ チャット データが含まれます。過去 1 年で辞めました。1 か月間削除した友人データ、すべての支払い情報、私が最も気にかけている人々、そして私を最も気にかけている人々を破棄します。関連するデータインターフェイスにはアクセス制限があるため、このプログラムは QQ フレンドを分析しません。
# 跳转到当前目录
cd 目录名
# 先卸载依赖库
pip uninstall -y -r requirement.txt
# 再重新安装依赖库
pip install -r requirement.txt
# 开始运行
python main.py
WeChat Moments はあなたのデータを保持し、良い思い出を保持し、私たちの成長のあらゆる部分を記録します。ある意味、モーメントに投稿するということは、人生を記録し、人生を感じ、あらゆる段階でみんなの成長を見ることなのです。
そんな大切な思い出、保存してみませんか?コーヒーを一杯飲むだけで、ワンクリックで友達の輪を印刷できます。紙の本でも電子書籍でも、長期間保存でき、写真を現像するよりも優れており、記憶に残る時間のフットプリントが大きいです。
電子書籍を印刷するか紙の本を印刷するかを選択できるようになりました。紙の本を印刷したい場合は、サードパーティの組織を見つけて購入してください。電子書籍を印刷したい場合は、当社が独自に作成できるため、大幅なコストを節約できます。
コードのアイデアを書き始める前に、最終的に生成されるエフェクトを見てみましょう。
# 跳转到当前目录
cd 目录名
# 先卸载依赖库
pip uninstall -y -r requirement.txt
# 再重新安装依赖库
pip install -r requirement.txt
# 开始运行
python main.py
過去 1 年間に何をしていたのか知りたいですか?インターネットにアクセスするときに、お金のために釣りをしているのか、それとも真剣に仕事をしているのかを考えてみましょう。年次報告書の概要を作成したいのですが、データがありませんか?さあ、ここです。
これは、Chrome ブラウザまたは Chromium ベースのブラウザに適した、あなたの閲覧履歴を理解できる Chrome 閲覧履歴分析プログラムです。現在国内のブラウザはChromiumを中心としたブラウザがほとんどなので、基本的には利用可能です。ただし、IE、Firefox、Safari のブラウザはサポートされていません。
このページでは、過去にアクセスして閲覧したドメイン名、URL、混雑日のトップ 10 ランキングと、関連するデータ グラフを表示できます。
コードのアイデアを書き始める前に、最終的に生成されるエフェクトを見てみましょう。
オンラインデモプログラム: http://39.106.118.77:8090 (通常のサーバー、圧力は測定しません)
このプログラムの実行は非常に簡単で、次のコマンドに従って実行するだけです。
# 跳转到当前目录
cd 目录名
# 先卸载依赖库
pip uninstall -y -r requirement.txt
# 再重新安装依赖库
pip install -r requirement.txt
# 开始运行
python app.py
# 运行成功后,通过浏览器打开http://localhost:8090
このプロジェクトは、@arry-lee のプロジェクト wereader に基づいて変更されています。ソース コードを提供してくれた元の作成者に感謝します。
ユニバーサル読書の時代が到来しました。現在、読書ソフトウェアのユーザーは 2 億 1,000 万人で、その中で 19 ~ 35 歳の若いユーザーが 60% 以上を占め、学士号を取得しています。北京、上海、広州では、深センなどの省都・自治体からのユーザーが80%以上を占めています。私は WeChat を使用して読書することに慣れています。本の整理やメモのエクスポートを容易にするために、この小さなツールを開発しました。
コードのアイデアを書き始める前に、最終的に生成されるエフェクトを見てみましょう。
# 跳转到当前目录
cd 目录名
# 先卸载依赖库
pip uninstall -y -r requirement.txt
# 再重新安装依赖库
pip install -r requirement.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
# 开始运行
python pyqt_gui.py
プロジェクトは継続的に更新されます。このプロジェクトにスターを付けることを歓迎します
MIT ライセンス (MIT)