海賊版サイトから torrent をダウンロードするのは少し面倒です。この Python ベースの CLI を使用すると、トレントを簡単にダウンロードできます。
pip install bs4
pip install selenium
次のブラウザのいずれか:
注: Firefox および IE ブラウザのサポートはまだ実装されていません
usage: pyratebay.py [-h] [-c [{all,audio,video,apps,games,other}]] query
positional arguments:
query Name of the media to download
optional arguments:
-h, --help show this help message and exit
-c, --category [{all,audio,video,apps,games,other}]
Searches for the given 'name' in the specified
category (default = all)
新しく更新された海賊湾サイトは動作が異なります。 Web ページをロードした後にのみデータを取得します。テーブルは JavaScript によって動的に設定されます。このため、通常のrequests
やurllib
モジュールを使用してウェブページのデータをスクレイピングすることは不可能になります。これは、テーブルなどを含まずにウェブページの基本的な HTML コンテンツのみを返すためです。この問題を解決するには、最初に Web ページをロードしてから、 selenium
またはbs4
モジュールを使用して Web ページのコンテンツをスクレイピングする必要があります。 Web をスクレイピングするこの方法は動的 Web スクレイピングとして知られており、実際にこのプログラムで実装されています。
MITライセンス