XHS Downloaderのダウンロード - XHS Downloaderソースコードのダウンロード

XHS Downloader

パイソン

XHS-Downloader V2.3

ダウンロード

XHSダウンローダー

簡体字中国語 |

小紅書リンク抽出・作品収集ツール: アカウント投稿、コレクション、いいね、アルバムの作品リンクを抽出; 小紅書作品のダウンロードアドレスを抽出; 小紅書作品ファイルをダウンロード;

このプロジェクトは完全に無料でオープンソースであり、有料機能はありません。騙されないでください。

? プロジェクト機能

プログラム機能

✅小紅書作品の情報収集
✅ 小紅書作品のダウンロードアドレスを抽出します
✅ 透かしのないXiaohongshu作品ファイルをダウンロード
✅ Xiaohongshu livePhoto ファイルをダウンロード (透かしなしではありません)
✅ ダウンロードした作業ファイルを自動的にスキップします
✅ 作業ファイルの整合性処理メカニズム
✅ カスタマイズされたグラフィックとテキストファイルのダウンロード形式
✅ 作業情報をファイルに永続的に保存
✅作業ファイルは別のフォルダーに保存されます
✅ クリップボードのダウンロードをバックグラウンドで監視
✅ ダウンロードした作品IDを記録する
✅作業ファイルをダウンロードするためのコマンドラインをサポート
✅ ブラウザからクッキーを読み取る
✅ カスタムファイル名形式
✅ API呼び出し機能をサポート
✅ ファイルブレークポイント再開ダウンロードをサポート
✅ 作業ファイルの種類のインテリジェントな識別

スクリプト機能

✅ 透かしのないXiaohongshu作品ファイルをダウンロード
✅ ディスカバリーページの作品リンクを抽出する
✅ アカウントを抽出して作品リンクを公開します
✅ アカウントの作品集のリンクを抽出
✅ アカウントが気に入った作品のリンクを抽出
✅ アカウントアルバム作品リンクを抽出
✅ 検索結果の作業リンクを抽出する
✅ 検索結果からユーザーリンクを抽出

XHS-Downloader の開発計画と進捗状況はプロジェクトで確認できます。

?プログラムのスクリーンショット

? 画像をクリックするとデモビデオがご覧いただけます。

? サポートリンク

https://www.xiaohongshu.com/explore/作品ID?xsec_token=XXX
https://www.xiaohongshu.com/discovery/item/作品ID?xsec_token=XXX
https://xhslink.com/分享码

スペースを使用してリンクを区切ることで、一度に複数の作業リンクを入力できます。プログラムは追加の処理を行わずに有効なリンクを自動的に抽出します。

?端末について

最適な表示効果を得るには、Windows ターミナル (Windows 11 のデフォルトのターミナル) を使用してプログラムを実行することをお勧めします。

使用方法

ウォーターマークなしの作業ファイルをダウンロードするだけの場合は、 「プログラムの実行」または「Docker の実行」を選択することをお勧めします。他のニーズがある場合は、 「ソースコードの実行」を選択することをお勧めします。

バージョン2.2からは、プロジェクト機能に異常がなければ、追加で Cookie を処理する必要はありません。

プログラム実行中?

Mac OS、Windows 10 以降のユーザーは、「リリース」に移動してプログラムの圧縮パッケージをダウンロードし、解凍してプログラムフォルダーを開き、ダブルクリックしてmainを実行して使用できます。

注: Mac OS プラットフォームの実行可能ファイルmain 、デバイスの制限により、ターミナルコマンドラインから起動する必要がある場合があります。Mac OS プラットフォームの実行可能ファイルはテストされていないため、可用性は保証できません。

この方法でプログラムを使用する場合、デフォルトのファイルダウンロードパスは._internalDownload 、構成ファイルパスは._internalsettings.jsonです。

⌨️ Docker の実行

画像を取得

方法 1: Dockerfileを使用してイメージを構築する
方法 2: docker pull joeanamier/xhs-downloaderコマンドを使用してイメージをプルする

コンテナの作成

TUI モード: docker run -it joeanamier/xhs-downloader
API モード: docker run -it joeanamier/xhs-downloader python main.py server

コンテナの実行
- コンテナを開始します: docker start -i 容器名称/容器ID
- コンテナを再起動します: docker restart -i 容器名称/容器ID

Docker はプロジェクト実行時にコマンドライン呼び出しモードをサポートしていません。クリップボードの読み取りとクリップボードの監視機能は正常に使用できません。その他の機能に異常がある場合は、報告してください。

⌨️ ソースコードの実行

バージョン番号3.12以上の Python インタープリターをインストールします。
このプロジェクトの最新のソースコード、または Releases によってリリースされたソースコードをローカルコンピューターにダウンロードします。
ターミナルを開き、プロジェクトのルートパスに切り替えます。
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txtコマンドを実行して、プログラムに必要なモジュールをインストールします。
main.py実行して使用します

? コマンドラインモード

プロジェクトはコマンドライン操作モードをサポートしており、グラフィック作品の画像をダウンロードしたい場合は、このモードを使用してダウンロードする画像のシリアル番号を設定できます。

Cookie はブラウザから読み取ったり、コマンドラインを使用して設定ファイルに書き込んだりできます。

コマンド例: python .main.py --browser_cookie Chrome --update_settings

bool型パラメーターは、 true 、 false 、 1 、 0 、 yes 、 no 、 onまたはoff (大文字と小文字は区別されません) を使用した設定をサポートします。

? サーバーモード

開始:コマンドを実行: python .main.py server

シャットダウン: Ctrl + C押してサーバーをシャットダウンします。

リクエストインターフェイス: /xhs/

リクエストメソッド： POST

リクエスト形式: JSON

リクエストパラメータ:

パラメータ	タイプ	意味	デフォルト値
URL	str	小紅書作品へのリンクは自動的に抽出され、複数のリンクはサポートされていません。	なし
ダウンロード	ブール	作業ファイルをダウンロードするかどうかを`true`に設定すると、さらに時間がかかります。	間違い
索引	リスト[int]	指定されたシリアル番号を持つ画像ファイルのダウンロードはグラフィック作品に対してのみ有効であり、 `download`パラメータが`false`	ヌル
スキップ	ブール	ダウンロードレコードのある作品をスキップするかどうかを`true`に設定すると、ダウンロードレコードのある作品のデータは返されません。	間違い

コード例:

 def api_demo():
    サーバー = "http://127.0.0.1:8000/xhs/"
    データ = {
        "url": "https://www.xiaohonshu.com/explore/123456789",
        「ダウンロード」: True、
        "索引"： [
            3、
            6、
            9、
        ]、
    }
    応答 = リクエスト.ポスト(サーバー、json=データ)
    print(response.json())

その他の指示

作品リンクには日付情報が含まれるため、以前の日付から取得した作品リンクを使用するとリスク管理の対象となる場合があります。作品ファイルをダウンロードする場合は、最新の作品リンクを使用することをお勧めします。
Windows システムでは、Chromium、Chrome、および Edge ブラウザーの Cookie を読み取るために、管理者としてプログラムを実行する必要があります。

ユーザースクリプト

ブラウザに Tampermonkey ブラウザ拡張機能がインストールされている場合は、ダウンロードしてインストールしなくても、ユーザースクリプトを追加してプロジェクトの機能を体験できます。

スクリプトが正常にインストールされたら、Xiaohongshu ページを開き、スクリプトの説明を表示し、プロンプトに従います。

ヒント: XHS-Downloader ユーザースクリプトを使用して作業リンクをバッチで抽出し、XHS-Downloader プログラムを使用してウォーターマークなしで作業ファイルをバッチダウンロードします。

スクリプトの説明

小紅書ウォーターマークのない作品ファイルをダウンロードする場合、スクリプトによるファイルの処理に時間がかかります。ダウンロードボタンを何度もクリックしないでください。
透かしなしの画像ファイルは PNG 形式ですが、透かしなしのビデオファイルはサイズが大きいため、処理に時間がかかり、ページジャンプによってダウンロードが失敗する可能性があります。
（無効）アカウントのリリース、お気に入り、いいね、アルバム作品へのリンクを抽出する場合、スクリプトはすべての作品が読み込まれるまで画面を自動的にスクロールしようとします。スクロール検出間隔は 2.5 秒です。
（無効）発見作品、検索作品、ユーザーリンクへのリンクを抽出する際、スクリプトは自動的に画面をスクロールし、さらにコンテンツを読み込もうとします。画面スクロール回数: 10 回。
（無効）スクロール検出間隔と画面のスクロール回数を変更できます。変更はすぐに有効になります。また、自動スクロール機能をオフにして、画面を手動でスクロールしてコンテンツをロードすることもできます。
グローバルプロキシツールを使用すると、スクリプトがファイルのダウンロードに失敗する可能性があります。例外が発生した場合は、プロキシツールをオフにして、必要に応じて作成者にフィードバックを提供してください。
XHS-Downloader ユーザースクリプトは、可視で利用可能なデータ収集機能のみを実装しており、課金機能やクラッキング機能はありません。

二次開発

他に必要な場合は、 main.pyのコメントプロンプトに従ってコードを呼び出したり変更したりできます。

非同期デフォルトの例():
    """コードを通じてパラメータを設定するため、二次開発に適しています"""
    # サンプルリンク error_link = "https://github.com/JoeanAmier/XHS_Downloader"
    デモリンク = "https://www.xiaohonshu.com/explore/xxxxxxxxxx"
    multiple_links = f"{demo_link} {demo_link} {demo_link}"
    # インスタンスオブジェクト work_path = "D:\" # 作業データ/ファイルを保存するルートパス、デフォルト値: プロジェクトルートパスfolder_name = "Download" # 作業ファイル格納フォルダ名(自動作成)、デフォルト値:ダウンロード
    name_format = "作品名 作品概要"
    user_agent = "" # ユーザーエージェント
    cookie = "" # Xiaohonshu Web バージョンの Cookie、ログインは不要、オプションのパラメータ、ログイン ステータスはデータ収集に影響を与える proxy = None # ネットワーク プロキシ タイムアウト = 5 # リクエスト データのタイムアウト制限、単位: 秒、デフォルト値: 10
    chunk = 1024 * 1024 * 10 # ファイルをダウンロードする際、毎回サーバーから取得するデータブロックのサイズ、単位: バイト max_retry = 2 # データのリクエストが失敗した場合の最大リトライ回数、単位: 秒、デフォルト値：5
    Record_data = False # 作業データをファイルに保存するかどうか image_format = "WEBP" # グラフィックおよびテキストの作業ファイルのダウンロード形式、サポート: PNG、WEBP
    folder_mode = False # 各作品のファイルを別のフォルダーに保存するかどうか # XHS() を xhs として非同期:
    # pass # XHS と非同期でデフォルトのパラメータを使用(
            ワークパス=ワークパス、
            フォルダー名=フォルダー名、
            名前の形式=名前の形式、
            ユーザーエージェント=ユーザーエージェント、
            クッキー=クッキー、
            プロキシ=プロキシ、
            タイムアウト=タイムアウト、
            チャンク=チャンク、
            max_retry=max_retry,
            レコードデータ=レコードデータ、
            画像フォーマット=画像フォーマット、
            フォルダーモード=フォルダーモード、
    ) as xhs: # カスタムパラメータを使用します download = True # 作業ファイルをダウンロードするかどうか、デフォルト値: False
        # ダウンロードアドレスを含む作品の詳細情報を返す # データの取得に失敗した場合は空の辞書を返す print(await xhs.extract(error_link, download, ))
        print(await xhs.extract(demo_link, download,index=[1, 2]))
        # 複数の作業リンクの受け渡しをサポート print(await xhs.extract(multiple_links, download, ))

? クリップボードを読み取る

このプロジェクトはpyperclip使用してクリップボード読み取り機能を実装します。このモジュールはシステムによって異なります。

Windows では、追加のモジュールは必要ありません。

Mac では、このモジュールは pbcopy および pbpaste コマンドを使用します。これらのコマンドはオペレーティングシステムに付属している必要があります。

Linux では、このモジュールは xclip または xsel コマンドを使用します。これらのコマンドはオペレーティングシステムに付属している必要があります。それ以外の場合は、「sudo apt-get install xclip」または「sudo apt-get install xsel」を実行します（注: xsel は常に機能するとは限りません）。

他の Linux システムでは、qtpy または PyQT5 モジュールをインストールする必要があります。

設定ファイル

プロジェクトのルートディレクトリ内のsettings.jsonファイルは、初回実行時に自動的に生成され、一部の実行パラメータはカスタマイズできます。

無効なパラメータ値が設定されている場合、プログラムはパラメータのデフォルト値を使用します。

パラメータ	タイプ	意味	デフォルト値
ワークパス	str	作業データ/ファイル保存ルートパス	プロジェクトのルートパス
フォルダ名	str	作業ファイルが保存されているフォルダーの名前	ダウンロード
名前の形式	str	作品ファイル名の形式。スペースを使用してフィールドを区切ります。サポートされるフィールド:`收藏数量`、`评论数量`、`分享数量`、`点赞数量`、`作品标签`、`作品ID` 、`作品标题`、`作品描述`、`作品类型`、`发布时间`、`最后更新时间`、`作者昵称`、`作者ID`	`发布时间作者昵称作品标题`
ユーザーエージェント	str	ブラウザユーザーエージェント	組み込みの Chrome ユーザーエージェント
クッキー	str	小紅書 Web バージョン Cookie、ログイン不要、必須パラメータなし!	なし
プロキシ	str	プログラムプロキシのセットアップ	ヌル
タイムアウト	整数	リクエストデータのタイムアウト制限、単位: 秒	10
かたまり	整数	ファイルをダウンロードする際、毎回サーバーから取得するデータブロックのサイズ、単位：バイト	2097152(2MB)
max_retry	整数	データのリクエストが失敗した場合の最大リトライ回数、単位：秒	5
レコードデータ	ブール	作業データをファイルに保存するかどうか、保存形式： `SQLite`	間違い
画像形式	str	グラフィックおよびテキストの作品ファイルのダウンロード形式、サポート: `PNG` 、 `WEBP` このパラメータは、画像をダウンロードするときに使用されるインターフェイスに影響し、固定された画像形式ではありません。	PNG
画像_ダウンロード	ブール	グラフィックワークファイルダウンロードスイッチ	真実
ビデオ_ダウンロード	ブール	動画作品ファイルダウンロードスイッチ	真実
ライブダウンロード	ブール	グラフィック、テキスト、アニメーションファイルのダウンロードスイッチ	間違い
フォルダーモード	ブール	各作品のファイルを別のフォルダーに保存するかどうか。フォルダー名はファイル名と一致する必要があります。	間違い
ダウンロード_レコード	ブール	ダウンロードに成功した作品のIDを記録するかどうか。オンにすると、既存の記録を持つ作品のダウンロードは自動的にスキップされます。	真実
言語	str	現在サポートされているプログラム言語を設定します: `zh_CN` 、 `en_GB`	zh_CN

その他の手順: user_agentパラメータを取得する例。実際のブラウザ情報に従って設定することを強くお勧めします。

クッキー

バージョン2.2からは、プロジェクト機能に異常がなければ、追加で Cookie を処理する必要はありません。

ブラウザを開いて (オプションのシークレットモード)、 https://www.xiaohongshu.com/exploreにアクセスします。
小紅書アカウントにログインします（スキップ可能）
F12を押して開発者ツールを開きます
网络タブを選択します
保留日志チェックを入れます
过滤入力ボックスにcookie-name:web_sessionと入力します。
Fetch/XHRフィルターを選択します
小紅書ページの作品をクリックしてください。
网络タブで任意のパケットを選択します (パケットがない場合は、手順 7 を繰り返します)。
すべて選択 Cookie Writer または設定ファイルをコピー

ダウンロード履歴

XHS-Downloaderは、ダウンロードした作品のIDをデータベースに保存します。同じ作品を繰り返しダウンロードする場合、（作品ファイルが存在しない場合でも）XHS-Downloaderは自動的にその作品のファイルダウンロードをスキップします。作品ファイルを再度ダウンロードしてください。まずデータベース内の該当する作品IDを削除してから、XHS-Downloaderを使用して作品ファイルをダウンロードしてください。

この機能はデフォルトで有効になっており、無効になっている場合、XHS-Downloader はファイルが存在するかどうかを確認し、ファイルが存在する場合はダウンロードをスキップします。

♥️支援プロジェクト

XHS-Downloaderが役に立った場合は、スターを付けることを検討してください。ご支援ありがとうございます。

微信	アリペイ

ご希望であれば、 XHS-Downloaderの追加サポートに資金を提供することを検討してください。

✉️著者に連絡する

著者のメールアドレス: [email protected]
WeChat 作成者: Downloader_Tools
WeChat パブリックアカウント: ダウンローダーツール
Discord コミュニティ: クリックしてコミュニティに参加します
QQ グループチャット: QR コードをスキャンしてグループチャットに参加します

注: QQ グループチャットは、プロジェクトの使用上の問題について話し合うことに限定されています。広告を掲載することは固く禁じられています。また、アカウントの取引、アカウントのトラフィック、トラフィックの収益化、グレーな業界、その他の関連コンテンツについて話し合うことも固く禁じられています。

著者の他のオープンソースプロジェクト:

TikTokDownloader (Douyin/TikTok) : https://github.com/JoeanAmier/TikTokDownloader
KS-Downloader (Kuaishou) : https://github.com/JoeanAmier/KS-Downloader

プロジェクトのスポンサーシップ

JetBrains は、世界的なオープンソースコミュニティによって認められたアクティブなプロジェクトをサポートし、非営利開発用の無料ライセンスを提供します。

️免責事項

ユーザーによるこのプロジェクトの使用は、ユーザー自身の裁量と責任において行われます。作者は、このプロジェクトを使用してユーザーが被る損失、責任、またはリスクについて一切の責任を負いません。
このプロジェクトの作成者によって提供されるコードと機能は、既存の知識とテクノロジーに基づいて開発されたものです。作成者はコードの正確さと安全性を確保するために最善を尽くしますが、コードにエラーや欠陥が完全にないことを保証するものではありません。
ユーザーは、このプロジェクトを使用する場合、GNU General Public License v3.0 の要件を厳密に遵守し、適切な場所に GNU General Public License v3.0 コードの使用を示す必要があります。
ユーザーは、いかなる状況においても、このプロジェクトの作成者、寄稿者、その他の関係者をユーザーによるプロジェクトの使用に関連付けたり、ユーザーによるプロジェクトの使用によって生じた損失や損害について責任を負わせたりすることはできません。
このプロジェクトのコードと機能を使用する場合、ユーザーは関連する法律と規制を自分で調査し、その使用が合法かつ準拠していることを確認する必要があります。法令違反により生じる法的責任およびリスクは利用者が負担するものとします。
このプロジェクトの作成者は、XHS-Downloader プロジェクトの有料版を提供したり、XHS-Downloader プロジェクトに関連する商用サービスを提供したりすることはありません。
このプロジェクトに基づくプログラムの二次開発、修正、コンパイルは、オリジナルの作者とは何の関係もありません。二次的な開発行為やその結果に関連する責任はユーザーが負うものではありません。二次開発によるすべての状況については全責任を負います。

このプロジェクトのコードと関数を使用する前に、上記の免責事項をよく検討し、同意してください。ご質問がある場合、または上記の声明に同意できない場合は、このプロジェクトのコードと関数を使用しないでください。このプロジェクトのコードと機能を使用する場合、上記の免責事項を十分に理解して同意したものとみなされ、このプロジェクトの使用によるすべてのリスクと結果を自発的に負担することになります。

プロジェクトリファレンス

https://github.com/encode/httpx/
https://github.com/tiangolo/fastapi
https://github.com/textualize/textual/
https://github.com/omnilib/aiosqlite
https://github.com/thewh1teagle/rookie
https://github.com/carpedm20/emoji/
https://github.com/asweigart/pyperclip
https://github.com/lxml/lxml
https://github.com/yaml/pyyaml
https://github.com/pallets/click/
https://github.com/encode/uvicorn
https://github.com/Tinche/aiofiles

拡大する

追加情報

バージョン XHS-Downloader V2.3
タイプパイソン
更新時間 2024-12-27
サイズ 1.98MB
から Github

XHS Downloader

XHSダウンローダー

? プロジェクト機能

?プログラムのスクリーンショット

? サポートリンク

?端末について

使用方法

プログラム実行中?

⌨️ Docker の実行

⌨️ ソースコードの実行

? コマンドラインモード

? サーバーモード

その他の指示

ユーザースクリプト

スクリプトの説明

二次開発

? クリップボードを読み取る

設定ファイル

クッキー

ダウンロード履歴

♥️支援プロジェクト

✉️著者に連絡する

プロジェクトのスポンサーシップ

️免責事項

プロジェクトリファレンス

likee downloader

overcast downloader

civitai downloader

AnimeFLV Downloader

fanqienovel downloader

film downloader

chat.petals.dev

GPT Prompt Templates

GPTyped

Nuitka

Google ブログコンバーター (ブログデータコンバーター)

azure storage python

waymo open dataset

termwind

wp functions