WeChatパブリックアカウント記事ダウンロードツール
このリポジトリはメンテナンスを停止しました。ご利用いただきありがとうございます。
GitHub にアクセスできる人は誰でも、デフォルトでフレンドリーな技術者です。問題を提起する前に、以下の手順に従って証明書が正しくインストールされていることを確認してください。問題では、環境 (システム バージョン、ソフトウェア バージョン、データベース バージョンなど) と発生した問題を詳細に説明し、ログを添付します (設定センター -> ログの場所を開く)。
参考:質問する知恵
Electron + Typescript + VUE3
WeChat パブリック アカウントの記事リストを取得するには、3 つの特別なパラメータが必要です。
_biz: 公式アカウントのID
uin: WeChat ユーザーの ID
キー:それが何なのか分かりません
これら 3 つのパラメータは http プロキシを通じて取得され、残りは通常のクローラーが実行することになります。
単一記事のダウンロード
リンクを入力してダウンロードボタンをクリックするだけです
この方法ではWeChatへのログインが必要ないため、コメントや記事内のQQ音楽音声を取得することができません。これら2つのデータが必要な場合は、一括ダウンロードまたはモニタリングダウンロードをご利用ください。
一括ダウンロード
自動インストール(ウィンドウシステムのみ)
管理者権限が必要です(ソフトウェアアイコンを右クリック→管理者として実行)
設定センター → 証明書のインストール
手動インストール
設定センター → 証明書パスを開く → rootCA.crt ファイルを開きます
初めて使用する場合は証明書をインストールしてください。
WeChatのコンピューター版をインストールする必要があります
一括ダウンロードボタンをクリックして、WeChat 公式アカウント データの監視を開始します
WeChatのコンピュータ版でダウンロードする必要がある公式アカウントに関する記事を開きます
WechatDownload に戻ると、プロンプトがポップアップ表示されます。
ダウンロードの監視
WeChatのコンピューター版をインストールする必要があります
WechatDownloadのモニターダウンロードボタンをクリックします(ボタンの色が変わります)
パソコン版WeChatでダウンロードする記事を開きます(複数の記事を開くことができます)
WechatDownload に戻り、モニターのダウンロードボタンをもう一度クリックしてダウンロードを開始します
MySQL に保存
テーブルを作成するには、/doc/mysql.sql ファイル内の SQL ステートメントを実行する必要があります。
スレッド構成
時間間隔: 単位はミリ秒です。時間間隔が 500 であるとします。単一のスレッドは記事をダウンロードし、ダウンロードを続行するまで 500 ミリ秒待機します。マルチスレッドとは、前の記事がダウンロードされるのを待たずに、500 ミリ秒ごとに記事を非同期でダウンロードすることを意味します。
単一バッチ数量: 単一バッチ数量が 10 であると仮定すると、毎回 10 個の記事が同時に非同期的にダウンロードされ、これら 10 個の記事のダウンロードが完了するまで待機し、その後 10 個の記事のダウンロードを続けます。
フィルタルール
現在、タイトルと著者のキーワード フィルタリングをサポートしています
{"title": {"include": ["キーワード 1 を含める", "キーワード 2 を含める"], "exclude": ["キーワード 1 を除外する", "キーワード 2 を除外する"] },"auth": {"include": ["キーワード 1 を含める", "キーワード 2 を含める"],"exclude": ["キーワード 1 を除外する", "キーワード 2 を除外する"] } }
たとえば、著者が Zhang San で、タイトルに「Good Guys」が含まれている場合、次のようになります。
{"タイトル": {"含む": ["グッドガイ"] },"auth": {"include": ["張三"] } }
Epub を生成する
HTML ファイルによる Epub 電子書籍の生成をサポートしているため、Epub を生成する前にバッチ ダウンロードを使用して公式アカウントの記事をローカルに保存する必要があります
使用するパラメータは次のとおりです
ファイル名: 必須パラメータ。たとえば、 testと入力すると、最終的にtest.epubファイルが生成されます。
フォルダー: 必須パラメーター。 EpubのデータソースとなるHTMLファイルが保存されているフォルダー
カバー画像: Epub ファイルのカバー画像、jpg、png 形式をサポート
設定センターはすべてをサポートします
ダウンロード範囲の選択をサポート
Web ページを HTML、Markdown、PDF に変換します
Web ページのソース コードを MySQL に保存します (ダウンロード ソースはインターネットからの場合にのみ有効です)。
写真と音声をローカルにダウンロードする
元のテキストリンクとメタデータ(作成者、時刻、公開アカウント名)を追加します
既存の記事をスキップする
コメントをダウンロード
ダウンロード ソース (このオプションはバッチ ダウンロードのみに影響します):
ネットワーク: WeChat インターフェースから記事を取得します
データベース: [Mysql に保存]オプションを選択すると、記事の Web ページのソース コードがデータベースに保存されます。ソース コードを HTML またはマークダウンに変換する必要がある場合は、ダウンロード ソースをデータベースとして選択するだけです。 (WeChatインターフェースを使いすぎると制限されます)
$npmインストール
$ npm rundev
# Windows の場合$ npm run build:win# macOS の場合$ npm run build:mac# Linux の場合$ npm run build:linux
オープンソース開発ライセンスを提供してくれた JetBrains に感謝します