Editions ENI はもう使用しません。彼らは DRM やその他のクソソフトウェア ソリューションを好むため、このスクリプトは更新しません。また、機能しなくなりました。フォークしてください。
Editions ENI から完全な PDF をダウンロードします。
Editions ENI は、技術的なテーマに関する素晴らしい書籍をフランス語で販売している素晴らしい会社です。
タブレット/電子リーダーで電子書籍を読みたいのですが、ENI が著作権侵害を「防止」または「制限」したいため、できません。 ENI のアカウントを持っています。したがって、書籍にアクセスしたり、PDF をダウンロードしたりできます。各章ごとに 1 つずつ。私自身のウェブサイトを通じて私の本をオンラインで読むこともできます。
今では、この PoC のおかげで本をダウンロードでき、インターネットがない場所 (地下鉄など) でも、最大 120 個のファイルを手動でダウンロードせずに本を読むことができます。
フランスの著作権法 (「Droit d'auteur」と呼ばれます) には、「私的コピー」 (「Copie privée」) と呼ばれる例外があります。目的が私的使用である場合、何かのコピーを作成することができます。起源は 2 つあり、公的な普及と購入されたものです。したがって、この PoC を使用して隠しネットワーク上で本を出版することはできません :)
casperJS と cpdf が必要です。マージ スニペットは MacOS 固有です。 2 つのダウンロードの間に「docs」ディレクトリを消去してください
申し訳ありませんが、このスクリプトは概念実証であり、現時点ではインターフェイスや構成ファイルは提供していません。
手順:
eni-training にログインし、書籍を選択し、URL をコピーします
app.js の 7 行目の「url」変数に URL を貼り付けます。
Cookie の値 __rsaxc をコピーします。 __hnwky ; 29、30、31行目のENI_Editions_Portail
./crawl.shを実行
docs ディレクトリ内の pdf を確認してください。ファイルが 3ko 未満の場合、クロールは失敗します。ファイル名の番号を確認し、43/47 行目のコメントを解除して番号を変更し、ステップ 1 に戻ります。同じ書籍でも URL は変更される可能性があります。
./merge.sh を実行して、すべての PDF ファイルを 1 つのファイルにマージします。
オプションで、 ./fix-footer.sh を実行してフッターを削除し、右側の「Page x of x」を追加できます:)