我不再使用 Editions ENI,因为他们喜欢 DRM 和其他糟糕的软件解决方案,所以我不会更新这个脚本,它不再工作。请分叉它。
从 Editions ENI 下载完整的 PDF。
Editions ENI 是一家伟大的公司,销售一些有关技术主题的优秀法语书籍。
我想在平板电脑/电子阅读器上阅读电子书,但我不能,因为 ENI 希望“防止”或“限制”盗版。我在 ENI 上有一个帐户。所以我可以访问书籍并且可以下载 PDF。每一章都一一讲解。我也可以自己通过网站在线阅读我的书。
现在,借助这个 PoC,我可以下载这本书,并在没有互联网(如地铁)的地方阅读我的书,而无需手动下载约 120 个文件。
在法国,版权(称为“Droit d'auteur”)法有一个例外,称为“私人复制”(“Copie privée”):如果目标是私人使用,您可以创建某物的副本。两个起源是公共传播和购买东西。因此,您无法使用此 PoC 在隐藏网络上出版书籍:)
你应该有 casperJS 和 cpdf。合并片段是 MacOS 特定的。请在两次下载之间清理“docs”目录
抱歉,这个脚本是一个概念证明,我目前没有提供接口,也没有配置文件。
步骤:
登录您的 eni-training,选择您的书籍,复制 URL
将您的 URL 粘贴到 app.js 第 7 行的“url”var 中
复制您的 cookie 值 __rsaxc ; __hnwky; ENI_Editions_Portail 第 29、30、31 行
执行./crawl.sh
检查 docs 目录中的 pdf。如果文件< 3ko,抓取失败。检查文件名中的数字,取消注释第 43/47 行,更改数字,然后返回步骤 1:同一本书的 URL 可以更改。
执行 ./merge.sh 将所有 pdf 文件合并到一个文件中。
或者,您可以执行 ./fix-footer.sh 删除页脚并添加右侧的“Page x of x”:)