저는 더 이상 Editions ENI를 사용하지 않습니다. 왜냐하면 그들은 DRM 및 기타 형편없는 소프트웨어 솔루션을 좋아하기 때문입니다. 따라서 이 스크립트를 업데이트하지 않을 것이며 더 이상 작동하지 않습니다. 포크해 주세요.
Editions ENI에서 전체 PDF를 다운로드하세요.
Editions ENI는 기술 주제에 관해 프랑스어로 된 훌륭한 책을 판매하는 훌륭한 회사입니다.
태블릿/e-reader에서 eBook을 읽고 싶지만 ENI는 불법 복제를 "방지"하거나 "제한"하기를 원하기 때문에 읽을 수 없습니다. ENI에 계정이 있습니다. 그래서 책에 접근할 수 있고 PDF를 다운로드할 수 있습니다. 각 장마다 하나씩. 웹사이트를 통해서도 온라인으로 내 책을 읽을 수 있습니다.
이제 이 PoC 덕분에 책을 다운로드할 수 있고, 인터넷이 없는 곳(지하철 등)에서도 약 120개의 파일을 수동으로 다운로드하지 않고도 책을 읽을 수 있습니다.
프랑스에서는 저작권("Droit d'auteur"라고 함)법에 "사적 사본"("Copie privée")이라는 예외가 있습니다. 목적이 개인적인 사용인 경우 무언가의 복사본을 만들 수 있습니다. 두 가지 기원은 대중 확산과 구매입니다. 따라서 이 PoC를 사용하여 숨겨진 네트워크에 책을 출판할 수 없습니다 :)
casperJS와 cpdf가 있어야 합니다. 병합 조각은 MacOS에만 적용됩니다. 두 다운로드 사이에 "docs" 디렉터리를 정리하십시오.
죄송합니다. 이 스크립트는 개념 증명이므로 현재로서는 인터페이스와 구성 파일을 제공하지 않습니다.
단계:
eni-training에 로그인하고 책을 선택한 후 URL을 복사하세요.
app.js의 7행에 있는 "url" var에 URL을 붙여넣으세요.
쿠키 값을 복사하세요 __rsaxc ; __hnwky ; 29, 30, 31행의 ENI_Editions_Portail
./crawl.sh 실행
docs 디렉토리에서 pdf를 확인하세요. 파일이 3ko보다 작으면 크롤링에 실패합니다. 파일 이름의 번호를 확인하고 43/47행의 주석 처리를 제거한 후 번호를 변경하고 1단계로 돌아갑니다. 동일한 책에 대해 URL이 변경될 수 있습니다.
./merge.sh를 실행하여 모든 PDF 파일을 단일 파일로 병합합니다.
선택적으로 ./fix-footer.sh를 실행하여 바닥글을 제거하고 오른쪽 "페이지 x/x"를 추가할 수 있습니다. :)