Vitalsource est une boutique en ligne pour les manuels. Malheureusement, l'accès au contenu acheté est extrêmement limité. Vous devez utiliser les applications de Vitalsource pour lire les livres (pas de PDF) et l'impression est limitée à 2 pages à la fois. Ces 2 pages seront également filigranées avec votre adresse e-mail et seront fournies en tant qu'image, devenant donc non connecté. Super. Il existe plusieurs autres référentiels prometteurs de téléchargement de livres Vitalsource, mais aucun d'entre eux n'a fonctionné pour moi, alors j'ai écrit le mien.
pip3 install requests
)brew install imagemagick
)Comme mentionné précédemment, Vitalsource vous permet d'imprimer max 2 pages à la fois. Il s'agit d'un détail important, car bien que chaque livre puisse être défini dans un format différent (A5 / A4 / Custom), la disposition imprimée est toujours en taille A4. Par conséquent, deux pages de texte de taille A5 ne rempliront pas complètement deux pages imprimées A4.
Si nous demandons à Vitalsource d'imprimer les pages une par une, le contenu sur toutes les pages sera également distribué. Si nous choisissons d'imprimer par 2 pages et que le livre original a été fixé au format plus petit que A4, les pages pair seront généralement presque vides. Pour mieux illustrer cette différence, veuillez vous référer à l'image suivante.
Pour télécharger les pages, vous voudrez utiliser le script download_single.py
ou download_double.py
, selon la variante que vous préférez. Je recommanderais de télécharger les 10 premières pages dans les deux variantes et de décider en fonction des résultats (variera pour chaque livre).
Avant d'exécuter le script, vous voudrez modifier certains paramètres sur les lignes 9-11: IBAN
, VitalSourceAPIKey
et VitalSourceAccessToken
. Bien qu'Iban soit assez explicite, les deux autres paramètres nécessiteront un travail de votre part. Vous devrez capturer le trafic réseau de l'application de bibliothèque à l'aide de l'un des proxys de débogage recommandés et en extraire les deux propriétés d'en-tête. Une fois que vous avez le proxy en place, ouvrez votre livre dans l'application de la bibliothèque et imprimez n'importe quelle page. Vérifiez ensuite votre journal proxy pour le trafic vers le domaine https://print.vitalsource.com/
et consultez les en-têtes de demande.
Une fois que vous avez mis à jour les 3 paramètres, exécutez le script. Il sera lentement (le téléchargement est étranglé afin d'éviter de déclencher des alertes) télécharger les pages demandées dans un nouveau dossier de vos téléchargements.
Le process.sh
de script.sh s'occupe du nettoyage des pages téléchargées. Tout d'abord, il supprime les filigranes, puis il ajoute le numéro de page au bas de chaque page.
Exécutez simplement le script avec Iban du livre téléchargé comme le seul paramètre et vous devriez être bon. Comme ça ./process.sh 9781000710899
Celui-ci est facile - Sélectionnez simplement toutes les images, cliquez avec le bouton droit et sélectionnez Actions rapides> Créer PDF
Pour rendre le PDF final consultable, vous devez exécuter la reconnaissance optique des caractères (OCR) dessus. Il existe de nombreux outils commerciaux qui peuvent le faire, par exemple Adobe Acrobat.