Récolter des listes d'urls, de titres, de dates et de descriptions à partir d'une requête sur un moteur de recherche tel que Google, DuckDuckGo, Baidu, Bing ou Qwant est un besoin récurrent dans les méthodes numériques et difficilement automatisable en raison des restrictions de ces sites envers les robots.
SearchEnginesBookmarklet est une solution low-tech à ce besoin en vous offrant un moyen simple de le faire directement depuis votre navigateur.
Installez-le en quelques clics depuis la page suivante : https://medialab.github.io/SearchEnginesBookmarklet/
Il fonctionne comme une petite icône à glisser-déposer dans la barre de favoris de votre navigateur, vous permettant de :
# Install node's express dependency
npm install express
# Create an HTTPS key & certificate set
openssl genrsa -out key.pem
openssl req -new -key key.pem -out csr.pem
openssl x509 -req -days 9999 -in csr.pem -signkey key.pem -out cert.pem
rm csr.pem
# Run your local HTTPS server
node serve-https.js
# Edit SearchEnginesBookmarklet.js to comment the second line and uncomment the third one
# Load the following page in your browser to accept the unsafe certificate first
https://localhost:4443/
# Then install your development version of the bookmarklet as usual by dragging and dropping the image from that page into your bookrmarks bar
Benjamin Ooghe-Tabanou, Julien Pontoire & al @ Sciences Po médialab
Découvrez plus de nos projets sur les outils médialab.
SearchEnginesBookmarklet est un logiciel open source gratuit publié sous licence GPL 3.0.