Volcar fácilmente las recetas de Cookidoo del sitio web oficial
Este programa le permite volcar todas las recetas en sitios web de Cookidoo (disponibles para diferentes países) para lectura fuera de línea y posticipada. Esas recetas son válidas en particular para los dispositivos Thermomix/Bimby. Para volcar las recetas, se necesita una suscripción válida.
El concepto inicial de este programa se basó en Jakubszalaty/Cookidoo-Parser.
Si tiene la intención de investigar o extender científicamente Cookidump, considere citar el siguiente documento.
@article{cambiaso2022cookidump,
title = {Web security and data dumping: The Cookidump case},
journal = {Software Impacts},
volume = {14},
pages = {100426},
year = {2022},
issn = {2665-9638},
doi = {https://doi.org/10.1016/j.simpa.2022.100426},
url = {https://www.sciencedirect.com/science/article/pii/S2665963822001105},
author = {Enrico Cambiaso and Maurizio Aiello},
keywords = {Cyber-security, Data dump, Database security, Browser automation},
abstract = {In the web security field, data dumping activities are often related to a malicious exploitation. In this paper, we focus on data dumping activities executed legitimately by scraping/storing data shown on the browser. We evaluate such operation by proposing Cookidump, a tool able to dump all recipes available on the Cookidoo© website portal. While such scenario is not relevant, in terms of security and privacy, we discuss the impact of such kind of activity for other scenarios including web applications hosting sensitive information.}
}
Se puede encontrar más información en https://www.sciencedirect.com/science/article/pii/S2665963822001105.
nix run github:auino/cookidump -- <outputdir> [--separate-json]
NIX disposición google-chrome
junto con chromedriver
. Solo se esperan argumentos <outputdir>
y [--separate-json]
.
git clone https://github.com/auino/cookidump.git
cd
en la carpeta de descarga
Instalar requisitos de Python:
pip install -r requirements.txt
Instale el navegador Google Chrome, si aún no está instalado
Descargue el Chrome WebDriver y guárdelo en la carpeta cookidump
Estás listo para volcar tus recetas
Simplemente ejecute el siguiente comando para iniciar el programa. El programa es interactivo para simplificar su uso.
python cookidump.py [--separate-json] <webdriverfile> <outputdir>
dónde:
webdriverfile
identifica la ruta al chrome webdriver descargado (por ejemplo, chromedriver.exe
para hosts de Windows, ./chromedriver
para hosts de Linux y macOS)outputdir
identifica la ruta del directorio de salida (se creará, si aún no existen)--separate-json
permite generar un archivo JSON separado para cada receta, en lugar de un archivo agregado que incluye todas las recetasEl programa abrirá una ventana de Google Chrome y esperará hasta que haya iniciado sesión en su cuenta de Cookidoo (se admiten diferentes países).
Después de eso, siga las intracciones proporcionadas por el script en sí para proceder con el volcado.
Siguiendo las instrucciones del script, también es posible aplicar filtros personalizados para exportar recetas seleccionadas (por ejemplo, en la base del plato, el título del título del título, los ingredientes, la versión Thermomix/Bimby, etc.).
La salida está representada por un archivo index.html
, incluido en outputdir
, además de un conjunto de recetas dentro de las carpetas estructuradas. Al abrir el archivo Generado index.html
en su navegador, es posible tener una lista de recetas descargadas y navegando a la receta deseada.
El número de recetas exportadas se limita a alrededor de 1000
para cada ejecución. Por lo tanto, el uso de filtros puede ayudar en este caso a reducir el número de recetas exportadas.
Un enfoque diferente, previamente adoptado, se basa en la recuperación de datos estructurados sobre recetas. Se puede encontrar más información en la rama DataStructure. La salida se representa en este caso en un formato diferente (estructurado), por lo tanto, debe interpretarse. Dicha interpretación no se implementa en la confirmación anterior vinculada.
Los autores de este programa no son responsables del uso del mismo. Este programa se publica solo para fines de investigación y difusión. Además, el programa proporciona a los usuarios la capacidad de almacenar recetas de forma local y temporal accesible a través de una suscripción legítima. Antes de usar este programa, consulte los términos de servicio de suscripción de Cookidoo, de acuerdo con el país relacionado con la suscripción explotada. Compartir las recetas obtenidas no es una actividad legítima y los autores de este programa no son responsables de ninguna actividad de Illecit y Compartir realizada por los usuarios.
Puedes encontrarme en Twitter como @auino.