輕鬆從官方網站傾倒Cookidoo食譜
該程序使您可以在Cookidoo網站(可用於不同國家 /地區)上將所有食譜傾倒以進行離線和貼次閱讀。這些食譜特別適用於ThermoMix/Bimby設備。為了轉儲配方,需要有效的訂閱。
該程序的最初概念基於Jakubszalaty/Cookidoo-Parser。
如果您打算科學地調查或擴展Cookidump,請考慮引用以下論文。
@article{cambiaso2022cookidump,
title = {Web security and data dumping: The Cookidump case},
journal = {Software Impacts},
volume = {14},
pages = {100426},
year = {2022},
issn = {2665-9638},
doi = {https://doi.org/10.1016/j.simpa.2022.100426},
url = {https://www.sciencedirect.com/science/article/pii/S2665963822001105},
author = {Enrico Cambiaso and Maurizio Aiello},
keywords = {Cyber-security, Data dump, Database security, Browser automation},
abstract = {In the web security field, data dumping activities are often related to a malicious exploitation. In this paper, we focus on data dumping activities executed legitimately by scraping/storing data shown on the browser. We evaluate such operation by proposing Cookidump, a tool able to dump all recipes available on the Cookidoo© website portal. While such scenario is not relevant, in terms of security and privacy, we discuss the impact of such kind of activity for other scenarios including web applications hosting sensitive information.}
}
可以在https://www.sciendirect.com/science/article/pii/s2665963822001105上找到更多信息。
nix run github:auino/cookidump -- <outputdir> [--separate-json]
NIX規定與chromedriver
一起使用google-chrome
。只有<outputdir>
和[--separate-json]
參數。
git clone https://github.com/auino/cookidump.git
cd
進入下載文件夾
安裝Python要求:
pip install -r requirements.txt
安裝Google Chrome瀏覽器,如果尚未安裝
下載Chrome WebDriver並將其保存在cookidump
文件夾中
您準備拋棄食譜
只需運行以下命令即可啟動程序。該程序具有互動性,以簡化其用法。
python cookidump.py [--separate-json] <webdriverfile> <outputdir>
在哪裡:
webdriverfile
確定了下載的Chrome WebDriver的路徑(例如,Windows Hosts的chromedriver.exe
, ./chromedriver
for Linux和MacOS Hosts)outputdir
標識輸出目錄的路徑(如果尚不存在,將創建)--separate-json
允許為每個食譜生成一個單獨的JSON文件,而不是一個包括所有配方的匯總文件該程序將打開Google Chrome窗口,然後等到您登錄到Cookidoo帳戶(支持不同的國家 /地區)。
之後,遵循腳本本身提供的結構來進行轉儲。
通過遵循腳本說明,也可以將自定義過濾器應用於導出所選食譜(例如,在菜餚的基部,標題和成分的基部,Thermomix/Bimby版本等)。
輸出由outputdir
中包含的index.html
文件表示,以及結構化文件夾中的一組食譜。通過打開瀏覽器上生成的index.html
。
對於每個執行,導出配方的數量限於約1000
。因此,在這種情況下,使用過濾器可能會有所幫助減少出口食譜的數量。
以前採用的另一種方法基於對配方的結構化數據的檢索。可以在數據架構分支上找到更多信息。在這種情況下,輸出以不同的(結構化)格式表示,因此必須解釋。這種解釋未在鏈接的先前提交中實施。
該計劃的作者不對它的使用負責。該程序僅用於研究和傳播目的。此外,該程序使用戶能夠在合法訂閱中訪問本地和臨時存儲食譜。在使用此程序之前,請根據與被剝削的訂閱有關的國家檢查Cookidoo訂閱條款。共享獲得的配方不是合法的活動,並且該計劃的作者不對用戶完成的任何違法行為和共享活動負責。
您可以在Twitter上找到我為@auino。