Dieses Repo enthält alle offiziellen Cocktails der International Bartenders Association (IBA) im CSV- und JSON-Format ab 2023 aus zwei verschiedenen Quellen: der IBA-Website und der Wikipedia-Liste der IBA-Cocktails. Meiner Meinung nach besteht der Unterschied zwischen diesen Quellen darin, dass die IBA-Website „offizieller“ ist (es ist schließlich ihre Liste), die Wikipedia-Rezepte jedoch einfacher zu befolgen sind.
Von der IBA-Website stammende Dateien, die Sie im iba-web
Ordner finden:
iba-cocktails-web.csv
: Eine CSV-Datei mit einer Zeile pro Cocktail. Das bedeutet, dass alle Zutaten in einer einzigen Spalte als durch Kommas getrennte Liste zusammengefasst sind.iba-cocktails-ingredients-web.csv
: Eine CSV-Datei mit einer Zeile pro Cocktailzutat. Beispielsweise gibt es drei Reihen für Margarita’s (1) Tequila, (2) Triple Sec und (3) Limettensaft. Hier wurde auch jede Zutatenbeschreibung leicht in ihre quantity
, unit
und ingredient
analysiert. Beispielsweise haben 15 ml Freshly Squeezed Lime Juice
quantity
: 15
, unit
: ml
und ingredient
: Freshly Squeezed Lime Juice
.iba-cocktails-web.json
: Eine JSON-Liste mit einem Wörterbuch/Objekt pro Cocktail. Dieser JSON enthält die kombinierten Informationen aus iba-cocktails-web.csv
und iba-cocktails-ingredients-web.csv
. Dateien aus der Wikipedia-Liste der IBA-Cocktails, die Sie im wikipedia
Ordner finden:
iba-cocktails-wiki.csv
: Eine CSV-Datei mit einer Zeile pro Cocktail. Die Zutaten werden als durch Kommas getrennte Liste in einer einzigen Spalte zusammengefasst.iba-cocktails-ingredients-wiki.csv
: Eine CSV-Datei mit einer Zeile pro Cocktailzutat. Da es bei Wikipedia mehr „unterschiedliche“ Beschreibungen der Inhaltsstoffe gibt als auf der IBA-Website, konnte ich diese Beschreibungen der Inhaltsstoffe nicht weiter analysieren.iba-cocktails-wiki.json
: Eine JSON-Liste mit einem Wörterbuch/Objekt pro Cocktail. Dieser JSON enthält die kombinierten Informationen aus iba-cocktails-wiki.csv
und iba-cocktails-ingredients-wiki.csv
.Hier sind auch die R-Skripte enthalten, die ich zum Scrapen dieser Daten verwendet habe. Diese Skripte funktionieren garantiert mindestens einmal auf meinem Computer, am 5. Spiel 2023.
Wenn Sie das Scraping- und Reinigungsskript von Grund auf ausführen möchten, können Sie entweder die Skripte 01_scrape.R
und 02_clean.R
interaktiv ausführen und hoffen, dass Sie zufällig die richtige Version von R und die erforderlichen Pakete installiert haben. Wenn Sie Docker installiert haben, können Sie auch ./dockerized-scrape-iba-web.sh
und dockerized-scrape-iba-wikipedia.sh
ausführen. Wenn sich jedoch Wikipedia ändert oder IBA ihre Website nur geringfügig im Vergleich zum Stand vom 05.03.2023 ändert, werden diese Skripte wahrscheinlich sowieso scheitern.
Siehe auch teijo/iba-cocktails für einen weiteren IBA-Cocktails-Datensatz.