Este repositorio incluye todos los cócteles oficiales de la Asociación Internacional de Bartenders (IBA) en formato CSV y JSON a partir de 2023, de dos fuentes diferentes: el sitio web de la IBA y la lista de cócteles de la IBA de Wikipedia. Mi opinión sobre la diferencia entre estas fuentes es que el sitio web de la IBA es más "oficial" (después de todo, es su lista), pero las recetas de Wikipedia son más fáciles de seguir.
Archivos extraídos del sitio web de IBA que encontrará en la carpeta iba-web
:
iba-cocktails-web.csv
: un archivo CSV con una fila por cóctel. Esto significa que todos los ingredientes están agrupados en una sola columna como una lista separada por comas.iba-cocktails-ingredients-web.csv
: un archivo CSV con una fila por ingrediente del cóctel. Por ejemplo, hay tres filas para (1) tequila, (2) triple sec y (3) jugo de lima de Margarita. Aquí la descripción de cada ingrediente también se ha analizado ligeramente en su quantity
, unit
e ingredient
. Por ejemplo, 15 ml Freshly Squeezed Lime Juice
tiene quantity
: 15
, unit
: ml
e ingredient
: Freshly Squeezed Lime Juice
.iba-cocktails-web.json
: una lista JSON con un diccionario/objeto por cóctel. Este JSON incluye la información combinada de iba-cocktails-web.csv
e iba-cocktails-ingredients-web.csv
. Archivos extraídos de la lista de cócteles IBA de Wikipedia que encontrará en la carpeta wikipedia
:
iba-cocktails-wiki.csv
: un archivo CSV con una fila por cóctel. Los ingredientes están agrupados en una sola columna como una lista separada por comas.iba-cocktails-ingredients-wiki.csv
: un archivo CSV con una fila por ingrediente del cóctel. Como Wikipedia tiene más descripciones de ingredientes "variantes" que el sitio web de la IBA, no pude analizar más estas descripciones de ingredientes.iba-cocktails-wiki.json
: una lista JSON con un diccionario/objeto por cóctel. Este JSON incluye la información combinada de iba-cocktails-wiki.csv
e iba-cocktails-ingredients-wiki.csv
.Aquí también se incluyen los scripts R que utilicé para extraer estos datos. Se garantiza que estos scripts funcionarán en mi computadora, el día 5 del Partido 2023, al menos una vez.
Si desea ejecutar el script de raspado y limpieza desde cero, puede ejecutar los scripts 01_scrape.R
y 02_clean.R
de forma interactiva y esperar tener la versión correcta de R y los paquetes necesarios instalados. O, si tiene Docker instalado, puede ejecutar ./dockerized-scrape-iba-web.sh
y dockerized-scrape-iba-wikipedia.sh
. Sin embargo, si Wikipedia cambia o IBA cambia su sitio web solo un poquito con respecto a cómo estaba el 5 de marzo de 2023, es probable que estos scripts fallen de todos modos.
Consulte también teijo/iba-cocktails para ver otro conjunto de datos de cócteles IBA.