การประกวดเพลงยูโรวิชันเป็นชุดข้อมูลที่หาได้ฟรีซึ่งประกอบด้วยข้อมูลเมตา การจัดอันดับการประกวด และข้อมูลการโหวตของเพลง 1,735 เพลงที่เข้าแข่งขันในการประกวดเพลงยูโรวิชัน รุ่นที่กำลังจะมาถึงจะมีคุณสมบัติด้านเสียงด้วย
ทุก ปี ชุดข้อมูลจะอัปเดตพร้อมผลการแข่งขัน ข่าวประชาสัมพันธ์ฉบับนี้ประกอบด้วยข้อมูลเมตาของผู้เข้าแข่งขัน การจัดอันดับการแข่งขัน และข้อมูลการโหวตของผลงาน 1,735 รายการที่เข้าร่วมในการประกวดเพลงยูโรวิชันนับตั้งแต่เกิดขึ้นครั้งแรกในปี 1956 จนถึงปัจจุบัน เสียงที่เกี่ยวข้องสำหรับทุกเพลงสามารถสตรีมผ่าน YouTube ได้
ข้อมูลเมตาและข้อมูลการลงคะแนนเสียงจัดทำโดยแฟนไซต์ EurovisionWorld
สามารถดาวน์โหลดชุดข้อมูลได้ที่นี่ หากต้องการทำซ้ำ ให้ทำตามคำแนะนำที่ด้านล่างของ readme
John Ashley Burgoyne, Janne Spijkervet และ David John Baker ขยายชุดข้อมูลนี้ด้วยข้อมูลระดับคณะลูกขุน ฟีเจอร์เสียงใหม่ และการวิเคราะห์ทางสถิติสำหรับ ISMIR 2023 คุณสามารถเข้าถึงข้อมูลและโค้ดของพวกเขาได้ที่พื้นที่เก็บข้อมูลนี้
เมื่อไฟล์ contestants.csv
อยู่ในโฟลเดอร์เดียวกับไฟล์ audio.py
คุณจึงสามารถรวบรวมสตรีมเสียง YouTube ของเพลงทั้งหมดได้โดยการรัน python3 audio.py
อีกทางหนึ่ง สามารถใช้ sh run.sh audio
หรือ sh run.sh docker audio
เพื่อคัดลอกในเครื่องหรือใช้คอนเทนเนอร์ Docker เพื่อคัดลอกสตรีม
เมื่อใช้เอกสารเหล่านี้ โปรดอ้างอิงแหล่งข้อมูลต่อไปนี้ ฉันสนใจที่จะทราบเกี่ยวกับโครงการที่สร้างจากงานนี้ด้วย โปรดส่งอีเมลไปที่: janne [dot] spijkervet [at] gmail [dot] com
@inproceedings{burgoyne_mirovision, author = {John Ashley Burgoyne and Janne Spijkervet and David John Baker}, title = {Measuring the {Eurovision Song Contest}: A Living Dataset for Real-World {MIR}}, booktitle = {Proceedings of the 24th International Society for Music Information Retrieval Conference}, year = 2023, address = {Milan, Italy}, url = {https://archives.ismir.net/ismir2023/paper/000097.pdf} } @misc{spijkervet_eurovision, author = {Janne Spijkervet}, title = {{The Eurovision Dataset}}, month = mar, year = 2020, doi = {10.5281/zenodo.4036457}, version = {1.0}, publisher = {Zenodo}, url = {https://zenodo.org/badge/latestdoi/214236225} }
หากต้องการทราบแนวคิดเบื้องต้นเกี่ยวกับชุดข้อมูล ตัวอย่าง Jupyter Notebook จะถูกสร้างขึ้นในไดเร็กทอรี examples
สามารถเปิดได้ด้วย jupyter notebook
หากต้องการจำลองชุดข้อมูล โปรดดูด้านล่าง:
คุณสามารถดาวน์โหลดชุดข้อมูลทั้งหมดได้โดยใช้โค้ดขูดที่รวมอยู่ในที่เก็บนี้ การดำเนินการนี้จะพยายามดึงและประมวลผลข้อมูลจากเว็บไซต์ EurovisionWorld ไปเป็นไฟล์ CSV ที่มีอยู่ในส่วนที่เผยแพร่ของพื้นที่เก็บข้อมูลนี้ด้วย:
votes.csv
contestants.csv
betting_offices.csv
pip3 install -r needs.txt# จะให้ผลการโหวต.csv และผู้เข้าแข่งขัน.csvpython3 scrape_votes.py# จะให้ผลการ bet_offices.csvpython3 scrape_odds.py
เรียกใช้ sh run.sh docker
เพื่อสร้าง Dockerfile และเรียกใช้ scrape_votes.py
จากภายในคอนเทนเนอร์ ไม่จำเป็นต้องตั้งค่าเพิ่มเติม ซึ่งจะจำลองชุดข้อมูลทั้งไฟล์ของ contestants.csv
, votes.csv
และ betting_offices.csv
สามารถดึงเสียงเพิ่มเติมได้จากภายในหรือภายนอกคอนเทนเนอร์ Docker:
bash run.sh docker audio bash run.sh audio
คุณสมบัติด้านเสียงสามารถแยกออกมาได้เมื่อมีเสียงทั้งหมดอยู่ในโฟลเดอร์ audio
โดยใช้:
sh audio_features.sh
นี่จะเป็นการเปิดตัวคอนเทนเนอร์ Docker ที่ติดตั้งตัวแยกเพลงสตรีมของ Essentia หรืออีกทางหนึ่ง คุณสามารถเรียกใช้ audio_features.py
ได้หากมีการติดตั้งตัวแยกข้อมูลของ Essentia ไว้ในสภาพแวดล้อม PATH
อันดับการแข่งขันมีให้ทั้งรอบชิงชนะเลิศและรอบรองชนะเลิศ ข้อมูลการลงคะแนนเสียงในแต่ละประเทศประกอบด้วยกิจกรรมการลงคะแนนเสียง 47,007 กิจกรรม และถูกแยกออกจากกันโดยคณะลูกขุนและการลงคะแนนเสียงทางโทรทัศน์ หลังจากที่เปิดตัวในปี 2559
คอลัมน์ | คำอธิบาย |
---|---|
ปี | ปีการประกวด |
ถึง_ประเทศ_id | รหัสประเทศของผู้แข่งขัน |
ถึง_ประเทศ | ชื่อประเทศของผู้เข้าแข่งขัน |
นักแสดง | ศิลปิน |
เพลง | ชื่อเพลงของผู้เข้าแข่งขัน |
sf_num | เข้าร่วมรอบรองชนะเลิศ 1, 2 หรือ 0 (ตั้งแต่ปี 2547-2551 มีรอบรองชนะเลิศเพียงรายการเดียว) |
วิ่ง_สุดท้าย | ลำดับในการถ่ายทอดการแข่งขันรอบชิงชนะเลิศ |
วิ่ง_sf | ลำดับในการถ่ายทอดการแข่งขันรอบรองชนะเลิศ |
สถานที่_สุดท้าย | สถานที่ในรอบสุดท้าย |
คะแนน_สุดท้าย | คะแนนในรอบชิงชนะเลิศ |
place_sf | สถานที่ในรอบรองชนะเลิศ |
point_sf | คะแนนในรอบรองชนะเลิศ |
point_tele_final | จุดถ่ายทอดสดการแข่งขันรอบสุดท้าย |
คะแนน_คณะลูกขุน_รอบชิงชนะเลิศ | คะแนนตัดสินในรอบชิงชนะเลิศของการแข่งขัน |
point_tele_sf | จุดถ่ายทอดสดการแข่งขันรอบรองชนะเลิศ |
point_jury_sf | คะแนนตัดสินในรอบรองชนะเลิศของการแข่งขัน |
เนื้อเพลง | เนื้อเพลงของเพลง |
youtube_url | URL ไปยังวิดีโอบน YouTube |
คอลัมน์ | คำอธิบาย |
---|---|
ปี | ปีการประกวด |
กลม | รอบชิงชนะเลิศ, รอบรองชนะเลิศ |
จาก_country_id | รหัสประเทศของประเทศที่ให้คะแนน |
ถึง_ประเทศ_id | รหัสประเทศของประเทศที่ได้รับคะแนน |
จาก_ประเทศ | ชื่อประเทศของประเทศที่ให้คะแนน |
ถึง_ประเทศ | ชื่อประเทศของประเทศที่ได้รับคะแนน |
คะแนน | จำนวนคะแนนที่ให้ |
ขอแนะนำให้ใช้ Docker โดยเรียกใช้ sh run.sh docker
หรือใช้การติดตั้งในเครื่องโดยเพียงแค่เรียกใช้ sh run.sh
หากต้องการรับเสียงด้วย ให้รัน sh run.sh audio
หรือ sh run.sh docker audio
ในการทำซ้ำชุดข้อมูล จำเป็นต้องมี WebDriver สำหรับ Chrome, Firefox หรือ Safari เช่น WebDriver สำหรับ Chrome พร้อมด้วยแพ็คเกจ Selenium Python ( pip3 install selenium
) ทำตามคำแนะนำเพื่อตั้งค่า WebDriver ที่นี่ การพึ่งพาของโครงการสามารถติดตั้งได้โดยใช้:
pip3 install -r requirements.txt
ใช้คำสั่งต่อไปนี้เพื่อดึงข้อมูลของการประกวดเพลงยูโรวิชันทั้งหมดระหว่างปี 1956 ถึง 2023:
python3 scrape_votes.py --start 1956 --end 2023
สิ่งนี้จะสร้างไฟล์ contestants.csv
และ votes.csv
@inproceedings{burgoyne_mirovision, author = {John Ashley Burgoyne and Janne Spijkervet and David John Baker}, title = {Measuring the {Eurovision Song Contest}: A Living Dataset for Real-World {MIR}}, booktitle = {Proceedings of the 24th International Society for Music Information Retrieval Conference}, year = 2023, address = {Milan, Italy}, url = {https://archives.ismir.net/ismir2023/paper/000097.pdf} } @misc{spijkervet_eurovision, author = {Janne Spijkervet}, title = {{The Eurovision Dataset}}, month = mar, year = 2020, doi = {10.5281/zenodo.4036457}, version = {1.0}, publisher = {Zenodo}, url = {https://zenodo.org/badge/latestdoi/214236225} }