用于语音技术研究和开发的开放语音语料库列表。
该列表优先考虑免费(即无美元成本)和真正开放的语料库(例如根据知识共享许可或社区数据许可协议发布)。并非所有这些语料库都可以满足这些标准,但以下所有语料库都可以访问并可用于研究和/或商业用途。
请随意向列表提出补充!
问题中存在大量积压的语料库,非常欢迎 Pull Requests :)
语料库 | 语言 | # 小时 | # 演讲者 | 下载 | 执照 |
---|---|---|---|---|---|
共同声音 | 多种语言 | >15,000 小时(已验证); >20,000 小时(总计) | 多扬声器 | https://voice.mozilla.org/en/datasets | CC-0 |
耶斯诺 | 希伯来语 | 6分钟 | 一名男性 | http://www.openslr.org/1/ | CC-0 |
LJ语音语料库 | 英语 | 〜24小时 | 一名女性 | https://data.keithito.com/data/speech/LJSpeech-1.1.tar.bz2 | CC-0 |
NST 丹麦 ASR 数据库 | 丹麦语 | 229,992 条言论 | 616 发言者 | 原始:https://www.nb.no/sprakbanken/en/resource-catalogue/oai-nb-no-sbr-19/,重组:https://www.nb.no/sprakbanken/en/resource-catalogue /oai-nb-no-sbr-55/ | CC-0 |
NST 丹麦语听写 | 丹麦语 | 34,955 条言论 | 151 位发言者 | https://www.nb.no/sprakbanken/en/resource-catalogue/oai-nb-no-sbr-20/ | CC-0 |
NST 丹麦语语音合成 | 丹麦语 | 4,108 条言论 | 1 男发言者 | https://www.nb.no/sprakbanken/en/resource-catalogue/oai-nb-no-sbr-21/ | CC-0 |
NST 瑞典 ASR 数据库 | 瑞典 | 366,000 条言论 | 1,000 名发言者 | 原始:https://www.nb.no/sprakbanken/en/resource-catalogue/oai-nb-no-sbr-16/,重组:https://www.nb.no/sprakbanken/en/resource-catalogue /oai-nb-no-sbr-56/ | CC-0 |
NST 瑞典语听写 | 瑞典 | 45,620 条言论 | 195 位发言者 | https://www.nb.no/sprakbanken/en/resource-catalogue/oai-nb-no-sbr-17/ | CC-0 |
NST 瑞典语语音合成 | 瑞典 | 5,279 条言论 | 1 男发言者 | https://www.nb.no/sprakbanken/en/resource-catalogue/oai-nb-no-sbr-18/ | CC-0 |
NST 挪威 ASR 数据库 | 挪威 | 359,760 条言论 | 980 个发言者 | 原始:https://www.nb.no/sprakbanken/en/resource-catalogue/oai-nb-no-sbr-13/,重组:https://www.nb.no/sprakbanken/en/resource-catalogue /oai-nb-no-sbr-54/ | CC-0 |
NST 挪威语听写 | 挪威 | 33,360 条言论 | 144 位发言者 | https://www.nb.no/sprakbanken/en/resource-catalogue/oai-nb-no-sbr-14/ | CC-0 |
NST 挪威语语音合成 | 挪威 | 5,363 条言论 | 1 男发言者 | https://www.nb.no/sprakbanken/en/resource-catalogue/oai-nb-no-sbr-15/ | CC-0 |
NB Tale – 挪威语语音数据库 | 挪威 | 7,600 条话语 + 约 12 小时 | 380 个扬声器 | https://www.nb.no/sprakbanken/en/resource-catalogue/oai-nb-no-sbr-31/ | CC-0 |
挪威议会演讲语料库 (v0.1) | 挪威 | 〜59小时 | 203 发言者 | https://www.nb.no/sprakbanken/en/resource-catalogue/oai-nb-no-sbr-58/ | CC-0 |
维基共享资源 奥迪亚 | 奥迪亚 | 〜8小时 | 约 20 位发言者 | https://commons.wikimedia.org/wiki/Category:Odia_发音 | 大部分(?)CC-0 |
Thorsten-21.02-中性 | 德语 | 〜24小时 | 1 男发言者 | https://www.Thorsten-Voice.de | CC-0 |
Thorsten-21.06-情感 | 德语 | 2.400 条话语(8 种情绪) | 1 男发言者 | https://www.Thorsten-Voice.de | CC-0 |
语料库 | 语言 | # 小时 | # 演讲者 | 下载 | 执照 |
---|---|---|---|---|---|
ARU语音语料库 | 英语(英国) | 720 次发言/发言者 | 12(6 女;6 男) | http://datacat.liverpool.ac.uk/681/1/ARU_Speech_Corpus_v1_0.zip | 抄送3.0 |
Althingi 议会演讲语料库 | 冰岛语 | 542小时25分钟 | 196 位发言者 | http://www.malfong.is/index.php?dlid=73&lang=en | CC-BY 4.0 |
Alþingisumræður 议会演讲语料库 | 冰岛语 | 〜21小时 | http://www.malfong.is/index.php?dlid=8&lang=en | 抄送3.0 | |
哈尔语料库 | 冰岛语 | 约 41,000 条录音 | 883 发言者 | http://www.malfong.is/index.php?dlid=5&lang=en | 抄送3.0 |
Malromur 语料库 | 冰岛语 | 152小时 | 563 发言者 | http://www.malfong.is/index.php?dlid=65&lang=en | CC-BY 4.0 |
Kinect 远程合作德语语料库 | 德语 | 〜35小时 | 约 180 位发言者 | http://www.repository.voxforge1.org/downloads/de/german-speechdata-TUDa-2015.tar.gz | CC-BY 2.0 |
非洲语音技术英英语音语料库 | 英语 | 〜21小时 | https://repo.sadilar.org/handle/20.500.12185/283 | CC-BY 2.5 南非 | |
非洲语音技术 isiXhosa 语音语料库 | 伊西科萨语 | 〜26小时 | https://repo.sadilar.org/handle/20.500.12185/305 | CC-BY 2.5 南非 | |
NCHLT 南非荷兰语 | 南非荷兰语 | 56小时 | 210 名发言者(98 名女性/112 名男性) | https://repo.sadilar.org/handle/20.500.12185/280 | 抄送3.0 |
NCHLT 英语 | 英语 | 56小时 | 210 名发言者(100 名女性/110 名男性) | https://repo.sadilar.org/handle/20.500.12185/274 | 抄送3.0 |
NCHLT 伊辛德贝莱 | 伊辛德贝莱 | 56小时 | 148 名发言者(78 名女性/70 名男性) | https://repo.sadilar.org/handle/20.500.12185/272 | 抄送3.0 |
NCHLT 伊西科萨语 | 伊西科萨语 | 56小时 | 209 名发言者(106 名女性/103 名男性) | https://repo.sadilar.org/handle/20.500.12185/279 | 抄送3.0 |
NCHLT 伊西祖鲁语 | 伊西祖鲁语 | 56小时 | 210 名发言者(98 名女性/112 名男性) | https://repo.sadilar.org/handle/20.500.12185/275 | 抄送3.0 |
NCHLT 塞佩迪 | 塞佩迪 | 56小时 | 210 名发言者(100 名女性/110 名男性) | https://repo.sadilar.org/handle/20.500.12185/270 | 抄送3.0 |
NCHLT 塞索托 | 塞索托语 | 56小时 | 210 名发言者(113 名女性/97 名男性) | https://repo.sadilar.org/handle/20.500.12185/278 | 抄送3.0 |
NCHLT 茨瓦纳 | 茨瓦纳语 | 56小时 | 210 名发言者(109 名女性/101 名男性) | https://repo.sadilar.org/handle/20.500.12185/281 | 抄送3.0 |
NCHLT 西斯瓦蒂 | 西斯瓦蒂 | 56小时 | 197 名发言者(96 名女性/101 名男性) | https://repo.sadilar.org/handle/20.500.12185/271 | 抄送3.0 |
NCHLT 茨文达 | 奇文达 | 56小时 | 208 名发言者(83 名女性/125 名男性) | https://repo.sadilar.org/handle/20.500.12185/276 | 抄送3.0 |
NCHLT 西松加 | 西松加 | 56小时 | 198 名发言者(95 名女性/103 名男性) | https://repo.sadilar.org/handle/20.500.12185/277 | 抄送3.0 |
Lwazi II 跨语言专有名称语料库 | 南非荷兰语;英语;祖鲁语;塞索托语 | 2小时5分钟 | 20 名发言者 | https://repo.sadilar.org/handle/20.500.12185/445 | 抄送3.0 |
Lwazi II 专有名称呼叫路由电话语料库 | 英语 | 2小时7分钟 | https://repo.sadilar.org/handle/20.500.12185/448 | 抄送3.0 | |
Lwazi II 南非荷兰语轨迹跟踪语料库 | 南非荷兰语 | 4小时 | 一名男性 | https://repo.sadilar.org/handle/20.500.12185/442 | 抄送3.0 |
图书馆演讲 | 英语 | 〜1000小时 | 2484 名发言者(1201 名女性/1283 名男性) | http://www.openslr.org/12/ | CC-BY 4.0 |
Zeroth-韩语 | 韩国人 | 52.8小时 | 115 位发言者 | http://www.openslr.org/40/ | CC-BY 4.0 |
语音命令 | 英语 | 17.8小时 | >1,000 名发言者 | https://ai.googleblog.com/2017/08/launching-speech-commands-dataset.html | CC-BY 4.0 |
议会议会 | 加泰罗尼亚语 | 320小时 | https://www.openslr.org/59/ | CC-BY 4.0 | |
SIWIS | 法语 | 〜10小时 | 一名女性 | http://datashare.is.ed.ac.uk/download/DS_10283_2353.zip | CC-BY 4.0 |
VCTK | 英语 | 44小时 | 109 位发言者 | http://datashare.is.ed.ac.uk/download/DS_10283_3443.zip | CC-BY 4.0 |
图书馆TTS | 英语 | 586小时 | 2,456 名发言者(1,185 名女性/1,271 名男性) | http://www.openslr.org/60/ | CC-BY 4.0 |
增强型LibriSpeech | 音频(英语);文本(英语、法语) | 236小时 | https://persyval-platform.univ-grenoble-alpes.fr/datasets/DS91 | CC-BY 4.0 | |
赫尔辛基韵律语料库 | 英语 | 262.5小时 | 1,230 位发言者 | https://github.com/Helsinki-NLP/prosody | CC-BY 4.0 |
图瓦语音数据库 | 挪威 | 24小时 | 40 名发言者 | https://www.nb.no/sprakbanken/show?serial=oai:nb.no:sbr-44&lang= | CC-BY 4.0 |
COERLL K'iche' 语料库 | 基切 | 34分钟 | ?扬声器 | https://cl.indiana.edu/~ftyers/resources/utexas-kiche-audio.tar.gz | CC-BY 4.0 |
定时器等 v0.1 | 英语(合成:美国,真实:各个国家) | 合成:172 小时,真实:0.29 小时 | 21 种合成,11 种真实 | https://zenodo.org/record/4110812#.X9j0RmBOkYM | CC-BY 4.0 |
捷克议会全体听证会大型语料库 | 捷克语 | 444小时 | https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-3126 | CC-BY 4.0 |
语料库 | 语言 | # 小时 | # 演讲者 | 下载 | 执照 |
---|---|---|---|---|---|
伊班语 | 伊班语 | 8小时 | http://www.openslr.org/24/ https://github.com/sarahjuan/iban | CC-BY-SA 2.0 | |
维斯塔迪尔 2013 | 英语;捷克语 | 41小时; 15小时 | http://www.openslr.org/6/ | CC-BY-SA 3.0 美国 | |
Vystadial 2016 捷克语 | 捷克语 | 77小时;包括 Vystadial 2013 捷克语 | https://lindat.cz/repository/xmlui/handle/11234/1-1740 | CC-BY-SA 4.0 | |
免费口语数字数据集 | 英语 | 2,000 个独立数字 | 4 个扬声器 | https://github.com/Jakobovski/free-spoken-digit-dataset | CC-BY-SA 4.0 |
谷歌爪哇语 | 爪哇语 | 296小时 | 1019 发言者 | http://www.openslr.org/35/ | CC-BY-SA 4.0 |
谷歌尼泊尔语 | 尼泊尔语 | 165小时 | 527 位发言者 | http://www.openslr.org/54/ | CC-BY-SA 4.0 |
谷歌孟加拉语 | 孟加拉 | 229小时 | 508 发言者 | http://www.openslr.org/53/ | CC-BY-SA 4.0 |
谷歌僧伽罗语 | 僧伽罗语 | 224小时 | 478 位发言者 | http://www.openslr.org/52/ | CC-BY-SA 4.0 |
谷歌巽他语 | 巽他语 | 333小时 | 542 发言者 | http://www.openslr.org/36/ | CC-BY-SA 4.0 |
维基百科口语语料库 (SWC-2017) | 英语;德语;荷兰语 | 182 小时; 249小时; 79小时 | 395 位发言者; 339 位发言者; 145 位发言者 | https://nats.gitlab.io/swc/ | CC-BY-SA 4.0 |
楚瓦什语 TTS | 楚瓦什语 | 4小时 | 1 个扬声器 | https://github.com/ftyers/Turkic_TTS | CC-BY-SA 4.0 |
福施吉斯特 | 德语 | 2小时 | 2 位发言者(1 名女性;1 名男性) | 女发言人:https://goofy.zamia.org/zamia-speech/corpora/forschergeist/annettevogt-20180320-rec.tgz;男发言者:https://goofy.zamia.org/zamia-speech/corpora/forschergeist/timpritlove-20180320-rec.tgz | CC-BY-SA 4.0 |
SMC 的马拉雅拉姆语语音语料库 | 马拉雅拉姆语 | 1:36 小时 | 75 名发言者(3 名女性、12 名男性、60 名身份不明) | https://releases.smc.org.in/msc-reviewed-speech/ | CC-BY-SA 4.0 |
谷歌马拉雅拉姆语 | 马拉雅拉姆语 | 3.02小时 | 24 个发言者 | http://www.openslr.org/63/ | CC-BY-SA 4.0 |
语料库 | 语言 | # 小时 | # 演讲者 | 下载 | 执照 |
---|---|---|---|---|---|
IBM 辩论录音 v1 | 英语 | 5小时 | 10 名发言者 | https://www.research.ibm.com/haifa/dept/vst/debating_data.shtml#Debate%20Speech%20Analysis | CC-BY-ND |
IBM 辩论录音 v2 | 英语 | 〜14小时 | 14 个扬声器 | https://www.research.ibm.com/haifa/dept/vst/debating_data.shtml#Debate%20Speech%20Analysis | CC-BY-ND |
语料库 | 语言 | # 小时 | # 演讲者 | 下载 | 执照 |
---|---|---|---|---|---|
TV3帕尔拉 | 加泰罗尼亚语 | 240小时 | http://laklak.eu/share/tv3_0.3.tar.gz | CC-BY-NC 4.0 | |
俄罗斯公开 STT 语料库 | 俄语 | 公开约 10,000 小时,根据要求可提供约 10,000 小时 | https://github.com/snakers4/open_stt/#links | CC-BY-NC 4.0,但有一些例外 | |
俄语公开 TTS 语料库 | 俄语 | 145小时 | 3 男 | https://github.com/snakers4/open_tts/#links | CC-BY-NC 4.0 的一些期望 |
OVM – Otázky Václava Moravce | 捷克语 | 35小时 | https://lindat.mff.cuni.cz/repository/xmlui/handle/11858/00-097C-0000-000D-EC98-3 | CC-BY-NC 3.0 |
语料库 | 语言 | # 小时 | # 演讲者 | 下载 | 执照 |
---|---|---|---|---|---|
ChiME-首页 | 英语 | 6.8小时 | https://archive.org/details/chime-home | CC-BY-NC-SA 3.0 | |
喀麦隆洋泾浜英语语料库 | 喀麦隆洋泾浜英语 | 〜17小时 | http://ota.ox.ac.uk/text/2563.zip | CC-BY-NC-SA 3.0 |
语料库 | 语言 | # 小时 | # 演讲者 | 下载 | 执照 |
---|---|---|---|---|---|
塔托巴-英格 | 英语 | ~250 小时(粗略估计) | 6 个扬声器 | https://voice.mozilla.org/en/datasets | CC-BY-NC 4.0(部分音频)/CC-BY-NC-ND 3.0(大部分音频)/CC-BY 2.0(所有文本) |
泰德-刘姆 | 英语 | 118小时 | 685 名发言者(36h 女性/81h 男性) | http://www.openslr.org/7/ | CC-BY-NC-ND 3.0 |
TED-LIUM-2 | 英语 | 207 小时 | 1242 个扬声器(66h 女性/141h 男性) | http://www.openslr.org/19/ | CC-BY-NC-ND 3.0 |
TED-LIUM-3 | 英语 | 452小时 | 2028 个扬声器(134h 女性/316h 男性) | http://www.openslr.org/51/ | CC-BY-NC-ND 3.0 |
盘索里 TEDxKR | 韩国人 | 3小时 | 41 位发言者 | http://www.openslr.org/58/ | CC-BY-NC-ND 4.0 |
Primewords 普通话 | 普通话 | 100小时 | 296 位发言者 | http://www.openslr.org/47/ | CC-BY-NC-ND 4.0 |
MuST-C v1.0 | 音频(英语);文本(荷兰语、法语、德语、意大利语、葡萄牙语、罗马尼亚语、俄语、西班牙语) | 每个语言对 408、504、492、465、442、385、432、489 小时 | https://ict.fbk.eu/must-c-release-v1-0/ | CC-BY-NC-ND 4.0 | |
捷克议会会议 | 捷克语 | 88小时 | https://lindat.mff.cuni.cz/repository/xmlui/handle/11858/00-097C-0000-0005-CF9C-4 | CC-BY-NC-ND 3.0 | |
本巴演讲 | 本巴 | 24小时 | 17 名发言者(9 男/8 女) | https://github.com/csikasote/BembaSpeech | CC-BY-NC-ND 4.0 |
语料库 | 语言 | # 小时 | # 演讲者 | 下载 | 执照 |
---|---|---|---|---|---|
迪普科 | 英语 | 〜5小时 | 32 名发言者(13 名女性;19 名男性) | https://s3.amazonaws.com/dipco/DiPCo.tgz | CDLA-Permissive-1.0 |
语料库 | 语言 | # 小时 | # 演讲者 | 下载 | 执照 |
---|---|---|---|---|---|
沃克斯锻造 | 英语 | 约 120 小时 | 约 2966 位发言者 | http://www.repository.voxforge1.org/downloads/en/Trunk/Audio/Main/16kHz_16bit/ https://voice.mozilla.org/en/datasets | GNU-GPL 3.0 |
沃克斯锻造 | 俄语 | http://www.repository.voxforge1.org/downloads/ru/Trunk/Audio/Main/16kHz_16bit/ http://www.repository.voxforge1.org/downloads/Russian/Trunk/Audio/Main/16kHz_16bit/ | GNU-GPL 3.0 | ||
沃克斯锻造 | 德语 | http://www.repository.voxforge1.org/downloads/de/Trunk/Audio/Main/16kHz_16bit/ | GNU-GPL 3.0 |
语料库 | 语言 | # 小时 | # 演讲者 | 下载 | 执照 |
---|---|---|---|---|---|
艾舍尔-1 | 普通话 | 170小时 | 400 名发言者 | http://www.openslr.org/33/ | 阿帕奇2.0 |
突尼斯_MSA | 现代标准阿拉伯语(突尼斯) | 11.2小时 | 118 位发言者 | http://www.openslr.org/46/ | 阿帕奇2.0 |
非洲口音的法语 | 法语 | 22小时 | 232 个发言者 | http://www.openslr.org/57/ | 阿帕奇2.0 |
THCHS-30 | 普通话 中文 | 33.57 小时(13,389 条言论) | 40 名发言者(31 名女性;9 名男性) | http://www.openslr.org/18/ | 阿帕奇2.0 |
生活音频数据集 - 荷兰语 | 荷兰语 | 57:49 分钟 | 1 个扬声器 | https://github.com/Idlak/Living-Audio-Dataset | 阿帕奇2.0 |
生活音频数据集 - 英语 | 英语 | 50:50 分钟 | 1 个扬声器 | https://github.com/Idlak/Living-Audio-Dataset | 阿帕奇2.0 |
生活音频数据集 - 爱尔兰语 | 爱尔兰语 | 61:56 分钟 | 1 个扬声器 | https://github.com/Idlak/Living-Audio-Dataset | 阿帕奇2.0 |
生活音频数据集 - 俄语 | 俄语 | 34:58 分钟 | 1 个扬声器 | https://github.com/Idlak/Living-Audio-Dataset | 阿帕奇2.0 |
语料库 | 语言 | # 小时 | # 演讲者 | 下载 | 执照 |
---|---|---|---|---|---|
阿尔法 | 阿姆哈拉语;豪萨语(付费);斯瓦希里语;沃洛夫语 | http://www.openslr.org/25/ https://github.com/besacier/ALFFA_PUBLIC | 麻省理工学院 |
语料库 | 语言 | # 小时 | # 演讲者 | 下载 | 执照 |
---|---|---|---|---|---|
M-AILAB德语语料库 | 德语 | 237小时22分钟 | http://www.caito.de/data/Training/stt_tts/de_DE.tgz | M-AILABS 许可证(特定于数据的 BSD 3 条款许可证) | |
M-AILABS 女王英语语料库 | 女王英语 | 45小时35分钟 | http://www.caito.de/data/Training/stt_tts/en_UK.tgz | M-AILABS 许可证(特定于数据的 BSD 3 条款许可证) | |
M-AILABS美国英语语料库 | 美式英语 | 102小时7分钟 | http://www.caito.de/data/Training/stt_tts/en_US.tgz | M-AILABS 许可证(特定于数据的 BSD 3 条款许可证) | |
M-AILAB 西班牙语语料库 | 西班牙语 西班牙语 | 108小时34分钟 | http://www.caito.de/data/Training/stt_tts/es_ES.tgz | M-AILABS 许可证(特定于数据的 BSD 3 条款许可证) | |
M-AILABS 意大利语语料库 | 意大利语 | 127小时40分钟 | http://www.caito.de/data/Training/stt_tts/it_IT.tgz | M-AILABS 许可证(特定于数据的 BSD 3 条款许可证) | |
M-AILABS 乌克兰语语料库 | 乌克兰 | 87小时8分钟 | http://www.caito.de/data/Training/stt_tts/uk_UK.tgz | M-AILABS 许可证(特定于数据的 BSD 3 条款许可证) | |
M-AILAB俄语语料库 | 俄语 | 46小时47分钟 | http://www.caito.de/data/Training/stt_tts/ru_RU.tgz | M-AILABS 许可证(特定于数据的 BSD 3 条款许可证) | |
M-AILABS 法语-v0.9 语料库 | 法语 | 190小时30分钟 | http://www.caito.de/data/Training/stt_tts/fr_FR.tgz | M-AILABS 许可证(特定于数据的 BSD 3 条款许可证) | |
M-AILAB波兰语语料库 | 抛光 | 53小时50分钟 | http://www.caito.de/data/Training/stt_tts/pl_PL.tgz | M-AILABS 许可证(特定于数据的 BSD 3 条款许可证) |
语料库 | 语言 | # 小时 | # 演讲者 | 下载 | 执照 |
---|---|---|---|---|---|
流利的语音命令语料库 | 英语 | 19 小时(30,043 条言论) | 97 位发言者 | http:// Fluent.ai:2052/jf8398hf30f0381738rucj3828chfdnchs.tar.gz | Fluent Speech Commands 公共许可证 |
卡耐基梅隆大学荒野 | 700 朗 | 没有音频或文本的对齐分发总计:约 14,000 小时;每语言:~20 小时 | https://github.com/festvox/datasets-CMU_Wilderness | https://live.bible.is/terms | |
CHiME-5 | 英语 | 50小时 | 48 位发言者 | http://spandh.dcs.shef.ac.uk/chime_challenge/data.html | CHiME-5 许可证 |
无畏的脚步语料库 | 英语 | 19,000 小时(转录 20 小时) | 约 450 位发言者 | https://fearless-steps.github.io/ChallengePhase3/#19k_Corpus_Access | NASA 媒体使用指南 |
Microsoft 语音语料库(印度语言) | 泰卢固语;泰米尔语;古吉拉特语 | https://msropendata.com/datasets/7230b4b1-912d-400e-be58-f84e0512985e | Microsoft 语音语料库(印度语言)许可证 | ||
微软语音翻译语料库 | 英语;中国人;日本人 | https://msropendata.com/datasets/54813518-4ea6-4c39-9bb2-b0d1e5f0c187 | 微软研究院数据许可协议 | ||
嘿剪语料库 | 英语 | 11K 条正面“Hey Snips”(约 4.4 小时)和 87K 条负面(约 89 小时)话语 | 2215 个扬声器(正负)和 4028 个扬声器(仅负) | https://research.snips.ai/datasets/keyword-spotting | 剪断数据许可证 |
剪切 SLU 语料库 | 英语;法语 | 1660 条“智能灯 EN”(约 1.3 小时)、1286 条“智能扬声器 EN”(约 55 分钟)、1138 条“智能扬声器 FR”(约 50 分钟)话语 | 英语:69 人;法语:30 人 | https://research.snips.ai/datasets/spoken-language-understanding | 剪断数据许可证 |
CMU Sphinx 集团 - AN4 | 英语 | “an4_clstk”(约 50 分钟) “an4test_clstk”(约 6 分钟) | “an4_clstk”:21 名女性,53 名男性 “an4test_clstk”:3 名女性,7 名男性 | http://www.speech.cs.cmu.edu/databases/an4/an4_raw.bigendian.tar.gz | AN4 |
英国金融时报演讲 | 丹麦语 | ~1,857 小时(1,017,244 条话语) | 434 名发言者(176 名女性,258 名男性) | https://ftspeech.dk | 英国《金融时报》演讲许可证 |
法拉巴西-LAPS-宪法 | 巴西-葡萄牙语 | 9小时 | 1 个扬声器 | https://drive.google.com/uc?export=download&confirm=SrvW&id=1Nf849u-27CYRzJqedLaI-FaZfMRO7FT | “音频转录基础和文本标准化基础(sem pontuação、com números escritos por extenso 等)disponibilizadas de forma gratuita* pelo Grupo FalaBrasil。[disponibilizadas de forma gratuita*] / Portanto、apenas as bases livres estão sendo disponibilizadas。” |
Fala巴西-LaPSMail | 巴西-葡萄牙语 | 1小时 | 25 位发言者 | https://drive.google.com/uc?export=download&confirm=PecV&id=1B_Vq8MDSE4fBQefVxqCGSl-EcKAcjJLb | “音频转录基础和文本标准化基础(sem pontuação、com números escritos por extenso 等)disponibilizadas de forma gratuita* pelo Grupo FalaBrasil。[disponibilizadas de forma gratuita*] / Portanto、apenas as bases livres estão sendo disponibilizadas。” |
FalaBrasil-LaPS 基准 | 巴西-葡萄牙语 | 1小时 | 1 个扬声器 | https://drive.google.com/uc?export=download&confirm=XFfF&id=1nZ8L9nJTt4blFC0RGT9Y7XRu02aAvDIo | “音频转录基础和文本标准化基础(sem pontuação、com números escritos por extenso 等)disponibilizadas de forma gratuita* pelo Grupo FalaBrasil。[disponibilizadas de forma gratuita*] / Portanto、apenas as bases livres estão sendo disponibilizadas。” |