音声技術の研究開発用に公開されている音声コーパスのリスト。
このリストには、無料 (つまり、コストがかからない) で真にオープンなコーパス (クリエイティブ コモンズ ライセンスまたはコミュニティ データ ライセンス契約に基づいてリリースされるものなど) が優先されます。これらのコーパスすべてがこれらの基準を満たしているわけではありませんが、以下のすべてのコーパスはアクセス可能であり、研究および/または商用利用に使用できます。
リストへの追加を遠慮なく提案してください。
Issue に追加すべきコーパスの長いバックログがあり、プル リクエストは大歓迎です :)
コーパス | 言語 | # 時間 | # スピーカー | ダウンロード | ライセンス |
---|---|---|---|---|---|
一般的な声 | 多言語対応 | >15,000 時間 (検証済み)。 >20,000 時間 (合計) | マルチスピーカー | https://voice.mozilla.org/en/datasets | CC-0 |
はいいいえ | ヘブライ語 | 6分 | 男性1人 | http://www.openslr.org/1/ | CC-0 |
LJ音声コーパス | 英語 | ~24時間 | 女性1人 | https://data.keithito.com/data/speech/LJSpeech-1.1.tar.bz2 | CC-0 |
NST デンマーク ASR データベース | デンマーク語 | 229,992 発言 | 616 人のスピーカー | 原文:https://www.nb.no/sprakbanken/en/resource-catalogue/oai-nb-no-sbr-19/、再構成:https://www.nb.no/sprakbanken/en/resource-catalogue /oai-nb-no-sbr-55/ | CC-0 |
NST デンマーク語ディクテーション | デンマーク語 | 34,955 発言 | 151 人の講演者 | https://www.nb.no/sprakbanken/en/resource-catalogue/oai-nb-no-sbr-20/ | CC-0 |
NST デンマーク語音声合成 | デンマーク語 | 4,108 発言 | 男性スピーカー1名 | https://www.nb.no/sprakbanken/en/resource-catalogue/oai-nb-no-sbr-21/ | CC-0 |
NST スウェーデン ASR データベース | スウェーデン語 | 366,000 発話 | 1,000人のスピーカー | 原文:https://www.nb.no/sprakbanken/en/resource-catalogue/oai-nb-no-sbr-16/、再構成:https://www.nb.no/sprakbanken/en/resource-catalogue /oai-nb-no-sbr-56/ | CC-0 |
NST スウェーデン語ディクテーション | スウェーデン語 | 45,620 発言 | 195 人の講演者 | https://www.nb.no/sprakbanken/en/resource-catalogue/oai-nb-no-sbr-17/ | CC-0 |
NST スウェーデン語音声合成 | スウェーデン語 | 5,279 発言 | 男性スピーカー1名 | https://www.nb.no/sprakbanken/en/resource-catalogue/oai-nb-no-sbr-18/ | CC-0 |
NST ノルウェー ASR データベース | ノルウェー語 | 359,760 発言 | 980スピーカー | 原文:https://www.nb.no/sprakbanken/en/resource-catalogue/oai-nb-no-sbr-13/、再構成:https://www.nb.no/sprakbanken/en/resource-catalogue /oai-nb-no-sbr-54/ | CC-0 |
NST ノルウェー語ディクテーション | ノルウェー語 | 33,360 発言 | 144 人のスピーカー | https://www.nb.no/sprakbanken/en/resource-catalogue/oai-nb-no-sbr-14/ | CC-0 |
NST ノルウェー語音声合成 | ノルウェー語 | 5,363 発言 | 男性スピーカー1名 | https://www.nb.no/sprakbanken/en/resource-catalogue/oai-nb-no-sbr-15/ | CC-0 |
NB Tale – ノルウェー語音声データベース | ノルウェー語 | 7,600 発話 + 約 12 時間 | 380 スピーカー | https://www.nb.no/sprakbanken/en/resource-catalogue/oai-nb-no-sbr-31/ | CC-0 |
ノルウェー議会演説コーパス (v0.1) | ノルウェー語 | ~59時間 | 203 人の講演者 | https://www.nb.no/sprakbanken/en/resource-catalogue/oai-nb-no-sbr-58/ | CC-0 |
ウィキメディア・コモンズ・オディア | オディア | ~8時間 | ~20 人のスピーカー | https://commons.wikimedia.org/wiki/Category:Odia_pronunciation | ほとんど(?) CC-0 |
トルステン-21.02-ニュートラル | ドイツ語 | ~24時間 | 男性スピーカー1名 | https://www.Thorsten-Voice.de | CC-0 |
トーステン-21.06-感情的 | ドイツ語 | 2,400 発話 (8 つの感情) | 男性スピーカー1名 | https://www.Thorsten-Voice.de | CC-0 |
コーパス | 言語 | # 時間 | # スピーカー | ダウンロード | ライセンス |
---|---|---|---|---|---|
ARU音声コーパス | 英語(イギリス) | 720 発言/スピーカー | 12名(女性6名、男性6名) | http://datacat.liverpool.ac.uk/681/1/ARU_Speech_Corpus_v1_0.zip | CC-BY 3.0 |
アルシンギ議会演説コーパス | アイスランド語 | 542時間25分 | 196 人の講演者 | http://www.malfong.is/index.php?dlid=73&lang=ja | CC-BY 4.0 |
Alþingisumræður 議会演説コーパス | アイスランド語 | ~21時間 | http://www.malfong.is/index.php?dlid=8&lang=ja | CC-BY 3.0 | |
ヒャルコーパス | アイスランド語 | ~41,000 件の録音 | 883 人の講演者 | http://www.malfong.is/index.php?dlid=5&lang=ja | CC-BY 3.0 |
マロムル コーパス | アイスランド語 | 152時間 | 563 人の講演者 | http://www.malfong.is/index.php?dlid=65&lang=ja | CC-BY 4.0 |
Kinect 用の遠隔協力ドイツ語コーパス | ドイツ語 | ~35時間 | ~180 人のスピーカー | http://www.repository.voxforge1.org/downloads/de/german-speechdata-TUDa-2015.tar.gz | CC-BY 2.0 |
アフリカの音声技術英語-英語音声コーパス | 英語 | ~21時間 | https://repo.sadilar.org/handle/20.500.12185/283 | CC-BY 2.5 南アフリカ | |
アフリカの音声技術 isiXhosa 音声コーパス | イシコサ | ~26時間 | https://repo.sadilar.org/handle/20.500.12185/305 | CC-BY 2.5 南アフリカ | |
NCHLT アフリカーンス語 | アフリカーンス語 | 56時間 | 講演者 210 名 (女性 98 名 / 男性 112 名) | https://repo.sadilar.org/handle/20.500.12185/280 | CC-BY 3.0 |
NCHLT英語 | 英語 | 56時間 | 講演者 210 名(女性 100 名 / 男性 110 名) | https://repo.sadilar.org/handle/20.500.12185/274 | CC-BY 3.0 |
NCHLT はシンデベレ | イシンデベレ | 56時間 | 講演者 148 名 (女性 78 名 / 男性 70 名) | https://repo.sadilar.org/handle/20.500.12185/272 | CC-BY 3.0 |
NCHLT はシコサ | イシコサ | 56時間 | 講演者 209 名 (女性 106 名 / 男性 103 名) | https://repo.sadilar.org/handle/20.500.12185/279 | CC-BY 3.0 |
NCHLT イシズールー | イシズール | 56時間 | 講演者 210 名 (女性 98 名 / 男性 112 名) | https://repo.sadilar.org/handle/20.500.12185/275 | CC-BY 3.0 |
NCHLT セペディ | セペディ | 56時間 | 講演者 210 名(女性 100 名 / 男性 110 名) | https://repo.sadilar.org/handle/20.500.12185/270 | CC-BY 3.0 |
NCHLT セソト | セソト | 56時間 | 講演者 210 名 (女性 113 名 / 男性 97 名) | https://repo.sadilar.org/handle/20.500.12185/278 | CC-BY 3.0 |
NCHLT セツワナ | セツワナ | 56時間 | 講演者 210 名(女性 109 名 / 男性 101 名) | https://repo.sadilar.org/handle/20.500.12185/281 | CC-BY 3.0 |
NCHLT シスワティ | シスワティ | 56時間 | 講演者 197 名 (女性 96 名 / 男性 101 名) | https://repo.sadilar.org/handle/20.500.12185/271 | CC-BY 3.0 |
NCHLT ツィベンダ | チヴェンダ | 56時間 | 講演者 208 名 (女性 83 名 / 男性 125 名) | https://repo.sadilar.org/handle/20.500.12185/276 | CC-BY 3.0 |
NCHLT シトソンガ | シトソンガ | 56時間 | 講演者 198 名 (女性 95 名/男性 103 名) | https://repo.sadilar.org/handle/20.500.12185/277 | CC-BY 3.0 |
ルワジ II 言語横断固有名コーパス | アフリカーンス語;英語;イシズール;セソト | 2時間5分 | 20人のスピーカー | https://repo.sadilar.org/handle/20.500.12185/445 | CC-BY 3.0 |
ルワジ II 固有名コール ルーティング電話コーパス | 英語 | 2時間7分 | https://repo.sadilar.org/handle/20.500.12185/448 | CC-BY 3.0 | |
ルワジ II アフリカーンス語軌跡追跡コーパス | アフリカーンス語 | 4時間 | 男性1人 | https://repo.sadilar.org/handle/20.500.12185/442 | CC-BY 3.0 |
リブスピーチ | 英語 | ~1000時間 | 2484 人の講演者 (女性 1201 人 / 男性 1283 人) | http://www.openslr.org/12/ | CC-BY 4.0 |
ゼロ番目の韓国語 | 韓国人 | 52.8時間 | 115 人のスピーカー | http://www.openslr.org/40/ | CC-BY 4.0 |
音声コマンド | 英語 | 17.8時間 | スピーカー数 1,000 人以上 | https://ai.googleblog.com/2017/08/launching-speech-commands-dataset.html | CC-BY 4.0 |
議会Parla | カタルーニャ語 | 320時間 | https://www.openslr.org/59/ | CC-BY 4.0 | |
シウィス | フランス語 | ~10時間 | 女性1人 | http://datashare.is.ed.ac.uk/download/DS_10283_2353.zip | CC-BY 4.0 |
VCTK | 英語 | 44時間 | 109 人の講演者 | http://datashare.is.ed.ac.uk/download/DS_10283_3443.zip | CC-BY 4.0 |
リブリッツ | 英語 | 586時間 | 講演者 2,456 名 (女性 1,185 名 / 男性 1,271 名) | http://www.openslr.org/60/ | CC-BY 4.0 |
拡張LibriSpeech | 音声 (英語);テキスト(英語、フランス語) | 236時間 | https://persyval-platform.univ-grenoble-alpes.fr/datasets/DS91 | CC-BY 4.0 | |
ヘルシンキ韻律コーパス | 英語 | 262.5時間 | 1,230人の講演者 | https://github.com/Helsinki-NLP/prosody | CC-BY 4.0 |
トゥヴァ語音声データベース | ノルウェー語 | 24時間 | 40人のスピーカー | https://www.nb.no/sprakbanken/show?serial=oai:nb.no:sbr-44&lang= | CC-BY 4.0 |
COERLL K’iche’ コーパス | キチェ | 34分 | ?スピーカー | https://cl.indiana.edu/~ftyers/resources/utexas-kiche-audio.tar.gz | CC-BY 4.0 |
タイマーなど v0.1 | 英語(合成:米国、本:さまざまな国籍) | 合成: 172 時間、本物: 0.29 時間 | 合成 21 個、本物 11 個 | https://zenodo.org/record/4110812#.X9j0RmBOkYM | CC-BY 4.0 |
チェコ議会本公聴会の大規模コーパス | チェコ語 | 444時間 | https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-3126 | CC-BY 4.0 |
コーパス | 言語 | # 時間 | # スピーカー | ダウンロード | ライセンス |
---|---|---|---|---|---|
イバン | イバン | 8時間 | http://www.openslr.org/24/ https://github.com/sarahjuan/iban | CC-BY-SA 2.0 | |
ヴィスタディアル 2013 | 英語;チェコ語 | 41時間。 15時間 | http://www.openslr.org/6/ | CC-BY-SA 3.0 米国 | |
ヴィスタディアル 2016 チェコ | チェコ語 | 77時間。ヴィスタディアル 2013 チェコ語を含む | https://lindat.cz/repository/xmlui/handle/11234/1-1740 | CC-BY-SA 4.0 | |
無料の音声数字データセット | 英語 | 2,000 個の独立した数字 | 4スピーカー | https://github.com/Jakobovski/free-spoken-digit-dataset | CC-BY-SA 4.0 |
Google ジャワ語 | ジャワ語 | 296時間 | 1019 人の講演者 | http://www.openslr.org/35/ | CC-BY-SA 4.0 |
Google ネパール語 | ネパール語 | 165時間 | 527 人の講演者 | http://www.openslr.org/54/ | CC-BY-SA 4.0 |
グーグルベンガル語 | ベンガル語 | 229時間 | 508 スピーカー | http://www.openslr.org/53/ | CC-BY-SA 4.0 |
Google シンハラ語 | シンハラ語 | 224時間 | 478 人のスピーカー | http://www.openslr.org/52/ | CC-BY-SA 4.0 |
Google スンダ語 | スンダ人 | 333時間 | 542 人の講演者 | http://www.openslr.org/36/ | CC-BY-SA 4.0 |
音声ウィキペディア コーパス (SWC-2017) | 英語;ドイツ語。オランダ語 | 182時間。 249時間。 79時間 | 395 人のスピーカー。 339 人の講演者。 145 人のスピーカー | https://nats.gitlab.io/swc/ | CC-BY-SA 4.0 |
チュヴァシ TTS | チュヴァシ語 | 4時間 | 1スピーカー | https://github.com/ftyers/Turkic_TTS | CC-BY-SA 4.0 |
フォルシャーガイスト | ドイツ語 | 2時間 | スピーカー 2 名 (女性 1 名、男性 1 名) | 女性スピーカー: https://goofy.zamia.org/zamia-speech/corpora/forschergeist/annettevogt-20180320-rec.tgz;男性スピーカー: https://goofy.zamia.org/zamia-speech/corpora/forschergeist/timpritlove-20180320-rec.tgz | CC-BY-SA 4.0 |
SMC によるマラヤーラム語音声コーパス | マラヤーラム語 | 1:36時間 | 講演者 75 名(女性 3 名、男性 12 名、身元不明 60 名) | https://releases.smc.org.in/msc-reviewed-speech/ | CC-BY-SA 4.0 |
Google マラヤーラム語 | マラヤーラム語 | 3.02時間 | 24 スピーカー | http://www.openslr.org/63/ | CC-BY-SA 4.0 |
コーパス | 言語 | # 時間 | # スピーカー | ダウンロード | ライセンス |
---|---|---|---|---|---|
IBM 録画討論 v1 | 英語 | 5時間 | 10 スピーカー | https://www.research.ibm.com/haifa/dept/vst/debating_data.shtml#Debate%20Speech%20分析 | CC-BY-ND |
IBM 録画討論 v2 | 英語 | ~14時間 | 14 スピーカー | https://www.research.ibm.com/haifa/dept/vst/debating_data.shtml#Debate%20Speech%20分析 | CC-BY-ND |
コーパス | 言語 | # 時間 | # スピーカー | ダウンロード | ライセンス |
---|---|---|---|---|---|
TV3パルラ | カタルーニャ語 | 240時間 | http://laklak.eu/share/tv3_0.3.tar.gz | CC-BY-NC 4.0 | |
ロシア語オープン STT コーパス | ロシア | 公開時間は最大 10,000 時間、リクエストに応じてさらに最大 10,000 時間 | https://github.com/snakers4/open_stt/#links | CC-BY-NC 4.0 (一部例外あり) | |
ロシア語オープン TTS コーパス | ロシア | 145時間 | 男性3名 | https://github.com/snakers4/open_tts/#links | CC-BY-NC 4.0 といくつかの期待 |
OVM – オタズキー・ヴァークラヴァ・モラヴチェ | チェコ語 | 35時間 | https://lindat.mff.cuni.cz/repository/xmlui/handle/11858/00-097C-0000-000D-EC98-3 | CC-BY-NC 3.0 |
コーパス | 言語 | # 時間 | # スピーカー | ダウンロード | ライセンス |
---|---|---|---|---|---|
CHiME-ホーム | 英語 | 6.8時間 | https://archive.org/details/chime-home | CC-BY-NC-SA 3.0 | |
カメルーン ピジン英語コーパス | カメルーン ピジン英語 | ~17時間 | http://ota.ox.ac.uk/text/2563.zip | CC-BY-NC-SA 3.0 |
コーパス | 言語 | # 時間 | # スピーカー | ダウンロード | ライセンス |
---|---|---|---|---|---|
タトエバ英語 | 英語 | ~250時間(概算) | 6スピーカー | https://voice.mozilla.org/en/datasets | CC-BY-NC 4.0 (一部の音声) / CC-BY-NC-ND 3.0 (ほとんどの音声) / CC-BY 2.0 (すべてのテキスト) |
テッド・リウム | 英語 | 118時間 | 685 人の講演者 (女性 36 時間 / 男性 81 時間) | http://www.openslr.org/7/ | CC-BY-NC-ND 3.0 |
テッド・リウム-2 | 英語 | 207時間 | 1,242 人の講演者 (女性 66 時間 / 男性 141 時間) | http://www.openslr.org/19/ | CC-BY-NC-ND 3.0 |
テッド・リウム-3 | 英語 | 452時間 | 2028 人の講演者 (女性 134 時間 / 男性 316 時間) | http://www.openslr.org/51/ | CC-BY-NC-ND 3.0 |
パンソリ TEDxKR | 韓国人 | 3時間 | 41 人のスピーカー | http://www.openslr.org/58/ | CC-BY-NC-ND 4.0 |
プライムワード中国語 | 北京語 | 100時間 | 296 人のスピーカー | http://www.openslr.org/47/ | CC-BY-NC-ND 4.0 |
MuST-C v1.0 | 音声 (英語);テキスト (オランダ語、フランス語、ドイツ語、イタリア語、ポルトガル語、ルーマニア語、ロシア語、スペイン語) | 言語ペアごとに 408、504、492、465、442、385、432、489 時間 | https://ict.fbk.eu/must-c-release-v1-0/ | CC-BY-NC-ND 4.0 | |
チェコ国会議事堂 | チェコ語 | 88時間 | https://lindat.mff.cuni.cz/repository/xmlui/handle/11858/00-097C-0000-0005-CF9C-4 | CC-BY-NC-ND 3.0 | |
ベンバスピーチ | ベンバ | 24時間 | 講演者 17 名(男性 9 名 / 女性 8 名) | https://github.com/csikasote/BembaSpeech | CC-BY-NC-ND 4.0 |
コーパス | 言語 | # 時間 | # スピーカー | ダウンロード | ライセンス |
---|---|---|---|---|---|
ディプコ | 英語 | ~5時間 | 講演者 32 名 (女性 13 名、男性 19 名) | https://s3.amazonaws.com/dipco/DiPCo.tgz | CDLA-パーミッシブ-1.0 |
コーパス | 言語 | # 時間 | # スピーカー | ダウンロード | ライセンス |
---|---|---|---|---|---|
ヴォックスフォージ | 英語 | ~120時間 | ~2966 人のスピーカー | http://www.repository.voxforge1.org/downloads/en/Trunk/Audio/Main/16kHz_16bit/ https://voice.mozilla.org/en/datasets | GNU-GPL 3.0 |
ヴォックスフォージ | ロシア | http://www.repository.voxforge1.org/downloads/ru/Trunk/Audio/Main/16kHz_16bit/ http://www.repository.voxforge1.org/downloads/Russian/Trunk/Audio/Main/16kHz_16bit/ | GNU-GPL 3.0 | ||
ヴォックスフォージ | ドイツ語 | http://www.repository.voxforge1.org/downloads/de/Trunk/Audio/Main/16kHz_16bit/ | GNU-GPL 3.0 |
コーパス | 言語 | # 時間 | # スピーカー | ダウンロード | ライセンス |
---|---|---|---|---|---|
アイシェル-1 | 北京語 | 170時間 | 400のスピーカー | http://www.openslr.org/33/ | アパッチ2.0 |
チュニジア_MSA | 現代標準アラビア語 (チュニジア) | 11.2時間 | 118 スピーカー | http://www.openslr.org/46/ | アパッチ2.0 |
アフリカ訛りのフランス語 | フランス語 | 22時間 | 232 人のスピーカー | http://www.openslr.org/57/ | アパッチ2.0 |
THCS-30 | 北京語 | 33.57 時間 (13,389 発話) | 講演者 40 名(女性 31 名、男性 9 名) | http://www.openslr.org/18/ | アパッチ2.0 |
リビングオーディオデータセット - オランダ語 | オランダ語 | 57:49 分 | 1スピーカー | https://github.com/Idlak/Living-Audio-Dataset | アパッチ2.0 |
リビングオーディオデータセット - 英語 | 英語 | 50:50分 | 1スピーカー | https://github.com/Idlak/Living-Audio-Dataset | アパッチ2.0 |
リビングオーディオデータセット - アイルランド語 | アイルランド人 | 61:56 分 | 1スピーカー | https://github.com/Idlak/Living-Audio-Dataset | アパッチ2.0 |
リビングオーディオデータセット - ロシア語 | ロシア | 34:58 分 | 1スピーカー | https://github.com/Idlak/Living-Audio-Dataset | アパッチ2.0 |
コーパス | 言語 | # 時間 | # スピーカー | ダウンロード | ライセンス |
---|---|---|---|---|---|
アルファ | アムハラ語;ハウサ語(有料);スワヒリ語;ウォロフ | http://www.openslr.org/25/ https://github.com/besacier/ALFFA_PUBLIC | マサチューセッツ工科大学 |
コーパス | 言語 | # 時間 | # スピーカー | ダウンロード | ライセンス |
---|---|---|---|---|---|
M-AILABS ドイツ語コーパス | ドイツ語 | 237時間22分 | http://www.caito.de/data/Training/stt_tts/de_DE.tgz | M-AILABS LICENSE (データ固有の BSD 3 条項ライセンス) | |
M-AILABS クイーンズイングリッシュコーパス | クイーンズ・イングリッシュ | 45時間35分 | http://www.caito.de/data/Training/stt_tts/en_UK.tgz | M-AILABS LICENSE (データ固有の BSD 3 条項ライセンス) | |
M-AILABS 米国英語コーパス | アメリカ英語 | 102時間7分 | http://www.caito.de/data/Training/stt_tts/en_US.tgz | M-AILABS LICENSE (データ固有の BSD 3 条項ライセンス) | |
M-AILABS スペイン語コーパス | スペイン語 スペイン語 | 108時間34分 | http://www.caito.de/data/Training/stt_tts/es_ES.tgz | M-AILABS LICENSE (データ固有の BSD 3 条項ライセンス) | |
M-AILABS イタリア語コーパス | イタリア語 | 127時間40分 | http://www.caito.de/data/Training/stt_tts/it_IT.tgz | M-AILABS LICENSE (データ固有の BSD 3 条項ライセンス) | |
M-AILABS ウクライナ語コーパス | ウクライナ語 | 87時間8分 | http://www.caito.de/data/Training/stt_tts/uk_UK.tgz | M-AILABS LICENSE (データ固有の BSD 3 条項ライセンス) | |
M-AILABS ロシア語コーパス | ロシア | 46時間47分 | http://www.caito.de/data/Training/stt_tts/ru_RU.tgz | M-AILABS LICENSE (データ固有の BSD 3 条項ライセンス) | |
M-AILABS フランス語 v0.9 コーパス | フランス語 | 190時間30分 | http://www.caito.de/data/Training/stt_tts/fr_FR.tgz | M-AILABS LICENSE (データ固有の BSD 3 条項ライセンス) | |
M-AILABS ポーランド語コーパス | 研磨 | 53時間50分 | http://www.caito.de/data/Training/stt_tts/pl_PL.tgz | M-AILABS LICENSE (データ固有の BSD 3 条項ライセンス) |
コーパス | 言語 | # 時間 | # スピーカー | ダウンロード | ライセンス |
---|---|---|---|---|---|
流暢な音声コマンドコーパス | 英語 | 19 時間 (30,043 発話) | 97 人の講演者 | http://fluent.ai:2052/jf8398hf30f0381738rucj3828chfdnchs.tar.gz | 流暢なスピーチコマンドのパブリックライセンス |
CMU ウィルダネス | 700ラング | 音声やテキストなしで配信されたアライメントの合計: ~ 14,000 時間。言語あたり: ~20 時間 | https://github.com/festvox/datasets-CMU_Wilderness | https://live.bible.is/terms | |
CHiME-5 | 英語 | 50時間 | 48 スピーカー | http://spandh.dcs.shef.ac.uk/chime_challenge/data.html | CHiME-5ライセンス |
恐れを知らないステップのコーパス | 英語 | 19,000時間(転写20時間) | ~450 人のスピーカー | https://fearless-steps.github.io/ChallengePhase3/#19k_Corpus_Access | NASA メディア使用ガイドライン |
Microsoft 音声コーパス (インド言語) | テルグ語;タミル語;グジャラート語 | https://msropendata.com/datasets/7230b4b1-912d-400e-be58-f84e0512985e | Microsoft 音声コーパス (インド言語) ライセンス | ||
Microsoft 音声言語翻訳コーパス | 英語;中国人;日本語 | https://msropendata.com/datasets/54813518-4ea6-4c39-9bb2-b0d1e5f0c187 | Microsoft Research データ使用許諾契約 | ||
ちょっと抜粋コーパス | 英語 | 11,000 の肯定的な「Hey Snips」(約 4.4 時間)および 87,000 の否定的な発話(約 89 時間) | 2215 スピーカー (ポジティブおよびネガティブ) および 4028 スピーカー (ネガティブのみ) | https://research.snips.ai/datasets/keyword-spotting | スニップデータライセンス |
SLU コーパスの一部を切り取る | 英語;フランス語 | 「スマート ライト EN」1660 回(約 1.3 時間)、「スマート スピーカー EN」1286 回(約 55 分)、「スマート スピーカー FR」1138 回(約 50 分) | 英語: 69 人の話者。フランス語: 30 人のスピーカー | https://research.snips.ai/datasets/spoken-lang- Understanding | スニップデータライセンス |
CMU スフィンクス グループ - AN4 | 英語 | 「an4_clstk」(約50分) 「an4test_clstk」(約6分) | 「an4_clstk」:女性21名、男性53名 「an4test_clstk」:女性3名、男性7名 | http://www.speech.cs.cmu.edu/databases/an4/an4_raw.bigendian.tar.gz | AN4 |
FTスピーチ | デンマーク語 | ~1,857 時間 (1,017,244 発話) | 講演者 434 名 (女性 176 名、男性 258 名) | https://ftspeech.dk | FTスピーチライセンス |
ファラブラジル-LAPS-コンスティトゥイソン | ブラジル系ポルトガル語 | 9時間 | 1スピーカー | https://drive.google.com/uc?export=download&confirm=SrvW&id=1Nf849u-27CYRzJqedLaI-FaZfMRO7FT | 「Bases de áudio transcrito e Bases de texto Normalizadas (sem pontuação, com números escritos por extenso, etc.) disponibilizadas de forma gratuita* pelo Grupo FalaBrasil. [disponibilizadas de forma gratuita*] / Portanto, apenas as Bases livres estão sendoディスポニビリザダス。」 |
ファラブラジル-LaPSメール | ブラジル系ポルトガル語 | 1時間 | 25 スピーカー | https://drive.google.com/uc?export=download&confirm=PecV&id=1B_Vq8MDSE4fBQefVxqCGSl-EcKAcjJLb | 「Bases de áudio transcrito e Bases de texto Normalizadas (sem pontuação, com números escritos por extenso, etc.) disponibilizadas de forma gratuita* pelo Grupo FalaBrasil. [disponibilizadas de forma gratuita*] / Portanto, apenas as Bases livres estão sendoディスポニビリザダス。」 |
ファラブラジル-LaPS ベンチマーク | ブラジル系ポルトガル語 | 1時間 | 1スピーカー | https://drive.google.com/uc?export=download&confirm=XFfF&id=1nZ8L9nJTt4blFC0RGT9Y7XRu02aAvDIo | 「Bases de áudio transcrito e Bases de texto Normalizadas (sem pontuação, com números escritos por extenso, etc.) disponibilizadas de forma gratuita* pelo Grupo FalaBrasil. [disponibilizadas de forma gratuita*] / Portanto, apenas as Bases livres estão sendoディスポニビリザダス。」 |