SpeechTransProgress
1.0.0
Corpus | Direction | Cible | Durée | Licence |
---|---|---|---|---|
CoVoST2 | {Fr, De, Es, Ca, It, Ru, Zh, Pt, Fa, Et, Mn, Nl, Tr, Ar, Sv, Lv, Sl, Ta, Ja, Id, Cy} -> En et En -> {De, Ca, Zh, Fa, Et, Mn, Tr, Ar, Sv, Lv, Sl, Ta, Ja, Id, Cy} | Texte | 2880h | CC0 |
CVSS | {Fr, De, Es, Ca, It, Ru, Zh, Pt, Fa, Et, Mn, Nl, Tr, Ar, Sv, Lv, Sl, Ta, Ja, Id, Cy} -> En | Texte et discours | 1900h | CC PAR 4.0 |
mTEDx | {Es, Fr, Pt, It, Ru, El} -> En, {Fr, Pt, It} -> Es, Es -> {Fr, It}, {Es,Fr} -> Pt | Texte | 765h | CC BY-NC-ND 4.0 |
CoVoST | {Fr, De, Nl, Ru, Es, It, Tr, Fa, Sv, Mn, Zh} -> En | Texte | 700h | CC0 |
MUST-C & MUST-Cinéma | En -> {De, Es, Fr, It, Nl, Pt, Ro, Ru, Ar, Cs, Fa, Tr, Vi, Zh} | Texte | 504h | CC BY-NC-ND 4.0 |
Comment2 | Fr -> Pt | Texte | 300h | Youtube et CC BY-SA 4.0 |
LibriSpeech augmenté | En -> Fr | Texte | 236h | CC PAR 4.0 |
Europarl-ST | {En, Fr, De, Es, It, Pt, Pl, Ro, Nl} -> {En, Fr, De, Es, It, Pt, Pl, Ro, Nl} | Texte | 280h | CC BY-NC 4.0 |
Kosp2e | Ko -> Fr | Texte | 198h | CC mixte |
Fisher + Callhome | Es -> Fr | Texte | 160h+20h | PMA |
Masse | parallèle entre En, Es, Eu, Fi, Fr, Hu, Ro et Ru | Texte et discours | 172h | Bible.is |
LibriVoxDeFr | De -> Fr | Texte | 110h | CC BY-NC-SA 4.0 |
Prabhupadavani | parallèle parmi En, Fr, De, Gu, Hi, Hu, Id, It, Lv, Lt, Ne, Fa, Pl, Pt, Ru, Sl, Sk, Es, Se, Ta, Te, Tr, Bg, Hr, Da et Nl | Texte | 94h | |
BSTC | Zh -> Fr | Texte | 68h | |
LibriS2S | De <-> Fr | Texte et discours | 52h/57h | CC BY-NC-SA 4.0 |
Changhan Wang ([email protected])