تقدم ترجمة الكلام من النهاية إلى النهاية
درس تعليمي
- البرنامج التعليمي EACL 2021: ترجمة الكلام
- المدونة: البدء في ترجمة الكلام من البداية إلى النهاية
- ورقة موضوع ACL 2020: ترجمة الكلام والوعد الشامل: تقييم ما نحن فيه
- حديث استطلاع INTERSPEECH 2019: ترجمة اللغة المنطوقة
بيانات
جسد | اتجاه | هدف | مدة | رخصة |
---|
كوفوست 2 | {Fr، De، Es، Ca، It، Ru، Zh، Pt، Fa، Et، Mn، Nl، Tr، Ar، Sv، Lv، Sl، Ta، Ja، Id، Cy} -> En وEn -> {De، Ca، Zh، Fa، Et، Mn، Tr، Ar، Sv، Lv، Sl، Ta، Ja، Id، Cy} | نص | 2880 ساعة | CC0 |
CVSS | {Fr، De، Es، Ca، It، Ru، Zh، Pt، Fa، Et، Mn، Nl، Tr، Ar، Sv، Lv، Sl، Ta، Ja، Id، Cy} -> En | النص والكلام | 1900 ساعة | سي سي بي 4.0 |
mTEDx | {Es، Fr، Pt، It، Ru، El} -> En، {Fr، Pt، It} -> Es، Es -> {Fr، It}، {Es، Fr} -> حزب العمال | نص | 765 ساعة | CC BY-NC-ND 4.0 |
CoVoST | {Fr، De، Nl، Ru، Es، It، Tr، Fa، Sv، Mn، Zh} -> En | نص | 700 ساعة | CC0 |
يجب أن يكون C ويجب أن يكون سينما | En -> {De, Es, Fr, It, Nl, Pt, Ro, Ru, Ar, Cs, Fa, Tr, Vi, Zh} | نص | 504 ح | CC BY-NC-ND 4.0 |
كيف2 | أون -> حزب العمال | نص | 300 ساعة | يوتيوب وCC BY-SA 4.0 |
خطاب Libri المعزز | أون -> الأب | نص | 236 ساعة | سي سي بي 4.0 |
يوروبرل-ST | {En، Fr، De، Es، It، Pt، Pl، Ro، Nl} -> {En، Fr، De، Es، It، Pt، Pl، Ro، Nl} | نص | 280 ساعة | سي سي بي-نك 4.0 |
Kosp2e | كو -> أون | نص | 198 ساعة | سي سي مختلط |
فيشر + كولهوم | وفاق -> أون | نص | 160 ساعة + 20 ساعة | أقل البلدان نموا |
كتلة | بالتوازي بين En و Es و Eu و Fi و Fr و Hu و Ro و Ru | النص والكلام | 172 ساعة | الكتاب المقدس.is |
LibriVoxDeEn | دي -> أون | نص | 110 ساعة | CC BY-NC-SA 4.0 |
برابوبادافاني | بالتوازي بين En، Fr، De، Gu، Hi، Hu، Id، It، Lv، Lt، Ne، Fa، Pl، Pt، Ru، Sl، Sk، Es، Se، Ta، Te، Tr، Bg، Hr، دا و نل | نص | 94 ساعة | |
بي اس تي سي | ز -> أون | نص | 68 ساعة | |
LibriS2S | دي <-> أون | النص والكلام | 52 ساعة/57 ساعة | CC BY-NC-SA 4.0 |
مجموعة الأدوات
- ESPNet-ST
- فيرسيك S2T
- نيورست
ورق
2023
- [arXiv] ضبط نموذج اللغة الكبيرة لترجمة الكلام من طرف إلى طرف
- [arXiv] تحسين ترجمة الكلام عن طريق التعلم التقابلي متعدد الوسائط
- [arXiv] ترجمة الكلام إلى كلام متعدد اللغات إلى لغات مستهدفة متعددة
- [ICCV] MixSpeech: التعلم الذاتي متعدد الأساليب مع مزيج من البث الصوتي والمرئي لترجمة الكلام المرئي والتعرف عليه
- [INTERSPEECH] MuAViC: مجموعة سمعية ومرئية متعددة اللغات للتعرف القوي على الكلام وترجمة قوية لتحويل الكلام إلى نص
- [INTERSPEECH] ترجمة معيارية لتحويل الكلام إلى نص من أجل النقل عبر الوسائط بدون لقطة
- [INTERSPEECH] ترجمة الكلام المشترك والتعرف على الكيان المسمى
- [INTERSPEECH] StyleS2ST: نقل نمط بدون لقطة للترجمة المباشرة من كلام إلى كلام
- [الحوار] تقطير المعرفة في مهمة مشتركة لترجمة الكلام من البداية إلى النهاية
- [INTERSPEECH] GigaST: مجموعة ترجمة كلام زائف مدتها 10000 ساعة
- [INTERSPEECH] الاتصال البيني: اتصال فعال بين جهاز التشفير وجهاز فك التشفير المدربين مسبقًا لترجمة الكلام
- [INTERSPEECH] AlignAtt: استخدام توافقات الترجمة الصوتية المبنية على الانتباه كدليل لترجمة الكلام المتزامنة
- [INTERSPEECH] البحث عن شعاع كتلة الاتجاه المتزايد لترجمة الكلام المتزامنة مع مقايضة زمن الوصول والجودة التي يمكن التحكم فيها
- [INTERSPEECH] HK-LegiCoST: الاستفادة من النصوص غير الحرفية لترجمة الكلام
- [INTERSPEECH] تعلم متى تتحدث: مقايضات زمن الوصول والجودة للترجمة المتزامنة من كلام إلى كلام باستخدام النماذج غير المتصلة بالإنترنت
- [ICML] التدريب المسبق على ترجمة الكلام: CTC تلبي النقل الأمثل
- [ACL] UnitY: ترجمة مباشرة لتحويل الكلام إلى كلام بممرين مع وحدات منفصلة
- [ACL] ترجمة كلامية بسيطة وفعالة وغير خاضعة للرقابة
- [ACL] BLASER: مقياس تقييم ترجمة تحويل الكلام إلى كلام بدون نص
- [ACL] SpeechMatrix: مجموعة واسعة النطاق من ترجمات تحويل الكلام إلى كلام متعددة اللغات
- [ACL] فهم وسد الفجوة في طريقة ترجمة الكلام
- [ACL] الترجمة الخلفية لترجمة الكلام إلى نص بدون نصوص
- [ACL] AV-TranSpeech: ترجمة قوية لتحويل الكلام إلى كلام صوتي ومرئي
- [ACL] WACO: التعلم المتباين بمحاذاة الكلمات لترجمة الكلام
- [ACL] الانتباه كدليل لترجمة الكلام المتزامنة
- [نتائج ACL] ترجمة تحويل الكلام إلى كلام للغة غير مكتوبة في العالم الحقيقي
- [نتائج ACL] CKDST: استخلاص المعرفة بشكل شامل وفعال من الترجمة الآلية إلى ترجمة الكلام الشاملة
- [نتائج ACL] تعمل نماذج الانتشار المزدوج على تحسين ترجمة الكلام إلى كلام
- [نتائج ACL] DUB: الترجمة الخلفية للوحدة المنفصلة لترجمة الكلام
- [نتائج ACL] ترجمة الكلام المتزامنة من طرف إلى طرف مع تجزئة قابلة للتمييز
- [نتائج ACL] محول الذاكرة الضمني لترجمة الكلام المتزامنة ذات الكفاءة الحسابية
- [نتائج ACL] نسخ وترجمة الكلام المشترك: وضع العلامات الزائفة مع البيانات خارج التوزيع
- [ICASSP] ترجمة كلام إلى كلام مباشرة بدون نص مع تمثيل منفصل للكلام
- [ICASSP] M3ST: المزج على ثلاثة مستويات لترجمة الكلام
- [نتائج EACL] إنشاء خطاب اصطناعي من SpokenVocab لترجمة الكلام
- [AAAI] تحسين ترجمة الكلام من طرف إلى طرف من خلال الاستفادة من الكلام المساعد والبيانات النصية
2022
- [arXiv] AdaTranS: التكيف مع التقليص القائم على الحدود لترجمة الكلام من طرف إلى طرف
- [arXiv] ترجمة مباشرة من كلام إلى كلام بدون تعليق توضيحي نصي باستخدام ميزات عنق الزجاجة
- [arXiv] ArzEn-ST: مجموعة ترجمة الكلام ثلاثية الاتجاهات للغة المصرية العربية - الإنجليزية
- [arXiv] ترجمة الكلام المتزامن متعدد اللغات
- [arXiv] Prabhupadavani: بيانات ترجمة الكلام المختلط بالشفرات لـ 25 لغة
- [نتائج EMNLP] هل تحتاج الترجمة الفورية للكلام إلى نماذج فورية؟
- [نتائج EMNLP] RedApt: محول لتشفير WAV2VEC 2 لترجمة الكلام بشكل أسرع وأصغر دون التنازل عن الجودة
- [INTERSPEECH] محول البث المباشر لفهم اللغة المنطوقة وترجمة الكلام المتزامنة
- [INTERSPEECH] الجمع بين الميزات الطيفية والإشراف الذاتي من أجل التعرف على الكلام منخفض الموارد وترجمته
- [INTERSPEECH] ترجمة الكلام على نطاق واسع من طرف إلى طرف باستخدام محولات الطاقة العصبية
- [INTERSPEECH] تحسين تجزئة الكلام باستخدام مجموعة الكلام المجزأة ثنائية اللغة لترجمة الكلام من طرف إلى طرف
- [INTERSPEECH] الاستفادة من البيانات غير الخاضعة للإشراف وضعيفة الإشراف لتحسين الترجمة المباشرة من الكلام إلى كلام
- [INTERSPEECH] SHAS: الاقتراب من التقسيم الأمثل لترجمة الكلام من طرف إلى طرف
- [INTERSPEECH] استكشاف التكامل المستمر والنار من أجل ترجمة الكلام المتزامنة التكيفية
- [INTERSPEECH] M-Adapter: تكييف الطريقة للترجمة الشاملة من الكلام إلى النص
- [NAACL] ترجمة الكلام إلى كلام بدون نص على البيانات الحقيقية
- [ICML] إعادة النظر في الترجمة الشاملة من الكلام إلى النص من البداية
- [ICML] Translatotron 2: ترجمة قوية ومباشرة لتحويل الكلام إلى كلام
- [ACL] تعلم متى تترجم الكلام المتدفق
- [ACL] نموذج وترجمة وإعادة تجميع: الاستفادة من محاذاة الصوت لزيادة البيانات في ترجمة الكلام من طرف إلى طرف
- [ACL] UniST: نموذج موحد شامل لترجمة الكلام المتدفقة وغير المتدفقة
- [ACL] ترجمة مباشرة من الكلام إلى كلام مع وحدات منفصلة
- [ACL] STEMM: التعلم الذاتي من خلال المزج بين النص والكلام لترجمة الكلام
- [نتائج ACL] ترجمة الكلام من طرف إلى طرف للكلام المحوّل بالرمز
- [LREC] مجموعة CVSS والترجمة واسعة النطاق لتحويل الكلام إلى كلام متعددة اللغات
- [LREC] LibriS2S: مجموعة ترجمة من الكلام إلى الكلام من الألمانية إلى الإنجليزية
- [ICASSP] معالجة ندرة البيانات في ترجمة الكلام باستخدام تقنيات الترجمة الآلية متعددة اللغات
- [NN] تحسين زيادة البيانات لترجمة الكلام إلى النص ذات الموارد المنخفضة مع إعادة صياغة متنوعة
- [AAAI] تنظيم ترجمة الكلام من البداية إلى النهاية من خلال اتفاقية التحلل الثلاثي
2021
- [arXiv] محول فعال لترجمة الكلام المباشر
- [arXiv] ترجمة الكلام بدون لقطة
- [arXiv] الترجمة المباشرة والمتزامنة لتحويل الكلام إلى كلام مع الاهتمام المتغير الرتيب متعدد الرؤوس
- [ASRU] Fast-MD: ترجمة سريعة للكلام من طرف إلى طرف مع وحدة فك ترميز متعددة باستخدام وسائط مخفية غير انحدارية
- [ASRU] تقييم مقاييس التقييم لترجمة الكلام إلى كلام
- [ASRU] تمكين ترجمة اللغات المنطوقة متعددة اللغات بتقنية Zero-shot باستخدام برامج التشفير وأجهزة فك التشفير الخاصة باللغة
- [ICNLSP] ما وراء اكتشاف النشاط الصوتي: تجزئة الصوت الهجين لترجمة الكلام المباشر
- [INTERSPEECH] تأثير استراتيجيات التشفير والتجزئة على ترجمة الكلام المتزامنة من طرف إلى طرف
- [EMNLP] Speechformer: الحد من فقدان المعلومات في ترجمة الكلام المباشر
- [EMNLP] هل "موبي ديك" حوت أم طائر؟ الكيانات والمصطلحات المسماة في ترجمة الكلام
- [EMNLP] التعلم المتبادل يحسن ترجمة الكلام من البداية إلى النهاية
- [الحوار] ترجمة الكلام من طرف إلى طرف عبر التدريب التقدمي متعدد الوسائط
- [INTERSPEECH] CoVoST 2 وترجمة الكلام إلى النص متعددة اللغات على نطاق واسع
- [interspeech] مجموعة TEDx المتعددة اللغات للتعرف على الكلام والترجمة
- [الحوار] التعلم الذاتي وشبه الخاضع للإشراف على نطاق واسع لترجمة الكلام
- [الحوار] Kosp2e: الخطاب الكوري إلى مجموعة الترجمة الإنجليزية
- [INTERSPEECH] AlloST: ترجمة الكلام منخفضة الموارد دون نسخ المصدر
- [INTERSPEECH] SpecRec: حل بديل لتحسين ترجمة الكلام إلى النص من طرف إلى طرف عبر إعادة بناء Spectrogram
- [الحوار] يعمل ترميز التحيزات الاستقرائية على النحو الأمثل في المحول على تحسين ترجمة الكلام من طرف إلى طرف
- [INTERSPEECH] فقدان ASR الخلفي لترجمة الكلام الشامل متعدد المهام
- [AMTA] ترجمة الكلام المتزامنة للترجمة المباشرة: من التأخير إلى العرض
- [ACL] التشفير الصوتي والنصي المكدس: دمج النماذج المدربة مسبقًا في برامج تشفير ترجمة الكلام
- [ACL] ترجمة الكلام متعدد اللغات مع الضبط الفعال للنماذج المدربة مسبقًا
- [ACL] ضبط محول خفيف الوزن لترجمة الكلام متعدد اللغات
- [ACL] الترجمة المتتالية مقابل ترجمة الكلام المباشر: هل لا تزال الاختلافات تحدث فرقًا؟
- [ACL] تحسين ترجمة الكلام من خلال الفهم والتعلم من مهمة ترجمة النص المساعد
- [ACL] ترجمة الكلام من البداية إلى النهاية على مستوى الجملة: يساعد السياق
- [نتائج ACL] ترجمة مباشرة ومتزامنة لتحويل الكلام إلى نص بمساعدة الدفق المتزامن ASR
- [نتائج ACL] AdaST: التكيف الديناميكي لحالات التشفير في وحدة فك التشفير للترجمة الشاملة من الكلام إلى النص
- [نتائج ACL] RealTranS: ترجمة الكلام المتزامنة من طرف إلى طرف مع محول تلافيفي مرجح الانكماش
- [نتائج ACL] تعلم المساحة الدلالية المشتركة لترجمة الكلام إلى النص
- [نتائج ACL] التحقيق في القدرة على إعادة الترتيب في ترجمة الكلام من طرف إلى طرف غير الانحداري القائم على CTC
- [نتائج ACL] كيفية التقسيم: تأثير تجزئة الكلمات على التحيز الجنسي في ترجمة الكلام
- [عرض ACL] NeurST: مجموعة أدوات ترجمة الكلام العصبي
- [ICML] دمج التشفير الصوتي والنصي للتدريب المسبق متعدد اللغات وترجمة الكلام
- [NAACL] المصدر والهدف لتقطير المعرفة ثنائي الاتجاه لترجمة الكلام من طرف إلى طرف
- [NAACL] الوسائط المخفية القابلة للبحث للنماذج الشاملة لمهام التسلسل القابلة للتحلل
- [NAACL AutoSimTrans] BSTC: مجموعة بيانات واسعة النطاق لترجمة الكلام الصينية-الإنجليزية
- [AmericasNLP] مجموعة ترجمة الكلام باللغة الإسبانية من Highland Puebla Nahuatl لتوثيق اللغات المهددة بالانقراض
- [ICASSP] التعلم متعدد المهام مع إدراك المهام لمهام تحويل الكلام إلى نص
- [ICASSP] إطار تعليمي عام متعدد المهام للاستفادة من البيانات النصية في تحويل الكلام إلى مهام نصية
- [ICASSP] دراسة تجريبية لاستراتيجيات فك تشفير ترجمة الكلام المتزامنة من طرف إلى طرف
- [ICASSP] بث ترجمة الكلام المتزامن باستخدام محول الذاكرة المعزز
- [ICASSP] Orthros: ترجمة غير رجعية للكلام من طرف إلى طرف باستخدام وحدة فك ترميز مزدوجة
- [ICASSP] النماذج المتتالية ذات التغذية الراجعة الدورية لترجمة الكلام المباشر
- [ICASSP] نماذج المحولات المدربة بشكل مشترك لترجمة اللغة المنطوقة
- [ICASSP] الاستخدام الفعال للبيانات الشاملة في معالجة اللغة المنطوقة
- [EACL] الضغط المستند إلى CTC لترجمة الكلام المباشر
- [EACL] نماذج التدفق للتعرف على الكلام المشترك وترجمته
- [IberSPEECH] mintzai-ST: النص والخطوط الأساسية لترجمة الكلام الباسكي-الإسباني
- [AAAI] فك التشفير المتتالي لترجمة الكلام إلى نص
- [AAAI] UWSpeech: ترجمة الكلام إلى كلام للغات غير المكتوبة
- [AAAI] "استمع وافهم وترجم": الإشراف الثلاثي يفصل بين الترجمة من الكلام إلى النص من طرف إلى طرف
- [SLT] تدريب شامل ومحكم لترجمة الكلام المتتالية
- [SLT] ترجمة مباشرة من كلام إلى كلام قائمة على المحولات باستخدام محول الترميز
2020
- [arXiv] سد الفجوة في طرق ترجمة الكلام إلى النص
- [arXiv] CSTNet: شبكة ترجمة الكلام المتباينة لتعلم تمثيل الكلام الخاضع للإشراف الذاتي
- [CLiC-IT] حول تقطير المعرفة لترجمة الكلام المباشر
- [COLING] محول فك التشفير المزدوج للتعرف التلقائي على الكلام المشترك وترجمة الكلام متعدد اللغات
- [COLING] تربية أنظمة ترجمة الكلام المباشر المراعية للنوع الاجتماعي
- [AACL] SimulMT إلى SimulST: تكييف ترجمة النصوص المتزامنة مع ترجمة الكلام المتزامنة من النهاية إلى النهاية
- [عرض AACL] fairseq S2T: النمذجة السريعة لتحويل الكلام إلى نص باستخدام fairseq
- [EMNLP] التدريب المسبق الفعال على وحدة فك ترميز ترجمة الكلام باستخدام بيانات الترجمة الآلية
- [نتائج EMNLP] اختيار الميزات التكيفية لترجمة الكلام من البداية إلى النهاية
- [AMTA] حول التقسيم المستهدف لترجمة الكلام المباشر
- [الحوار] التعرف على الكلام من تسلسل إلى تسلسل منخفض الكمون وترجمته عن طريق تحديد الفرضية الجزئية
- [INTERSPEECH] التشفير الموضعي النسبي للتعرف على الكلام والترجمة المباشرة
- [interspeech] الترجمة السياقية للكلام المجزأ تلقائيًا
- [الحوار] التدريب الذاتي على ترجمة الكلام من البداية إلى النهاية
- [INTERSPEECH] تحسين تعلم النقل عبر اللغات للتعرف على الكلام من طرف إلى طرف من خلال ترجمة الكلام
- [interspeech] تعمل التمثيلات الخاضعة للإشراف الذاتي على تحسين ترجمة الكلام من البداية إلى النهاية
- [INTERSPEECH] التحقيق في التدريب المسبق الخاضع للإشراف الذاتي لترجمة الكلام من البداية إلى النهاية
- [TACL] النسخ والترجمة المتسقة للكلام
- [ACL] أسوأ من WER، ولكن أفضل من BLEU؟ الاستفادة من تضمين الكلمات كوسيط في ترجمة الكلام الشاملة للمهام المتعددة
- [ACL] تعمل ميزات الهاتف على تحسين ترجمة الكلام
- [ACL] التدريب المسبق للمناهج الدراسية لترجمة الكلام من البداية إلى النهاية
- [ACL] SimulSpeech: تحويل الكلام المتزامن إلى النص من طرف إلى طرف
- [ACL] الجنس في خطر؟ تقييم تكنولوجيا ترجمة الكلام في مجموعة MuST-SHE
- [موضوع ACL] ترجمة الكلام والوعد الشامل: تقييم ما نحن فيه
- [عرض ACL] ESPnet-ST: مجموعة أدوات ترجمة الكلام الكل في واحد
- [LREC] CoVoST: مجموعة متنوعة من خدمات تحويل الكلام إلى نص متعددة اللغات
- [LREC] MuST-Cinema: مجموعة تحويل الكلام إلى ترجمة
- [LREC] MaSS: مجموعة كبيرة ونظيفة ومتعددة اللغات من الأقوال المنطوقة المتوافقة مع الجمل المستخرجة من الكتاب المقدس
- [LREC] LibriVoxDeEn: مجموعة متكاملة لترجمة الكلام من الألمانية إلى الإنجليزية والتعرف على الكلام
- [ICASSP] Europarl-ST: مجموعة متعددة اللغات لترجمة الكلام للمناقشات البرلمانية
- [ICASSP] التكيف النموذجي القائم على المثيل لترجمة الكلام المباشر
- [ICASSP] ترجمة مباشرة فعالة لتحويل الكلام إلى نص باستخدام أسلوب التعلم التلوي الحيادي
- [ICASSP] تحليل التدريب المسبق على ASR لترجمة الكلام إلى النص منخفضة الموارد
- [ICASSP] ترجمة الكلام من البداية إلى النهاية مع معالجة المفردات المستقلة
- [AAAI] سد الفجوة بين التدريب المسبق والضبط الدقيق لترجمة الكلام الشاملة
- [AAAI] التعرف المتزامن على الكلام وترجمة الكلام إلى نص مع فك التشفير التفاعلي
2019
- [ASRU] ترجمة الكلام من طرف إلى طرف متعدد اللغات
- [ASRU] ترجمة الكلام متعددة اللغات من البداية إلى النهاية
- [ASRU] ترجمة الكلام إلى كلام بين اللغات غير المعروفة غير المكتوبة
- [ASRU] دراسة مقارنة حول ترجمة الكلام من طرف إلى طرف إلى نص
- [IWSLT] تسخير بيانات التدريب غير المباشرة للترجمة التلقائية للكلام من البداية إلى النهاية: حيل التجارة
- [IWSLT] حول استخدام SpecAugment لترجمة الكلام من طرف إلى طرف
- [الحوار] ترجمة الكلام من طرف إلى طرف مع تقطير المعرفة
- [الحوار] تكييف المحول لترجمة اللغة المنطوقة من البداية إلى النهاية
- [INTERSPEECH] ترجمة مباشرة من الكلام إلى كلام باستخدام نموذج تسلسل إلى تسلسل
- [ACL] استكشاف تمثيلات الكلام على مستوى الصوت لترجمة الكلام من البداية إلى النهاية
- [ACL] نماذج تمرير الانتباه لترجمة الكلام من طرف إلى طرف قوية وفعالة من حيث البيانات
- [NAACL] التدريب المسبق على التعرف على الكلام عالي الموارد يحسن ترجمة الكلام إلى نص منخفض الموارد
- [NAACL] MuST-C: مجموعة ترجمة الكلام متعدد اللغات
- [NAACL] الترجمات السلسة من الكلام غير السلس في ترجمة الكلام من النهاية إلى النهاية
- [ICASSP] الاستفادة من البيانات الخاضعة للإشراف الضعيف لتحسين الترجمة الشاملة من الكلام إلى النص
- [ICASSP] نحو ترجمة الكلام إلى النص غير الخاضعة للرقابة
- [ICASSP] نحو ترجمة الكلام إلى النص من طرف إلى طرف مع فك التشفير ثنائي المسار
2018
- [NIPS] How2: مجموعة بيانات واسعة النطاق لفهم اللغات المتعددة الوسائط
- [IberSPEECH] ترجمة الكلام من طرف إلى طرف باستخدام المحول
- [الحوار] ترجمة الكلام إلى النص منخفضة الموارد
- [LREC] تعزيز الخطاب المكتبي بالترجمات الفرنسية: مجموعة متعددة الوسائط لتقييم ترجمة الكلام المباشر
- [NAACL] التعلم المترابط متعدد المهام لترجمة الكلام العصبي
- [ICASSP] ترجمة الكلام التلقائي الشاملة للكتب الصوتية
2017
- [INTERSPEECH] يمكن لنماذج التسلسل إلى التسلسل ترجمة الكلام الأجنبي مباشرة
- [INTERSPEECH] منهج دراسي منظم لترجمة الكلام من الإنجليزية إلى اليابانية بشكل شامل
- [EACL] نحو ترجمة الكلام إلى نص دون التعرف على الكلام
2016
- [ورشة عمل NIPS] الاستماع والترجمة: إثبات لمفهوم الترجمة الشاملة من الكلام إلى النص
- [NAACL] نموذج متعمد لترجمة الكلام بدون النسخ
2013
- [IWSLT] ترجمة محسنة لتحويل الكلام إلى نص باستخدام مجموعة ترجمة الكلام الإسبانية-الإنجليزية من Fisher وCallhome
اتصال
تشانغهان وانغ ([email protected])