SpeechTransProgress تنزيل - تنزيل كود المصدر SpeechTransProgress

SpeechTransProgress

كود الذكاء الاصطناعي

1.0.0

تنزيل

تقدم ترجمة الكلام من النهاية إلى النهاية

درس تعليمي

البرنامج التعليمي EACL 2021: ترجمة الكلام
المدونة: البدء في ترجمة الكلام من البداية إلى النهاية
ورقة موضوع ACL 2020: ترجمة الكلام والوعد الشامل: تقييم ما نحن فيه
حديث استطلاع INTERSPEECH 2019: ترجمة اللغة المنطوقة

بيانات

جسد	اتجاه	هدف	مدة	رخصة
كوفوست 2	{Fr، De، Es، Ca، It، Ru، Zh، Pt، Fa، Et، Mn، Nl، Tr، Ar، Sv، Lv، Sl، Ta، Ja، Id، Cy} -> En وEn -> {De، Ca، Zh، Fa، Et، Mn، Tr، Ar، Sv، Lv، Sl، Ta، Ja، Id، Cy}	نص	2880 ساعة	CC0
CVSS	{Fr، De، Es، Ca، It، Ru، Zh، Pt، Fa، Et، Mn، Nl، Tr، Ar، Sv، Lv، Sl، Ta، Ja، Id، Cy} -> En	النص والكلام	1900 ساعة	سي سي بي 4.0
mTEDx	{Es، Fr، Pt، It، Ru، El} -> En، {Fr، Pt، It} -> Es، Es -> {Fr، It}، {Es، Fr} -> حزب العمال	نص	765 ساعة	CC BY-NC-ND 4.0
CoVoST	{Fr، De، Nl، Ru، Es، It، Tr، Fa، Sv، Mn، Zh} -> En	نص	700 ساعة	CC0
يجب أن يكون C ويجب أن يكون سينما	En -> {De, Es, Fr, It, Nl, Pt, Ro, Ru, Ar, Cs, Fa, Tr, Vi, Zh}	نص	504 ح	CC BY-NC-ND 4.0
كيف2	أون -> حزب العمال	نص	300 ساعة	يوتيوب وCC BY-SA 4.0
خطاب Libri المعزز	أون -> الأب	نص	236 ساعة	سي سي بي 4.0
يوروبرل-ST	{En، Fr، De، Es، It، Pt، Pl، Ro، Nl} -> {En، Fr، De، Es، It، Pt، Pl، Ro، Nl}	نص	280 ساعة	سي سي بي-نك 4.0
Kosp2e	كو -> أون	نص	198 ساعة	سي سي مختلط
فيشر + كولهوم	وفاق -> أون	نص	160 ساعة + 20 ساعة	أقل البلدان نموا
كتلة	بالتوازي بين En و Es و Eu و Fi و Fr و Hu و Ro و Ru	النص والكلام	172 ساعة	الكتاب المقدس.is
LibriVoxDeEn	دي -> أون	نص	110 ساعة	CC BY-NC-SA 4.0
برابوبادافاني	بالتوازي بين En، Fr، De، Gu، Hi، Hu، Id، It، Lv، Lt، Ne، Fa، Pl، Pt، Ru، Sl، Sk، Es، Se، Ta، Te، Tr، Bg، Hr، دا و نل	نص	94 ساعة
بي اس تي سي	ز -> أون	نص	68 ساعة
LibriS2S	دي <-> أون	النص والكلام	52 ساعة/57 ساعة	CC BY-NC-SA 4.0

مجموعة الأدوات

ESPNet-ST
فيرسيك S2T
نيورست

ورق

2023

[arXiv] ضبط نموذج اللغة الكبيرة لترجمة الكلام من طرف إلى طرف
[arXiv] تحسين ترجمة الكلام عن طريق التعلم التقابلي متعدد الوسائط
[arXiv] ترجمة الكلام إلى كلام متعدد اللغات إلى لغات مستهدفة متعددة
[ICCV] MixSpeech: التعلم الذاتي متعدد الأساليب مع مزيج من البث الصوتي والمرئي لترجمة الكلام المرئي والتعرف عليه
[INTERSPEECH] MuAViC: مجموعة سمعية ومرئية متعددة اللغات للتعرف القوي على الكلام وترجمة قوية لتحويل الكلام إلى نص
[INTERSPEECH] ترجمة معيارية لتحويل الكلام إلى نص من أجل النقل عبر الوسائط بدون لقطة
[INTERSPEECH] ترجمة الكلام المشترك والتعرف على الكيان المسمى
[INTERSPEECH] StyleS2ST: نقل نمط بدون لقطة للترجمة المباشرة من كلام إلى كلام
[الحوار] تقطير المعرفة في مهمة مشتركة لترجمة الكلام من البداية إلى النهاية
[INTERSPEECH] GigaST: مجموعة ترجمة كلام زائف مدتها 10000 ساعة
[INTERSPEECH] الاتصال البيني: اتصال فعال بين جهاز التشفير وجهاز فك التشفير المدربين مسبقًا لترجمة الكلام
[INTERSPEECH] AlignAtt: استخدام توافقات الترجمة الصوتية المبنية على الانتباه كدليل لترجمة الكلام المتزامنة
[INTERSPEECH] البحث عن شعاع كتلة الاتجاه المتزايد لترجمة الكلام المتزامنة مع مقايضة زمن الوصول والجودة التي يمكن التحكم فيها
[INTERSPEECH] HK-LegiCoST: الاستفادة من النصوص غير الحرفية لترجمة الكلام
[INTERSPEECH] تعلم متى تتحدث: مقايضات زمن الوصول والجودة للترجمة المتزامنة من كلام إلى كلام باستخدام النماذج غير المتصلة بالإنترنت
[ICML] التدريب المسبق على ترجمة الكلام: CTC تلبي النقل الأمثل
[ACL] UnitY: ترجمة مباشرة لتحويل الكلام إلى كلام بممرين مع وحدات منفصلة
[ACL] ترجمة كلامية بسيطة وفعالة وغير خاضعة للرقابة
[ACL] BLASER: مقياس تقييم ترجمة تحويل الكلام إلى كلام بدون نص
[ACL] SpeechMatrix: مجموعة واسعة النطاق من ترجمات تحويل الكلام إلى كلام متعددة اللغات
[ACL] فهم وسد الفجوة في طريقة ترجمة الكلام
[ACL] الترجمة الخلفية لترجمة الكلام إلى نص بدون نصوص
[ACL] AV-TranSpeech: ترجمة قوية لتحويل الكلام إلى كلام صوتي ومرئي
[ACL] WACO: التعلم المتباين بمحاذاة الكلمات لترجمة الكلام
[ACL] الانتباه كدليل لترجمة الكلام المتزامنة
[نتائج ACL] ترجمة تحويل الكلام إلى كلام للغة غير مكتوبة في العالم الحقيقي
[نتائج ACL] CKDST: استخلاص المعرفة بشكل شامل وفعال من الترجمة الآلية إلى ترجمة الكلام الشاملة
[نتائج ACL] تعمل نماذج الانتشار المزدوج على تحسين ترجمة الكلام إلى كلام
[نتائج ACL] DUB: الترجمة الخلفية للوحدة المنفصلة لترجمة الكلام
[نتائج ACL] ترجمة الكلام المتزامنة من طرف إلى طرف مع تجزئة قابلة للتمييز
[نتائج ACL] محول الذاكرة الضمني لترجمة الكلام المتزامنة ذات الكفاءة الحسابية
[نتائج ACL] نسخ وترجمة الكلام المشترك: وضع العلامات الزائفة مع البيانات خارج التوزيع
[ICASSP] ترجمة كلام إلى كلام مباشرة بدون نص مع تمثيل منفصل للكلام
[ICASSP] M3ST: المزج على ثلاثة مستويات لترجمة الكلام
[نتائج EACL] إنشاء خطاب اصطناعي من SpokenVocab لترجمة الكلام
[AAAI] تحسين ترجمة الكلام من طرف إلى طرف من خلال الاستفادة من الكلام المساعد والبيانات النصية

2022

[arXiv] AdaTranS: التكيف مع التقليص القائم على الحدود لترجمة الكلام من طرف إلى طرف
[arXiv] ترجمة مباشرة من كلام إلى كلام بدون تعليق توضيحي نصي باستخدام ميزات عنق الزجاجة
[arXiv] ArzEn-ST: مجموعة ترجمة الكلام ثلاثية الاتجاهات للغة المصرية العربية - الإنجليزية
[arXiv] ترجمة الكلام المتزامن متعدد اللغات
[arXiv] Prabhupadavani: بيانات ترجمة الكلام المختلط بالشفرات لـ 25 لغة
[نتائج EMNLP] هل تحتاج الترجمة الفورية للكلام إلى نماذج فورية؟
[نتائج EMNLP] RedApt: محول لتشفير WAV2VEC 2 لترجمة الكلام بشكل أسرع وأصغر دون التنازل عن الجودة
[INTERSPEECH] محول البث المباشر لفهم اللغة المنطوقة وترجمة الكلام المتزامنة
[INTERSPEECH] الجمع بين الميزات الطيفية والإشراف الذاتي من أجل التعرف على الكلام منخفض الموارد وترجمته
[INTERSPEECH] ترجمة الكلام على نطاق واسع من طرف إلى طرف باستخدام محولات الطاقة العصبية
[INTERSPEECH] تحسين تجزئة الكلام باستخدام مجموعة الكلام المجزأة ثنائية اللغة لترجمة الكلام من طرف إلى طرف
[INTERSPEECH] الاستفادة من البيانات غير الخاضعة للإشراف وضعيفة الإشراف لتحسين الترجمة المباشرة من الكلام إلى كلام
[INTERSPEECH] SHAS: الاقتراب من التقسيم الأمثل لترجمة الكلام من طرف إلى طرف
[INTERSPEECH] استكشاف التكامل المستمر والنار من أجل ترجمة الكلام المتزامنة التكيفية
[INTERSPEECH] M-Adapter: تكييف الطريقة للترجمة الشاملة من الكلام إلى النص
[NAACL] ترجمة الكلام إلى كلام بدون نص على البيانات الحقيقية
[ICML] إعادة النظر في الترجمة الشاملة من الكلام إلى النص من البداية
[ICML] Translatotron 2: ترجمة قوية ومباشرة لتحويل الكلام إلى كلام
[ACL] تعلم متى تترجم الكلام المتدفق
[ACL] نموذج وترجمة وإعادة تجميع: الاستفادة من محاذاة الصوت لزيادة البيانات في ترجمة الكلام من طرف إلى طرف
[ACL] UniST: نموذج موحد شامل لترجمة الكلام المتدفقة وغير المتدفقة
[ACL] ترجمة مباشرة من الكلام إلى كلام مع وحدات منفصلة
[ACL] STEMM: التعلم الذاتي من خلال المزج بين النص والكلام لترجمة الكلام
[نتائج ACL] ترجمة الكلام من طرف إلى طرف للكلام المحوّل بالرمز
[LREC] مجموعة CVSS والترجمة واسعة النطاق لتحويل الكلام إلى كلام متعددة اللغات
[LREC] LibriS2S: مجموعة ترجمة من الكلام إلى الكلام من الألمانية إلى الإنجليزية
[ICASSP] معالجة ندرة البيانات في ترجمة الكلام باستخدام تقنيات الترجمة الآلية متعددة اللغات
[NN] تحسين زيادة البيانات لترجمة الكلام إلى النص ذات الموارد المنخفضة مع إعادة صياغة متنوعة
[AAAI] تنظيم ترجمة الكلام من البداية إلى النهاية من خلال اتفاقية التحلل الثلاثي

2021

[arXiv] محول فعال لترجمة الكلام المباشر
[arXiv] ترجمة الكلام بدون لقطة
[arXiv] الترجمة المباشرة والمتزامنة لتحويل الكلام إلى كلام مع الاهتمام المتغير الرتيب متعدد الرؤوس
[ASRU] Fast-MD: ترجمة سريعة للكلام من طرف إلى طرف مع وحدة فك ترميز متعددة باستخدام وسائط مخفية غير انحدارية
[ASRU] تقييم مقاييس التقييم لترجمة الكلام إلى كلام
[ASRU] تمكين ترجمة اللغات المنطوقة متعددة اللغات بتقنية Zero-shot باستخدام برامج التشفير وأجهزة فك التشفير الخاصة باللغة
[ICNLSP] ما وراء اكتشاف النشاط الصوتي: تجزئة الصوت الهجين لترجمة الكلام المباشر
[INTERSPEECH] تأثير استراتيجيات التشفير والتجزئة على ترجمة الكلام المتزامنة من طرف إلى طرف
[EMNLP] Speechformer: الحد من فقدان المعلومات في ترجمة الكلام المباشر
[EMNLP] هل "موبي ديك" حوت أم طائر؟ الكيانات والمصطلحات المسماة في ترجمة الكلام
[EMNLP] التعلم المتبادل يحسن ترجمة الكلام من البداية إلى النهاية
[الحوار] ترجمة الكلام من طرف إلى طرف عبر التدريب التقدمي متعدد الوسائط
[INTERSPEECH] CoVoST 2 وترجمة الكلام إلى النص متعددة اللغات على نطاق واسع
[interspeech] مجموعة TEDx المتعددة اللغات للتعرف على الكلام والترجمة
[الحوار] التعلم الذاتي وشبه الخاضع للإشراف على نطاق واسع لترجمة الكلام
[الحوار] Kosp2e: الخطاب الكوري إلى مجموعة الترجمة الإنجليزية
[INTERSPEECH] AlloST: ترجمة الكلام منخفضة الموارد دون نسخ المصدر
[INTERSPEECH] SpecRec: حل بديل لتحسين ترجمة الكلام إلى النص من طرف إلى طرف عبر إعادة بناء Spectrogram
[الحوار] يعمل ترميز التحيزات الاستقرائية على النحو الأمثل في المحول على تحسين ترجمة الكلام من طرف إلى طرف
[INTERSPEECH] فقدان ASR الخلفي لترجمة الكلام الشامل متعدد المهام
[AMTA] ترجمة الكلام المتزامنة للترجمة المباشرة: من التأخير إلى العرض
[ACL] التشفير الصوتي والنصي المكدس: دمج النماذج المدربة مسبقًا في برامج تشفير ترجمة الكلام
[ACL] ترجمة الكلام متعدد اللغات مع الضبط الفعال للنماذج المدربة مسبقًا
[ACL] ضبط محول خفيف الوزن لترجمة الكلام متعدد اللغات
[ACL] الترجمة المتتالية مقابل ترجمة الكلام المباشر: هل لا تزال الاختلافات تحدث فرقًا؟
[ACL] تحسين ترجمة الكلام من خلال الفهم والتعلم من مهمة ترجمة النص المساعد
[ACL] ترجمة الكلام من البداية إلى النهاية على مستوى الجملة: يساعد السياق
[نتائج ACL] ترجمة مباشرة ومتزامنة لتحويل الكلام إلى نص بمساعدة الدفق المتزامن ASR
[نتائج ACL] AdaST: التكيف الديناميكي لحالات التشفير في وحدة فك التشفير للترجمة الشاملة من الكلام إلى النص
[نتائج ACL] RealTranS: ترجمة الكلام المتزامنة من طرف إلى طرف مع محول تلافيفي مرجح الانكماش
[نتائج ACL] تعلم المساحة الدلالية المشتركة لترجمة الكلام إلى النص
[نتائج ACL] التحقيق في القدرة على إعادة الترتيب في ترجمة الكلام من طرف إلى طرف غير الانحداري القائم على CTC
[نتائج ACL] كيفية التقسيم: تأثير تجزئة الكلمات على التحيز الجنسي في ترجمة الكلام
[عرض ACL] NeurST: مجموعة أدوات ترجمة الكلام العصبي
[ICML] دمج التشفير الصوتي والنصي للتدريب المسبق متعدد اللغات وترجمة الكلام
[NAACL] المصدر والهدف لتقطير المعرفة ثنائي الاتجاه لترجمة الكلام من طرف إلى طرف
[NAACL] الوسائط المخفية القابلة للبحث للنماذج الشاملة لمهام التسلسل القابلة للتحلل
[NAACL AutoSimTrans] BSTC: مجموعة بيانات واسعة النطاق لترجمة الكلام الصينية-الإنجليزية
[AmericasNLP] مجموعة ترجمة الكلام باللغة الإسبانية من Highland Puebla Nahuatl لتوثيق اللغات المهددة بالانقراض
[ICASSP] التعلم متعدد المهام مع إدراك المهام لمهام تحويل الكلام إلى نص
[ICASSP] إطار تعليمي عام متعدد المهام للاستفادة من البيانات النصية في تحويل الكلام إلى مهام نصية
[ICASSP] دراسة تجريبية لاستراتيجيات فك تشفير ترجمة الكلام المتزامنة من طرف إلى طرف
[ICASSP] بث ترجمة الكلام المتزامن باستخدام محول الذاكرة المعزز
[ICASSP] Orthros: ترجمة غير رجعية للكلام من طرف إلى طرف باستخدام وحدة فك ترميز مزدوجة
[ICASSP] النماذج المتتالية ذات التغذية الراجعة الدورية لترجمة الكلام المباشر
[ICASSP] نماذج المحولات المدربة بشكل مشترك لترجمة اللغة المنطوقة
[ICASSP] الاستخدام الفعال للبيانات الشاملة في معالجة اللغة المنطوقة
[EACL] الضغط المستند إلى CTC لترجمة الكلام المباشر
[EACL] نماذج التدفق للتعرف على الكلام المشترك وترجمته
[IberSPEECH] mintzai-ST: النص والخطوط الأساسية لترجمة الكلام الباسكي-الإسباني
[AAAI] فك التشفير المتتالي لترجمة الكلام إلى نص
[AAAI] UWSpeech: ترجمة الكلام إلى كلام للغات غير المكتوبة
[AAAI] "استمع وافهم وترجم": الإشراف الثلاثي يفصل بين الترجمة من الكلام إلى النص من طرف إلى طرف
[SLT] تدريب شامل ومحكم لترجمة الكلام المتتالية
[SLT] ترجمة مباشرة من كلام إلى كلام قائمة على المحولات باستخدام محول الترميز

2020

[arXiv] سد الفجوة في طرق ترجمة الكلام إلى النص
[arXiv] CSTNet: شبكة ترجمة الكلام المتباينة لتعلم تمثيل الكلام الخاضع للإشراف الذاتي
[CLiC-IT] حول تقطير المعرفة لترجمة الكلام المباشر
[COLING] محول فك التشفير المزدوج للتعرف التلقائي على الكلام المشترك وترجمة الكلام متعدد اللغات
[COLING] تربية أنظمة ترجمة الكلام المباشر المراعية للنوع الاجتماعي
[AACL] SimulMT إلى SimulST: تكييف ترجمة النصوص المتزامنة مع ترجمة الكلام المتزامنة من النهاية إلى النهاية
[عرض AACL] fairseq S2T: النمذجة السريعة لتحويل الكلام إلى نص باستخدام fairseq
[EMNLP] التدريب المسبق الفعال على وحدة فك ترميز ترجمة الكلام باستخدام بيانات الترجمة الآلية
[نتائج EMNLP] اختيار الميزات التكيفية لترجمة الكلام من البداية إلى النهاية
[AMTA] حول التقسيم المستهدف لترجمة الكلام المباشر
[الحوار] التعرف على الكلام من تسلسل إلى تسلسل منخفض الكمون وترجمته عن طريق تحديد الفرضية الجزئية
[INTERSPEECH] التشفير الموضعي النسبي للتعرف على الكلام والترجمة المباشرة
[interspeech] الترجمة السياقية للكلام المجزأ تلقائيًا
[الحوار] التدريب الذاتي على ترجمة الكلام من البداية إلى النهاية
[INTERSPEECH] تحسين تعلم النقل عبر اللغات للتعرف على الكلام من طرف إلى طرف من خلال ترجمة الكلام
[interspeech] تعمل التمثيلات الخاضعة للإشراف الذاتي على تحسين ترجمة الكلام من البداية إلى النهاية
[INTERSPEECH] التحقيق في التدريب المسبق الخاضع للإشراف الذاتي لترجمة الكلام من البداية إلى النهاية
[TACL] النسخ والترجمة المتسقة للكلام
[ACL] أسوأ من WER، ولكن أفضل من BLEU؟ الاستفادة من تضمين الكلمات كوسيط في ترجمة الكلام الشاملة للمهام المتعددة
[ACL] تعمل ميزات الهاتف على تحسين ترجمة الكلام
[ACL] التدريب المسبق للمناهج الدراسية لترجمة الكلام من البداية إلى النهاية
[ACL] SimulSpeech: تحويل الكلام المتزامن إلى النص من طرف إلى طرف
[ACL] الجنس في خطر؟ تقييم تكنولوجيا ترجمة الكلام في مجموعة MuST-SHE
[موضوع ACL] ترجمة الكلام والوعد الشامل: تقييم ما نحن فيه
[عرض ACL] ESPnet-ST: مجموعة أدوات ترجمة الكلام الكل في واحد
[LREC] CoVoST: مجموعة متنوعة من خدمات تحويل الكلام إلى نص متعددة اللغات
[LREC] MuST-Cinema: مجموعة تحويل الكلام إلى ترجمة
[LREC] MaSS: مجموعة كبيرة ونظيفة ومتعددة اللغات من الأقوال المنطوقة المتوافقة مع الجمل المستخرجة من الكتاب المقدس
[LREC] LibriVoxDeEn: مجموعة متكاملة لترجمة الكلام من الألمانية إلى الإنجليزية والتعرف على الكلام
[ICASSP] Europarl-ST: مجموعة متعددة اللغات لترجمة الكلام للمناقشات البرلمانية
[ICASSP] التكيف النموذجي القائم على المثيل لترجمة الكلام المباشر
[ICASSP] ترجمة مباشرة فعالة لتحويل الكلام إلى نص باستخدام أسلوب التعلم التلوي الحيادي
[ICASSP] تحليل التدريب المسبق على ASR لترجمة الكلام إلى النص منخفضة الموارد
[ICASSP] ترجمة الكلام من البداية إلى النهاية مع معالجة المفردات المستقلة
[AAAI] سد الفجوة بين التدريب المسبق والضبط الدقيق لترجمة الكلام الشاملة
[AAAI] التعرف المتزامن على الكلام وترجمة الكلام إلى نص مع فك التشفير التفاعلي

2019

[ASRU] ترجمة الكلام من طرف إلى طرف متعدد اللغات
[ASRU] ترجمة الكلام متعددة اللغات من البداية إلى النهاية
[ASRU] ترجمة الكلام إلى كلام بين اللغات غير المعروفة غير المكتوبة
[ASRU] دراسة مقارنة حول ترجمة الكلام من طرف إلى طرف إلى نص
[IWSLT] تسخير بيانات التدريب غير المباشرة للترجمة التلقائية للكلام من البداية إلى النهاية: حيل التجارة
[IWSLT] حول استخدام SpecAugment لترجمة الكلام من طرف إلى طرف
[الحوار] ترجمة الكلام من طرف إلى طرف مع تقطير المعرفة
[الحوار] تكييف المحول لترجمة اللغة المنطوقة من البداية إلى النهاية
[INTERSPEECH] ترجمة مباشرة من الكلام إلى كلام باستخدام نموذج تسلسل إلى تسلسل
[ACL] استكشاف تمثيلات الكلام على مستوى الصوت لترجمة الكلام من البداية إلى النهاية
[ACL] نماذج تمرير الانتباه لترجمة الكلام من طرف إلى طرف قوية وفعالة من حيث البيانات
[NAACL] التدريب المسبق على التعرف على الكلام عالي الموارد يحسن ترجمة الكلام إلى نص منخفض الموارد
[NAACL] MuST-C: مجموعة ترجمة الكلام متعدد اللغات
[NAACL] الترجمات السلسة من الكلام غير السلس في ترجمة الكلام من النهاية إلى النهاية
[ICASSP] الاستفادة من البيانات الخاضعة للإشراف الضعيف لتحسين الترجمة الشاملة من الكلام إلى النص
[ICASSP] نحو ترجمة الكلام إلى النص غير الخاضعة للرقابة
[ICASSP] نحو ترجمة الكلام إلى النص من طرف إلى طرف مع فك التشفير ثنائي المسار

2018

[NIPS] How2: مجموعة بيانات واسعة النطاق لفهم اللغات المتعددة الوسائط
[IberSPEECH] ترجمة الكلام من طرف إلى طرف باستخدام المحول
[الحوار] ترجمة الكلام إلى النص منخفضة الموارد
[LREC] تعزيز الخطاب المكتبي بالترجمات الفرنسية: مجموعة متعددة الوسائط لتقييم ترجمة الكلام المباشر
[NAACL] التعلم المترابط متعدد المهام لترجمة الكلام العصبي
[ICASSP] ترجمة الكلام التلقائي الشاملة للكتب الصوتية

2017

[INTERSPEECH] يمكن لنماذج التسلسل إلى التسلسل ترجمة الكلام الأجنبي مباشرة
[INTERSPEECH] منهج دراسي منظم لترجمة الكلام من الإنجليزية إلى اليابانية بشكل شامل
[EACL] نحو ترجمة الكلام إلى نص دون التعرف على الكلام