أطلقت iFlytek رسميًا نموذج Xinghuo الصوتي للترجمة الفورية واسع النطاق، مما يمثل الإطلاق الرسمي لأول نموذج واسع النطاق في الصين مزود بقدرات الترجمة الفورية الصوتية الشاملة. تم تطبيق هذا النموذج على iFlytek Translator، مما لم يحقق أي تأخير تقريبًا في الترجمة الفورية للكلام من الإنجليزية إلى الصينية، مما أدى إلى تحسين سرعة الترجمة ودقتها بشكل كبير، وهو مناسب لمجموعة متنوعة من سيناريوهات الاتصال الدولية، مثل السفر إلى الخارج والمعارض الدولية. وتتمثل تقنيتها الأساسية في دعم التحكم العكسي في طول الترجمة وتحسين طبيعة الترجمة وطلاقتها من خلال تقنية تركيب الكلام المتدفق. يتفوق أداء هذا النموذج على تقنيات الترجمة الفورية مثل Google Gemini 2.0 وOpenAI GPT-4o، ويمكنه تحقيق تأخير في الترجمة الفورية أقل من 5 ثوانٍ في أسرع وقت، ليصل إلى مستوى المترجمين الخبراء من البشر.
اليوم، أطلقت iFlytek رسميًا نموذجها الصوتي واسع النطاق للترجمة الفورية المتزامنة Spark والذي تم تطويره حديثًا، مما يمثل الإطلاق الرسمي لأول نموذج محلي واسع النطاق مزود بقدرات الترجمة الفورية الصوتية الشاملة. بالمقارنة مع تقنية الترجمة السابقة لشركة iFlytek، فقد أدت هذه التقنية المبتكرة إلى تحسين تأثير الترجمة بشكل كبير في جميع السيناريوهات وتقصير وقت الاستجابة الشامل بشكل كبير.
يوفر إصدار النموذج الصوتي للترجمة الفورية Xinghuo للمستخدمين تجربة ترجمة فورية أكثر سلاسة ودقة. في عرض iFlytek، لم يحقق مترجم iFlytek المجهز بنموذج Spark الصوتي للترجمة الفورية واسع النطاق أي تأخير تقريبًا في الترجمة الفورية الصوتية الإنجليزية الصينية، وهو مناسب جدًا للاستخدام في سيناريوهات مثل السفر إلى الخارج والمعارض الدولية. لا يؤدي هذا التحسين إلى تحسين سرعة عرض الترجمات المترجمة بشكل كبير فحسب، بل يضمن أيضًا دقة الترجمة الصينية-الإنجليزية.
من المفهوم أن النموذج الكبير لخطاب الترجمة الفورية من Xinghuo يدعم التحكم العكسي في طول الترجمة أثناء عملية الترجمة الشاملة من الكلام إلى النص، ويمكنه إجراء تجزئة مجموعة المعنى وفهم السياق وإعادة تنظيم المعلومات بطريقة متدفقة. وفي الوقت نفسه، يمكن لتقنية تركيب الكلام المتدفق أيضًا أن تدعم الاتصال العروضي لمجموعة المعنى وتعديل سرعة الكلام التكيفي، مما يزيد من تحسين طبيعة الترجمة وطلاقتها.
في سيناريوهات الاتصالات الدولية، سواء كان ذلك حوارًا يوميًا أو اتصالات تجارية أو ترجمة صناعية وغيرها من احتياجات الترجمة الفورية الصعبة، أظهر النموذج الكبير للترجمة الفورية الصوتية من Xinghuo أداءً ممتازًا. إن اكتمال المحتوى ودقة المعلومات وجودة اللغة كلها على المستوى الرائد في الصناعة، وقد تجاوزت تقنيات الترجمة مثل Google Gemini2.0 وOpenAI GPT-4o. أسرع تأخير ممكن للترجمة الفورية هو خلال 5 ثواني، ليصل إلى مستوى المترجمين الخبراء من البشر.
لا يمثل إصدار نموذج Spark الصوتي للترجمة الفورية واسع النطاق من iFlytek طفرة كبيرة في تكنولوجيا ترجمة الذكاء الاصطناعي المحلية فحسب، بل يشير أيضًا إلى أن الاتصالات الدولية ستكون أكثر ملاءمة وكفاءة في المستقبل.
يمثل ظهور نموذج Xinghuo للترجمة الفورية الصوتية علامة فارقة جديدة في تكنولوجيا الترجمة بالذكاء الاصطناعي، وفي المستقبل، سيخدم التبادلات والتعاون الدولي بشكل أفضل ويعزز كفاءة وراحة الاتصالات العالمية. سيستمر التقدم التكنولوجي في تحسين حياة الناس وتوفير المزيد من الإمكانيات للعالم.