iFLYTEK Xinghuo Model Besar Pidato Interpretasi Simultan Dirilis: Mencapai Tingkat Penerjemah Ahli Manusia - Artikel AI

Penulis：Eve Cole Waktu Pembaruan：2025-01-30 02:32:01

iFlytek secara resmi merilis model suara interpretasi simultan Xinghuo berskala besar, menandai peluncuran resmi model berskala besar pertama di Tiongkok dengan kemampuan interpretasi simultan suara menyeluruh. Model ini telah diterapkan pada iFlytek Translator, sehingga hampir tidak ada penundaan dalam interpretasi ucapan simultan dari Bahasa Inggris ke Bahasa Mandarin, secara signifikan meningkatkan kecepatan dan keakuratan terjemahan, dan cocok untuk berbagai skenario komunikasi internasional, seperti perjalanan ke luar negeri dan pameran internasional. Teknologi intinya adalah untuk mendukung kontrol terbalik pada panjang terjemahan dan meningkatkan kealamian dan kelancaran terjemahan melalui teknologi sintesis ucapan streaming. Kinerja model ini melampaui teknologi interpretasi seperti Google Gemini 2.0 dan OpenAI GPT-4o, dan dapat mencapai penundaan interpretasi simultan paling cepat kurang dari 5 detik, mencapai tingkat penerjemah ahli manusia.

Hari ini, iFlytek secara resmi merilis model suara skala besar interpretasi simultan Spark yang baru dikembangkan, menandai peluncuran resmi model skala besar domestik pertama dengan kemampuan interpretasi suara simultan ujung ke ujung. Dibandingkan dengan teknologi terjemahan iFlytek sebelumnya, teknologi inovatif ini telah meningkatkan efek terjemahan secara signifikan di semua skenario dan sangat mempersingkat waktu respons ujung ke ujung.

Peluncuran model suara interpretasi simultan Xinghuo menghadirkan pengalaman interpretasi simultan yang lebih lancar dan akurat kepada pengguna. Dalam demonstrasi iFlytek, penerjemah iFlytek yang dilengkapi dengan model suara interpretasi simultan Spark berskala besar hampir tidak mengalami penundaan dalam interpretasi simultan suara Inggris-Mandarin, sehingga sangat cocok untuk digunakan dalam skenario seperti perjalanan ke luar negeri dan pameran internasional. Pengoptimalan ini tidak hanya meningkatkan kecepatan rendering subtitle terjemahan secara signifikan, namun juga memastikan keakuratan terjemahan bahasa Mandarin-Inggris.

微信截图_20250115110120.png

Dapat dipahami bahwa model besar ucapan interpretasi simultan Xinghuo mendukung kontrol terbalik dari panjang terjemahan. Selama proses penerjemahan ujung ke ujung dari ucapan ke teks, model tersebut dapat melakukan segmentasi kelompok makna, pemahaman konteks, dan reorganisasi informasi secara streaming. Pada saat yang sama, teknologi sintesis ucapan streaming juga dapat mendukung koneksi prosodik kelompok makna dan penyesuaian kecepatan ucapan adaptif, sehingga semakin meningkatkan kealamian dan kelancaran terjemahan.

Dalam skenario komunikasi internasional, apakah itu dialog sehari-hari, komunikasi bisnis atau terjemahan industri dan kebutuhan interpretasi simultan yang sulit lainnya, model besar suara interpretasi simultan Xinghuo telah menunjukkan kinerja yang sangat baik. Kelengkapan konten, keakuratan informasi, dan kualitas bahasanya berada pada level terdepan di industri, dan telah melampaui teknologi terjemahan seperti Google Gemini2.0 dan OpenAI GPT-4o. Penundaan interpretasi simultan tercepat yang mungkin terjadi adalah dalam 5 detik, mencapai tingkat penerjemah ahli manusia.

Peluncuran model suara interpretasi simultan Spark berskala besar dari iFlytek tidak hanya mewakili terobosan besar dalam teknologi terjemahan AI dalam negeri, namun juga menunjukkan bahwa komunikasi internasional akan lebih nyaman dan efisien di masa depan.

Munculnya model suara interpretasi simultan Xinghuo menandai tonggak sejarah baru dalam teknologi terjemahan AI. Di masa depan, model ini akan melayani pertukaran dan kerja sama internasional dengan lebih baik serta mendorong efisiensi dan kenyamanan komunikasi global. Kemajuan teknologi akan terus meningkatkan kehidupan masyarakat dan memberikan lebih banyak kemungkinan bagi dunia.