Seri terbaru model penerjemahan ucapan Komunikasi Seamless yang dirilis oleh Meta bisa disebut sebagai terobosan besar di bidang penerjemahan ucapan. Seri ini mencakup empat model yang mendukung terjemahan ucapan real-time dalam hampir seratus bahasa, dengan penundaan hanya sekitar 2 detik, dan dapat memulihkan nada, kecepatan, dan detail lain dari ucapan sumber secara maksimal, menjadikan efek terjemahan menjadi realistis dan alami. . Langkah Meta tidak hanya menunjukkan posisi terdepannya di bidang kecerdasan buatan, namun juga menghadirkan kemudahan yang belum pernah terjadi sebelumnya dalam komunikasi global.
Meta baru-baru ini merilis seri Komunikasi Tanpa Batas, model baru untuk terjemahan ucapan, termasuk 4 model yang mendukung terjemahan ucapan waktu nyata antara hampir 100 bahasa, dengan kontrol penundaan sekitar 2 detik. Model ini dapat mereproduksi fitur kompleks seperti jeda, nada, dan kecepatan bicara sumber ucapan, sehingga membuat terjemahan menjadi lebih realistis. Arsitektur non-autoregresif diadopsi untuk mendukung terjemahan urutan panjang. Selain itu, Meta telah membuat model menjadi sumber terbuka dan korpus ucapan terbesar selama 585.000 jam, dan menambahkan fungsi seperti tanda air audio dan mitigasi toksisitas terjemahan untuk mencegah penyalahgunaan model.
Model sumber terbuka dan korpus besar Meta akan sangat mendorong pengembangan teknologi terjemahan ucapan dan mendorong pertukaran informasi global. Pada saat yang sama, langkah-langkah anti-penyalahgunaan juga mencerminkan rasa tanggung jawab dalam penerapan teknologi. Kami menantikan seri Komunikasi Tanpa Batas yang menghadirkan lebih banyak kejutan di masa mendatang.