Editor Downcodes mengetahui bahwa Alibaba Cloud telah meluncurkan model bahasa audio berskala besar baru Qwen2-Audio, yang telah membuat terobosan signifikan di bidang interaksi suara. Ia dapat menerima berbagai input sinyal audio dan melakukan analisis audio atau langsung menjawab perintah suara, sehingga sangat meningkatkan pengalaman pengguna. Dibandingkan dengan model Qwen-Audio sebelumnya, Qwen2-Audio menunjukkan kinerja yang lebih kuat dalam pelacakan instruksi dan telah mencapai posisi terdepan dalam berbagai pengujian benchmark. Hal ini menandai langkah solid lainnya yang diambil oleh Alibaba Cloud di bidang kecerdasan buatan, menghadirkan teknologi interaksi suara yang lebih canggih dan nyaman bagi pengguna.
Alibaba Cloud baru-baru ini merilis model bahasa audio berskala besar yang disebut Qwen-Audio. Model ini dapat menerima berbagai input sinyal audio dan dapat melakukan analisis audio atau langsung menjawab perintah suara, sehingga sangat meningkatkan pengalaman interaksi suara.
Dalam hal kemampuan obrolan Qwen2-Audio, para peneliti mengukur kinerjanya pada tolok ukur obrolan AIR-Bench (Yang et al., 2024). Qwen2-Audio menunjukkan kinerja canggih dalam pidato, musik suara, dan audio campuran subset.(SOTA) fungsi pelacakan instruksi. Ini menunjukkan peningkatan substansial dibandingkan dengan Qwen-Audio dan secara signifikan mengungguli LALM lainnya.
Menyorot:
Alibaba Cloud merilis Qwen2-Audio, model bahasa frekuensi berskala besar yang inovatif yang meningkatkan pengalaman interaksi suara;
Qwen2-Audio dapat menerima berbagai input sinyal audio untuk analisis audio atau langsung menjawab perintah suara, sangat memperluas fungsi interaksi suara;
Melalui proses pelatihan tiga tahap, metode dan kinerja pelatihan struktur model Qwen2-Audio telah didemonstrasikan sepenuhnya, memberikan pengalaman interaksi audio yang lebih baik kepada pengguna.
Secara keseluruhan, kemunculan Qwen2-Audio menghadirkan kemungkinan-kemungkinan baru pada teknologi interaksi suara, dan kinerja serta keserbagunaannya yang kuat menjadikannya memiliki prospek yang luas dalam penerapan di masa depan. Editor Downcodes akan terus memperhatikan kemajuan terbaru Alibaba Cloud di bidang kecerdasan buatan dan memberikan lebih banyak laporan menarik kepada pembaca.