Play AI dengan megahnya meluncurkan mahakarya terbarunya - PlayDialog versi beta, model suara AI yang dapat menghasilkan audio podcast percakapan. Ini tidak hanya dapat menyesuaikan intonasi, emosi, dan kecepatan berbicara sesuai dengan konteks historis percakapan, mencapai sintesis ucapan yang lebih alami, tetapi juga menciptakan pengalaman komunikasi suara yang mendalam, yang dapat disebut sebagai tonggak baru dalam dialog manusia-komputer. Editor Downcodes akan menjelaskan secara rinci fungsi hebat PlayDialog dan alat pendukungnya, PlayNote.
Baru-baru ini, Play AI secara resmi meluncurkan produk paling ambisiusnya, PlayDialog versi beta, yang dapat menghasilkan audio podcast percakapan.
Model ucapan AI menyeluruh ini menggunakan konteks historis percakapan untuk mengontrol intonasi, emosi, dan kecepatan bicara guna mencapai sintesis ucapan yang lebih alami, sehingga menandai tingkat baru dalam dialog manusia-mesin. PlayDialog sangat cocok untuk menciptakan pengalaman dialog nyata, seperti narasi, sulih suara, podcast yang disintesis, dll. PlayDialog juga dapat memberikan pengalaman komunikasi suara satu-ke-satu yang mendalam dalam lingkungan bisnis, mirip dengan NotebookLM Google
Pada saat yang sama, Play AI juga meluncurkan PlayNote, sebuah alat yang dapat mengonversi berbagai file media (seperti PDF, teks, video, dll.) menjadi pengalaman percakapan. Pengguna dapat membuat podcast, presentasi, narasi, dan bahkan cerita anak-anak dalam hitungan menit, serta menikmati efek suara yang halus dan alami yang dibawa oleh PlayDialog. Keunikan PlayNote adalah ia juga menyediakan antarmuka API, memungkinkan pengguna dengan mudah mencapai pembuatan konten audio terprogram tanpa bergantung pada antarmuka pengguna.
PlayDialog beta telah dilatih pada ratusan juta percakapan nyata. Ukuran modelnya sekitar sepuluh kali lipat dari Play AI3.0mini, dan dapat menandingi performa ucapan manusia dalam hal intonasi (seperti irama suara dan kecepatan suara). pidato). Dalam pengujian buta, PlayDialog beta memiliki kinerja dua kali lebih baik dibandingkan model pesaing terkemuka di pasar, dengan mencetak nilai tertinggi khususnya dalam hal ekspresi.
Berbeda dengan model ucapan sebelumnya, PlayDialog beta dapat memahami konteks keseluruhan percakapan, sehingga memengaruhi efek pembuatan ucapan. Play AI membangun arsitektur baru yang disebut Adaptive Speech Contextualizer (ASC), yang memungkinkan model merespons menggunakan riwayat percakapan lengkap, sehingga setiap kalimat bukanlah keluaran yang terisolasi, melainkan keluaran yang kaya nada membuat podcast yang dihasilkan terasa seperti pendengar berkomunikasi di ruang yang sama dengan pembicara.
Baik itu diskusi dinamis atau topik sensitif yang memerlukan empati, PlayDialog beradaptasi dengan lancar, membuat interaksi terasa lebih alami dan manusiawi.
Pengguna dapat merasakan semua ini dengan PlayNote, menggunakannya untuk membuat narasi, podcast, presentasi, dan lainnya yang kuat dan alami hanya dalam hitungan menit. PlayNote juga tersedia melalui antarmuka API, memungkinkan pengembang menghasilkan konten menarik dalam skala besar secara terprogram.
Pintu masuk Tia: https://play.ai/playnote
Pengenalan blog resmi: https://blog.play.ai/blog/introducing-playdialog
Kemunculan PlayDialog dan PlayNote tidak diragukan lagi akan mendorong teknologi sintesis ucapan AI ke tingkat yang lebih tinggi dan membawa perubahan revolusioner pada produksi podcast, komunikasi suara, dan bidang lainnya. Kami menantikan inovasi yang lebih mengejutkan dari Play AI di masa mendatang!