Hume AI mengumumkan fungsi kontrol suara revolusionernya, yang merupakan fungsi eksperimental yang memungkinkan pengguna untuk membuat suara AI yang sangat personal tanpa pengkodean atau keterampilan profesional. Fungsi ini didasarkan pada Antarmuka Suara Empati Hume 2 (EVI2), yang selanjutnya meningkatkan kealamian, ekspresi emosional dan kustomisasi suara, memberikan pengembang dan pengguna tingkat kontrol yang belum pernah terjadi sebelumnya, sehingga menciptakan pertemuan yang memenuhi berbagai kebutuhan aplikasi, seperti itu, seperti suara unik, seperti Sebagai robot obrolan layanan pelanggan, asisten digital, alat pendidikan, dll. Teknologi inovatif ini diharapkan untuk sepenuhnya mengubah industri suara AI dan memberi pengguna pengalaman suara yang lebih intim dan lebih personal.
Hume AI, startup yang berfokus pada antarmuka suara cerdas emosional, baru -baru ini meluncurkan fungsi eksperimental yang disebut "kontrol suara".
Alat baru ini dirancang untuk membantu pengembang dan pengguna dapat membuat suara AI yang dipersonalisasi tanpa penyandian, rekayasa cepat AI atau keterampilan desain suara. Pengguna dapat dengan mudah menyesuaikan suara yang memenuhi kebutuhan dengan secara akurat menyesuaikan karakteristik suara.
Fitur baru ini didasarkan pada "Antarmuka Suara Konvergensi 2" sebelumnya (EVI2), EVI2 meningkatkan sifat alami, kemampuan respons emosional, dan penyesuaian suara. Tidak seperti teknologi kloning suara tradisional, produk Hume fokus pada penyediaan suara yang unik dan ekspresif untuk memenuhi kebutuhan robot obrolan layanan pelanggan, asisten digital, guru, pemandu wisata, dan fungsi bebas penghalang.
Fungsi kontrol suara memungkinkan pengembang untuk menyesuaikan karakteristik suara pada sepuluh dimensi yang berbeda, termasuk jenis kelamin, ketegasan, kegembiraan, dan kepercayaan diri.
"Pria/Wanita: Gender, kisarannya antara lebih maskulin dan lebih feminin.
Konfigurasi diri: Ketegasan suara adalah antara pemalu dan berani.
Buoyancy: Kepadatan suara adalah antara deflasi dan daya apung.
Keyakinan: Tingkat penentuan suara adalah antara rasa malu dan percaya diri.
Gairah: Kegembiraan dalam suara adalah antara kedamaian dan antusiasme.
Suara Nasal: Keterbukaan suara antara suara jernih dan hidung.
Santai: Tekanan dalam suara adalah antara ketegangan dan relaksasi.
Smooth: Tekstur suara antara halus dan terputus.
Ringan: Vitalitas di balik suara antara ringan dan kuat.
Ketat: Toleransi suara ada dalam keketatan dan asma. "
Pengguna dapat dengan baik -mendirikan atribut ini secara real time melalui slider virtual untuk membuat kustomisasi menjadi sederhana dan jelas. Fungsi ini saat ini disediakan di platform virtual Hume, dan pengguna dapat mengaksesnya untuk pendaftaran gratis.
Kontrol Suara kini telah meluncurkan versi uji dan terintegrasi dengan Hume's Empathic Voice Interface (EVI) untuk memungkinkannya digunakan untuk aplikasi yang luas. Pengembang dapat memilih suara dasar, menyesuaikan karakteristiknya, dan melihat pratinjau hasilnya secara real time. Proses ini dapat memastikan pengulangan dan stabilitas antar sesi.
Pengaruh EVI2 jelas dalam hal fungsi kontrol suara. Model awal memperkenalkan fungsi -fungsi seperti prompt dialog dan fungsi multi -bahasa, yang memperluas ruang lingkup aplikasi AI suara. Misalnya, EVI2 mendukung waktu respons sub -detik untuk mencapai dialog alami dan instan. Ini juga memungkinkan menyesuaikan gaya berbicara secara dinamis selama interaksi, menjadikannya alat multi -fungsional untuk perusahaan.
Ini tepat untuk menyelesaikan masalah suara yang telah ditetapkan dalam industri AI, banyak merek atau aplikasi seringkali sulit untuk menemukan suara yang memenuhi kebutuhan mereka. Tujuan Hume adalah mengembangkan AI suara emosional dan halus untuk mempromosikan kemajuan industri. Ketika EVI2 dirilis pada bulan September 2024, EVI2 telah sangat meningkatkan penundaan dan manfaat biaya suara, dan memberikan alternatif yang aman untuk fungsi penyesuaian suara.
Metode yang didorong oleh penelitian Hume menempati posisi inti dalam pengembangan produk, menggabungkan rekaman suara silang -budaya dan data survei emosional. Metodologi ini merupakan dasar dari EVI2 dan kontrol suara yang baru diluncurkan, memungkinkannya untuk dengan hati -hati menangkap persepsi manusia tentang suara manusia.
Saat ini, kontrol suara telah diluncurkan dalam versi uji, dan dikombinasikan dengan Hume's Empathy Voice Interface (EVI) untuk mendukung berbagai skenario aplikasi. Pengembang dapat memilih suara dasar, menyesuaikan karakteristiknya, dan melihat pratinjau hasilnya secara real time untuk memastikan konsistensi dan stabilitas dalam aplikasi waktu nyata seperti layanan pelanggan atau asisten virtual.
Dengan intensifikasi persaingan di pasar, suara yang dipersonalisasi Hume dan posisi cerdas emosional membuatnya menonjol di bidang suara AI. Di masa depan, Hume berencana untuk memperluas fungsi kontrol suara, meningkatkan penyesuaian dimensi yang dapat disesuaikan, mengoptimalkan kualitas suara, dan meningkatkan ruang lingkup pemilihan suara dasar.
Blog resmi: https://www.hume.ai/blog/introducing-voice-control
Poin:
** Hume AI meluncurkan fungsi "kontrol suara", dan pengguna dapat dengan mudah membuat suara AI yang dipersonalisasi. **
** Fitur ini tidak perlu menyandikan keterampilan, pengguna dapat menyesuaikan karakteristik suara melalui slider. **
** Hume bertujuan untuk memenuhi kebutuhan aplikasi yang beragam melalui AI kecerdasan yang dipersonalisasi dan emosional. **
Secara keseluruhan, fungsi "Kontrol Suara" Hume AI membawa kemungkinan baru ke bidang kustomisasi suara AI. Di masa depan, dengan peningkatan berkelanjutan dan perluasan fungsi, Hume AI diharapkan menjadi pemimpin di bidang suara AI.