ElevenLabs, sebuah perusahaan rintisan yang berfokus pada kloning suara AI dan API text-to-speech, baru-baru ini meluncurkan fitur baru yang menarik: pengguna dapat membangun agen AI percakapan lengkap secara mandiri. Pembaruan ini menandai transformasi ElevenLabs dari penyedia teknologi suara murni menjadi penyedia solusi AI yang lebih komprehensif, memberikan ruang penyesuaian yang belum pernah ada sebelumnya bagi pengembang, dan juga menandai persaingan yang lebih ketat di bidang dialog AI. Editor Downcodes akan memberi Anda pemahaman mendalam tentang kekuatan fitur baru ini.
Pengguna kini dapat menyesuaikan berbagai variabel agen percakapan sesuai dengan kebutuhan mereka di platform pengembang ElevenLabs, seperti intonasi suara dan panjang balasan.
ElevenLabs pada dasarnya menyediakan layanan ucapan dan text-to-speech yang berbeda di masa lalu. Sam Sklar, kepala pertumbuhan perusahaan, mengatakan kepada TechCrunch bahwa banyak pelanggan sudah menggunakan platform tersebut untuk membuat agen AI percakapan. Namun mengintegrasikan basis pengetahuan dan menangani pemadaman pelanggan adalah tantangan terbesar. Jadi ElevenLabs memutuskan untuk membangun saluran bot percakapan lengkap untuk mempermudah proses ini.
Pengguna dapat mulai membangun agen percakapan dengan masuk ke akun ElevenLabs mereka, memilih template, atau membuat proyek baru. Mereka dapat memilih bahasa utama agen, pesan pertama, dan perintah sistem untuk menentukan kepribadian agen.
Selain itu, pengembang perlu memilih model bahasa yang besar (seperti Gemini, GPT, atau Claude), suhu respons (menentukan kreativitas), dan batasan penggunaan token.
Pengguna juga dapat menambahkan basis pengetahuan seperti file, URL, atau blok teks sesuai kebutuhannya untuk meningkatkan kemampuan bot percakapan. Pada saat yang sama, mereka dapat mengintegrasikan model bahasa besar kustom mereka dengan bot. SDK ElevenLabs kompatibel dengan Python, JavaScript, React, dan Swift, dan perusahaan juga menyediakan API WebSocket untuk penyesuaian lebih lanjut.
Perusahaan juga mengizinkan pengguna untuk menentukan kriteria pengumpulan data, seperti nama dan email pelanggan yang berbicara dengan agen, dan menggunakan bahasa alami untuk menentukan kriteria untuk mengevaluasi keberhasilan panggilan.
ElevenLabs memanfaatkan jalur text-to-speech yang ada sekaligus mengembangkan kemampuan voice-to-text untuk produk AI percakapan baru. Saat ini, perusahaan tersebut tidak menawarkan API ucapan-ke-teks yang terpisah, namun mungkin akan meluncurkannya di masa mendatang, sehingga bersaing dengan API ucapan-ke-teks dari perusahaan seperti Google, Microsoft, dan Amazon, serta dengan Whisper OpenAI, AssemblyAI, Deepgram, Speechmatics, dan Gladia API bersaing.
Perusahaan berencana untuk mengumpulkan putaran pendanaan baru dengan valuasi lebih dari $3 miliar dan bersaing dengan startup voice AI lainnya seperti Vapi dan Retell, yang juga membangun agen percakapan. Terlebih lagi, ElevenLabs akan bersaing dengan API percakapan real-time OpenAI. Namun, ElevenLabs yakin kemampuannya untuk menyesuaikan dan fleksibilitas untuk berganti model akan memberikan keunggulan dalam persaingan.
Fitur baru ElevenLabs ini tidak hanya meningkatkan daya saingnya di bidang suara AI, namun juga memberi pengembang alat yang mudah digunakan untuk membangun agen AI percakapan yang lebih kuat dan personal. Di masa depan, dengan peluncuran fungsi ucapan-ke-teks dan penambahan lebih banyak opsi penyesuaian, ElevenLabs diperkirakan akan mengambil tempat di bidang dialog AI. Redaksi Downcodes akan terus memperhatikan perkembangannya.