ElevenLabs telah meluncurkan fitur baru, GenFM, yang memungkinkan pengguna mengunggah berbagai konten, seperti video YouTube, teks atau dokumen, dan menggunakan AI untuk menghasilkan podcast multi-saluran. Hal ini mirip dengan NotebookLM Google, namun GenFM ElevenLabs lebih berfokus pada penambahan elemen manusia ke audio yang dihasilkan AI, seperti kata pengisi seperti "um" dan "ah", yang berupaya mencapai keseimbangan antara nuansa percakapan alami dan kepraktisan. dari konten. Fitur ini kini tersedia di aplikasi ElevenLabs Reader iOS, mendukung 32 bahasa, memberikan pengalaman pembuatan podcast multibahasa yang lebih nyaman bagi pengguna.
Startup kecerdasan buatan ElevenLabs pada hari Rabu meluncurkan fitur baru yang disebut GenFM yang memungkinkan pengguna mengunggah berbagai jenis konten untuk menghasilkan podcast multi-saluran, mirip dengan NotebookLM Google.
Fitur ini telah diluncurkan di aplikasi iOS ElevenLabs Reader dan mendukung 32 bahasa, termasuk Inggris, Hindi, Portugis, China, Spanyol, Prancis, Jerman, dan Jepang.
Saat menggunakan GenFM, pengguna dapat mengunggah video, teks, atau dokumen YouTube terlebih dahulu, dan aplikasi secara otomatis memilih dua suara untuk membuat podcast.
ElevenLabs menawarkan lebih dari selusin suara untuk dipilih pengguna. Saat aplikasi menyiapkan podcast yang dihasilkan AI, pengguna mungkin melihat beberapa perintah menarik, seperti "Tambahkan beberapa jeda" dan "Sisipkan beberapa kata pengisi". Di dunia di mana banyak alat membantu orang menghilangkan “ums” dan “ahs,” ElevenLabs telah memilih untuk menambahkan sentuhan manusiawi ke podcast yang dihasilkan AI.
"Kami membahas seberapa banyak memperkenalkan suara pengisi atau hamparan percakapan manusia seperti 'um,' 'ah,' 'um hum,' tawa dan napas," kata Jack McDermott, kepala pertumbuhan seluler di ElevenLabs, dalam sebuah wawancara adalah menemukan keseimbangan yang tepat antara percakapan alami manusia dan kepraktisan konten.”
Dia juga menunjukkan bahwa podcast berdurasi panjang terbaik cenderung memiliki lebih sedikit gangguan dan alur percakapan yang lebih alami dan lebih dalam sebagai pengalaman yang mereka perjuangkan, yang bertujuan untuk membuat penyampaian cerita audio lebih mudah diakses dalam berbagai suara dan bahasa.
Di masa depan, ElevenLabs berencana untuk mendukung lebih banyak opsi penyesuaian dan memungkinkan pengguna menambahkan berbagai sumber untuk membuat podcast AI generatif. Pada bulan September, Google meluncurkan fitur percakapan yang dihasilkan AI dari NotebookLM, dan sebulan kemudian menambahkan kemampuan bagi pengguna untuk menyesuaikan keluaran podcast.
Awal bulan ini, ElevenLabs juga mengumumkan bahwa mereka akan menginvestasikan US$11 juta pada ekosistem start-up Polandia dan membuka pusat penelitian dan pengembangan di Warsawa untuk menarik talenta AI lokal. Sementara itu, perusahaan ini berekspansi ke India, telah merekrut seorang pemimpin bisnis dan sedang membangun tim. Selain itu, ElevenLabs telah meluncurkan agen AI percakapan untuk pelanggan.
Menyorot:
ElevenLabs meluncurkan fungsi GenFM, yang memungkinkan pengguna mengunggah video atau teks untuk menghasilkan podcast multi-saluran.
Fitur ini secara otomatis memilih dua suara dan menambahkan kata pengisi mirip manusia untuk meningkatkan pengalaman percakapan alami.
ElevenLabs berencana untuk mendukung lebih banyak opsi penyesuaian di masa depan dan memperluas operasi di Polandia dan India.
Secara keseluruhan, fungsi GenFM ElevenLabs menyediakan solusi AI yang nyaman dan mudah digunakan untuk produksi podcast, dan arah pengembangannya di masa depan patut dinantikan. Strategi ekspansi global perusahaan yang agresif juga menunjukkan ambisinya di bidang kecerdasan buatan.