AI 音声クローン作成とテキスト読み上げ API に焦点を当てているスタートアップ企業 イレブンラボは、最近、ユーザーが完全な会話型 AI エージェントを独立して構築できるという、目を引く新機能を発表しました。このアップデートは、イレブンラボが純粋な音声技術プロバイダーからより包括的な AI ソリューション プロバイダーへの変革を示すもので、開発者に前例のないカスタマイズ スペースを提供するとともに、AI 対話の分野での競争の激化を予告しています。 Downcodes のエディターを使用すると、この新機能の威力を深く理解できます。
ユーザーは、イレブンラボ開発者プラットフォーム上で、音声のイントネーションや応答の長さなど、会話型エージェントのさまざまな変数を自分のニーズに応じてカスタマイズできるようになりました。
イレブンラボはこれまで、主にさまざまな音声サービスやテキスト読み上げサービスを提供してきました。同社の成長責任者サム・スクラー氏はTechCrunchに対し、多くの顧客がすでにこのプラットフォームを利用して会話型AIエージェントを作成していると語った。しかし、ナレッジ ベースの統合と顧客の停止への対応が最大の課題です。そこで、イレブンラボは、このプロセスを容易にするために、完全な会話型ボット パイプラインを構築することにしました。
ユーザーは、イレブンラボ アカウントにログインし、テンプレートを選択するか、新しいプロジェクトを作成することで、会話型エージェントの構築を開始できます。エージェントの第一言語、最初のメッセージ、およびシステム プロンプトを選択して、エージェントの性格を決定できます。
さらに、開発者は、大規模な言語モデル (Gemini、GPT、Claude など)、応答の温度 (創造性を決定する)、およびトークンの使用制限を選択する必要があります。
ユーザーは、ニーズに応じてファイル、URL、テキスト ブロックなどのナレッジ ベースを追加して、会話型ボットの機能を強化することもできます。同時に、独自のカスタム大規模言語モデルをボットと統合できます。イレブンラボの SDK は Python、JavaScript、React、Swift と互換性があり、さらにカスタマイズするための WebSocket API も提供しています。
同社では、ユーザーがエージェントと話した顧客の名前や電子メールなどのデータ収集基準を定義したり、自然言語を使用して通話の成功を評価するための基準を定義したりすることもできます。
イレブンラボは、既存のテキスト読み上げパイプラインを活用しながら、新しい会話型 AI 製品向けの音声テキスト変換機能も開発しています。現在、同社は個別の音声テキスト変換 API を提供していませんが、将来的には提供する可能性があり、Google、Microsoft、Amazon などの企業の音声テキスト変換 API と競合する可能性があります。 OpenAI の Whisper、AssemblyAI、Deepgram、Speechmatics、および Gladia API が競合します。
同社は評価額30億ドル以上の新たな資金調達を計画しており、同様に会話エージェントを開発しているVapiやRetellなどの他の音声AIスタートアップ企業と競合している。さらに、イレブンラボはOpenAIのリアルタイム会話APIと競合することになる。しかし、イレブンラボは、そのカスタマイズ能力とモデルを切り替える柔軟性が競合他社に対して優位性をもたらすと信じている。
イレブンラボのこの新機能は、AI 音声の分野での競争力を強化するだけでなく、より強力でパーソナライズされた会話型 AI エージェントを構築するための便利なツールを開発者に提供します。将来的には、音声テキスト変換機能の開始とより多くのカスタマイズ オプションの追加により、イレブンラボは AI 対話の分野での地位を占めることが期待されます。 Downcodes編集部は今後もその発展に注目していきたいと思います。