أطلقت شركة ElevenLabs، وهي شركة ناشئة تركز على استنساخ الصوت بالذكاء الاصطناعي وواجهة برمجة تطبيقات تحويل النص إلى كلام، مؤخرًا ميزة جديدة: يمكن للمستخدمين إنشاء عملاء ذكاء اصطناعي كامل للمحادثة بشكل مستقل. تتيح هذه الميزة الجديدة للمستخدمين تخصيص العديد من معلمات وكيل المحادثة وفقًا لاحتياجاتهم الخاصة على منصة مطور ElevenLabs، مثل نغمة الصوت وطول الرد وما إلى ذلك، مما يحسن بشكل كبير التخصيص والتطبيق العملي لوكيل الذكاء الاصطناعي. لا تعمل هذه الخطوة على تبسيط عملية إنشاء روبوتات المحادثة فحسب، بل توفر أيضًا للمطورين أدوات أكثر مرونة وقوة لتلبية سيناريوهات التطبيقات المختلفة.
أعلنت شركة ElevenLabs، وهي شركة ناشئة تركز على استنساخ الصوت بالذكاء الاصطناعي وواجهة برمجة تطبيقات تحويل النص إلى كلام، مؤخرًا عن إطلاق ميزات جديدة تتيح للمستخدمين إنشاء وكلاء محادثة كاملين بالذكاء الاصطناعي.
يمكن للمستخدمين الآن تخصيص متغيرات مختلفة لوكيل المحادثة وفقًا لاحتياجاتهم الخاصة على منصة مطوري ElevenLabs، مثل نغمة الصوت وطول الرد.
قدمت ElevenLabs في المقام الأول خدمات مختلفة للكلام وتحويل النص إلى كلام في الماضي. صرح سام سكلار، رئيس قسم النمو في الشركة، لـ TechCrunch أن العديد من العملاء يستخدمون بالفعل النظام الأساسي لإنشاء عملاء الذكاء الاصطناعي للمحادثة. لكن دمج قاعدة المعرفة والتعامل مع انقطاع خدمة العملاء يمثل أكبر التحديات. لذلك قررت شركة ElevenLabs إنشاء خط أنابيب كامل لروبوتات المحادثة لتسهيل هذه العملية.
يمكن للمستخدمين البدء في إنشاء وكلاء محادثة عن طريق تسجيل الدخول إلى حساب ElevenLabs الخاص بهم، أو تحديد قالب، أو إنشاء مشروع جديد. يمكنهم تحديد اللغة الأساسية للوكيل، والرسالة الأولى، ومطالبات النظام لتحديد شخصية الوكيل.
بالإضافة إلى ذلك، يحتاج المطورون إلى اختيار نموذج لغة كبير (مثل Gemini أو GPT أو Claude)، ودرجة حرارة الاستجابة (التي تحدد الإبداع)، وقيود استخدام الرمز المميز.
يمكن للمستخدمين أيضًا إضافة قواعد المعرفة مثل الملفات أو عناوين URL أو الكتل النصية وفقًا لاحتياجاتهم لتعزيز قدرات روبوت المحادثة. وفي الوقت نفسه، يمكنهم دمج نماذج اللغة الكبيرة المخصصة الخاصة بهم مع الروبوت. يتوافق SDK الخاص بـ ElevenLabs مع Python وJavaScript وReact وSwift، وتوفر الشركة أيضًا واجهة برمجة تطبيقات WebSocket لمزيد من التخصيص.
كما تتيح الشركة للمستخدمين تحديد معايير جمع البيانات، مثل الاسم والبريد الإلكتروني للعميل الذي تحدث إلى الوكيل، واستخدام اللغة الطبيعية لتحديد معايير تقييم نجاح المكالمة.
تعمل ElevenLabs على الاستفادة من خط أنابيب تحويل النص إلى كلام الحالي الخاص بها مع تطوير أيضًا إمكانات تحويل الكلام إلى نص لمنتجات المحادثة الجديدة التي تعمل بالذكاء الاصطناعي. حاليًا، لا تقدم الشركة واجهة برمجة تطبيقات منفصلة لتحويل الكلام إلى نص، لكنها قد تطلقها في المستقبل، وبالتالي تتنافس مع واجهات برمجة تطبيقات تحويل الكلام إلى نص الخاصة بشركات مثل Google، وMicrosoft، وAmazon، وكذلك مع تتنافس واجهات برمجة التطبيقات Whisper و AssemblyAI و Deepgram و Speechmatics و Gladia.
وتخطط الشركة لجمع جولة جديدة من التمويل بقيمة تزيد عن 3 مليارات دولار، وتتنافس مع شركات ناشئة أخرى تعمل بالذكاء الاصطناعي الصوتي مثل Vapi وRetell، والتي تقوم أيضًا ببناء وكلاء محادثة. علاوة على ذلك، سوف تتنافس ElevenLabs مع واجهة برمجة التطبيقات للمحادثة في الوقت الفعلي الخاصة بـ OpenAI. ومع ذلك، تعتقد ElevenLabs أن قدرتها على التخصيص والمرونة في تبديل النماذج ستمنحها ميزة على المنافسة.
تسليط الضوء على:
أطلقت ElevenLabs ميزة جديدة لبناء وكلاء الذكاء الاصطناعي للمحادثة والتي تتيح للمستخدمين تخصيص متغيرات متعددة.
يمكن للمستخدمين إضافة قواعد المعرفة لتعزيز قدرات الوكيل ودمج نماذج اللغة الكبيرة المخصصة معهم.
تخطط ElevenLabs لجمع التمويل بقيمة تزيد عن 3 مليارات دولار والتنافس مع منافسين مثل OpenAI.
بشكل عام، توفر قدرات ElevenLabs الجديدة مرونة وراحة غير مسبوقة لبناء وكلاء الذكاء الاصطناعي المخصصين للمحادثة، مما سيدفعها إلى موقع أكثر ملاءمة في سوق الذكاء الاصطناعي شديد التنافسية. في المستقبل، يستحق تطوير ElevenLabs الاهتمام المستمر.