OpenAI على وشك إطلاق إصدار Alpha المرتقب من الوضع الصوتي لمشتركي ChatGPT Plus. وتعتمد هذه الميزة على نموذجها الرائد GPT-4o وتعمل على تحسين تجربة التفاعل الصوتي بشكل كبير. يمكن لنموذج GPT-4o معالجة إدخال الصوت بسرعة قريبة من رد الفعل البشري، ويجمع بين التدريب الشامل لثلاث طرق: النص والرؤية والصوت، مما يدل على أحدث إنجازات OpenAI في مجال الذكاء الاصطناعي متعدد الوسائط. في السابق، تم تأخير طرح هذه الميزة بسبب الحاجة إلى تحسين الإشراف على محتوى النموذج وإنشاء البنية التحتية. لن يحل هذا التحديث مشكلة التأخير المفرط في وضع ChatGPT الصوتي الحالي فحسب، بل سيوفر للمستخدمين أيضًا تجربة محادثة صوتية أكثر سلاسة وطبيعية.
عندما تم إصدار النموذج الرئيسي لشركة OpenAI GPT-4o (o يرمز إلى omni) في شهر مايو، جذبت قدرات فهم الصوت الخاصة به الكثير من الاهتمام. كان نموذج GPT-4o قادرًا على الاستجابة لإدخال الصوت في متوسط 320 مللي ثانية، وهو ما يشبه وقت رد فعل البشر في محادثة نموذجية.
أعلنت OpenAI أيضًا أن ميزة الوضع الصوتي في ChatGPT ستستفيد من القدرات الصوتية لنموذج GPT-4o لتزويد المستخدمين بتجربة محادثة صوتية سلسة. فيما يتعلق بقدرات الكلام لـ GPT-4o، كتب فريق OpenAI:
باستخدام GPT-4o، قمنا بتدريب نموذج جديد تمامًا يقوم بتدريب الأنماط الثلاث للنص والرؤية والصوت من البداية إلى النهاية، أي أن جميع المدخلات والمبالغ تتم معالجتها بواسطة نفس الشبكة العصبية. نظرًا لأن GPT-4o هو نموذجنا الأول الذي يجمع كل هذه الأساليب، فإننا لم نقم إلا بخدش سطح إمكانات نموذجنا وقيوده.
في يونيو، أعلنت OpenAI عن خطط لطرح وضع اللغة المتقدم في ألفا لمجموعة صغيرة من مستخدمي ChatGPT Plus في وقت لاحق، لكن الخطط تأخرت لمدة شهر بسبب الحاجة إلى تحسين قدرة النموذج على اكتشاف محتوى معين ورفضه. . بالإضافة إلى ذلك، تعمل OpenAI على إعداد بنيتها التحتية لتوسيع نطاقها لتشمل ملايين المستخدمين مع الحفاظ على الاستجابة في الوقت الفعلي.
الآن، أكد الرئيس التنفيذي لشركة OpenAI Sam Altman عبر X أنه سيتم طرح إصدار Alpha من الوضع الصوتي لمشتركي ChatGPT Plus بدءًا من الأسبوع المقبل.
الوضع الصوتي الحالي لـ ChatGPT ليس سهل الاستخدام نظرًا لمتوسط تأخير يبلغ 2.8 ثانية (GPT3.5) و5.4 ثانية (GPT-4). سيسمح الوضع الصوتي المتقدم القادم المستند إلى GPT-4o لمشتركي ChatGPT بإجراء محادثات سلسة دون تأخير.
بالإضافة إلى ذلك، أصدرت OpenAI اليوم أيضًا SearchGPT المرتقب، وهي محاولتها الجديدة لتجربة البحث على الويب. يوفر SearchGPT حاليًا، وهو نموذج أولي، إمكانات بحث بالذكاء الاصطناعي يمكنها تقديم إجابات دقيقة بسرعة من مصادر واضحة وذات صلة. يمكنك معرفة المزيد هنا.
بشكل عام، تُظهر سلسلة تحديثات OpenAI قدرتها على مواصلة الابتكار في مجال الذكاء الاصطناعي، وعلى وجه الخصوص، سيؤدي تطبيق نموذج GPT-4o إلى تحسين تجربة المستخدم بشكل كبير، ويبشر إصدار SearchGPT باتجاه جديد لـ. تطوير محرك البحث في المستقبل. ونحن نتطلع إلى المزيد من الابتكارات التكنولوجية المدهشة التي تقدمها OpenAI في المستقبل.