في أسئلة وأجوبة Reddit الأخيرة، اعترف الرئيس التنفيذي لشركة OpenAI، سام ألتمان، بأن الافتقار إلى القدرة الحاسوبية هو أحد الأسباب الرئيسية لعدم قدرة الشركة على إطلاق منتجات جديدة بشكل متكرر. وقال إن نماذج الذكاء الاصطناعي الحالية أصبحت أكثر تعقيدًا، وتواجه OpenAI العديد من القيود والقرارات الصعبة بشأن كيفية تخصيص موارد الحوسبة لتحقيق العديد من الأفكار الممتازة.
وفقًا لتقارير متعددة، واجه OpenAI صعوبات في الحصول على بنية تحتية حاسوبية كافية. ونقلت رويترز هذا الأسبوع عن مصادر قولها إن OpenAI تعمل مع Broadcom لتطوير شريحة ذكاء اصطناعي لتشغيل نماذجها، والتي من المتوقع أن تكون متاحة بحلول عام 2026.
نظرًا للقيود المفروضة على قوة الحوسبة، كشف ألتمان أن القدرات المرئية المخطط لها أصلاً في الوضع الصوتي المتقدم لـ ChatGPT لن يتم إطلاقها على المدى القصير. في وقت مبكر من المؤتمر الصحفي الذي عُقد في إبريل/نيسان، أظهرت شركة OpenAI أن تطبيق ChatGPT الخاص بها يعمل على الهواتف الذكية ويمكنه التعرف على المعلومات المرئية مثل الملابس التي يرتديها الأشخاص في مجال رؤية الكاميرا. ومع ذلك، تشير التقارير إلى أن هذا العرض التوضيحي هو محاولة لسرقة انتباه مؤتمر مطوري Google I/O، ويعتقد العديد من موظفي OpenAI الداخليين أن GPT-4o ليس جاهزًا للإعلان عنه.
في الأسئلة والأجوبة، ذكر ألتمان أنه لا يوجد تاريخ لإصدار التحديث الرئيسي التالي لمولد الصور الخاص بـ OpenAI DALL-E. وفي الوقت نفسه، تأخرت أداة Sora لإنشاء الفيديو من OpenAI بسبب الحاجة إلى تحسين النماذج وضمان الأمان وتوسيع قوة الحوسبة. عانت Sora أيضًا من بعض النكسات الفنية، مما جعلها في وضع غير مؤاتٍ أمام المنافسين مثل Luma وRunway.
بالإضافة إلى ذلك، في شهر أكتوبر، غادر تيم بروكس، الرئيس المشارك لشركة Sora، للذهاب إلى Google. ذكر ألتمان في الأسئلة والأجوبة أن OpenAI لا تزال تدرس ما إذا كانت ستسمح بـ "محتوى للبالغين" في ChatGPT، وقال إن الأولوية الحالية للشركة هي تحسين أداء نموذج "الاستدلال" لسلسلة o1 وإصداراته اللاحقة. في مؤتمر DevDay هذا الأسبوع، عرضت OpenAI بعض القدرات الجديدة القادمة، بما في ذلك فهم الصور.
واختتم ألتمان حديثه قائلاً: "سيكون لدينا بعض الإصدارات الجديدة الرائعة التي ستصدر في وقت لاحق من هذا العام، لكننا لن نسميها GPT-5".