В недавнем интервью Reddit генеральный директор OpenAI Сэм Альтман признал, что нехватка вычислительных мощностей является одной из основных причин, по которой компания не может часто выпускать новые продукты. Он сказал, что нынешние модели ИИ становятся все более сложными, и OpenAI сталкивается со множеством ограничений и трудными решениями о том, как распределить вычислительные ресурсы для реализации множества прекрасных идей.
Согласно многочисленным сообщениям, OpenAI столкнулась с трудностями в получении достаточной вычислительной инфраструктуры. На этой неделе агентство Reuters со ссылкой на источники сообщило, что OpenAI работает с Broadcom над разработкой чипа искусственного интеллекта для работы своих моделей, который, как ожидается, будет доступен к 2026 году.
Из-за ограничений вычислительной мощности Альтман сообщил, что первоначально запланированные визуальные возможности расширенного голосового режима ChatGPT не будут запущены в ближайшем будущем. Еще на апрельской пресс-конференции OpenAI продемонстрировала, что ее приложение ChatGPT работает на смартфонах и может идентифицировать визуальную информацию, например одежду, которую носят люди, в поле зрения камеры. Однако в отчетах указывается, что эта демонстрация является попыткой переманить внимание конференции разработчиков Google I/O, и многие внутренние сотрудники OpenAI считают, что GPT-4o не готов к обнародованию.
В вопросах и ответах Альтман упомянул, что дата выпуска следующего крупного обновления генератора изображений OpenAI DALL-E неизвестна. Между тем, запуск инструмента OpenAI для генерации видео Sora был отложен из-за необходимости усовершенствовать модели, обеспечить безопасность и расширить вычислительную мощность. Sora также потерпела некоторые технические неудачи, что поставило ее в невыгодное положение по сравнению с такими конкурентами, как Luma и Runway.
Кроме того, в октябре соруководитель Sora Тим Брукс ушел в Google. Альтман упомянул в вопросах и ответах, что OpenAI все еще рассматривает вопрос о том, разрешить ли «контент для взрослых» в ChatGPT, и сказал, что текущим приоритетом компании является улучшение производительности модели «вывода» серии o1 и ее последующих версий. На своей конференции DevDay на этой неделе OpenAI продемонстрировала некоторые новые возможности, включая понимание изображений.
«Позже в этом году у нас выйдет несколько действительно хороших новых версий, но мы не будем называть их GPT-5», — заключил Альтман.