Cognition запустила потрясающий программист искусственного интеллекта Genie, который обогнал Devin и GPT-4 с результатом 30,08% на авторитетной платформе тестирования SWE-Bench, став сильнейшим в мире помощником по программированию искусственного интеллекта. Редактор Downcodes даст вам глубокое понимание технологических прорывов и будущих перспектив Genie.
Стартап Cognition, занимающийся искусственным интеллектом, выпустил нового программиста искусственного интеллекта Genie. Его производительность поразительна. Он мгновенно победил Devin и GPT-4 и стал самым мощным в мире помощником по программированию искусственного интеллекта.
Этот программист искусственного интеллекта набрал 30,08% на авторитетной платформе тестирования SWE-Bench, что намного превышает 13,8% у Devin и 12,47% у Swe-agent+GPT-4.
Вам может быть интересно, как Genie это делает. Еще в декабре 2022 года сооснователь Genie Алистер Пуллен продемонстрировал этот проект в Лондонском университете. Он надеется создать программу искусственного интеллекта, которая сможет автоматически кодировать, отлаживать и оптимизировать, как люди. После более чем года разработки Genie наконец перешла на стадию тестирования и получила начальное финансирование в размере 2,5 миллионов долларов США.
Алистер отметил, что успех Genie тесно связан с данными и методами обучения. В отличие от традиционной точной настройки больших моделей, Genie использует специальный набор данных, включающий в себя процесс рассуждения программистов-людей. Данные охватывают поэтапное открытие знаний и процесс принятия решений на основе конкретных случаев, что позволяет Genie демонстрировать суждение, подобное суждению человека-инженера, когда он сталкивается со сложными проблемами.
Кроме того, Genie также использует уникальный «механизм самосовершенствования». Первоначально Genie обучалась на высококачественных данных и достигла «идеального» состояния, но в процессе Genie не смогла оценить свои собственные ошибки и не смогла улучшиться. Чтобы решить эту проблему, разработчики использовали Genie для создания синтетических данных для дальнейшего обогащения содержания обучения. Это похоже на то, как мать учит своего ребенка ходить и дает ему правильные указания после каждого падения.
После многих итераций обучения способности Джинна значительно улучшились, и он даже может предлагать творческие решения невидимых проблем. Функционально Genie поддерживает множество задач разработки, включая разработку функций, исправление ошибок, рефакторинг кода, тестирование кода и т. д., охватывая десятки языков программирования, таких как JavaScript, Python и Java.
Теперь Genie открыла приложения для пробного использования. Вы можете зарегистрироваться через официальный сайт. Ожидается, что разрешения на тестирование будут выданы в ближайшие несколько недель.
Официальный блог: https://cosine.sh/blog/state-of-the-art.
Адрес опыта: https://cosine.sh/register
Выделять:
Genie набрал 30,08% в тесте SWE-Bench, став сильнейшим в мире программистом искусственного интеллекта.
Используя специальные наборы данных и механизмы самосовершенствования, Genie превосходно справляется со сложным программированием.
? Заявка на пробную версию в настоящее время открыта, и в будущем будут запущены новые неожиданные функции!
Появление Genie знаменует собой новый прорыв в области помощников по программированию с использованием искусственного интеллекта. Его уникальный метод обучения и механизм самосовершенствования заслуживают внимания отрасли. Редактор Downcodes надеется, что Genie в будущем преподнесет разработчикам еще больше сюрпризов!