Недавно, казалось бы, простой вопрос математического сравнения «Что больше, 13,8 или 13,11?» поставил в тупик многих людей, в том числе некоторые продвинутые модели ИИ. Редактор Downcodes поможет вам углубиться в этот инцидент, проанализировать недостатки ИИ в решении проблем здравого смысла и направления будущих улучшений. Это не только раскрывает ограничения технологии искусственного интеллекта, но и заставляет людей задуматься о будущем развитии искусственного интеллекта.
Недавно простой математический вопрос — что больше, 13,8 или 13,11? — не только поставил в тупик некоторых людей, но и создал проблемы для многих больших языковых моделей (LLM). Этот вопрос вызвал широкую дискуссию о способности ИИ решать проблемы здравого смысла.
В известном варьете этот вопрос вызвал бурные дискуссии среди пользователей сети. Многие думают, что 13,11% должно быть больше, чем 13,8%, но на самом деле 13,8% больше.
Исследователь AI2 Линь Юйчэнь обнаружил, что даже большие языковые модели, такие как GPT-4o, допускают ошибки в этой простой задаче сравнения. GPT-4o ошибочно полагал, что 13,11 больше, чем 13,8, и дал неправильное объяснение.
Открытие Линь Юйчэня быстро вызвало бурные дискуссии в сообществе ИИ. Многие другие большие языковые модели, такие как Gemini, Claude3.5Sonnet и т. д., также допускают ту же ошибку в этой простой задаче сравнения.
Возникновение этой проблемы показывает, с какими трудностями может столкнуться ИИ при выполнении задач, которые кажутся простыми, но на самом деле требуют точных числовых сравнений.
Хотя искусственный интеллект добился значительного прогресса во многих областях, таких как понимание естественного языка, распознавание изображений и принятие сложных решений, он все еще может совершать ошибки, когда дело касается основных математических операций и логических рассуждений, что показывает ограничения современных технологий.
Почему ИИ совершает такие ошибки?
Смещение в данных обучения. Данные обучения для модели ИИ могут не содержать достаточно примеров для правильного решения этого конкретного типа задачи численного сравнения. Если во время обучения модель подвергается воздействию данных, которые в первую очередь указывают на то, что большие числа всегда имеют больше десятичных знаков, она может неправильно интерпретировать большее количество десятичных знаков как большие значения.
Проблемы точности чисел с плавающей запятой. В информатике представление и вычисление чисел с плавающей запятой связано с проблемами точности. Даже небольшие различия могут привести к ошибочным результатам при сравнении, особенно если точность не указана явно.
Недостаточное понимание контекста. Хотя ясность контекста может не быть серьезной проблемой в этом случае, моделям ИИ часто необходимо правильно интерпретировать информацию на основе контекста. Недоразумения могут возникнуть, если вопрос сформулирован недостаточно ясно или не соответствует шаблонам, общим для ИИ в обучающих данных.
Влияние оперативного дизайна: то, как вы задаете вопросы ИИ, имеет решающее значение для получения правильного ответа. Различные методы допроса могут повлиять на понимание ИИ и точность ответов.
Как улучшить?
Улучшенные данные обучения. Предоставляя более разнообразные и точные данные обучения, модели ИИ могут помочь лучше понять числовые сравнения и другие основные математические концепции.
Оптимизируйте структуру подсказок. Хорошо продуманная формулировка задачи может повысить вероятность того, что ИИ даст правильный ответ. Например, использование более явных числовых представлений и методов опроса может уменьшить двусмысленность.
Повысьте точность числовой обработки: разработайте и внедрите алгоритмы и методы, которые более точно обрабатывают операции с плавающей запятой, чтобы уменьшить вычислительные ошибки.
Расширенные возможности логического рассуждения и рассуждения на основе здравого смысла. Благодаря обучению, специально ориентированному на логические рассуждения и рассуждения на основе здравого смысла, возможности ИИ в этих областях расширяются, что позволяет ему лучше понимать и решать задачи, связанные со здравым смыслом.
В целом, недостатки, выявленные ИИ при решении простых задач математического сравнения, напоминают нам, что технология ИИ все еще находится на стадии разработки и нуждается в постоянном совершенствовании и совершенствовании. В будущем, оптимизируя данные обучения, улучшая алгоритмы и расширяя возможности логического рассуждения, ИИ добьется большего прогресса в решении проблем здравого смысла.