Скачать awesome language model analysis - awesome language model analysis Скачать исходный код

Потрясающий анализ языковой модели

Этот список статей посвящен теоретическому и эмпирическому анализу языковых моделей, особенно больших языковых моделей (LLM). Статьи в этом списке исследуют поведение обучения, способность к обобщению и другие свойства языковых моделей посредством теоретического анализа, эмпирического анализа или их комбинации.

Объем этого списка:

В настоящее время в этом списке основное внимание уделяется моделям на базе трансформатора .
Мы надеемся собрать статьи, посвященные только теоретическому и эмпирическому анализу языковых моделей, а не статьи, направленные на улучшение производительности языковых моделей.

Ограничения этого списка:

Этот список не является исчерпывающим, и мы можем пропустить некоторые очень важные статьи.
Этот список еще не очень хорошо организован, и нам, возможно, придется его реорганизовать в будущем.
Некоторые популярные темы, такие как машиностроение, зондирование и интерпретируемость, еще недостаточно освещены.

Статистика этого списка бумаг:

Общее количество различных работ: 550
Более подробную статистику можно найти в конце этой страницы.

Если у вас есть какие-либо предложения или вы хотите внести свой вклад, пожалуйста, не стесняйтесь открыть проблему или запрос на включение.

Подробную информацию о том, как внести свой вклад, можно найти в правилах внесения вклада.

Вы также можете поделиться своими мыслями и обсудить их с другими в обсуждениях.

Примечание

Для версии без категории, пожалуйста, обратитесь сюда.

Содержание

Потрясающий анализ языковой модели
Содержание
- Феномены интереса
  - Контекстное обучение
  - Цепочка мыслей
  - Галлюцинация
  - Обратное проклятие
  - Законы масштабирования/Эмерджентные способности/Гроккинг/и т.д.
  - Знания/Механизмы памяти
  - Динамика обучения/Пейзаж/Оптимизация/Точная настройка/и т.д.
  - Обучение/Обобщение/Рассуждение/Обобщение от слабого до сильного
  - Другие явления/открытия
- Представительский потенциал
  - Что может трансформатор? / Свойства трансформатора
  - Чего не может трансформатор? / Ограничение трансформатора
- Архитектурная эффективность
  - Нормализация слоев
  - Токенизация/встраивание
  - Линейное внимание/Модели пространства состояний/Рекуррентные языковые модели/и т.д.
- Парадигмы обучения
- Машиностроение/Измерение/Интерпретируемость
- Разное

Феномены интереса

^ back to top ^

Категории, посвященные различным явлениям, свойствам и поведению, наблюдаемым в моделях большого языка (LLM) и моделях на основе преобразователей.

Контекстное обучение

^ back to top ^

Статьи, посвященные теоретическому и эмпирическому анализу контекстного обучения в больших языковых моделях.