Хронология ChatGPT, GenerativeAI и LLM
В этом репозитории организована временная шкала ключевых событий (продуктов, услуг, статей, GitHub, сообщений в блогах и новостей), которые произошли до и после объявления ChatGPT.
На этой временной шкале он курирует различную информацию, уделяя особое внимание LLM и генеративному искусственному интеллекту.
Возможно, это сцена из самой горячей истории, поэтому я подумал, что будет важно сохранить эти воспоминания, поэтому я их систематизировал.
Статистика
Эти диаграммы были созданы интерпретатором кода ChatGPT.
Содействие
Мы очень ценим проблемы и запросы на включение. Если вы никогда раньше не участвовали в проекте с открытым исходным кодом, я более чем рад рассказать вам, как создать запрос на включение.
Вы можете начать с открытия вопроса, описывающего проблему, которую вы хотите решить, и мы продолжим дальше.
Эмодзи
arXiv, PDF?, arxiv-vanity?, бумажная страница?, статьи с кодом ✳️, Github
Лицензия
Этот документ доступен по лицензии MIT © Jonghong Jeon (전종홍)
Хронология V2
2024 год
- 17 мая — OpenAI заключает сделку с Reddit, чтобы обучить свой ИИ работе с вашими сообщениями
(Новости), - 17 мая — OpenAI распускает команду, занимающуюся долгосрочными рисками ИИ, менее чем через год после объявления об этом
(Новости), - 17.05 – Международный научный доклад о безопасности передового искусственного интеллекта
(Блог), - 16 июля – TRANSIC: перенос политики из симуляционной модели в реальную путем обучения на основе онлайн-коррекции
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 16 мая — Toon3D: взгляд на мультфильмы с новой точки зрения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 16.05 - Проверка надежности модели большого языка на основе искусственного интеллекта для извлечения экологической информации из научной литературы
(Новости), - 16 мая – Многоэтапное контекстное обучение в мультимодальных базовых моделях
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 16.05. Как нажать на паузу в работе ИИ, пока не стало слишком поздно
(Новости), - 16.05 - Заземление DINO 1.5: Продвиньте «край» обнаружения открытых объектов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 16 мая — Майнинг и анализ магазина GPT
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 16 мая — Dual3D: эффективное и последовательное преобразование текста в 3D с помощью двухрежимной многопроекционной скрытой диффузии
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 16 мая — Хамелеон: смешанные модальные модели Early-Fusion Foundation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 16 мая — CAT3D: создавайте что угодно в 3D с помощью многопроекционных диффузионных моделей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 15 мая — Xmodel-VLM: простая базовая версия для языковой модели мультимодального видения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 15 мая — LoRA меньше учится и меньше забывает
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 15 мая – Невидимый водяной знак Google с искусственным интеллектом поможет распознавать генеративный текст и видео
(Новости), - 15 мая – Google I/O 2024: все объявлено
(Блог), - 15 мая — BEHAVIOR Vision Suite: создание настраиваемого набора данных посредством моделирования
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 15 мая – ALPINE: раскрытие возможностей планирования авторегрессионного обучения в языковых моделях
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 14 05 – Понимание разницы в производительности между онлайн- и офлайн-алгоритмами выравнивания
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 14 мая — SpeechVerse: крупномасштабная обобщаемая модель аудиоязыка
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 14 мая – SpeechGuard: исследование состязательной устойчивости мультимодальных моделей большого языка
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 14 05 – Не теряйте времени: используйте время для понимания мобильного видео
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 14 мая - Hunyuan-DiT: мощный диффузионный преобразователь с несколькими разрешениями и детальным пониманием китайского языка
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 14 05 – Композиционная генерация текста в изображение с использованием плотных представлений Blob
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 14.05. За пределами законов масштабирования: понимание производительности трансформатора с помощью ассоциативной памяти
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 13 мая - SambaNova SN40L: масштабирование стены памяти искусственного интеллекта с помощью потока данных и состава экспертов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 13 мая — Рабочий процесс RLHF: от моделирования вознаграждений к онлайн-RLHF
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 13 мая — Plot2Code: комплексный тест для оценки мультимодальных моделей большого языка при генерации кода на основе научных графиков
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 13 мая – OpenAI представляет новейшую модель искусственного интеллекта GPT-4o
(Новости), - 13 мая — Веб-поиск MS MARCO: крупномасштабный информативный набор веб-данных с миллионами реальных меток кликов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 13.05. Сколько исследований проводится с использованием больших языковых моделей?
(Блог), - 13.05 — Привет GPT-4o
(Блог), - 13 05 – Coin3D: создание управляемых и интерактивных 3D-активов с кондиционированием под управлением прокси-сервера
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 11.05. Piccolo2: общее встраивание текста с помощью многозадачного гибридного обучения потерям
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 11 мая — LogoMotion: визуально обоснованная генерация кода для контентно-зависимой анимации
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 10 мая - INSPECT - Платформа с открытым исходным кодом для оценки больших языковых моделей.
(Блог), - 10 мая – Институт безопасности ИИ выпускает новую платформу оценки безопасности ИИ
(Новости), - 07.05 - SUTRA: Архитектура масштабируемой многоязычной языковой модели
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 07.05 — Мета-релизы Llama 3 с открытым исходным кодом LLM
(Новости), - 03/05 - Что важно при построении моделей языка видения?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 02.05 – WildChat: 1 млн журналов взаимодействия ChatGPT в дикой природе
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 02 05 — StoryDiffusion: постоянное внимание к созданию изображений и видео на большие расстояния
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 02.05 — «Прометей 2»: языковая модель с открытым исходным кодом, специализирующаяся на оценке других языковых моделей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 02.05 - NeMo-Aligner: масштабируемый набор инструментов для эффективного выравнивания модели
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 02.05 - LLM-AD: Система описания аудио на основе большой языковой модели
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 02.05. FLAME: Согласование больших языковых моделей с учетом фактов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 02 05 – Настройка моделей преобразования текста в изображение с помощью одной пары изображений
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 01.05. Спектрально сокращенные гауссовы поля с нейронной компенсацией
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 01.05 - Оптимизация предпочтений самостоятельной игры для согласования языковой модели
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 01/05 – Всегда ли больший размер пакета редактирования лучше? -- Эмпирическое исследование редактирования моделей с помощью Llama-3.
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 01.05. Клевер: регрессивное упрощенное спекулятивное декодирование с последовательным знанием
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 01/05 – Тщательное исследование производительности модели большого языка по арифметике в начальной школе
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30 апреля — Визуальная проверка фактов: включение создания высококачественных подробных подписей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30 апреля – STT: отслеживание состояния с помощью трансформаторов для автономного вождения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30 апреля — SemantiCodec: семантический аудиокодек со сверхнизким битрейтом для общего звука
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30.04 - Octopus v4: График языковых моделей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30 апреля — MotionLCM: генерация управляемого движения в реальном времени с помощью модели скрытой согласованности
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30 апреля — MicroDreamer: создание 3D-изображений с нуля за sim20 секунд с помощью итеративной реконструкции на основе оценок
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30 апреля — Lightplane: высокомасштабируемые компоненты для нейронных 3D-полей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30 апреля - КАН: Колмогоров-Арнольд Нетворкс
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30 апреля — Оптимизация предпочтений итеративного рассуждения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30 апреля — Невидимый стежок: создание плавных 3D-сцен с помощью прорисовки глубины
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30 апреля – InstantFamily: замаскированное внимание для создания изображений с несколькими идентификаторами с нулевым выстрелом
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30 апреля — GS-LRM: Большая модель реконструкции для 3D-гауссовского разбрызгивания
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30 апреля — Расширение контекста Ламы-3 за ночь в десять раз
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30 апреля - DOCCI: Описания связанных и контрастирующих изображений
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30 апреля — Улучшение и ускорение моделей большого языка с помощью прогнозирования нескольких токенов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 29 апреля — Стилус: автоматический выбор адаптера для диффузионных моделей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 29 апреля — SAGS: трехмерное гауссовское разбрызгивание с учетом структуры
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 29 апреля - Замена судей присяжными: оценка поколений LLM с помощью группы разнообразных моделей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 29 апреля — Профиль генеративного ИИ NIST AI RMF
(Новости), - 29 апреля — LoRA Land: 310 доработанных LLM, конкурирующих с GPT-4, технический отчет
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 29 апреля — Кенгуру: самоспекулятивное декодирование без потерь с помощью двойного раннего выхода
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 29.04 - Возможности моделей Gemini в медицине
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 28 апреля — Paint от Inpaint: учимся добавлять объекты изображения, сначала удаляя их
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 28 апреля - LEGENT: Открытая платформа для воплощенных агентов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 27 апреля — Ag2Manip: изучение новых навыков манипулирования с помощью агентно-агностических визуальных представлений и представлений действий
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 26 апреля — MaPa: Текстовое фотореалистичное рисование материалов для 3D-фигур
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 26 апреля — BlenderAlchemy: редактирование 3D-графики с помощью моделей на языке Vision
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 25 апреля – Технический отчет Tele-FLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 25 апреля - SEED-Bench-2-Plus: Сравнительный анализ мультимодальных моделей большого языка с визуальным восприятием большого количества текста
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 25 апреля – Возобновление оценки преобразования текста в изображение с помощью Gecko: метрики, подсказки и человеческие рейтинги
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 25 апреля — PLLaVA: расширение LLaVA без параметров для преобразования изображений в видео для плотных субтитров к видео
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 25 апреля — Заставьте свой LLM полностью использовать контекст
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 25 апреля — Перечислите элементы один за другим: новый источник данных и парадигма обучения для мультимодальных программ LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 25 апреля — Пропуск слоя: включение раннего вывода и самоспекулятивного декодирования
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 25 апреля — Interactive3D: создавайте то, что хотите, с помощью интерактивной генерации 3D
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 25 апреля — Как далеко мы до GPT-4V? Устранение разрыва с коммерческими мультимодальными моделями с помощью пакетов с открытым исходным кодом
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 25 апреля — ConsistentID: создание портрета с мультимодальным детальным сохранением идентичности
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24 апреля — XC-Cache: перекрестное обращение к кэшированному контексту для эффективного вывода LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24 апреля – Этика продвинутых ИИ-помощников
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24 апреля — PuLID: настройка идентификаторов Pure и Lightning посредством контрастного выравнивания
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24 апреля — NeRF-XL: масштабирование NeRF с помощью нескольких графических процессоров
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24 апреля — MotionMaster: передача движения камеры для создания видео без обучения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24 апреля – Mode: Эксперты по данным CLIP через кластеризацию
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24 апреля — MMT-Bench: комплексный мультимодальный тест для оценки больших моделей языка видения в направлении многозадачного AGI
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24 апреля — MaGGIe: управляемое постепенное матирование человеческого экземпляра в маске
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24 апреля — ID-Aligner: улучшение генерации преобразования текста в изображение с сохранением идентичности с помощью обучения с обратной связью
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24.04 — Редактируемые элементы изображения для управляемого синтеза
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24 апреля — CatLIP: точность визуального распознавания на уровне CLIP с ускорением в 2,7 раза предварительного обучения на изображениях и текстовых данных в веб-масштабе
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24 апреля — BASS: пакетное спекулятивное сэмплирование, оптимизированное по вниманию
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 23 апреля — Трансформеры могут представлять n-граммные языковые модели
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 23 апреля — Технический отчет Pegasus-v1
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 23.04 - Смешанная команда экспертов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 23 апреля — FlashSpeech: эффективный синтез речи с нулевым выстрелом
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 22 апреля - SnapKV: LLM знает, что вы ищете, еще до генерации
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 22 апреля - SEED-X: Мультимодальные модели с унифицированным пониманием и генерацией многоуровневой структуры
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 22 апреля - Реконструкция координат сцены: постановка коллекций изображений посредством постепенного обучения релокализатора
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 22 апреля — Технический отчет Phi-3: высокопроизводительная языковая модель локально на вашем телефоне
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 22 апреля — OpenELM: эффективное семейство языковых моделей с открытым исходным кодом для обучения и платформы вывода
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 22 апреля – MultiBooth: как создать все ваши концепции в изображении из текста
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 22.04 — Обучение управлению передвижением H-Infinity
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 22 апреля — Насколько хороши низкобитовые квантованные модели LLaMA3? Эмпирическое исследование
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 22 апреля - Согласуйте свои шаги: оптимизация графиков отбора проб в моделях диффузии
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 22 апреля – Мультимодальный автоматизированный агент интерпретации
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 21 апреля – Hyper-SD: модель согласованности сегментированных траекторий для эффективного синтеза изображений
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 21 апреля — AdvPrompter: быстрые адаптивные состязательные подсказки для LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 20 апреля – Модели согласованности музыки
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 19.04 – Иерархия инструкций: обучение преподавателей LLM расставлять приоритеты привилегированных инструкций
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 19 апреля — TextSquare: масштабирование настройки текстовых визуальных инструкций
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 19.04 — PhysDreamer: физическое взаимодействие с 3D-объектами посредством генерации видео
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 19 апреля — LLM-R2: расширенная система перезаписи на основе правил для большой языковой модели для повышения эффективности запросов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 19.04 — Насколько реально? Система человеческой оценки для неограниченных состязательных примеров
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 19.04. Как далеко мы можем зайти с практическим восстановлением программ на функциональном уровне?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 19 апреля — Groma: локализованная визуальная токенизация для обоснования мультимодальных моделей большого языка
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 19.04. Требуется ли для гауссовского сплаттинга инициализация SFM?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 19 апреля — AutoCrawler: продвинутый веб-агент для создания веб-сканеров
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 18 апреля - TriForce: ускорение генерации длинных последовательностей без потерь с помощью иерархического спекулятивного декодирования
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 18 апреля - На пути к самосовершенствованию LLM через воображение, поиск и критику
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 18 апреля – Повторное использование ваших вознаграждений: перенос модели вознаграждения для межъязыкового выравнивания с нулевым выстрелом
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 18 апреля — Reka Core, Flash и Edge: серия мощных мультимодальных языковых моделей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 18 апреля — OpenBezoar: небольшие, экономичные и открытые модели, обученные на сочетании данных инструкций
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 18.04 - MeshLRM: Большая модель реконструкции для высококачественной сетки
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 18 апреля — Представляем версию 0.5 теста AI Safety Benchmark от MLCommons
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 18.04 — Представляем Meta Llama 3: наиболее функциональную на сегодняшний день общедоступную LLM
(Блог), - 18 апреля — EdgeFusion: генерация текста в изображение на устройстве
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 18 апреля – BLINK: Мультимодальные модели большого языка могут видеть, но не воспринимать
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 18 апреля — AniClipart: анимация клипартов с преобразованием текста в видео
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 17.04. – МОА: сочетание внимания для распутывания предмета и контекста при создании персонализированных изображений
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 17.04 — FlowMind: автоматическое создание рабочих процессов с помощью LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 17.04 — Динамическая типографика: воплощение слов в жизнь
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 17.04 — Доступен API Stable Diffusion 3
(Твиттер), (Блог), (Демо), - 16 апреля — VASA-1: реалистичные говорящие лица, управляемые звуком, генерируемые в реальном времени
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 16 апреля – Министр торговли США Джина Раймондо объявляет о расширении руководящего состава Института безопасности искусственного интеллекта США.
(Новости), - 16.04 - Генерация длинной музыки со скрытой диффузией
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 15 апреля - Оценщики LLM признают и отдают предпочтение своим поколениям
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 15 апреля — Video2Game: интерактивная, реалистичная и совместимая с браузером среда в реальном времени из одного видео
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 15 апреля — Танго 2: Согласование генерации текста в аудио на основе диффузии посредством оптимизации прямых предпочтений
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 15 апреля - Укрощение модели скрытой диффузии для рисования нейронного поля излучения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 15 апреля — Opus может работать как машина Тьюринга
(твиттер), - 15 апреля – MathGPT: использование Llama 2 для создания платформы для персонализированного обучения
- 15 апреля — HQ-Edit: высококачественный набор данных для редактирования изображений на основе инструкций
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 15 апреля — Ctrl-Adapter: эффективная и универсальная платформа для адаптации разнообразных элементов управления к любой модели распространения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 15.04. Сжатие представляет интеллект линейно
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 15 апреля — CompGS: эффективное представление 3D-сцен с помощью сжатых гауссовских пятен
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 14 апреля — TextHawk: исследование эффективного детального восприятия мультимодальных моделей большого языка
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 13 апреля — Кэти Вуд Маскулс вступает в бум ChatGPT с новой долей OpenAI
(Новости), - 12.04. Масштабирование (вниз) CLIP: комплексный анализ данных, архитектуры и стратегий обучения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 12 апреля – Исследование 3D-модели Visual Foundation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 12.04 — Предварительное обучение малых базовых LM с меньшим количеством жетонов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 12.04 - Об устойчивости языкового руководства для задач низкого уровня зрительного восприятия: результаты оценки глубины
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 12 апреля — MonoPatchNeRF: улучшение полей нейронного излучения с помощью монокулярного наведения на основе патчей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 12 апреля — Мегалодон: эффективное предварительное обучение LLM и вывод с неограниченной длиной контекста
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 12.04. Изменяет ли ChatGPT стиль письма ученых?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 12.04 – COCONut: Модернизация сегментации COCO
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 12 апреля — Чип искусственного интеллекта сокращает энергетический бюджет более чем на 99 процентов
(Новости), - 12.04 - AdaptSwap: непрерывное обучение LLM с гарантиями удаления данных и контроля доступа
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 12.04 — Обзор видения Грок-1.5
(Демо), - 12.04 – Хороший, плохой и гуманный значок
(Новости), - 12 апреля. Пользователи платного ChatGPT теперь могут получить доступ к GPT-4 Turbo.
(твиттер), (Новости), , () - 11 апреля - Необходимость советов по аудиту ИИ
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 11.04. Трансформатор памяти для непрерывного обучения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 11 апреля – Amazon вводит в свой совет директоров Эндрю Нг, ведущего специалиста в области искусственного интеллекта.
(Новости), - 11 апреля — Adobe покупает видео по 3 доллара в минуту для создания модели искусственного интеллекта
(Новости), - 11 апреля - UltraEval: легкая платформа для гибкой и комплексной оценки для студентов LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 11.04. Переносимая и принципиальная эффективность сегментации открытого словаря
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 11.04 - SWE-агент
(твиттер), (Демо), , () - 11.04 — Редкий Лейнформер
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 11.04 — Rho-1: не все токены — то, что вам нужно
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 11 апреля - ResearchAgent: Итеративная генерация исследовательских идей на основе научной литературы с использованием больших языковых моделей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 11 апреля - RecurrentGemma: отказ от трансформаторов для создания эффективных моделей открытого языка
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 11 апреля - OSWorld: Сравнительный анализ мультимодальных агентов для задач открытого типа в реальных компьютерных средах
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 11.04. LLoCO: изучение длинных контекстов в автономном режиме
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 11 апреля – Использование больших языковых моделей (LLM) для поддержки совместной аннотации данных о рисках в режиме реального времени между человеком и искусственным интеллектом
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 11 апреля – JetMoE: достижение производительности Llama2 за 0,1 миллиона долларов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) (Проект), (twitter), , (✳️), () - 11 апреля — HGRN2: закрытые линейные RNN с расширением состояний
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 11.04 – От слов к числам: ваша большая языковая модель тайно может стать эффективным регрессором, если дать ей примеры из контекста
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 11.04 — Ferret-v2: улучшенная основа для ссылок и обоснования с помощью больших языковых моделей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 11.04. ControlNet++: улучшение условных элементов управления с помощью эффективной обратной связи по согласованности
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 11.04. Контекстно-зависимое обнаружение видеоаномалий в долгосрочных наборах данных
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 11 апреля — ChatGPT-3.5, Клод 3 надрал пиксельную задницу в турнире Street Fighter III для LLM
(Новости), - 11.04. ChatGPT может предсказывать будущее, рассказывая истории, происходящие в будущем, о прошлом
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 11 апреля – Передовой опыт и уроки, извлеченные из синтетических данных для языковых моделей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 11 апреля — Оцените степень LLM, сражаясь в Street Fighter 3
(Демо), , () - 11 апреля — Аудио диалоги: набор данных диалогов для понимания аудио и музыки
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 11.04. Применение рекомендаций в ограниченном интервале улучшает качество выборки и распределения в диффузионных моделях
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 11 апреля - AmpleGCG: изучение универсальной и переносимой генеративной модели состязательных суффиксов для взлома как открытых, так и закрытых LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 10 апреля - Инструмент прозрачности LM: интерактивный инструмент для анализа языковых моделей трансформаторов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 10 апреля — Gemini 1.5 Pro теперь понимает звук
(твиттер), - 10 апреля – Исследование глубины концепций: как большие языковые модели приобретают знания на разных уровнях?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 10 апреля — Urban Architect: создание управляемой городской 3D-сцены с предварительной компоновкой
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 10 апреля — RealmDreamer: создание 3D-сцен на основе текста с использованием Inpainting и Depth Diffusion
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 10 апреля – OpenAI и Meta близки к выпуску моделей ИИ, способных рассуждать как люди, говорится в отчете
(Новости), - 10 апреля — MetaCheckGPT — многозадачный детектор галлюцинаций, использующий неопределенность LLM и метамодели
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 10 апреля — Meta подтверждает, что в следующем месяце выйдет Llama 3 с открытым исходным кодом.
(Новости), - 10 апреля — Не оставляйте контекст позади: эффективные преобразователи бесконечного контекста с бесконечным вниманием
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 10 апреля – Инкрементальный XAI: незабываемое понимание ИИ с пошаговыми объяснениями
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 10 апреля — DreamScene360: неограниченное преобразование текста в 3D-сцены с панорамным распределением по Гауссу
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 10.04 — Содержит ли тофу в Мапо кофе кофе? Исследование LLM на предмет культурных знаний, связанных с едой
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 10 апреля – BRAVE: Расширение визуального кодирования моделей языка видения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 10 апреля – Стартап Mistral, занимающийся искусственным интеллектом, запускает модель искусственного интеллекта емкостью 281 ГБ, способную конкурировать с OpenAI, Meta и Google
(Новости), - 10 апреля - Генеративная семантическая связь, управляемая агентом, для удаленного наблюдения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 10.04. Адаптация декодера LLaMA к Vision Transformer
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 10 апреля – Исследование об интеграции генеративного искусственного интеллекта для критического мышления в мобильных сетях
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 09.04 - Взгляните на это! Переосмысление способа оценки джейлбрейка языковой модели
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 09.04 – RULER: Каков реальный размер контекста ваших языковых моделей с длинным контекстом?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 09.04 – Пересмотр уплотнения в методе гауссовского разбрызгивания
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 09.04 - Реконструкция ручных объектов в 3D
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 09.04 - RAR-b: рассуждение как эталон поиска
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 09.04 – Оперативная инженерия по сохранению конфиденциальности: опрос
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 09.04 - Об оценке эффективности исходного кода, генерируемого LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 09.04 — Технический отчет OmniFusion
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 09.04 — MuPT: генеративный преобразователь символьной музыки с предварительной подготовкой
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 09.04 - MiniCPM: раскрытие потенциала моделей малого языка с помощью масштабируемых стратегий обучения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 09.04 — Magic-Boost: Ускорьте генерацию 3D-изображений с помощью условного рассеяния Mutli-View
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 09.04 - LLM2Vec: Большие языковые модели являются мощными кодировщиками текста
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 09.04 — InternLM-XComposer2-4KHD: новаторская модель большого визуального языка, поддерживающая разрешения от 336 пикселей до 4K HD
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 09.04 - Hash3D: ускорение создания 3D без обучения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 09.04 – Google представляет проекты с открытым исходным кодом для генеративного искусственного интеллекта
(Новости), - 09.04 - Слоны никогда не забывают: запоминание и изучение табличных данных в больших языковых моделях
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 09.04 — Apple только что представила новую LLM Ferret-UI — этот ИИ может читать экран вашего iPhone
(Новости), - 09.04 - AEGIS: онлайн-модерация безопасности контента с помощью адаптивного искусственного интеллекта с ансамблем экспертов LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 08.04 - YaART: еще одна технология ART-рендеринга
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 08 апреля – WILBUR: Адаптивное контекстное обучение для надежных и точных веб-агентов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 08.04 - UniFL: Улучшите стабильное распространение с помощью унифицированного обучения с обратной связью
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 08.04 - Необузданный Икар: обзор потенциальных опасностей ввода изображений в безопасности мультимодальной модели большого языка
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 08 апреля — Таблица лидеров галлюцинаций — открытая попытка измерить галлюцинации с помощью больших языковых моделей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 08.04 - Проблема выбора фактов при восстановлении программ на основе LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 04/08 - Swapanything: Включение произвольного обмена объекта в персонализированном визуальном редактировании
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/08 - Sambalingo: преподавание на больших языковых моделях новые языки
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/08 - Оптимизация отрицательных предпочтений: от катастрофического коллапса до эффективного отключения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/08 - Naver дебютирует с многоязычным Hyperclova x LLM. Он будет использовать для создания суверенного искусственного интеллекта для Азии
(Новости), - 04/08 - MOMA: мультимодальный адаптер LLM для быстрого персонализированного генерации изображений
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/08 - MedExpqa: многоязычное сравнительный анализ больших языковых моделей для ответа на медицинский вопрос
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/08- MA-LMM: авторская большая мультимодальная модель для долгосрочного понимания видео
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/08 - Layoutllm: Настройка инструкций с макетом с большими языковыми моделями для понимания документов
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/08 - Ferret -UI: заземленное понимание мобильного пользовательского интерфейса с помощью мультимодальных LLMS
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/08 - Оценка интервенционных возможностей рассуждений крупных языковых моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/08 - Eagle and Finch: RWKV с матричными состояниями и динамическим рецидивом
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/08 - Codeclm: выравнивание языковых моделей с индивидуальными синтетическими данными
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/08 - Autocoderover: Автономное улучшение программы
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/07 - TimeGPT в прогнозировании нагрузки: большая модель временных рядов
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/07 - OpenAI транскрибируется более миллиона часов видео на YouTube для обучения GPT -4
(Новости), - 04/07 - Magictime: модели генерации видеороликов в качестве метаморфических симуляторов
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/07 - Byteedit: повысить, соблюдать и ускорить редактирование генеративного изображения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/06 - Большинство голосования врачей улучшают уместность зависимости ИИ в патологии
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss) - 04/06- Диффузия-RWKV: масштабирование RWKV-подобных архитектур для диффузионных моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/06- Datenerf: Текстовое редактирование на основе глубины.
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/06- За пределами Scene: генерация сцены с высоким разрешением с предварительной диффузией с предварительной диффузией
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/06 - Выравнивающиеся диффузионные модели путем оптимизации человеческой утилиты
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/06 - Случай для разработки модели фундамента для планирования, подобных задачам с нуля
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/05 - Повышенные уязвимости LLM от тонкой настройки и квантования
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/05 - SpatialTracker: отслеживание любых 2D пикселей в 3D -пространстве
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/05 - Обучение социальным навыкам с большими языковыми моделями
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/05 - Sigma: Siamese Mamba Network для мультимодальной семантической сегментации
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/05 - надежное гауссовое раскол
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/05 - Physavatar: изучение физики одетых 3D -аватаров из визуальных наблюдений
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/05- Koala: ключевой кадр с кондиционером Long Video-LLM
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/05 - Подсказка: оценка понимания клинического языка для LLMS
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/05 - Китайский крошечный LLM: предварительно подготовка китайской модели большой языка
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/05 - Помощь людям в сложных сравнениях: автоматическое сравнение информации в масштабе
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/04 - воплощенный ИИ с двумя руками: нулевое обучение, безопасность и модульность
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss) - 04/04 - Эволюция языковой модели: итерационная перспектива обучения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/04- Визуализация мыслей вызывает пространственные рассуждения в моделях крупных языков
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss) (Twitter), - 04/04 - Нет "нулевого выстрела" без экспоненциальных данных: предварительная концепция частота определяет производительность мультимодальной модели
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/04 - Оценка LLMS при обнаружении ошибок в ответах LLM
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/04 - Оценка моделей генеративных языков в извлечении информации как субъективная коррекция вопросов
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/04 - Прямая оптимизация NASH: модели преподавания языка для самостоятельной работы с общими предпочтениями
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/04- CBR-RAG: Рассуждение на основе случаев для получения добычи в поисках в LLMS для ответа на юридический вопрос
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/04 - Возможности крупных языковых моделей в управлении инженерией: эталонное исследование GPT -4, Claude 3 Opus и Gemini 1.0 Ultra
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/04 - Canttalkaboutis: выравнивание языковых моделей, чтобы оставаться на теме в диалогах
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/04 - Autowebglm: Bootstrap и подкрепление большого агента веб -навигации на основе моделей на основе моделей.
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/04 - Обучение LLMS над сжатым текстом невропейски
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/04 - Reft: Prevation Cenetuning для языковых моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/04- Red Teaming GPT-4V: безопасны ли GPT-4V против атак Uni/Multi-Modal Jailbreak?
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/04- RALL-E: Надежное моделирование языка кодека с помощью цепочки мыслей для синтеза текста в речь
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/04 - PointInfinity: модели диффузии -точки с разрешением.
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/04- Minigpt4-Video: продвижение мультимодальных LLM для понимания видео с чередующимися визуальными текстовыми токенами
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/04- Comat: Выравнивание диффузионной модели текста к изображению с сопоставлением концепции с изображением в тексте
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/04 - CodeeditorTorbench: оценка возможностей редактирования кода крупных языковых моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/04 - Autowebglm: Bootstrap и подкрепление большого агента веб -навигации на основе моделей на основе моделей.
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/03 - Визуальное авторегрессивное моделирование: масштабируемое генерация изображений с помощью следующего предсказания
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/03- О масштабируемости генерации на основе диффузии.
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/03 - многократный джейлбрейк
() - 04/03- LVLM-Intrepret: инструмент интерпретации для больших моделей языка зрения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/03 - Языковые модели как компиляторы: моделирование выполнения псевдокода улучшает алгоритмические рассуждения в языковых моделях
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/03- InstantStyle: Бесплатный обед для обеспечения стиля в генерации текста к изображению
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/03 - Freditor: высокая точка и передаваемое редактирование NERF путем разложения частоты
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/03- Поперечное внимание делает вывод громоздким в диффузионных моделях текста до изображения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/03- Chatglm-Math: улучшение математического решения проблем в больших языковых моделях с самокритическим трубопроводом
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/02 - Великобритания и Соединенные Штаты объявляют о партнерстве по науке о безопасности ИИ
(Новости), - 04/02 - Большие языковые модели как генераторы доменов планирования
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss) - 04/02 - Poro 34b и благословение многоязычности
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/02 - Octopus v2: модель языка на Device для Super Agent
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/02- Смести Depths: динамически распределение вычислительных моделей на основе трансформатора
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/02-LLMS LOL-Context TLM борются с долгой в контексте обучения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/02 - LLM -ABR: проектирование адаптивных алгоритмов битрейта с помощью крупных языковых моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/02 - Модели крупных языков могут изменить будущее поведенческого здравоохранения: предложение о ответственной разработке и оценке
() - 04/02 - Технический отчет Hyperclova X
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/02- CAMERACTRL: включение управления камерой для генерации текста-Video
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/02 - продвижение универсалов LLM с деревьями предпочтений
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/01 - Поток поиска (SOS): обучение поиску на языке
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/01 - LLM как вдохновитель: обзор стратегических рассуждений с большими языковыми моделями
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/01 - Повышение и рост моделей AI на больших языках (LLMS)
(Блог), - 04/01 - потоковая плотная подписание видео
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/01 - сходство стиля измерения в диффузионных моделях
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/01- Получение правильно: улучшение пространственной последовательности в моделях текста до изображения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/01 - Для компаний, занимающихся искусственными искусственными технологиями, в Интернете слишком маленький
(Новости), - 04/01- FlexIdReamer: однократное генерацию с помощью FlexIcubes
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/01 - Оценка: объединенная и доступная библиотека для оценки модели большой языка
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/01 - Оптимизация прямой предпочтения видео большие мультимодальные модели из языковой модели вознаграждения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 04/01 - DBRX, постоянная предварительная подготовка, вознаграждение, более быстрый вывод и многое другое
(Блог), - 04/01- Cosmicman: модель фонда текста к изображению для людей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/01 - Нейронная сеть с условиями для контролируемого генерации изображений
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/01 - больше не всегда лучше: масштабирующие свойства скрытых диффузионных моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 04/01 - Сверхчеловеческие химики с большими языками?
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/31 - Wavllm: к надежной и адаптивной речи большой языковой модель
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/31 - устал от плагинов? Модели на больших языках могут быть сквозными рекомендациями
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/30 - ОБСЛЕДОВАНИЕ ПО УЧИТЕЛЬНОГО ОБРАЗОВАНИЮ
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/30 - ST -LLM: Модели больших языков являются эффективными временными учениками
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss) - 03/30- Обучение на шумоподавлении с помощью языковых моделей с планом
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/30 - Magritte: манипулятивная и генеративная трехмерная реализация из изображения, topview и text
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss) - 03/30- Aurora-M: первая многоязычная языковая модель с открытым исходным кодом в соответствии с исполнительным приказом США
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/29 - Неоправданное обнаружение проблем: оценка достоверности моделей языка зрения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/29- Transformer-Lite: Высокоэффективное развертывание больших языковых моделей на графических процессорах мобильного телефона
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/29- SNAP-IT, TAP-IT, SPLAT-IT: Тектильно информированное 3D Гауссовое распад для реконструкции сложных поверхностей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/29 - Царство: Справочное разрешение как языковое моделирование
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/29 - NVIDIA H200 GPUS CRUAT MLPERF
(Новости), - 03/29 - Mambamixer: эффективные модели селективного пространства состояния с двойным токеном и выбором канала
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/29 - Llava -Gemma: ускоряющие модели мультимодальных фундаментов с компактным языковым моделью
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/29- instantsplat: безграничный разветвленный позы гауссовой распад за 40 секунд
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/29 - Gecko: универсальные текстовые встраиваемые встроенные из крупных языковых моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/29 - Dijiang: эффективные крупные языковые модели с помощью компактной ядра
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/29- DeepMind разрабатывает Safe, приложение на основе искусственного интеллекта, которое может проверить LLMS фактических
(Новости), - 03/29 - CTRL -SIM: реактивные и контролируемые водительские агенты с офлайн -обучением
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/29 - Правильно ли мы для оценки больших моделей на языке зрения?
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/28 - SDPO: не используйте свои данные одновременно
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/28 - Mesh2nerf: Прямой сетчатый надзор за представлением и генерацией нейронного излучения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/28 - Локализация запоминания абзаца в языковых моделях
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/28 - Джамба: гибридная языковая модель трансформатора -мамба
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/28 - Gaussiancube: структурирование гауссового распада с использованием оптимального транспорта для 3D -генеративного моделирования
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/28 - Клод 3 обгоняет GPT -4 в дуэли ботов AI. Вот как войти в действие
(Новости), - 03/28 - объявление Grok -1.5
(Блог), (демонстрация), - 03/27 - Путь к юридической автономии: совместимый и объяснительный подход к извлечению, преобразованию, загрузке и вычислению юридической информации с использованием крупных языковых моделей, экспертных систем и байесовских сетей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/27 - Vitar: Vision Transformer с любым разрешением
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/27- На пути к всемирско-английскому языковой модели для виртуальных помощников на границе
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/27 - Textcraftor: ваш текстовый энкодер может быть контроллером качества изображения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/27 - ObjectDrop: Bootprancepping Contrackfuls для удаления и вставки фотореалистического объекта
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/27- Мини-гемини: добыча потенциала моделей языка зрения в мультимодальности
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/27 - Длинная Фактура в моделях крупных языков
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/27 - LITA: языковой ассистент по временной локализации
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/27 - Одежда
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/27 - Гамба: жениться на гауссовом раскол
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/27- Flexedit: Гибкое и управляемое редактирование изображений на основе диффузии на основе диффузии
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/27 - Biomedlm: модель языка параметров 2.7B
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/26- Magis: LLM, основанная на многоагентных рамках для решения выпуска GitHub
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/26 - Необоснованная неэффективность более глубоких слоев
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/26- TC4D: траектория, связанная
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/26- Octree-GS: к последовательному рендерингу в режиме реального времени со структурированным LOD 3D Гаусса.
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/26- Представление DBRX: новый современный Open LLM
(Блог), - 26/26. - Технический отчет internlm2
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/26- Улучшение согласованности текста до изображения с помощью автоматической оптимизации быстрого приглашения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/26- Полностью пролитанные многослойные персептроны на графических процессорах Intel Data
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/26 - Эголифтер: 3D -сегментация открытого мира для эгоцентрического восприятия
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/26 - Aniportrait: Аудио, обоснованный синтез фотореалистической портретной анимации
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 26/26 - 2D Гауссовый разбрызгивание для геометрически точного сияния полей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/25 - к автоматической оценке клинических возможностей LLMS: метрика, данных и алгоритма
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/25 .
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/25- RL для моделей согласованности: более быстрое вознаграждение
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/25- VP3D: развязка 2D визуальной подсказки для генерации текста в 3D
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/25- Трип: временное остаточное обучение с шумом изображения перед моделями диффузии изображений-видео
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/25- SDXS: одностадийные модели скрытых диффузии в реальном времени с условиями изображения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/25 - операционная система агента LLM
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/25 - Flashface: персонализация человека с высокой точки зрения идентичности сохранения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/25.- Dreampolisher: к высококачественному поколению текста к 3D через геометрическую диффузию
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/25- будь собой: ограниченное внимание для многофункционального генерации текста к изображению
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 23/23/23 - когда генерация кодов на основе LLM соответствует процессу разработки программного обеспечения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/22 - Themestation: генерирование 3D -активов с темами от нескольких примеров
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/22 - SIMBA: упрощенная архитектура на основе мамбы для видения и многомерных временных рядов
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/22 - LLM2LLM: повышение LLM с новым итеративным улучшением данных
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/22- Latte3d: крупномасштабный амортизированный синтез текста до 3D
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/22 - Internvideo2: масштабирование моделей видео фонда для мультимодального понимания видео
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/22 - Следуйте: Оценка и обучение моделей поиска информации для следования инструкциям
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/22 - Dragapart: изучение движения на части на уровне частично для сочлененных объектов
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/22 - Могут ли крупные языковые модели исследовать в контексте?
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/22 - Allhands: Спросите меня что -нибудь о крупномасштабной дословной обратной связи с помощью больших языковых моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss) - 03/21 - Peergpt: Исследование ролей сверстников на основе LLM в качестве модераторов команды и участников совместного обучения детей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/21 - Stylecinegan: поколение пейзажа Cinemagraph с использованием предварительно обученного стиля.
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/21 - StreamingT2V: последовательный, динамический и расширяемый длинное генерация видео из текста
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/21 - Ренуза: Реальная инверсия изображения через итерационное номезирование
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/21 - направление для рекультивания: общение с генеративными языковыми моделями
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/21 - Rakutenai -7B: расширение больших языковых моделей для японских
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/21 - MyVLM: персонализируя VLMS для пользовательских запросов
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/21 - Mathverse: действительно ли ваш мультимодальный LLM видит диаграммы в визуальных математических задачах?
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/21 - GRM: Большая модель реконструкции гауссовой реконструкции для эффективной 3D -реконструкции и генерации
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/21 - Генеральная Ассамблея принимает резолюцию по искусственному интеллекту
(Новости), - 03/21 - Гауссовая глазурь: редактируемые комплексные поля сияния с рендерингом в реальном времени
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/21 - Исследование между временем и пространством
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/21- Эффективные модели диффузии видео с помощью разложения на фарма-кадре с контентом
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/21- DreamReward: Text-to-3d поколение с человеческими предпочтениями
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/21 - COBRA: расширение мамбы на многомодальную большую языковую модель для эффективного вывода
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/21 - чемпион: контролируемая и последовательная анимация человеческого изображения с 3D -параметрическим руководством
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/21- AnyV2V: платковая платформа для любых задач по редактированию видео-видео
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/20 - Картирование ландшафтов безопасности LLM: комплексное предложение по оценке риска заинтересованных сторон
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/20 - Зигма: зигзагская диффузионная модель мамба
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/20 - VSTAR: Генеративное временное уход за большим динамическим синтезом видео
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/20 - Rewardbench: оценка моделей вознаграждений для языкового моделирования
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/20 - Обратная подготовка, чтобы кормить проклятие реверса
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/20- Radsplat: Radiance Field-Informed Gaussian Splatting для надежного рендеринга в реальном времени с 900+ FPS
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/20 - MORA: включение генерального генерации видео через многоагентную рамку
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/20 - Llamafactory: единая эффективная тонкая настройка 100+ языковых моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/20- Идадаптер: обучение смешанным функциям для безстройки персонализации моделей текста к изображению
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/20 - Гиперллава: Динамическая визуальная и языковая экспертная настройка для мультимодальных крупных языковых моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/20 - Оценка пограничных моделей для опасных возможностей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/20 - DexitFM: быстрая оценка глубины монокулярной глубины с соответствием потока
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/20 - Compress3d: сжатое скрытое пространство для 3D -генерации из одного изображения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/20- Be-your-outpainter: Mastering Video Outpainting через входной адаптацию
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/19 - Когда нам не нужны модели более крупного зрения?
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/19- VID2ROBOT: сквозное обучение политике с кондиционированным видео с трансформаторами по перекрестному обращению
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/19 - На пути к модели фундамента общего назначения для вычислительной патологии
() - 03/19- Texdreamer: к нулевым выстрелу с высокой точки зрения 3D-генерация текстуры человека
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/19 - сценарист: реконструкция сцен с моделью авторегрессии структурированного языка
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/19- Mplug-Docowl 1.5: Объединенное структурный обучение для понимания документов без OCR
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/19 - Magic Fixup: упрощение редактирования фотографий, просмотрев динамические видеоролики
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/19 .
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/19- GVGen: Text-To-3d Generation с объемным представлением
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/19 - Gaussianflow: разбрызгивание гауссовой динамики для создания контента 4D
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/19- Фреска: пространственная временная переписка для перевода видео с нулевым выстрелом
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/19- FOURSISCALE: частота перспектива на синтез изображения без тренировки с высоким разрешением с высоким разрешением
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/19 - Эволюционная оптимизация рецептов слияния моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ([: actocat:] (https : //github.com/ sakanaiai/evolutionary-model-merge)! [Github Repo Stars] (https://img.shields.io/github/stars/ Sakanaiai/Evolutionary-Model-Merge? Style = Social)) - 03/19 - Comboverse: Создание 3D -активов с использованием пространственно с учетом диффузионного руководства
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/19 - Рассуждения на основе диаграмм: передача возможностей от LLMS в VLMS
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/19 - MM1 Apple: мультимодальная большая языковая модель, способная интерпретировать как изображения, так и текстовые данные
(Новости), - 03/19- Animatediff-Lightning: диффузионная диффузия кросс-модель
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/19 - Агент -флан: проектирование данных и методов эффективной настройки агентов для моделей крупных языков
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/19 - модель фонда визуального языка для вычислительной патологии
(), (✳) - 03/19 - характерные агенты ИИ с помощью больших языковых моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), (! [Github Repo Stars] ( https://img.shields.io/github/stars/nuaa-nlp/character100? Style = Social)) - 03/18 - Как далеко мы находимся в принятии решений LLMS? Оценка игровых способностей LLMS в мультиагентных средах
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/18 - Видеоагент: мультимодальный агент для понимания видео -автор
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/18 - VFUSION3D: масштабируемые 3D -генеративные модели из моделей диффузии видео
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/18 - TNT -LLM: добыча текста в масштабе с большими языковыми моделями
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/18 - SV3D: новый синтез с несколькими видами и 3D -генерация из одного изображения с использованием скрытого видео диффузии
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/18 - RouterBench: эталон для системы маршрутизации с несколькими LLM
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), (ss) - 03/18- Мета-снижение для автоматизации визуального распознавания с нулевым выстрелом с LLMS
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/18 - LN3DIFF: масштабируемые скрытые нервные поля диффузии для быстрого 3D -поколения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/18- Llava-UHD: LMM воспринимает любое соотношение сторон и изображения с высоким разрешением
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), () - 03/18 - Larimar: модели больших языков с эпизодическим управлением памяти
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/18- Infinite-ID: Идентификационная персонализация с помощью идентификационной семантики. Отдел парадигма
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳) - 03/18 - GPT -4 в качестве оценщика: оценка моделей крупных языков по борьбе с вредителями в сельском хозяйстве
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/18 - Generic 3D Diffusion Adapter Using Controlled Multi-View Editing
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/18 - From Pixels to Insights: A Survey on Automatic Chart Understanding in the Era of Large Foundation Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/18 - Fast High-Resolution Image Synthesis with Latent Adversarial Diffusion Distillation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/18 - Decoding Compressed Trust: Scrutinizing the Trustworthiness of Efficient LLMs Under Compression
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/18 - Compiler generated feedback for Large Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/17 - PhD: A Prompted Visual Hallucination Evaluation Dataset
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/17 - MindEye2: Shared-Subject Models Enable fMRI-To-Image With 1 Hour of Data
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/16 - VisionCLIP: An Med-AIGC based Ethical Language-Image Foundation Model for Generalizable Retina Image Analysis
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/16 - Do Large Language Models understand Medical Codes?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - VideoAgent: Long-form Video Understanding with Large Language Model as Agent
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - Uni-SMART: Universal Science Multimodal Analysis and Research Transformer
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - Trusting the Search: Unraveling Human Trust in Health Information from Google and ChatGPT
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/15 - RAFT: Adapting Language Model to Domain Specific RAG
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/15 - RAFT: Adapting Language Model to Domain Specific RAG
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - PERL: Parameter Efficient Reinforcement Learning from Human Feedback
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - NeuFlow: Real-time, High-accuracy Optical Flow Estimation on Robots Using Edge Devices
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/15 - MusicHiFi: Fast High-Fidelity Stereo Vocoding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/15 - LightIt: Illumination Modeling and Control for Diffusion Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - Isotropic3D: Image-to-3D Generation Based on a Single CLIP Embedding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/15 - FDGaussian: Fast Gaussian Splatting from Single Image via Geometric-aware Diffusion Model
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - Enhancing Human-Centered Dynamic Scene Understanding via Multiple LLMs Collaborated Reasoning
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - EfficientVMamba: Atrous Selective Scan for Light Weight Visual Mamba
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - DiPaCo: Distributed Path Composition
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - Controllable Text-to-3D Generation via Surface-Aligned Gaussian Splatting
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - WavCraft: Audio Editing and Generation with Natural Language Prompts
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - VisionGPT-3D: A Generalized Multimodal Agent for Enhanced 3D Vision Understanding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - Video Mamba Suite: State Space Model as a Versatile Alternative for Video Understanding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - Video Editing via Factorized Diffusion Distillation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - Unlocking the conversion of Web Screenshots into HTML Code with the WebSight Dataset
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - StreamMultiDiffusion: Real-Time Interactive Generation with Region-Based Semantic Control
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - Scaling Instructable Agents Across Many Simulated Worlds
(twitter), (Blog), - 03/14 - Recurrent Drafter for Fast Speculative Decoding in Large Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - LocalMamba: Visual State Space Model with Windowed Selective Scan
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - Large Language Models and Causal Inference in Collaboration: A Comprehensive Survey
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - Helpful or Harmful? Exploring the Efficacy of Large Language Models for Online Grooming Prevention
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - Griffon v2: Advancing Multimodal Perception with High-Resolution Scaling and Visual-Language Co-Referring
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - GPT on a Quantum Computer
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/14 - Glyph-ByT5: A Customized Text Encoder for Accurate Visual Text Rendering
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - GiT: Towards Generalist Vision Transformer through Universal Language Interface
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - Exploring the Capabilities and Limitations of Large Language Models in the Electric Energy Sector
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - BurstAttention: An Efficient Distributed Attention Framework for Extremely Long Sequences
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - 3D-VLA: A 3D Vision-Language-Action Generative World Model
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - Scaling Instructable Agents Across Many Simulated Worlds
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/13 - VLOGGER: Multimodal Diffusion for Embodied Avatar Synthesis
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - The Human Factor in Detecting Errors of Large Language Models: A Systematic Literature Review and Future Research Directions
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - SOTOPIA-π: Interactive Learning of Socially Intelligent Language Agents
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/13 - Simple and Scalable Strategies to Continually Pre-train Large Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/13 - Scaling Up Dynamic Human-Scene Interaction Modeling
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - Language-based game theory in the age of artificial intelligence
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - Language models scale reliably with over-training and on downstream tasks
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/13 - Knowledge Conflicts for LLMs: A Survey
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - Gemma: Open Models Based on Gemini Research and Technology
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - GaussianImage: 1000 FPS Image Representation and Compression by 2D Gaussian Splatting
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - Follow-Your-Click: Open-domain Regional Image Animation via Short Prompts
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/13 - Cultural evolution in populations of Large Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/13 - Bugs in Large Language Models Generated Code: An Empirical Study
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/12 - Synth^2: Boosting Visual-Language Models with Synthetic Captions and Image Embeddings
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/12 - Motion Mamba: Efficient and Long Sequence Motion Generation with Hierarchical and Bidirectional Selective SSM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/12 - MoAI: Mixture of All Intelligence for Large Language and Vision Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/12 - Learning Generalizable Feature Fields for Mobile Manipulation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/12 - DragAnything: Motion Control for Anything using Entity Representation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/12 - Chronos: Learning the Language of Time Series
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/12 - Branch-Train-MiX: Mixing Expert LLMs into a Mixture-of-Experts LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/11 - Transparent AI Disclosure Obligations: Who, What, When, Where, Why, How
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/11 - HILL: A Hallucination Identifier for Large Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/11 - FAX: Scalable and Differentiable Federated Primitives in JAX
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/11 - FashionReGen: LLM-Empowered Fashion Report Generation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/11 - VideoMamba: State Space Model for Efficient Video Understanding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/11 - V3D: Video Diffusion Models are Effective 3D Generators
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/11 - Stealing Part of a Production Language Model
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/11 - Multistep Consistency Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/11 - FaceChain-SuDe: Building Derived Class to Inherit Category Attributes for One-shot Subject-Driven Generation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/11 - Chain-of-table: Evolving tables in the reasoning chain for table understanding (Blog),
- 03/11 - An Image is Worth 1/2 Tokens After Layer 2: Plug-and-Play Inference Acceleration for Large Vision-Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/11 - Adding NVMe SSDs to Enable and Accelerate 100B Model Fine-tuning on a Single GPU
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/10 - VidProM: A Million-scale Real Prompt-Gallery Dataset for Text-to-Video Diffusion Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/09 - Algorithmic progress in language models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - Sora as an AGI World Model? A Complete Survey on Text-to-Video Generation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - On Protecting the Data Privacy of Large Language Models (LLMs): A Survey
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/08 - VideoElevator: Elevating Video Generation Quality with Versatile Text-to-Image Diffusion Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - Personalized Audiobook Recommendations at Spotify Through Graph Neural Networks
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - ELLA: Equip Diffusion Models with LLM for Enhanced Semantic Alignment
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - DeepSeek-VL: Towards Real-World Vision-Language Understanding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/08 - CRM: Single Image to 3D Textured Mesh with Convolutional Reconstruction Model
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - CogView3: Finer and Faster Text-to-Image Generation via Relay Diffusion
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - Now available on Poe: Claude 3 (Demo),
- 03/08 - Google - Health-specific embedding tools for dermatology and pathology (Blog),
- 03/07 - Yi: Open Foundation Models by 01.AI
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/07 - Teaching Large Language Models to Reason with Reinforcement Learning
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/07 - StableDrag: Stable Dragging for Point-based Image Editing
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/07 - Radiative Gaussian Splatting for Efficient X-ray Novel View Synthesis
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/07 - PixArt-Σ: Weak-to-Strong Training of Diffusion Transformer for 4K Text-to-Image Generation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/07 - Pix2Gif: Motion-Guided Diffusion for GIF Generation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/07 - Meet 'Liberated Qwen', an uncensored LLM that strictly adheres to system prompts (News),
- 03/07 - LLMs in the Imaginarium: Tool Learning through Simulated Trial and Error
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/07 - KAIST develops next-generation ultra-low power LLM accelerator (News),
- 03/07 - Inflection-2.5: meet the world's best personal AI (News),
- 03/07 - How Far Are We from Intelligent Visual Deductive Reasoning?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/07 - GaLore: Memory-Efficient LLM Training by Gradient Low-Rank Projection
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/07 - Evaluating LLM models at scale (Blog),
- 03/07 - Common 7B Language Models Already Possess Strong Math Capabilities
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/07 - Chatbot Arena: An Open Platform for Evaluating LLMs by Human Preference
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/06 - Stop Regressing: Training Value Functions via Classification for Scalable Deep RL
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/06 - ShortGPT: Layers in Large Language Models are More Redundant Than You Expect
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/06 - SaulLM-7B: A pioneering Large Language Model for Law
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/06 - NY hospital exec: Multimodal LLM assistants will create a “paradigm shift” in patient care (News),
- 03/06 - Learning to Decode Collaboratively with Multiple Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/06 - Enhancing Vision-Language Pre-training with Rich Supervisions
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/06 - Backtracing: Retrieving the Cause of the Query
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/06 - AI Prompt Engineering Is Dead (News),
- 03/06 - 3D Diffusion Policy
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/05 - OpenAI and Elon Musk (Blog),
- 03/05 - Caduceus: Bi-Directional Equivariant Long-Range DNA Sequence Modeling
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/05 - WikiTableEdit: A Benchmark for Table Editing by Natural Language Instruction (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Updating the Minimum Information about CLinical Artificial Intelligence (MI-CLAIM) checklist for generative modeling research (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
- 03/05 - Tuning-Free Noise Rectification for High Fidelity Image-to-Video Generation (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - The WMDP Benchmark: Measuring and Reducing Malicious Use With Unlearning (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Scaling Rectified Flow Transformers for High-Resolution Image Synthesis (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - RT-Sketch: Goal-Conditioned Imitation Learning from Hand-Drawn Sketches (), (), (?), (?), (?), (HTML), (SL), (SP), (GS ), (SS)
- 03/05 - Revisiting Meta-evaluation for Grammatical Error Correction (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - NaturalSpeech 3: Zero-Shot Speech Synthesis with Factorized Codec and Diffusion Models (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Modeling Collaborator: Enabling Subjective Vision Classification With Minimal Human Effort via LLM Tool-Use (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - MathScale: Scaling Instruction Tuning for Mathematical Reasoning (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
- 03/05 - KnowAgent: Knowledge-Augmented Planning for LLM-Based Agents (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
- 03/05 - Interactive Continual Learning: Fast and Slow Thinking (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - InjecAgent: Benchmarking Indirect Prompt Injections in Tool-Integrated Large Language Model Agents (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - In Search of Truth: An Interrogation Approach to Hallucination Detection (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - ImgTrojan: Jailbreaking Vision-Language Models with ONE Image (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Generative Software Engineering (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
- 03/05 - Finetuned Multimodal Language Models Are High-Quality Image-Text Data Filters (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Feast Your Eyes: Mixture-of-Resolution Adaptation for Multimodal Large Language Models (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Exploring the Limitations of Large Language Models in Compositional Relation Reasoning (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - EasyQuant: An Efficient Data-free Quantization Algorithm for LLMs (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Design2Code: How Far Are We From Automating Front-End Engineering? (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - ChatGPT and biometrics: an assessment of face recognition, gender detection, and age estimation capabilities (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - ChatCite: LLM Agent with Human Workflow Guidance for Comparative Literature Summary (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Benchmarking the Text-to-SQL Capability of Large Language Models: A Comprehensive Evaluation (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - An Empirical Study of LLM-as-a-Judge for LLM Evaluation: Fine-tuned Judge Models are Task-specific Classifiers (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 3/5 - OpenAI - ChatGPT can now read responses to you. (twitter,
- 03/04 - The Claude 3 Model Family: Opus, Sonnet, Haiku
() (twitter), , (✳️) - 03/04 - Wukong: Towards a Scaling Law for Large-Scale Recommendation (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/04 - Large language models surpass human experts in predicting neuroscience results
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/04 - NoteLLM: A Retrievable Large Language Model for Note Recommendation (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/04 - MagicClay: Sculpting Meshes With Generative Neural Fields (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
- 03/04 - Enhancing LLM Safety via Constrained Direct Preference Optimization (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/04 - DACO: Towards Application-Driven and Comprehensive Data Analysis via Code Generation (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
- 03/04 - CODE-ACCORD: A Corpus of Building Regulatory Data for Rule Generation towards Automatic Compliance Checking (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
- 03/04 - Balancing Enhancement, Harmlessness, and General Capabilities: Enhancing Conversational LLMs with Direct RLHF (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/04 - adaptMLLM: Fine-Tuning Multilingual Language Models on Low-Resource Languages with Integrated LLM Playgrounds (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
- 3/4 - ViewDiff: 3D-Consistent Image Generation with Text-to-Image Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 3/4 - TripoSR: Fast 3D Object Reconstruction from a Single Image (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 3/4 - RT-H: Action Hierarchies Using Language (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 3/4 - ResAdapter: Domain Consistent Resolution Adapter for Diffusion Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 3/4 - OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 3/4 - Build AI for a Better Future (twitter), (News),
- 3/4 - AtomoVideo: High Fidelity Image-to-Video Generation (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️ )
- 03/03 - Research Papers in February 2024: A LoRA Successor, Small Finetuned LLMs Vs Generalist LLMs, and Transparent LLM Research (Blog),
- 3/3 - Nvidia CEO Jensen Huang says AI could pass most human tests in 5 years (News
- 3/3 - MovieLLM: Enhancing Long Video Understanding with AI-Generated Movies (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 3/3 - InfiMM-HD: A Leap Forward in High-Resolution Multimodal Understanding (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 3/3 - Could this be bigger than OpenAI? Microsoft invests billions in French startup — Mistral AI is a multilingual maestro that's almost as good as ChatGPT 4 (News),
- 3/3 - 3DGStream: On-the-Fly Training of 3D Gaussians for Efficient Streaming of Photo-Realistic Free-Viewpoint Videos (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 3/2 - Nvidia CEO says AI could pass human tests in five years (News
- 3/1 - Elon Musk sues OpenAI and CEO Sam Altman over contract breach (News)
- 3.1 - AtP*: An efficient and scalable method for localizing LLM behaviour to components (), (), (?), (?), (?), (HTML), (SP), (GS), (SS)
- 3.1 - VisionLLaMA: A Unified LLaMA Interface for Vision Tasks (), (), (?), (?), (?), (HTML), (SP), (GS), (SS)
- 3.1 - Learning and Leveraging World Models in Visual Representation Learning (), (), (?), (?), (?), (HTML), (SP), (GS), (SS)
- 3.1 - RealCustom: Narrowing Real Text Word for Real-Time Open-Domain Text-to-Image Customization (), (), (?), (?), (?), (HTML), (SP), (GS) , (SS)
- 3.1 - Multimodal ArXiv: A Dataset for Improving Scientific Comprehension of Large Vision-Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS)
- 3.1 - Resonance RoPE: Improving Context Length Generalization of Large Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 02/29 - OHTA: One-shot Hand Avatar via Data-driven Implicit Priors
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 02/29 - Retrieval-Augmented Generation for AI-Generated Content: A Survey (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
- 2.29 - DistriFusion: Distributed Parallel Inference for High-Resolution Diffusion Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.29 - Panda-70M: Captioning 70M Videos with Multiple Cross-Modality Teachers (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.29 - Humanoid Locomotion as Next Token Prediction (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.29 - Griffin: Mixing Gated Linear Recurrences with Local Attention for Efficient Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.29 - StarCoder 2 and The Stack v2: The Next Generation (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.29 - Trajectory Consistency Distillation (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.29 - Beyond Language Models: Byte Models are Digital World Simulators (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.29 - Syntactic Ghost: An Imperceptible General-purpose Backdoor Attacks on Pre-trained Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.29 - ViewFusion: Towards Multi-View Consistency via Interpolated Denoising (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.29 - MOSAIC: A Modular System for Assistive and Interactive Cooking (), (), (?), (?), (?), (HTML), (SP), (GS), (SS)
- 02/28 - Automatic Creative Selection with Cross-Modal Matching
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 2.28 - Priority Sampling of Large Language Models for Compilers (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.28 - Simple linear attention language models balance the recall-throughput tradeoff (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.28 - Approaching Human-Level Forecasting with Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.28 - Datasets for Large Language Models: A Comprehensive Survey (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ( )
- 2.28 - A Survey on Recent Advances in LLM-Based Multi-turn Dialogue Systems (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 02/27 - A High Level Guide to LLM Evaluation Metrics (Blog),
- 2/27 - Users Say Microsoft's AI Has Alternate Personality as Godlike AGI That Demands to Be Worshipped (News)
- 2/27 - Google DeepMind CEO on AGI, OpenAI and Beyond – MWC 2024 (News)
- 2.27 - Large Language Models(LLMs) on Tabular Data: Prediction, Generation, and Understanding -- A Survey (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.27 - Towards Optimal Learning of Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - Evaluating Very Long-Term Conversational Memory of LLM Agents (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - Seeing and Hearing: Open-domain Visual-Audio Generation with Diffusion Latent Aligners (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - OmniACT: A Dataset and Benchmark for Enabling Multimodal Generalist Autonomous Agents for Desktop and Web (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - EMO: Emote Portrait Alive -- Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - EMO: Emote Portrait Alive - Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - Training-Free Long-Context Scaling of Large Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.27 - VastGaussian: Vast 3D Gaussians for Large Scene Reconstruction (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - DiffuseKronA: A Parameter Efficient Fine-tuning Method for Personalized Diffusion Model (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - Sora Generates Videos with Stunning Geometrical Consistency (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - Playground v2.5: Three Insights towards Enhancing Aesthetic Quality in Text-to-Image Generation (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - When Scaling Meets LLM Finetuning: The Effect of Data, Model and Finetuning Method (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.27 - Video as the New Language for Real-World Decision Making (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 02/27 - On the Societal Impact of Open Foundation Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 02/26 - Set the Clock: Temporal Alignment of Pretrained Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 2/26 - DenseMamba: State Space Models with Dense Hidden Connection for Efficient Large Language Models (), ()(?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 02/26 - Mistral Large is our flagship model, with top-tier reasoning capacities (News)
- 2.26 - Disentangled 3D Scene Generation with Layout Learning (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.26 - Multi-LoRA Composition for Image Generation (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.26 - MobiLlama: Towards Accurate and Lightweight Fully Transparent GPT (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ( )
- 2.26 - Do Large Language Models Latently Perform Multi-Hop Reasoning? (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.26 - Rainbow Teaming: Open-Ended Generation of Diverse Adversarial Prompts (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.26 - Nemotron-4 15B Technical Report (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.26 - StructLM: Towards Building Generalist Models for Structured Knowledge Grounding (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.26 - Towards Open-ended Visual Quality Comparison (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.25 - ChatMusician: Understanding and Generating Music Intrinsically with LLM (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ( )
- 2.25 - FuseChat: Knowledge Fusion of Chat Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 02/24 - Divide-or-Conquer? Which Part Should You Distill Your LLM?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 02/24 - Perplexity.ai Revamps Google SEO Model For LLM Era (News)
- 02/24 - Data Interpreter: An LLM Agent For Data Science
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 2.24 - Empowering Large Language Model Agents through Action Learning (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.23 - MegaScale: Scaling Large Language Model Training to More Than 10,000 GPUs (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️ )
- 2.23 - Seamless Human Motion Composition with Blended Positional Encodings (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.23 - AgentOhana: Design Unified Data and Training Pipeline for Effective Agent Learning (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️ )
- 2.23 - Gen4Gen: Generative Data Pipeline for Generative Multi-Concept Composition (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.23 - API-BLEND: A Comprehensive Corpora for Training and Benchmarking API LLMs (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.23 - Genie: Generative Interactive Environments (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.23 - GPTVQ: The Blessing of Dimensionality for LLM Quantization (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.23 - ChunkAttention: Efficient Self-Attention with Prefix-Aware KV Cache and Two-Phase Partition (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.22 - CLoVe: Encoding Compositional Language in Contrastive Vision-Language Models (), (), (?), (?), (?), (HTML), (AS), (GS), (✳️), ()
- 02/22 - Assisting in Writing Wikipedia-like Articles From Scratch with Large Language Models (), (), (?), (?), (?), (HTML), (SL), (SP), (GS) , (SS)
- 2.22 - Divide-or-Conquer? Which Part Should You Distill Your LLM? (), (), (?), (?), (?), (HTML), (AS), (GS), (✳️)
- 2.22 - MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases (), (), (?), (?), (?), (HTML), (AS), (GS), (✳️)
- 2.22 - Watermarking Makes Language Models Radioactive (), (), (?), (?), (?), (HTML), (AS), (GS), (✳️)
- 2.22 - AutoPrompt - prompt optimization framework ()
- 2.22 - Announcing Stable Diffusion 3 (tweet), (blog)
- 2.22 - DualFocus: Integrating Macro and Micro Perspectives in Multi-modal Large Language Models (), (), (?), (?), (?), (HTML), (✳️) , ()
- 2.22 - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real and Simulation (), (), (?), (?), (?), (HTML), (✳️)
- 2.22 - LLMs with Industrial Lens: Deciphering the Challenges and Prospects -- A Survey (), (), (?), (?), (?), (HTML), (✳️)
- 2.22 - Vision-Language Navigation with Embodied Intelligence: A Survey (), (), (?), (?), (?), (HTML), (✳️)
- 2.22 - Enhancing Robotic Manipulation with AI Feedback from Multimodal Large Language Models (), (), (?), (?), (?), (HTML), (✳️)
- 2.22 - Do Machines and Humans Focus on Similar Code? Exploring Explainability of Large Language Models in Code Summarization (), (), (?), (?), (?), (HTML), (✳️)
- 2.22 - PALO: A Polyglot Large Multimodal Model for 5B People (), (), (?), (?), (?), (HTML), (✳️) , ()
- 2.22 - GeneOH Diffusion: Towards Generalizable Hand-Object Interaction Denoising via Denoising Diffusion (), (), ([:paperclip:](https://arxiv.org/pdf/2402.148