GenAI_LLM_timeline Загрузка - GenAI_LLM_timeline Загрузка исходного кода

Хронология ChatGPT, GenerativeAI и LLM

В этом репозитории организована временная шкала ключевых событий (продуктов, услуг, статей, GitHub, сообщений в блогах и новостей), которые произошли до и после объявления ChatGPT.

На этой временной шкале он курирует различную информацию, уделяя особое внимание LLM и генеративному искусственному интеллекту.

Возможно, это сцена из самой горячей истории, поэтому я подумал, что будет важно сохранить эти воспоминания, поэтому я их систематизировал.

Статистика

Эти диаграммы были созданы интерпретатором кода ChatGPT.

Содействие

Мы очень ценим проблемы и запросы на включение. Если вы никогда раньше не участвовали в проекте с открытым исходным кодом, я более чем рад рассказать вам, как создать запрос на включение.

Вы можете начать с открытия вопроса, описывающего проблему, которую вы хотите решить, и мы продолжим дальше.

Эмодзи

arXiv, PDF?, arxiv-vanity?, бумажная страница?, статьи с кодом ✳️, Github

Лицензия

Хронология V2

2024 год

17 мая — OpenAI заключает сделку с Reddit, чтобы обучить свой ИИ работе с вашими сообщениями
(Новости),
17 мая — OpenAI распускает команду, занимающуюся долгосрочными рисками ИИ, менее чем через год после объявления об этом
(Новости),
17.05 – Международный научный доклад о безопасности передового искусственного интеллекта
(Блог),
16 июля – TRANSIC: перенос политики из симуляционной модели в реальную путем обучения на основе онлайн-коррекции
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
16 мая — Toon3D: взгляд на мультфильмы с новой точки зрения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
16.05 - Проверка надежности модели большого языка на основе искусственного интеллекта для извлечения экологической информации из научной литературы
(Новости),
16 мая – Многоэтапное контекстное обучение в мультимодальных базовых моделях
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
16.05. Как нажать на паузу в работе ИИ, пока не стало слишком поздно
(Новости),
16.05 - Заземление DINO 1.5: Продвиньте «край» обнаружения открытых объектов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
16 мая — Майнинг и анализ магазина GPT
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
16 мая — Dual3D: эффективное и последовательное преобразование текста в 3D с помощью двухрежимной многопроекционной скрытой диффузии
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
16 мая — Хамелеон: смешанные модальные модели Early-Fusion Foundation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
16 мая — CAT3D: создавайте что угодно в 3D с помощью многопроекционных диффузионных моделей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
15 мая — Xmodel-VLM: простая базовая версия для языковой модели мультимодального видения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
15 мая — LoRA меньше учится и меньше забывает
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
15 мая – Невидимый водяной знак Google с искусственным интеллектом поможет распознавать генеративный текст и видео
(Новости),
15 мая – Google I/O 2024: все объявлено
(Блог),
15 мая — BEHAVIOR Vision Suite: создание настраиваемого набора данных посредством моделирования
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
15 мая – ALPINE: раскрытие возможностей планирования авторегрессионного обучения в языковых моделях
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
14 05 – Понимание разницы в производительности между онлайн- и офлайн-алгоритмами выравнивания
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
14 мая — SpeechVerse: крупномасштабная обобщаемая модель аудиоязыка
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
14 мая – SpeechGuard: исследование состязательной устойчивости мультимодальных моделей большого языка
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
14 05 – Не теряйте времени: используйте время для понимания мобильного видео
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
14 мая - Hunyuan-DiT: мощный диффузионный преобразователь с несколькими разрешениями и детальным пониманием китайского языка
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
14 05 – Композиционная генерация текста в изображение с использованием плотных представлений Blob
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
14.05. За пределами законов масштабирования: понимание производительности трансформатора с помощью ассоциативной памяти
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
13 мая - SambaNova SN40L: масштабирование стены памяти искусственного интеллекта с помощью потока данных и состава экспертов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
13 мая — Рабочий процесс RLHF: от моделирования вознаграждений к онлайн-RLHF
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
13 мая — Plot2Code: комплексный тест для оценки мультимодальных моделей большого языка при генерации кода на основе научных графиков
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
13 мая – OpenAI представляет новейшую модель искусственного интеллекта GPT-4o
(Новости),
13 мая — Веб-поиск MS MARCO: крупномасштабный информативный набор веб-данных с миллионами реальных меток кликов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
13.05. Сколько исследований проводится с использованием больших языковых моделей?
(Блог),
13.05 — Привет GPT-4o
(Блог),
13 05 – Coin3D: создание управляемых и интерактивных 3D-активов с кондиционированием под управлением прокси-сервера
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
11.05. Piccolo2: общее встраивание текста с помощью многозадачного гибридного обучения потерям
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
11 мая — LogoMotion: визуально обоснованная генерация кода для контентно-зависимой анимации
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
10 мая - INSPECT - Платформа с открытым исходным кодом для оценки больших языковых моделей.
(Блог),
10 мая – Институт безопасности ИИ выпускает новую платформу оценки безопасности ИИ
(Новости),
07.05 - SUTRA: Архитектура масштабируемой многоязычной языковой модели
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
07.05 — Мета-релизы Llama 3 с открытым исходным кодом LLM
(Новости),
03/05 - Что важно при построении моделей языка видения?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
02.05 – WildChat: 1 млн журналов взаимодействия ChatGPT в дикой природе
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
02 05 — StoryDiffusion: постоянное внимание к созданию изображений и видео на большие расстояния
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
02.05 — «Прометей 2»: языковая модель с открытым исходным кодом, специализирующаяся на оценке других языковых моделей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
02.05 - NeMo-Aligner: масштабируемый набор инструментов для эффективного выравнивания модели
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
02.05 - LLM-AD: Система описания аудио на основе большой языковой модели
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
02.05. FLAME: Согласование больших языковых моделей с учетом фактов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
02 05 – Настройка моделей преобразования текста в изображение с помощью одной пары изображений
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
01.05. Спектрально сокращенные гауссовы поля с нейронной компенсацией
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
01.05 - Оптимизация предпочтений самостоятельной игры для согласования языковой модели
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
01/05 – Всегда ли больший размер пакета редактирования лучше? -- Эмпирическое исследование редактирования моделей с помощью Llama-3.
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
01.05. Клевер: регрессивное упрощенное спекулятивное декодирование с последовательным знанием
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
01/05 – Тщательное исследование производительности модели большого языка по арифметике в начальной школе
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
30 апреля — Визуальная проверка фактов: включение создания высококачественных подробных подписей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
30 апреля – STT: отслеживание состояния с помощью трансформаторов для автономного вождения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
30 апреля — SemantiCodec: семантический аудиокодек со сверхнизким битрейтом для общего звука
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
30.04 - Octopus v4: График языковых моделей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
30 апреля — MotionLCM: генерация управляемого движения в реальном времени с помощью модели скрытой согласованности
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
30 апреля — MicroDreamer: создание 3D-изображений с нуля за sim20 секунд с помощью итеративной реконструкции на основе оценок
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
30 апреля — Lightplane: высокомасштабируемые компоненты для нейронных 3D-полей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
30 апреля - КАН: Колмогоров-Арнольд Нетворкс
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
30 апреля — Оптимизация предпочтений итеративного рассуждения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
30 апреля — Невидимый стежок: создание плавных 3D-сцен с помощью прорисовки глубины
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
30 апреля – InstantFamily: замаскированное внимание для создания изображений с несколькими идентификаторами с нулевым выстрелом
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
30 апреля — GS-LRM: Большая модель реконструкции для 3D-гауссовского разбрызгивания
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
30 апреля — Расширение контекста Ламы-3 за ночь в десять раз
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
30 апреля - DOCCI: Описания связанных и контрастирующих изображений
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
30 апреля — Улучшение и ускорение моделей большого языка с помощью прогнозирования нескольких токенов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
29 апреля — Стилус: автоматический выбор адаптера для диффузионных моделей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
29 апреля — SAGS: трехмерное гауссовское разбрызгивание с учетом структуры
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
29 апреля - Замена судей присяжными: оценка поколений LLM с помощью группы разнообразных моделей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
29 апреля — Профиль генеративного ИИ NIST AI RMF
(Новости),
29 апреля — LoRA Land: 310 доработанных LLM, конкурирующих с GPT-4, технический отчет
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
29 апреля — Кенгуру: самоспекулятивное декодирование без потерь с помощью двойного раннего выхода
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
29.04 - Возможности моделей Gemini в медицине
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
28 апреля — Paint от Inpaint: учимся добавлять объекты изображения, сначала удаляя их
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
28 апреля - LEGENT: Открытая платформа для воплощенных агентов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
27 апреля — Ag2Manip: изучение новых навыков манипулирования с помощью агентно-агностических визуальных представлений и представлений действий
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
26 апреля — MaPa: Текстовое фотореалистичное рисование материалов для 3D-фигур
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
26 апреля — BlenderAlchemy: редактирование 3D-графики с помощью моделей на языке Vision
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
25 апреля – Технический отчет Tele-FLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
25 апреля - SEED-Bench-2-Plus: Сравнительный анализ мультимодальных моделей большого языка с визуальным восприятием большого количества текста
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
25 апреля – Возобновление оценки преобразования текста в изображение с помощью Gecko: метрики, подсказки и человеческие рейтинги
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
25 апреля — PLLaVA: расширение LLaVA без параметров для преобразования изображений в видео для плотных субтитров к видео
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
25 апреля — Заставьте свой LLM полностью использовать контекст
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
25 апреля — Перечислите элементы один за другим: новый источник данных и парадигма обучения для мультимодальных программ LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
25 апреля — Пропуск слоя: включение раннего вывода и самоспекулятивного декодирования
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
25 апреля — Interactive3D: создавайте то, что хотите, с помощью интерактивной генерации 3D
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
25 апреля — Как далеко мы до GPT-4V? Устранение разрыва с коммерческими мультимодальными моделями с помощью пакетов с открытым исходным кодом
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
25 апреля — ConsistentID: создание портрета с мультимодальным детальным сохранением идентичности
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
24 апреля — XC-Cache: перекрестное обращение к кэшированному контексту для эффективного вывода LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
24 апреля – Этика продвинутых ИИ-помощников
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
24 апреля — PuLID: настройка идентификаторов Pure и Lightning посредством контрастного выравнивания
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
24 апреля — NeRF-XL: масштабирование NeRF с помощью нескольких графических процессоров
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
24 апреля — MotionMaster: передача движения камеры для создания видео без обучения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
24 апреля – Mode: Эксперты по данным CLIP через кластеризацию
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
24 апреля — MMT-Bench: комплексный мультимодальный тест для оценки больших моделей языка видения в направлении многозадачного AGI
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
24 апреля — MaGGIe: управляемое постепенное матирование человеческого экземпляра в маске
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
24 апреля — ID-Aligner: улучшение генерации преобразования текста в изображение с сохранением идентичности с помощью обучения с обратной связью
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
24.04 — Редактируемые элементы изображения для управляемого синтеза
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
24 апреля — CatLIP: точность визуального распознавания на уровне CLIP с ускорением в 2,7 раза предварительного обучения на изображениях и текстовых данных в веб-масштабе
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
24 апреля — BASS: пакетное спекулятивное сэмплирование, оптимизированное по вниманию
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
23 апреля — Трансформеры могут представлять n-граммные языковые модели
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
23 апреля — Технический отчет Pegasus-v1
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
23.04 - Смешанная команда экспертов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
23 апреля — FlashSpeech: эффективный синтез речи с нулевым выстрелом
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
22 апреля - SnapKV: LLM знает, что вы ищете, еще до генерации
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
22 апреля - SEED-X: Мультимодальные модели с унифицированным пониманием и генерацией многоуровневой структуры
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
22 апреля - Реконструкция координат сцены: постановка коллекций изображений посредством постепенного обучения релокализатора
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
22 апреля — Технический отчет Phi-3: высокопроизводительная языковая модель локально на вашем телефоне
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
22 апреля — OpenELM: эффективное семейство языковых моделей с открытым исходным кодом для обучения и платформы вывода
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
22 апреля – MultiBooth: как создать все ваши концепции в изображении из текста
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
22.04 — Обучение управлению передвижением H-Infinity
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
22 апреля — Насколько хороши низкобитовые квантованные модели LLaMA3? Эмпирическое исследование
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
22 апреля - Согласуйте свои шаги: оптимизация графиков отбора проб в моделях диффузии
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
22 апреля – Мультимодальный автоматизированный агент интерпретации
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
21 апреля – Hyper-SD: модель согласованности сегментированных траекторий для эффективного синтеза изображений
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
21 апреля — AdvPrompter: быстрые адаптивные состязательные подсказки для LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
20 апреля – Модели согласованности музыки
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
19.04 – Иерархия инструкций: обучение преподавателей LLM расставлять приоритеты привилегированных инструкций
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
19 апреля — TextSquare: масштабирование настройки текстовых визуальных инструкций
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
19.04 — PhysDreamer: физическое взаимодействие с 3D-объектами посредством генерации видео
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
19 апреля — LLM-R2: расширенная система перезаписи на основе правил для большой языковой модели для повышения эффективности запросов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
19.04 — Насколько реально? Система человеческой оценки для неограниченных состязательных примеров
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
19.04. Как далеко мы можем зайти с практическим восстановлением программ на функциональном уровне?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
19 апреля — Groma: локализованная визуальная токенизация для обоснования мультимодальных моделей большого языка
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
19.04. Требуется ли для гауссовского сплаттинга инициализация SFM?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
19 апреля — AutoCrawler: продвинутый веб-агент для создания веб-сканеров
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
18 апреля - TriForce: ускорение генерации длинных последовательностей без потерь с помощью иерархического спекулятивного декодирования
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
18 апреля - На пути к самосовершенствованию LLM через воображение, поиск и критику
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
18 апреля – Повторное использование ваших вознаграждений: перенос модели вознаграждения для межъязыкового выравнивания с нулевым выстрелом
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
18 апреля — Reka Core, Flash и Edge: серия мощных мультимодальных языковых моделей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
18 апреля — OpenBezoar: небольшие, экономичные и открытые модели, обученные на сочетании данных инструкций
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
18.04 - MeshLRM: Большая модель реконструкции для высококачественной сетки
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
18 апреля — Представляем версию 0.5 теста AI Safety Benchmark от MLCommons
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
18.04 — Представляем Meta Llama 3: наиболее функциональную на сегодняшний день общедоступную LLM
(Блог),
18 апреля — EdgeFusion: генерация текста в изображение на устройстве
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
18 апреля – BLINK: Мультимодальные модели большого языка могут видеть, но не воспринимать
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
18 апреля — AniClipart: анимация клипартов с преобразованием текста в видео
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
17.04. – МОА: сочетание внимания для распутывания предмета и контекста при создании персонализированных изображений
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
17.04 — FlowMind: автоматическое создание рабочих процессов с помощью LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
17.04 — Динамическая типографика: воплощение слов в жизнь
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
17.04 — Доступен API Stable Diffusion 3
(Твиттер), (Блог), (Демо),
16 апреля — VASA-1: реалистичные говорящие лица, управляемые звуком, генерируемые в реальном времени
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
16 апреля – Министр торговли США Джина Раймондо объявляет о расширении руководящего состава Института безопасности искусственного интеллекта США.
(Новости),
16.04 - Генерация длинной музыки со скрытой диффузией
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
15 апреля - Оценщики LLM признают и отдают предпочтение своим поколениям
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
15 апреля — Video2Game: интерактивная, реалистичная и совместимая с браузером среда в реальном времени из одного видео
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
15 апреля — Танго 2: Согласование генерации текста в аудио на основе диффузии посредством оптимизации прямых предпочтений
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
15 апреля - Укрощение модели скрытой диффузии для рисования нейронного поля излучения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
15 апреля — Opus может работать как машина Тьюринга
(твиттер),
15 апреля – MathGPT: использование Llama 2 для создания платформы для персонализированного обучения
15 апреля — HQ-Edit: высококачественный набор данных для редактирования изображений на основе инструкций
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
15 апреля — Ctrl-Adapter: эффективная и универсальная платформа для адаптации разнообразных элементов управления к любой модели распространения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
15.04. Сжатие представляет интеллект линейно
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
15 апреля — CompGS: эффективное представление 3D-сцен с помощью сжатых гауссовских пятен
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
14 апреля — TextHawk: исследование эффективного детального восприятия мультимодальных моделей большого языка
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
13 апреля — Кэти Вуд Маскулс вступает в бум ChatGPT с новой долей OpenAI
(Новости),
12.04. Масштабирование (вниз) CLIP: комплексный анализ данных, архитектуры и стратегий обучения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
12 апреля – Исследование 3D-модели Visual Foundation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
12.04 — Предварительное обучение малых базовых LM с меньшим количеством жетонов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
12.04 - Об устойчивости языкового руководства для задач низкого уровня зрительного восприятия: результаты оценки глубины
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
12 апреля — MonoPatchNeRF: улучшение полей нейронного излучения с помощью монокулярного наведения на основе патчей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
12 апреля — Мегалодон: эффективное предварительное обучение LLM и вывод с неограниченной длиной контекста
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
12.04. Изменяет ли ChatGPT стиль письма ученых?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
12.04 – COCONut: Модернизация сегментации COCO
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
12 апреля — Чип искусственного интеллекта сокращает энергетический бюджет более чем на 99 процентов
(Новости),
12.04 - AdaptSwap: непрерывное обучение LLM с гарантиями удаления данных и контроля доступа
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
12.04 — Обзор видения Грок-1.5
(Демо),
12.04 – Хороший, плохой и гуманный значок
(Новости),
12 апреля. Пользователи платного ChatGPT теперь могут получить доступ к GPT-4 Turbo.
(твиттер), (Новости), , ()
11 апреля - Необходимость советов по аудиту ИИ
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
11.04. Трансформатор памяти для непрерывного обучения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
11 апреля – Amazon вводит в свой совет директоров Эндрю Нг, ведущего специалиста в области искусственного интеллекта.
(Новости),
11 апреля — Adobe покупает видео по 3 доллара в минуту для создания модели искусственного интеллекта
(Новости),
11 апреля - UltraEval: легкая платформа для гибкой и комплексной оценки для студентов LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
11.04. Переносимая и принципиальная эффективность сегментации открытого словаря
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
11.04 - SWE-агент
(твиттер), (Демо), , ()
11.04 — Редкий Лейнформер
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
11.04 — Rho-1: не все токены — то, что вам нужно
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
11 апреля - ResearchAgent: Итеративная генерация исследовательских идей на основе научной литературы с использованием больших языковых моделей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
11 апреля - RecurrentGemma: отказ от трансформаторов для создания эффективных моделей открытого языка
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
11 апреля - OSWorld: Сравнительный анализ мультимодальных агентов для задач открытого типа в реальных компьютерных средах
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
11.04. LLoCO: изучение длинных контекстов в автономном режиме
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
11 апреля – Использование больших языковых моделей (LLM) для поддержки совместной аннотации данных о рисках в режиме реального времени между человеком и искусственным интеллектом
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
11 апреля – JetMoE: достижение производительности Llama2 за 0,1 миллиона долларов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) (Проект), (twitter), , (✳️), ()
11 апреля — HGRN2: закрытые линейные RNN с расширением состояний
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
11.04 – От слов к числам: ваша большая языковая модель тайно может стать эффективным регрессором, если дать ей примеры из контекста
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
11.04 — Ferret-v2: улучшенная основа для ссылок и обоснования с помощью больших языковых моделей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
11.04. ControlNet++: улучшение условных элементов управления с помощью эффективной обратной связи по согласованности
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
11.04. Контекстно-зависимое обнаружение видеоаномалий в долгосрочных наборах данных
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
11 апреля — ChatGPT-3.5, Клод 3 надрал пиксельную задницу в турнире Street Fighter III для LLM
(Новости),
11.04. ChatGPT может предсказывать будущее, рассказывая истории, происходящие в будущем, о прошлом
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
11 апреля – Передовой опыт и уроки, извлеченные из синтетических данных для языковых моделей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
11 апреля — Оцените степень LLM, сражаясь в Street Fighter 3
(Демо), , ()
11 апреля — Аудио диалоги: набор данных диалогов для понимания аудио и музыки
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
11.04. Применение рекомендаций в ограниченном интервале улучшает качество выборки и распределения в диффузионных моделях
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
11 апреля - AmpleGCG: изучение универсальной и переносимой генеративной модели состязательных суффиксов для взлома как открытых, так и закрытых LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
10 апреля - Инструмент прозрачности LM: интерактивный инструмент для анализа языковых моделей трансформаторов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
10 апреля — Gemini 1.5 Pro теперь понимает звук
(твиттер),
10 апреля – Исследование глубины концепций: как большие языковые модели приобретают знания на разных уровнях?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
10 апреля — Urban Architect: создание управляемой городской 3D-сцены с предварительной компоновкой
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
10 апреля — RealmDreamer: создание 3D-сцен на основе текста с использованием Inpainting и Depth Diffusion
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
10 апреля – OpenAI и Meta близки к выпуску моделей ИИ, способных рассуждать как люди, говорится в отчете
(Новости),
10 апреля — MetaCheckGPT — многозадачный детектор галлюцинаций, использующий неопределенность LLM и метамодели
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
10 апреля — Meta подтверждает, что в следующем месяце выйдет Llama 3 с открытым исходным кодом.
(Новости),
10 апреля — Не оставляйте контекст позади: эффективные преобразователи бесконечного контекста с бесконечным вниманием
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
10 апреля – Инкрементальный XAI: незабываемое понимание ИИ с пошаговыми объяснениями
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
10 апреля — DreamScene360: неограниченное преобразование текста в 3D-сцены с панорамным распределением по Гауссу
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
10.04 — Содержит ли тофу в Мапо кофе кофе? Исследование LLM на предмет культурных знаний, связанных с едой
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
10 апреля – BRAVE: Расширение визуального кодирования моделей языка видения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
10 апреля – Стартап Mistral, занимающийся искусственным интеллектом, запускает модель искусственного интеллекта емкостью 281 ГБ, способную конкурировать с OpenAI, Meta и Google
(Новости),
10 апреля - Генеративная семантическая связь, управляемая агентом, для удаленного наблюдения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
10.04. Адаптация декодера LLaMA к Vision Transformer
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
10 апреля – Исследование об интеграции генеративного искусственного интеллекта для критического мышления в мобильных сетях
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
09.04 - Взгляните на это! Переосмысление способа оценки джейлбрейка языковой модели
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
09.04 – RULER: Каков реальный размер контекста ваших языковых моделей с длинным контекстом?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
09.04 – Пересмотр уплотнения в методе гауссовского разбрызгивания
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
09.04 - Реконструкция ручных объектов в 3D
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
09.04 - RAR-b: рассуждение как эталон поиска
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
09.04 – Оперативная инженерия по сохранению конфиденциальности: опрос
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
09.04 - Об оценке эффективности исходного кода, генерируемого LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
09.04 — Технический отчет OmniFusion
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
09.04 — MuPT: генеративный преобразователь символьной музыки с предварительной подготовкой
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
09.04 - MiniCPM: раскрытие потенциала моделей малого языка с помощью масштабируемых стратегий обучения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
09.04 — Magic-Boost: Ускорьте генерацию 3D-изображений с помощью условного рассеяния Mutli-View
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
09.04 - LLM2Vec: Большие языковые модели являются мощными кодировщиками текста
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
09.04 — InternLM-XComposer2-4KHD: новаторская модель большого визуального языка, поддерживающая разрешения от 336 пикселей до 4K HD
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
09.04 - Hash3D: ускорение создания 3D без обучения
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
09.04 – Google представляет проекты с открытым исходным кодом для генеративного искусственного интеллекта
(Новости),
09.04 - Слоны никогда не забывают: запоминание и изучение табличных данных в больших языковых моделях
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
09.04 — Apple только что представила новую LLM Ferret-UI — этот ИИ может читать экран вашего iPhone
(Новости),
09.04 - AEGIS: онлайн-модерация безопасности контента с помощью адаптивного искусственного интеллекта с ансамблем экспертов LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
08.04 - YaART: еще одна технология ART-рендеринга
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
08 апреля – WILBUR: Адаптивное контекстное обучение для надежных и точных веб-агентов
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
08.04 - UniFL: Улучшите стабильное распространение с помощью унифицированного обучения с обратной связью
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
08.04 - Необузданный Икар: обзор потенциальных опасностей ввода изображений в безопасности мультимодальной модели большого языка
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
08 апреля — Таблица лидеров галлюцинаций — открытая попытка измерить галлюцинации с помощью больших языковых моделей
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
08.04 - Проблема выбора фактов при восстановлении программ на основе LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
04/08 - Swapanything: Включение произвольного обмена объекта в персонализированном визуальном редактировании
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/08 - Sambalingo: преподавание на больших языковых моделях новые языки
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/08 - Оптимизация отрицательных предпочтений: от катастрофического коллапса до эффективного отключения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/08 - Naver дебютирует с многоязычным Hyperclova x LLM. Он будет использовать для создания суверенного искусственного интеллекта для Азии
(Новости),
04/08 - MOMA: мультимодальный адаптер LLM для быстрого персонализированного генерации изображений
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/08 - MedExpqa: многоязычное сравнительный анализ больших языковых моделей для ответа на медицинский вопрос
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/08- MA-LMM: авторская большая мультимодальная модель для долгосрочного понимания видео
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/08 - Layoutllm: Настройка инструкций с макетом с большими языковыми моделями для понимания документов
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/08 - Ferret -UI: заземленное понимание мобильного пользовательского интерфейса с помощью мультимодальных LLMS
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/08 - Оценка интервенционных возможностей рассуждений крупных языковых моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/08 - Eagle and Finch: RWKV с матричными состояниями и динамическим рецидивом
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/08 - Codeclm: выравнивание языковых моделей с индивидуальными синтетическими данными
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/08 - Autocoderover: Автономное улучшение программы
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/07 - TimeGPT в прогнозировании нагрузки: большая модель временных рядов
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/07 - OpenAI транскрибируется более миллиона часов видео на YouTube для обучения GPT -4
(Новости),
04/07 - Magictime: модели генерации видеороликов в качестве метаморфических симуляторов
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/07 - Byteedit: повысить, соблюдать и ускорить редактирование генеративного изображения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/06 - Большинство голосования врачей улучшают уместность зависимости ИИ в патологии
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss)
04/06- Диффузия-RWKV: масштабирование RWKV-подобных архитектур для диффузионных моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/06- Datenerf: Текстовое редактирование на основе глубины.
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/06- За пределами Scene: генерация сцены с высоким разрешением с предварительной диффузией с предварительной диффузией
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/06 - Выравнивающиеся диффузионные модели путем оптимизации человеческой утилиты
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/06 - Случай для разработки модели фундамента для планирования, подобных задачам с нуля
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/05 - Повышенные уязвимости LLM от тонкой настройки и квантования
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/05 - SpatialTracker: отслеживание любых 2D пикселей в 3D -пространстве
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/05 - Обучение социальным навыкам с большими языковыми моделями
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/05 - Sigma: Siamese Mamba Network для мультимодальной семантической сегментации
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/05 - надежное гауссовое раскол
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/05 - Physavatar: изучение физики одетых 3D -аватаров из визуальных наблюдений
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/05- Koala: ключевой кадр с кондиционером Long Video-LLM
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/05 - Подсказка: оценка понимания клинического языка для LLMS
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/05 - Китайский крошечный LLM: предварительно подготовка китайской модели большой языка
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/05 - Помощь людям в сложных сравнениях: автоматическое сравнение информации в масштабе
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/04 - воплощенный ИИ с двумя руками: нулевое обучение, безопасность и модульность
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss)
04/04 - Эволюция языковой модели: итерационная перспектива обучения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/04- Визуализация мыслей вызывает пространственные рассуждения в моделях крупных языков
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss) (Twitter),
04/04 - Нет "нулевого выстрела" без экспоненциальных данных: предварительная концепция частота определяет производительность мультимодальной модели
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/04 - Оценка LLMS при обнаружении ошибок в ответах LLM
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/04 - Оценка моделей генеративных языков в извлечении информации как субъективная коррекция вопросов
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/04 - Прямая оптимизация NASH: модели преподавания языка для самостоятельной работы с общими предпочтениями
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/04- CBR-RAG: Рассуждение на основе случаев для получения добычи в поисках в LLMS для ответа на юридический вопрос
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/04 - Возможности крупных языковых моделей в управлении инженерией: эталонное исследование GPT -4, Claude 3 Opus и Gemini 1.0 Ultra
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/04 - Canttalkaboutis: выравнивание языковых моделей, чтобы оставаться на теме в диалогах
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/04 - Autowebglm: Bootstrap и подкрепление большого агента веб -навигации на основе моделей на основе моделей.
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/04 - Обучение LLMS над сжатым текстом невропейски
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/04 - Reft: Prevation Cenetuning для языковых моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/04- Red Teaming GPT-4V: безопасны ли GPT-4V против атак Uni/Multi-Modal Jailbreak?
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/04- RALL-E: Надежное моделирование языка кодека с помощью цепочки мыслей для синтеза текста в речь
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/04 - PointInfinity: модели диффузии -точки с разрешением.
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/04- Minigpt4-Video: продвижение мультимодальных LLM для понимания видео с чередующимися визуальными текстовыми токенами
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/04- Comat: Выравнивание диффузионной модели текста к изображению с сопоставлением концепции с изображением в тексте
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/04 - CodeeditorTorbench: оценка возможностей редактирования кода крупных языковых моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/04 - Autowebglm: Bootstrap и подкрепление большого агента веб -навигации на основе моделей на основе моделей.
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/03 - Визуальное авторегрессивное моделирование: масштабируемое генерация изображений с помощью следующего предсказания
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/03- О масштабируемости генерации на основе диффузии.
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/03 - многократный джейлбрейк
()
04/03- LVLM-Intrepret: инструмент интерпретации для больших моделей языка зрения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/03 - Языковые модели как компиляторы: моделирование выполнения псевдокода улучшает алгоритмические рассуждения в языковых моделях
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/03- InstantStyle: Бесплатный обед для обеспечения стиля в генерации текста к изображению
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/03 - Freditor: высокая точка и передаваемое редактирование NERF путем разложения частоты
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/03- Поперечное внимание делает вывод громоздким в диффузионных моделях текста до изображения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/03- Chatglm-Math: улучшение математического решения проблем в больших языковых моделях с самокритическим трубопроводом
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/02 - Великобритания и Соединенные Штаты объявляют о партнерстве по науке о безопасности ИИ
(Новости),
04/02 - Большие языковые модели как генераторы доменов планирования
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss)
04/02 - Poro 34b и благословение многоязычности
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/02 - Octopus v2: модель языка на Device для Super Agent
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/02- Смести Depths: динамически распределение вычислительных моделей на основе трансформатора
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/02-LLMS LOL-Context TLM борются с долгой в контексте обучения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/02 - LLM -ABR: проектирование адаптивных алгоритмов битрейта с помощью крупных языковых моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/02 - Модели крупных языков могут изменить будущее поведенческого здравоохранения: предложение о ответственной разработке и оценке
()
04/02 - Технический отчет Hyperclova X
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/02- CAMERACTRL: включение управления камерой для генерации текста-Video
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/02 - продвижение универсалов LLM с деревьями предпочтений
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/01 - Поток поиска (SOS): обучение поиску на языке
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/01 - LLM как вдохновитель: обзор стратегических рассуждений с большими языковыми моделями
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/01 - Повышение и рост моделей AI на больших языках (LLMS)
(Блог),
04/01 - потоковая плотная подписание видео
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/01 - сходство стиля измерения в диффузионных моделях
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/01- Получение правильно: улучшение пространственной последовательности в моделях текста до изображения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/01 - Для компаний, занимающихся искусственными искусственными технологиями, в Интернете слишком маленький
(Новости),
04/01- FlexIdReamer: однократное генерацию с помощью FlexIcubes
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/01 - Оценка: объединенная и доступная библиотека для оценки модели большой языка
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/01 - Оптимизация прямой предпочтения видео большие мультимодальные модели из языковой модели вознаграждения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
04/01 - DBRX, постоянная предварительная подготовка, вознаграждение, более быстрый вывод и многое другое
(Блог),
04/01- Cosmicman: модель фонда текста к изображению для людей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/01 - Нейронная сеть с условиями для контролируемого генерации изображений
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/01 - больше не всегда лучше: масштабирующие свойства скрытых диффузионных моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
04/01 - Сверхчеловеческие химики с большими языками?
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/31 - Wavllm: к надежной и адаптивной речи большой языковой модель
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/31 - устал от плагинов? Модели на больших языках могут быть сквозными рекомендациями
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/30 - ОБСЛЕДОВАНИЕ ПО УЧИТЕЛЬНОГО ОБРАЗОВАНИЮ
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/30 - ST -LLM: Модели больших языков являются эффективными временными учениками
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss)
03/30- Обучение на шумоподавлении с помощью языковых моделей с планом
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/30 - Magritte: манипулятивная и генеративная трехмерная реализация из изображения, topview и text
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss)
03/30- Aurora-M: первая многоязычная языковая модель с открытым исходным кодом в соответствии с исполнительным приказом США
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/29 - Неоправданное обнаружение проблем: оценка достоверности моделей языка зрения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/29- Transformer-Lite: Высокоэффективное развертывание больших языковых моделей на графических процессорах мобильного телефона
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/29- SNAP-IT, TAP-IT, SPLAT-IT: Тектильно информированное 3D Гауссовое распад для реконструкции сложных поверхностей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/29 - Царство: Справочное разрешение как языковое моделирование
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/29 - NVIDIA H200 GPUS CRUAT MLPERF
(Новости),
03/29 - Mambamixer: эффективные модели селективного пространства состояния с двойным токеном и выбором канала
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/29 - Llava -Gemma: ускоряющие модели мультимодальных фундаментов с компактным языковым моделью
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/29- instantsplat: безграничный разветвленный позы гауссовой распад за 40 секунд
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/29 - Gecko: универсальные текстовые встраиваемые встроенные из крупных языковых моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/29 - Dijiang: эффективные крупные языковые модели с помощью компактной ядра
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/29- DeepMind разрабатывает Safe, приложение на основе искусственного интеллекта, которое может проверить LLMS фактических
(Новости),
03/29 - CTRL -SIM: реактивные и контролируемые водительские агенты с офлайн -обучением
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/29 - Правильно ли мы для оценки больших моделей на языке зрения?
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/28 - SDPO: не используйте свои данные одновременно
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/28 - Mesh2nerf: Прямой сетчатый надзор за представлением и генерацией нейронного излучения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/28 - Локализация запоминания абзаца в языковых моделях
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/28 - Джамба: гибридная языковая модель трансформатора -мамба
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/28 - Gaussiancube: структурирование гауссового распада с использованием оптимального транспорта для 3D -генеративного моделирования
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/28 - Клод 3 обгоняет GPT -4 в дуэли ботов AI. Вот как войти в действие
(Новости),
03/28 - объявление Grok -1.5
(Блог), (демонстрация),
03/27 - Путь к юридической автономии: совместимый и объяснительный подход к извлечению, преобразованию, загрузке и вычислению юридической информации с использованием крупных языковых моделей, экспертных систем и байесовских сетей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/27 - Vitar: Vision Transformer с любым разрешением
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/27- На пути к всемирско-английскому языковой модели для виртуальных помощников на границе
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/27 - Textcraftor: ваш текстовый энкодер может быть контроллером качества изображения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/27 - ObjectDrop: Bootprancepping Contrackfuls для удаления и вставки фотореалистического объекта
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/27- Мини-гемини: добыча потенциала моделей языка зрения в мультимодальности
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/27 - Длинная Фактура в моделях крупных языков
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/27 - LITA: языковой ассистент по временной локализации
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/27 - Одежда
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/27 - Гамба: жениться на гауссовом раскол
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/27- Flexedit: Гибкое и управляемое редактирование изображений на основе диффузии на основе диффузии
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/27 - Biomedlm: модель языка параметров 2.7B
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/26- Magis: LLM, основанная на многоагентных рамках для решения выпуска GitHub
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/26 - Необоснованная неэффективность более глубоких слоев
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/26- TC4D: траектория, связанная
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/26- Octree-GS: к последовательному рендерингу в режиме реального времени со структурированным LOD 3D Гаусса.
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/26- Представление DBRX: новый современный Open LLM
(Блог),
26/26. - Технический отчет internlm2
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/26- Улучшение согласованности текста до изображения с помощью автоматической оптимизации быстрого приглашения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/26- Полностью пролитанные многослойные персептроны на графических процессорах Intel Data
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/26 - Эголифтер: 3D -сегментация открытого мира для эгоцентрического восприятия
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/26 - Aniportrait: Аудио, обоснованный синтез фотореалистической портретной анимации
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
26/26 - 2D Гауссовый разбрызгивание для геометрически точного сияния полей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/25 - к автоматической оценке клинических возможностей LLMS: метрика, данных и алгоритма
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/25 .
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/25- RL для моделей согласованности: более быстрое вознаграждение
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/25- VP3D: развязка 2D визуальной подсказки для генерации текста в 3D
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/25- Трип: временное остаточное обучение с шумом изображения перед моделями диффузии изображений-видео
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/25- SDXS: одностадийные модели скрытых диффузии в реальном времени с условиями изображения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/25 - операционная система агента LLM
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/25 - Flashface: персонализация человека с высокой точки зрения идентичности сохранения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/25.- Dreampolisher: к высококачественному поколению текста к 3D через геометрическую диффузию
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/25- будь собой: ограниченное внимание для многофункционального генерации текста к изображению
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
23/23/23 - когда генерация кодов на основе LLM соответствует процессу разработки программного обеспечения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/22 - Themestation: генерирование 3D -активов с темами от нескольких примеров
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/22 - SIMBA: упрощенная архитектура на основе мамбы для видения и многомерных временных рядов
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/22 - LLM2LLM: повышение LLM с новым итеративным улучшением данных
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/22- Latte3d: крупномасштабный амортизированный синтез текста до 3D
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/22 - Internvideo2: масштабирование моделей видео фонда для мультимодального понимания видео
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/22 - Следуйте: Оценка и обучение моделей поиска информации для следования инструкциям
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/22 - Dragapart: изучение движения на части на уровне частично для сочлененных объектов
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/22 - Могут ли крупные языковые модели исследовать в контексте?
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/22 - Allhands: Спросите меня что -нибудь о крупномасштабной дословной обратной связи с помощью больших языковых моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss)
03/21 - Peergpt: Исследование ролей сверстников на основе LLM в качестве модераторов команды и участников совместного обучения детей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/21 - Stylecinegan: поколение пейзажа Cinemagraph с использованием предварительно обученного стиля.
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/21 - StreamingT2V: последовательный, динамический и расширяемый длинное генерация видео из текста
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/21 - Ренуза: Реальная инверсия изображения через итерационное номезирование
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/21 - направление для рекультивания: общение с генеративными языковыми моделями
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/21 - Rakutenai -7B: расширение больших языковых моделей для японских
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/21 - MyVLM: персонализируя VLMS для пользовательских запросов
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/21 - Mathverse: действительно ли ваш мультимодальный LLM видит диаграммы в визуальных математических задачах?
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/21 - GRM: Большая модель реконструкции гауссовой реконструкции для эффективной 3D -реконструкции и генерации
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/21 - Генеральная Ассамблея принимает резолюцию по искусственному интеллекту
(Новости),
03/21 - Гауссовая глазурь: редактируемые комплексные поля сияния с рендерингом в реальном времени
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/21 - Исследование между временем и пространством
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/21- Эффективные модели диффузии видео с помощью разложения на фарма-кадре с контентом
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/21- DreamReward: Text-to-3d поколение с человеческими предпочтениями
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/21 - COBRA: расширение мамбы на многомодальную большую языковую модель для эффективного вывода
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/21 - чемпион: контролируемая и последовательная анимация человеческого изображения с 3D -параметрическим руководством
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/21- AnyV2V: платковая платформа для любых задач по редактированию видео-видео
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/20 - Картирование ландшафтов безопасности LLM: комплексное предложение по оценке риска заинтересованных сторон
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/20 - Зигма: зигзагская диффузионная модель мамба
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/20 - VSTAR: Генеративное временное уход за большим динамическим синтезом видео
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/20 - Rewardbench: оценка моделей вознаграждений для языкового моделирования
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/20 - Обратная подготовка, чтобы кормить проклятие реверса
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/20- Radsplat: Radiance Field-Informed Gaussian Splatting для надежного рендеринга в реальном времени с 900+ FPS
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/20 - MORA: включение генерального генерации видео через многоагентную рамку
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/20 - Llamafactory: единая эффективная тонкая настройка 100+ языковых моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/20- Идадаптер: обучение смешанным функциям для безстройки персонализации моделей текста к изображению
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/20 - Гиперллава: Динамическая визуальная и языковая экспертная настройка для мультимодальных крупных языковых моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/20 - Оценка пограничных моделей для опасных возможностей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/20 - DexitFM: быстрая оценка глубины монокулярной глубины с соответствием потока
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/20 - Compress3d: сжатое скрытое пространство для 3D -генерации из одного изображения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/20- Be-your-outpainter: Mastering Video Outpainting через входной адаптацию
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/19 - Когда нам не нужны модели более крупного зрения?
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/19- VID2ROBOT: сквозное обучение политике с кондиционированным видео с трансформаторами по перекрестному обращению
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/19 - На пути к модели фундамента общего назначения для вычислительной патологии
()
03/19- Texdreamer: к нулевым выстрелу с высокой точки зрения 3D-генерация текстуры человека
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/19 - сценарист: реконструкция сцен с моделью авторегрессии структурированного языка
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/19- Mplug-Docowl 1.5: Объединенное структурный обучение для понимания документов без OCR
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/19 - Magic Fixup: упрощение редактирования фотографий, просмотрев динамические видеоролики
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/19 .
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/19- GVGen: Text-To-3d Generation с объемным представлением
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/19 - Gaussianflow: разбрызгивание гауссовой динамики для создания контента 4D
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/19- Фреска: пространственная временная переписка для перевода видео с нулевым выстрелом
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/19- FOURSISCALE: частота перспектива на синтез изображения без тренировки с высоким разрешением с высоким разрешением
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/19 - Эволюционная оптимизация рецептов слияния моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ([: actocat:] (https : //github.com/ sakanaiai/evolutionary-model-merge)! [Github Repo Stars] (https://img.shields.io/github/stars/ Sakanaiai/Evolutionary-Model-Merge? Style = Social))
03/19 - Comboverse: Создание 3D -активов с использованием пространственно с учетом диффузионного руководства
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/19 - Рассуждения на основе диаграмм: передача возможностей от LLMS в VLMS
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/19 - MM1 Apple: мультимодальная большая языковая модель, способная интерпретировать как изображения, так и текстовые данные
(Новости),
03/19- Animatediff-Lightning: диффузионная диффузия кросс-модель
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/19 - Агент -флан: проектирование данных и методов эффективной настройки агентов для моделей крупных языков
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/19 - модель фонда визуального языка для вычислительной патологии
(), (✳)
03/19 - характерные агенты ИИ с помощью больших языковых моделей
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), (! [Github Repo Stars] ( https://img.shields.io/github/stars/nuaa-nlp/character100? Style = Social))
03/18 - Как далеко мы находимся в принятии решений LLMS? Оценка игровых способностей LLMS в мультиагентных средах
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/18 - Видеоагент: мультимодальный агент для понимания видео -автор
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/18 - VFUSION3D: масштабируемые 3D -генеративные модели из моделей диффузии видео
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/18 - TNT -LLM: добыча текста в масштабе с большими языковыми моделями
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/18 - SV3D: новый синтез с несколькими видами и 3D -генерация из одного изображения с использованием скрытого видео диффузии
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/18 - RouterBench: эталон для системы маршрутизации с несколькими LLM
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), (ss)
03/18- Мета-снижение для автоматизации визуального распознавания с нулевым выстрелом с LLMS
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/18 - LN3DIFF: масштабируемые скрытые нервные поля диффузии для быстрого 3D -поколения
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/18- Llava-UHD: LMM воспринимает любое соотношение сторон и изображения с высоким разрешением
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳), ()
03/18 - Larimar: модели больших языков с эпизодическим управлением памяти
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/18- Infinite-ID: Идентификационная персонализация с помощью идентификационной семантики. Отдел парадигма
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳)
03/18 - GPT -4 в качестве оценщика: оценка моделей крупных языков по борьбе с вредителями в сельском хозяйстве
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/18 - Generic 3D Diffusion Adapter Using Controlled Multi-View Editing
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/18 - From Pixels to Insights: A Survey on Automatic Chart Understanding in the Era of Large Foundation Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/18 - Fast High-Resolution Image Synthesis with Latent Adversarial Diffusion Distillation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/18 - Decoding Compressed Trust: Scrutinizing the Trustworthiness of Efficient LLMs Under Compression
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/18 - Compiler generated feedback for Large Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/17 - PhD: A Prompted Visual Hallucination Evaluation Dataset
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/17 - MindEye2: Shared-Subject Models Enable fMRI-To-Image With 1 Hour of Data
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/16 - VisionCLIP: An Med-AIGC based Ethical Language-Image Foundation Model for Generalizable Retina Image Analysis
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/16 - Do Large Language Models understand Medical Codes?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/15 - VideoAgent: Long-form Video Understanding with Large Language Model as Agent
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/15 - Uni-SMART: Universal Science Multimodal Analysis and Research Transformer
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/15 - Trusting the Search: Unraveling Human Trust in Health Information from Google and ChatGPT
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
03/15 - RAFT: Adapting Language Model to Domain Specific RAG
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/15 - RAFT: Adapting Language Model to Domain Specific RAG
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/15 - PERL: Parameter Efficient Reinforcement Learning from Human Feedback
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/15 - NeuFlow: Real-time, High-accuracy Optical Flow Estimation on Robots Using Edge Devices
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/15 - MusicHiFi: Fast High-Fidelity Stereo Vocoding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
03/15 - LightIt: Illumination Modeling and Control for Diffusion Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/15 - Isotropic3D: Image-to-3D Generation Based on a Single CLIP Embedding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/15 - FDGaussian: Fast Gaussian Splatting from Single Image via Geometric-aware Diffusion Model
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/15 - Enhancing Human-Centered Dynamic Scene Understanding via Multiple LLMs Collaborated Reasoning
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/15 - EfficientVMamba: Atrous Selective Scan for Light Weight Visual Mamba
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/15 - DiPaCo: Distributed Path Composition
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/15 - Controllable Text-to-3D Generation via Surface-Aligned Gaussian Splatting
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/14 - WavCraft: Audio Editing and Generation with Natural Language Prompts
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/14 - VisionGPT-3D: A Generalized Multimodal Agent for Enhanced 3D Vision Understanding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/14 - Video Mamba Suite: State Space Model as a Versatile Alternative for Video Understanding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/14 - Video Editing via Factorized Diffusion Distillation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/14 - Unlocking the conversion of Web Screenshots into HTML Code with the WebSight Dataset
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/14 - StreamMultiDiffusion: Real-Time Interactive Generation with Region-Based Semantic Control
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/14 - Scaling Instructable Agents Across Many Simulated Worlds
(twitter), (Blog),
03/14 - Recurrent Drafter for Fast Speculative Decoding in Large Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/14 - Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/14 - MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/14 - LocalMamba: Visual State Space Model with Windowed Selective Scan
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/14 - Large Language Models and Causal Inference in Collaboration: A Comprehensive Survey
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/14 - Helpful or Harmful? Exploring the Efficacy of Large Language Models for Online Grooming Prevention
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/14 - Griffon v2: Advancing Multimodal Perception with High-Resolution Scaling and Visual-Language Co-Referring
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/14 - GPT on a Quantum Computer
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
03/14 - Glyph-ByT5: A Customized Text Encoder for Accurate Visual Text Rendering
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/14 - GiT: Towards Generalist Vision Transformer through Universal Language Interface
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/14 - Exploring the Capabilities and Limitations of Large Language Models in the Electric Energy Sector
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/14 - BurstAttention: An Efficient Distributed Attention Framework for Extremely Long Sequences
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/14 - 3D-VLA: A 3D Vision-Language-Action Generative World Model
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/13 - Scaling Instructable Agents Across Many Simulated Worlds
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
03/13 - VLOGGER: Multimodal Diffusion for Embodied Avatar Synthesis
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/13 - The Human Factor in Detecting Errors of Large Language Models: A Systematic Literature Review and Future Research Directions
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/13 - SOTOPIA-π: Interactive Learning of Socially Intelligent Language Agents
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/13 - Simple and Scalable Strategies to Continually Pre-train Large Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/13 - Scaling Up Dynamic Human-Scene Interaction Modeling
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/13 - Language-based game theory in the age of artificial intelligence
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/13 - Language models scale reliably with over-training and on downstream tasks
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/13 - Knowledge Conflicts for LLMs: A Survey
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/13 - Gemma: Open Models Based on Gemini Research and Technology
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/13 - GaussianImage: 1000 FPS Image Representation and Compression by 2D Gaussian Splatting
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/13 - Follow-Your-Click: Open-domain Regional Image Animation via Short Prompts
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/13 - Cultural evolution in populations of Large Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/13 - Bugs in Large Language Models Generated Code: An Empirical Study
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/12 - Synth^2: Boosting Visual-Language Models with Synthetic Captions and Image Embeddings
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/12 - Motion Mamba: Efficient and Long Sequence Motion Generation with Hierarchical and Bidirectional Selective SSM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/12 - MoAI: Mixture of All Intelligence for Large Language and Vision Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/12 - Learning Generalizable Feature Fields for Mobile Manipulation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/12 - DragAnything: Motion Control for Anything using Entity Representation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/12 - Chronos: Learning the Language of Time Series
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/12 - Branch-Train-MiX: Mixing Expert LLMs into a Mixture-of-Experts LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/11 - Transparent AI Disclosure Obligations: Who, What, When, Where, Why, How
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
03/11 - HILL: A Hallucination Identifier for Large Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
03/11 - FAX: Scalable and Differentiable Federated Primitives in JAX
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/11 - FashionReGen: LLM-Empowered Fashion Report Generation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/11 - VideoMamba: State Space Model for Efficient Video Understanding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/11 - V3D: Video Diffusion Models are Effective 3D Generators
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/11 - Stealing Part of a Production Language Model
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
03/11 - Multistep Consistency Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/11 - FaceChain-SuDe: Building Derived Class to Inherit Category Attributes for One-shot Subject-Driven Generation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/11 - Chain-of-table: Evolving tables in the reasoning chain for table understanding (Blog),
03/11 - An Image is Worth 1/2 Tokens After Layer 2: Plug-and-Play Inference Acceleration for Large Vision-Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/11 - Adding NVMe SSDs to Enable and Accelerate 100B Model Fine-tuning on a Single GPU
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
03/10 - VidProM: A Million-scale Real Prompt-Gallery Dataset for Text-to-Video Diffusion Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/09 - Algorithmic progress in language models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/08 - Sora as an AGI World Model? A Complete Survey on Text-to-Video Generation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/08 - On Protecting the Data Privacy of Large Language Models (LLMs): A Survey
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
03/08 - VideoElevator: Elevating Video Generation Quality with Versatile Text-to-Image Diffusion Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/08 - Personalized Audiobook Recommendations at Spotify Through Graph Neural Networks
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/08 - Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/08 - ELLA: Equip Diffusion Models with LLM for Enhanced Semantic Alignment
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/08 - DeepSeek-VL: Towards Real-World Vision-Language Understanding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/08 - CRM: Single Image to 3D Textured Mesh with Convolutional Reconstruction Model
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/08 - CogView3: Finer and Faster Text-to-Image Generation via Relay Diffusion
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/08 - Now available on Poe: Claude 3 (Demo),
03/08 - Google - Health-specific embedding tools for dermatology and pathology (Blog),
03/07 - Yi: Open Foundation Models by 01.AI
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/07 - Teaching Large Language Models to Reason with Reinforcement Learning
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/07 - StableDrag: Stable Dragging for Point-based Image Editing
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/07 - Radiative Gaussian Splatting for Efficient X-ray Novel View Synthesis
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/07 - PixArt-Σ: Weak-to-Strong Training of Diffusion Transformer for 4K Text-to-Image Generation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/07 - Pix2Gif: Motion-Guided Diffusion for GIF Generation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/07 - Meet 'Liberated Qwen', an uncensored LLM that strictly adheres to system prompts (News),
03/07 - LLMs in the Imaginarium: Tool Learning through Simulated Trial and Error
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/07 - KAIST develops next-generation ultra-low power LLM accelerator (News),
03/07 - Inflection-2.5: meet the world's best personal AI (News),
03/07 - How Far Are We from Intelligent Visual Deductive Reasoning?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/07 - GaLore: Memory-Efficient LLM Training by Gradient Low-Rank Projection
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/07 - Evaluating LLM models at scale (Blog),
03/07 - Common 7B Language Models Already Possess Strong Math Capabilities
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/07 - Chatbot Arena: An Open Platform for Evaluating LLMs by Human Preference
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/06 - Stop Regressing: Training Value Functions via Classification for Scalable Deep RL
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/06 - ShortGPT: Layers in Large Language Models are More Redundant Than You Expect
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/06 - SaulLM-7B: A pioneering Large Language Model for Law
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/06 - NY hospital exec: Multimodal LLM assistants will create a “paradigm shift” in patient care (News),
03/06 - Learning to Decode Collaboratively with Multiple Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/06 - Enhancing Vision-Language Pre-training with Rich Supervisions
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/06 - Backtracing: Retrieving the Cause of the Query
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/06 - AI Prompt Engineering Is Dead (News),
03/06 - 3D Diffusion Policy
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/05 - OpenAI and Elon Musk (Blog),
03/05 - Caduceus: Bi-Directional Equivariant Long-Range DNA Sequence Modeling
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/05 - WikiTableEdit: A Benchmark for Table Editing by Natural Language Instruction (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/05 - Updating the Minimum Information about CLinical Artificial Intelligence (MI-CLAIM) checklist for generative modeling research (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/05 - Tuning-Free Noise Rectification for High Fidelity Image-to-Video Generation (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/05 - The WMDP Benchmark: Measuring and Reducing Malicious Use With Unlearning (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/05 - Scaling Rectified Flow Transformers for High-Resolution Image Synthesis (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/05 - RT-Sketch: Goal-Conditioned Imitation Learning from Hand-Drawn Sketches (), (), (?), (?), (?), (HTML), (SL), (SP), (GS ), (SS)
03/05 - Revisiting Meta-evaluation for Grammatical Error Correction (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/05 - NaturalSpeech 3: Zero-Shot Speech Synthesis with Factorized Codec and Diffusion Models (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/05 - Modeling Collaborator: Enabling Subjective Vision Classification With Minimal Human Effort via LLM Tool-Use (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/05 - MathScale: Scaling Instruction Tuning for Mathematical Reasoning (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
03/05 - KnowAgent: Knowledge-Augmented Planning for LLM-Based Agents (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/05 - Interactive Continual Learning: Fast and Slow Thinking (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/05 - InjecAgent: Benchmarking Indirect Prompt Injections in Tool-Integrated Large Language Model Agents (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/05 - In Search of Truth: An Interrogation Approach to Hallucination Detection (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/05 - ImgTrojan: Jailbreaking Vision-Language Models with ONE Image (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/05 - Generative Software Engineering (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
03/05 - Finetuned Multimodal Language Models Are High-Quality Image-Text Data Filters (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/05 - Feast Your Eyes: Mixture-of-Resolution Adaptation for Multimodal Large Language Models (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/05 - Exploring the Limitations of Large Language Models in Compositional Relation Reasoning (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/05 - EasyQuant: An Efficient Data-free Quantization Algorithm for LLMs (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/05 - Design2Code: How Far Are We From Automating Front-End Engineering? (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/05 - ChatGPT and biometrics: an assessment of face recognition, gender detection, and age estimation capabilities (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/05 - ChatCite: LLM Agent with Human Workflow Guidance for Comparative Literature Summary (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/05 - Benchmarking the Text-to-SQL Capability of Large Language Models: A Comprehensive Evaluation (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/05 - An Empirical Study of LLM-as-a-Judge for LLM Evaluation: Fine-tuned Judge Models are Task-specific Classifiers (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
3/5 - OpenAI - ChatGPT can now read responses to you. (twitter,
03/04 - The Claude 3 Model Family: Opus, Sonnet, Haiku
() (twitter), , (✳️)
03/04 - Wukong: Towards a Scaling Law for Large-Scale Recommendation (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/04 - Large language models surpass human experts in predicting neuroscience results
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/04 - NoteLLM: A Retrievable Large Language Model for Note Recommendation (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/04 - MagicClay: Sculpting Meshes With Generative Neural Fields (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
03/04 - Enhancing LLM Safety via Constrained Direct Preference Optimization (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/04 - DACO: Towards Application-Driven and Comprehensive Data Analysis via Code Generation (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/04 - CODE-ACCORD: A Corpus of Building Regulatory Data for Rule Generation towards Automatic Compliance Checking (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
03/04 - Balancing Enhancement, Harmlessness, and General Capabilities: Enhancing Conversational LLMs with Direct RLHF (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
03/04 - adaptMLLM: Fine-Tuning Multilingual Language Models on Low-Resource Languages with Integrated LLM Playgrounds (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
3/4 - ViewDiff: 3D-Consistent Image Generation with Text-to-Image Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
3/4 - TripoSR: Fast 3D Object Reconstruction from a Single Image (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
3/4 - RT-H: Action Hierarchies Using Language (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
3/4 - ResAdapter: Domain Consistent Resolution Adapter for Diffusion Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
3/4 - OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
3/4 - Build AI for a Better Future (twitter), (News),
3/4 - AtomoVideo: High Fidelity Image-to-Video Generation (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️ )
03/03 - Research Papers in February 2024: A LoRA Successor, Small Finetuned LLMs Vs Generalist LLMs, and Transparent LLM Research (Blog),
3/3 - Nvidia CEO Jensen Huang says AI could pass most human tests in 5 years (News
3/3 - MovieLLM: Enhancing Long Video Understanding with AI-Generated Movies (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
3/3 - InfiMM-HD: A Leap Forward in High-Resolution Multimodal Understanding (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
3/3 - Could this be bigger than OpenAI? Microsoft invests billions in French startup — Mistral AI is a multilingual maestro that's almost as good as ChatGPT 4 (News),
3/3 - 3DGStream: On-the-Fly Training of 3D Gaussians for Efficient Streaming of Photo-Realistic Free-Viewpoint Videos (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
3/2 - Nvidia CEO says AI could pass human tests in five years (News
3/1 - Elon Musk sues OpenAI and CEO Sam Altman over contract breach (News)
3.1 - AtP*: An efficient and scalable method for localizing LLM behaviour to components (), (), (?), (?), (?), (HTML), (SP), (GS), (SS)
3.1 - VisionLLaMA: A Unified LLaMA Interface for Vision Tasks (), (), (?), (?), (?), (HTML), (SP), (GS), (SS)
3.1 - Learning and Leveraging World Models in Visual Representation Learning (), (), (?), (?), (?), (HTML), (SP), (GS), (SS)
3.1 - RealCustom: Narrowing Real Text Word for Real-Time Open-Domain Text-to-Image Customization (), (), (?), (?), (?), (HTML), (SP), (GS) , (SS)
3.1 - Multimodal ArXiv: A Dataset for Improving Scientific Comprehension of Large Vision-Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS)
3.1 - Resonance RoPE: Improving Context Length Generalization of Large Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
02/29 - OHTA: One-shot Hand Avatar via Data-driven Implicit Priors
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
02/29 - Retrieval-Augmented Generation for AI-Generated Content: A Survey (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
2.29 - DistriFusion: Distributed Parallel Inference for High-Resolution Diffusion Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.29 - Panda-70M: Captioning 70M Videos with Multiple Cross-Modality Teachers (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.29 - Humanoid Locomotion as Next Token Prediction (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.29 - Griffin: Mixing Gated Linear Recurrences with Local Attention for Efficient Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.29 - StarCoder 2 and The Stack v2: The Next Generation (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.29 - Trajectory Consistency Distillation (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
2.29 - Beyond Language Models: Byte Models are Digital World Simulators (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.29 - Syntactic Ghost: An Imperceptible General-purpose Backdoor Attacks on Pre-trained Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.29 - ViewFusion: Towards Multi-View Consistency via Interpolated Denoising (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
2.29 - MOSAIC: A Modular System for Assistive and Interactive Cooking (), (), (?), (?), (?), (HTML), (SP), (GS), (SS)
02/28 - Automatic Creative Selection with Cross-Modal Matching
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
2.28 - Priority Sampling of Large Language Models for Compilers (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.28 - Simple linear attention language models balance the recall-throughput tradeoff (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
2.28 - Approaching Human-Level Forecasting with Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.28 - Datasets for Large Language Models: A Comprehensive Survey (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ( )
2.28 - A Survey on Recent Advances in LLM-Based Multi-turn Dialogue Systems (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
02/27 - A High Level Guide to LLM Evaluation Metrics (Blog),
2/27 - Users Say Microsoft's AI Has Alternate Personality as Godlike AGI That Demands to Be Worshipped (News)
2/27 - Google DeepMind CEO on AGI, OpenAI and Beyond – MWC 2024 (News)
2.27 - Large Language Models(LLMs) on Tabular Data: Prediction, Generation, and Understanding -- A Survey (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.27 - The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
2.27 - Towards Optimal Learning of Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.27 - Evaluating Very Long-Term Conversational Memory of LLM Agents (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.27 - Seeing and Hearing: Open-domain Visual-Audio Generation with Diffusion Latent Aligners (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.27 - OmniACT: A Dataset and Benchmark for Enabling Multimodal Generalist Autonomous Agents for Desktop and Web (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.27 - EMO: Emote Portrait Alive -- Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.27 - EMO: Emote Portrait Alive - Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.27 - Training-Free Long-Context Scaling of Large Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
2.27 - VastGaussian: Vast 3D Gaussians for Large Scene Reconstruction (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.27 - DiffuseKronA: A Parameter Efficient Fine-tuning Method for Personalized Diffusion Model (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.27 - Sora Generates Videos with Stunning Geometrical Consistency (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.27 - Playground v2.5: Three Insights towards Enhancing Aesthetic Quality in Text-to-Image Generation (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.27 - When Scaling Meets LLM Finetuning: The Effect of Data, Model and Finetuning Method (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.27 - Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
2.27 - Video as the New Language for Real-World Decision Making (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
02/27 - On the Societal Impact of Open Foundation Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
02/26 - Set the Clock: Temporal Alignment of Pretrained Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
2/26 - DenseMamba: State Space Models with Dense Hidden Connection for Efficient Large Language Models (), ()(?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
02/26 - Mistral Large is our flagship model, with top-tier reasoning capacities (News)
2.26 - Disentangled 3D Scene Generation with Layout Learning (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.26 - Multi-LoRA Composition for Image Generation (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.26 - MobiLlama: Towards Accurate and Lightweight Fully Transparent GPT (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ( )
2.26 - Do Large Language Models Latently Perform Multi-Hop Reasoning? (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.26 - Rainbow Teaming: Open-Ended Generation of Diverse Adversarial Prompts (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.26 - Nemotron-4 15B Technical Report (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.26 - StructLM: Towards Building Generalist Models for Structured Knowledge Grounding (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.26 - Towards Open-ended Visual Quality Comparison (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.25 - ChatMusician: Understanding and Generating Music Intrinsically with LLM (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ( )
2.25 - FuseChat: Knowledge Fusion of Chat Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
02/24 - Divide-or-Conquer? Which Part Should You Distill Your LLM?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
02/24 - Perplexity.ai Revamps Google SEO Model For LLM Era (News)
02/24 - Data Interpreter: An LLM Agent For Data Science
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
2.24 - Empowering Large Language Model Agents through Action Learning (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.23 - MegaScale: Scaling Large Language Model Training to More Than 10,000 GPUs (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️ )
2.23 - Seamless Human Motion Composition with Blended Positional Encodings (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
2.23 - AgentOhana: Design Unified Data and Training Pipeline for Effective Agent Learning (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️ )
2.23 - Gen4Gen: Generative Data Pipeline for Generative Multi-Concept Composition (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
2.23 - API-BLEND: A Comprehensive Corpora for Training and Benchmarking API LLMs (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.23 - Genie: Generative Interactive Environments (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.23 - GPTVQ: The Blessing of Dimensionality for LLM Quantization (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.23 - ChunkAttention: Efficient Self-Attention with Prefix-Aware KV Cache and Two-Phase Partition (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
2.22 - CLoVe: Encoding Compositional Language in Contrastive Vision-Language Models (), (), (?), (?), (?), (HTML), (AS), (GS), (✳️), ()
02/22 - Assisting in Writing Wikipedia-like Articles From Scratch with Large Language Models (), (), (?), (?), (?), (HTML), (SL), (SP), (GS) , (SS)
2.22 - Divide-or-Conquer? Which Part Should You Distill Your LLM? (), (), (?), (?), (?), (HTML), (AS), (GS), (✳️)
2.22 - MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases (), (), (?), (?), (?), (HTML), (AS), (GS), (✳️)
2.22 - Watermarking Makes Language Models Radioactive (), (), (?), (?), (?), (HTML), (AS), (GS), (✳️)
2.22 - AutoPrompt - prompt optimization framework ()
2.22 - Announcing Stable Diffusion 3 (tweet), (blog)
2.22 - DualFocus: Integrating Macro and Micro Perspectives in Multi-modal Large Language Models (), (), (?), (?), (?), (HTML), (✳️) , ()
2.22 - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real and Simulation (), (), (?), (?), (?), (HTML), (✳️)
2.22 - LLMs with Industrial Lens: Deciphering the Challenges and Prospects -- A Survey (), (), (?), (?), (?), (HTML), (✳️)
2.22 - Vision-Language Navigation with Embodied Intelligence: A Survey (), (), (?), (?), (?), (HTML), (✳️)
2.22 - Enhancing Robotic Manipulation with AI Feedback from Multimodal Large Language Models (), (), (?), (?), (?), (HTML), (✳️)
2.22 - Do Machines and Humans Focus on Similar Code? Exploring Explainability of Large Language Models in Code Summarization (), (), (?), (?), (?), (HTML), (✳️)
2.22 - PALO: A Polyglot Large Multimodal Model for 5B People (), (), (?), (?), (?), (HTML), (✳️) , ()
2.22 - GeneOH Diffusion: Towards Generalizable Hand-Object Interaction Denoising via Denoising Diffusion (), (), ([:paperclip:](https://arxiv.org/pdf/2402.148