Скачать ai game devtools - ai game devtools скачать исходный код

Инструменты разработчика игр с искусственным интеллектом (AI-GDT) ?

AI-игра

Здесь мы будем отслеживать новейшие инструменты разработки игр с использованием искусственного интеллекта, включая LLM, агент, код, писатель, изображение, текстуру, шейдер, 3D-модель, анимацию, видео, аудио, музыку, поющий голос и аналитику.

Список проектов

Инструмент (AI LLM)

Источник	Описание	Бумага	Игровой движок	Тип
АгентGPT	? Собирайте, настраивайте и развертывайте автономные агенты ИИ в своем браузере.			Инструмент
AICommand	Интеграция ChatGPT с редактором Unity.		Единство	Инструмент
АЙОС	Операционная система агента LLM.			Инструмент
Ученый ИИ	Ученый по искусственному интеллекту: на пути к полностью автоматизированным открытым научным открытиям.	arXiv		Инструмент
Ассистент интерфейса командной строки	Удобный инструмент CLI для использования сервиса ChatGPT.			Инструмент
Авто-GPT	Экспериментальная попытка с открытым исходным кодом сделать GPT-4 полностью автономным.			Инструмент
BabyAGI	Этот скрипт Python является примером системы управления задачами на базе искусственного интеллекта.			Инструмент
?? Пользовательский интерфейс BabyAGI	Пользовательский интерфейс BabyAGI предназначен для упрощения запуска и разработки с помощью babyagi в веб-приложении, например ChatGPT.			Инструмент
Байчуань-7Б	Крупномасштабная языковая модель 7B для предварительного обучения, разработанная Baichuan.			Инструмент
Байчуань-13Б	Большая языковая модель 13B, разработанная Baichuan Intelligent Technology.			Инструмент
Байчуань 2	Серия больших языковых моделей, разработанных Baichuan Intelligent Technology.			Инструмент
Бишенг	Bisheng — это открытая платформа LLM DevOps для приложений искусственного интеллекта следующего поколения.			Инструмент
Персонаж-LLM	Обучаемый агент для ролевых игр.	arXiv		Инструмент
ЧатДев	Коммуникативные агенты для разработки программного обеспечения.	arXiv		Инструмент
ЧатGPT-API-единство	Связывает API завершения чата ChatGPT с чистым C# на Unity.		Единство	Инструмент
ЧатGPTForUnity	ChatGPT для единства.		Единство	Инструмент
ЧатRWKV	ChatRWKV похож на ChatGPT, но основан на языковой модели RWKV (100% RNN) и имеет открытый исходный код.			Инструмент
ЧатЮань	Большая языковая модель для диалога на китайском и английском языках.			Инструмент
Китайский-ЛЛАМА-Альпака-3	(Китайские Llama-3 LLM), разработанные на основе Meta Llama 3.			Инструмент
Chrome-GPT	Агент AutoGPT, который управляет Chrome на вашем рабочем столе.			Инструмент
CogVLM	CogVLM — мощная базовая модель визуального языка с открытым исходным кодом.	arXiv		Инструмент
КорНет	Библиотека для обучения глубоких нейронных сетей.			Инструмент
Космос	Cosmos — это платформа для разработки мировых моделей, состоящая из мировых базовых моделей, токенизаторов и конвейера обработки видео для ускорения разработки физического искусственного интеллекта в лабораториях робототехники и AV.			Магистр права
ДБРКС	DBRX — это большая языковая модель, обученная Databricks.			Инструмент
ДЦЛМ	DataComp для языковых моделей.	arXiv		Инструмент
ДипСик-В3	DeepSeek-V3 — это мощная языковая модель Mixture-of-Experts (MoE) с общим числом параметров 671B, из которых 37B активировано для каждого токена.	arXiv		Магистр права
ДемоGPT	Генератор приложений Auto Gen-AI на базе Llama 2			Инструмент
Дизайн2Код	Автоматизация клиентского проектирования			Инструмент
Девика	Девика — инженер-программист агентного ИИ.			Инструмент
Девон	Парный программист с открытым исходным кодом.			Инструмент
Дора	Создание мощных веб-сайтов, по одному запросу за раз.			Инструмент
Флоуиз	Перетащите пользовательский интерфейс, чтобы создать индивидуальный процесс LLM с помощью LangchainJS.			Инструмент
Близнецы	Gemini изначально создан для мультимодальности — беспрепятственного анализа текста, изображений, видео, аудио и кода.			Инструмент
Джемма	Gemma — это семейство легких современных открытых моделей, созданных на основе исследований и технологий, используемых при создании моделей Google Gemini.			Инструмент
gemma.cpp	легкий, автономный механизм вывода C++ для моделей Google Gemma.			Инструмент
ГЛМ-4	GLM-4-9B — это версия с открытым исходным кодом последнего поколения предварительно обученных моделей серии GLM-4, выпущенная Zhipu AI.			Инструмент
GPT4Все	Чат-бот обучался на массивной коллекции чистых данных помощника, включая код, истории и диалоги.			Инструмент
ГПТ-4о	GPT-4o («o» от «omni») — это шаг к более естественному взаимодействию человека с компьютером: он принимает в качестве входных данных любую комбинацию текста, аудио, изображения и видео и генерирует любую комбинацию текста, аудио и изображения. выходы.			Инструмент
GPTScript	Разрабатывайте приложения LLM на естественном языке.			Инструмент
Грок-1	Веса и архитектура нашей модели «Смесь экспертов», состоящей из 314 миллиардов параметров, Grok-1.			Инструмент
ОбниматьсяЧат	Делаем лучшие модели чатов с искусственным интеллектом доступными каждому.			Инструмент
Интеграция Hugging Face API с Unity	Этот пакет Unity обеспечивает простую в использовании интеграцию API Hugging Face Inference, позволяя разработчикам получать доступ к моделям Hugging Face AI и использовать их в своих проектах Unity.		Единство	Инструмент
Привязка изображения	ImageBind Одно пространство для встраивания, чтобы связать их все.	arXiv		Инструмент
Индекс-1,9Б	Легкий многоязычный LLM SOTA.			Инструмент
InteractML-Unity	InteractML, платформа визуальных сценариев интерактивного машинного обучения для Unity3D.		Единство	Инструмент
InteractML-Unreal Engine	Использование машинного обучения в Unreal Engine.		Нереальный движок	Инструмент
СтажерLM	InternLM открыла исходный код базовой модели с 7 миллиардами параметров, модели чата, адаптированной для практических сценариев, и системы обучения.	arXiv		Инструмент
СтажерLM-XComposer	InternLM-XComposer2 — это новаторская большая модель языка видения (VLLM), превосходящая себя в композиции и понимании текста и изображений в произвольной форме.	arXiv		Инструмент
Ян	Перенесите искусственный интеллект на свой рабочий стол.			Инструмент
Ламини	Lamini позволяет любой команде инженеров превзойти LLM общего назначения благодаря RLHF и точной настройке на собственных данных.			Инструмент
ЛаМини-ЛМ	LaMini-LM — это набор небольших по размеру эффективных языковых моделей, извлеченных из ChatGPT и обученных на крупномасштабном наборе данных из 2,58 млн инструкций.			Инструмент
Лангчейн	LangChain — это платформа для разработки приложений на основе языковых моделей.			Инструмент
LangFlow	⛓️ LangFlow — это пользовательский интерфейс для LangChain, разработанный с использованием React-Flow, позволяющий легко экспериментировать и создавать прототипы потоков.			Инструмент
ЛаВаг	Автоматизируйте автоматизацию с помощью платформы Large Action Model.			Инструмент
Лемур	Открытые базовые модели для языковых агентов.			Инструмент
Лептон ИИ	Платформа Pythonic для упрощения создания сервисов ИИ.			Инструмент
Лит-ЛЛАМА	Реализация языковой модели LLaMA на основе nanoGPT. Поддерживает флэш-внимание, 4-битное квантование Int8 и GPTQ, тонкую настройку адаптера LoRA и LLaMA, предварительное обучение.			Инструмент
llama2-webui	Запускайте Llama 2 локально с пользовательским интерфейсом Gradio на графическом процессоре или процессоре из любого места (Linux/Windows/Mac).			Инструмент
Лама 3	Официальный сайт Meta Llama 3 на GitHub.			Инструмент
Лама 3.1	Llama — это доступная открытая модель большого языка (LLM), предназначенная для разработчиков, исследователей и предприятий, позволяющая создавать, экспериментировать и ответственно масштабировать свои идеи генеративного ИИ.			Инструмент
LLaSM	Большая модель языка и речи.			Инструмент
Система ответов LLM	Создайте систему ответов, основанную на недоумении, используя Next.js, Groq, Mixtral, Langchain, OpenAI, Brave и Serper.			Инструмент
llm.c	Обучение LLM простому сырому C/CUDA.			Инструмент
LLMUnity	Создавайте персонажей в Unity с помощью LLM!		Единство	Инструмент
LЛокальный поиск	LLocalSearch — это полностью локально работающая поисковая система, использующая агенты LLM.			Инструмент
ЛогическиеИгрыРешатель	Инструмент Python для решения логических игр с использованием искусственного интеллекта, глубокого обучения и компьютерного зрения.			Инструмент
Лонграйтер	LongWriter: создание более 10 000 слов на основе LLM длинного контекста.	arXiv		Инструмент
Модель большого мира (LWM)	Модель большого мира (LWM) — это мультимодальная авторегрессионная модель общего назначения с большим контекстом.	arXiv		Инструмент
Люмина-T2X	Lumina-T2X — это унифицированная платформа для генерации текста в любой модальности.	arXiv		Инструмент
МетаGPT	Мультиагентная платформа			Инструмент
МиниКПМ-2Б	Торцевой LLM превосходит Llama2-13B.			Инструмент
МиниGPT-4	Улучшение понимания языка видения с помощью усовершенствованных моделей большого языка.	arXiv		Инструмент
МиниGPT-5	Перемежающаяся генерация видения и языка посредством генеративных вокенов.	arXiv		Инструмент
Микстрал 8х7Б	Высококачественная разреженная смесь экспертов.	arXiv		Инструмент
Мистраль 7Б	Лучшая модель 7B на сегодняшний день — Apache 2.0.			Инструмент
Мистраль Большой	Mistral Large — новая передовая модель генерации текста. Он достигает высочайшего уровня рассуждений.			Инструмент
МЛК, LLM	Предоставьте каждому возможность разрабатывать, оптимизировать и развертывать модели искусственного интеллекта на всех устройствах.			Инструмент
МобиЛлама	На пути к точному и легкому, полностью прозрачному GPT.	arXiv		Инструмент
МО-ЛЛАВА	Сочетание экспертов по большим моделям визуального языка.	arXiv		Инструмент
Моши	Моши — экспериментальный разговорный ИИ.			Инструмент
Моши	Моши: речево-текстовая основа для диалога в реальном времени.			Инструмент
МОХ	Модель разговорного языка с открытым исходным кодом, дополненная инструментами, разработанная Университетом Фудань.			Инструмент
mPLUG-Сова?	Модульизация наделяет большие языковые модели мультимодальностью.	arXiv		Инструмент
Немотрон-4	Большая многоязычная языковая модель с 15 миллиардами параметров, обученная на 8 триллионах текстовых токенов.	arXiv		Инструмент
НЕКСТ-GPT	Мультимодальная модель большого языка «любой к любому».			Инструмент
ОЛМо	Модель открытого языка	arXiv		Инструмент
ОмниЛММ	Большие мультимодальные модели для высокой производительности и эффективного развертывания.			Инструмент
ОдинLLM	Одна структура для согласования всех модальностей с языком.	arXiv		Инструмент
Открытый помощник	OpenAssistant — это помощник на основе чата, который понимает задачи, может взаимодействовать со сторонними системами и для этого динамически получать информацию.			Инструмент
ОпенДевин	Автономный инженер-программист искусственного интеллекта.			Инструмент
Орион-14Б	Орион-14Б — семейство моделей, включающее фундамент ЛЛМ 14Б и серию моделей.	arXiv		Инструмент
Панда	Зарубежная модель китайского языка с открытым исходным кодом, основанная на Llama-7B, -13B, -33B, -65B для непрерывного предварительного обучения на китайском языке.			Инструмент
Перплексика	Поисковая система на базе искусственного интеллекта.			Инструмент
Пи	Чат-бот с искусственным интеллектом, предназначенный для личной помощи и эмоциональной поддержки.			Инструмент
Квен1.5	Qwen1.5 — улучшенная версия Qwen.			Инструмент
Квен2	Qwen2 — это серия больших языковых моделей, разработанная командой Qwen, Alibaba Cloud.			Инструмент
Квен-7Б	Официальный репозиторий чата Qwen-7B (通义千问-7B) и предварительно обученной модели большого языка, предложенной Alibaba Cloud.			Инструмент
РепоАгент	RepoAgent — это проект с открытым исходным кодом, основанный на моделях больших языков (LLM), целью которого является предоставление интеллектуального способа документирования проектов.	arXiv		Инструмент
Движок здравомыслия AI	Sanity AI Engine для инструмента разработки игр Unity.		Единство	Инструмент
ПоискGPT	? Подключение ChatGPT к Интернету			Инструмент
ПоделитьсяGPT4V	Улучшение больших мультимодальных моделей с помощью более качественных подписей.			Инструмент
Скайворк	Модели серии Skywork предварительно обучены на 3,2 ТБ высококачественных многоязычных (в основном китайских и английских) и кодовых данных.			Инструмент
СтабильныйLM	Стабильность языковых моделей искусственного интеллекта.	arXiv		Инструмент
Стэнфордская Альпака	Модель LLaMA, следующая инструкциям.			Инструмент
Веб-интерфейс создания текста	Веб-интерфейс Gradio для запуска больших языковых моделей, таких как LLaMA, llama.cpp, GPT-J, OPT и GALACTICA.			Инструмент
TinyChatEngine	Библиотека вывода LLM на устройстве.			Инструмент
ИнструментСкамейка	Открытая платформа для обучения, обслуживания и оценки большой языковой модели для изучения инструментов.			Инструмент
Unity ЧатGPT	Unity ChatGPT Эксперименты.		Единство	Инструмент
Интеграция Unity OpenAI-API	Интегрируйте языковую модель openai GPT-3 и API ChatGPT в проект Unity.		Единство	Инструмент
Unreal Engine 5 Лама Лора	Проект проверки концепции, демонстрирующий потенциал использования небольших, обучаемых на месте LLM для создания инструментов документации следующего поколения.		Нереальный движок	Инструмент
UnrealGPT	Коллекция виджетов Unreal Engine 5 Editor Utility на базе GPT3/4.		Нереальный движок	Инструмент
Видео-LLaVA	Изучение единого визуального представления путем выравнивания перед проецированием.	arXiv		Инструмент
ВебGPT	Запустите модель GPT в браузере с помощью WebGPU.			Инструмент
Web3-GPT	Развертывание смарт-контрактов с помощью ИИ			Инструмент
WordGPT	? Используйте возможности ChatGPT в Microsoft Word			Инструмент
XАгент	Автономный агент LLM для решения сложных задач.			Инструмент
Йи	Серия крупных языковых моделей, обученных разработчиками с нуля.			Инструмент
01 Проект	Компьютер языковой модели с открытым исходным кодом.			Инструмент

^ Вернуться к содержанию ^

Игра (Агент)

Источник	Описание	Бумага	Тип
АгентБенч	Комплексный тест для оценки LLM как агентов.	arXiv	Агент
Групповой чат агентов	Симулякры интерактивного группового чата для лучшего выявления коллективного непредвиденного поведения.	arXiv	Агент
Агент К.	Автоагентный искусственный интеллект, который является саморазвивающимся и модульным.		Агент
Область агента	Начните создавать многоагентные приложения на базе LLM более простым способом.	arXiv	Агент
АгентSims	Песочница с открытым исходным кодом для оценки больших языковых моделей.		Агент
Ай-Таун	AI Town — это виртуальный город, где персонажи AI живут, общаются и общаются.		Агент
аниме.подруга	Локальная альтернатива CharacterAI с открытым исходным кодом.		Игра
Астрокада	Создавайте игры с помощью ИИ		Игра
Атомные агенты	Платформа Atomic Agents спроектирована как модульная, расширяемая и простая в использовании.		Агент
АвтоАгенты	Платформа для автоматического создания агентов.		Агент
Автогенерация	Включите приложения больших языковых моделей следующего поколения.	arXiv	Агент
поведение	Behaviac — это основа разработки игрового ИИ.		Рамки
Биомы	Biomes — это MMORPG-песочница с открытым исходным кодом, созданная для Интернета с использованием таких веб-технологий, как Next.js, Typescript, React и WebAssembly.		Игра
Буфер мыслей	Мысленно-дополненное рассуждение с использованием больших языковых моделей.	arXiv	Агент
Байзер-Агент	Простая, быстрая и распределенная среда агентов для всех.		Агент
Кошачий город	Моделирование кошек с помощью AC(h)atGPT.		Агент
Кошачий город	Моделирование кошек с помощью AC(h)atGPT.		Агент
ПерсонажGLM	Настройка китайских разговорных символов искусственного интеллекта с помощью больших языковых моделей.	arXiv	Агент
ЧатДев	Коммуникативные агенты для разработки программного обеспечения.	arXiv	Агент
CogAgent	CogAgent — это модель визуального языка с открытым исходным кодом, улучшенная на основе CogVLM.	arXiv	Агент
Колыбель	На пути к общему компьютерному управлению.		Агент
экипажИИ	Платформа для организации ролевых игр, автономных агентов ИИ.		Агент
Диди	Dify — это платформа для создания приложений LLM с открытым исходным кодом.		Агент
Проект цифровой жизни	Автономные 3D-персонажи с социальным интеллектом.	arXiv	Агент
все-ай	Ваш высококвалифицированный локальный чат-бот-помощник на базе искусственного интеллекта?		Агент
ткань	Fabric — это платформа с открытым исходным кодом для улучшения человеческого потенциала с помощью искусственного интеллекта.		Агент
ФастGPT	FastGPT — это платформа, основанная на знаниях, построенная на основе LLM.		Агент
fastRAG	Эффективная структура расширения и генерации поиска.		Агент
ИграAISDK	Платформа автоматизации игрового искусственного интеллекта на основе изображений.		Рамки
GameNGen	Модели диффузии — это игровые движки реального времени.	arXiv	Игра
GameGen-O	GameGen-O: создание видеоигр с открытым миром.		Игра
ГенАгент	GenAgent: создание систем искусственного интеллекта для совместной работы с автоматизированной генерацией рабочих процессов — практические примеры использования ComfyUI.	arXiv	Агент
Генеративные агенты	Интерактивные симулякры человеческого поведения.	arXiv	Агент
Бытие	Genesis: генеративный и универсальный физический двигатель для робототехники и не только.		Игра
Джинн	Генеративные интерактивные среды.		Игра
гигакс	NPC на базе LLM.		Игра
ГиппоРАГ	Нейробиологически обусловленная долговременная память для больших языковых моделей.	arXiv	Агент
Интерактивные NPC с поддержкой LLM	Interactive LLM Powered NPC — это проект с открытым исходным кодом, который полностью меняет ваше взаимодействие с неигровыми персонажами (NPC) в любой игре!		Игра
ИоА	Платформа с открытым исходным кодом для совместной работы агентов ИИ, позволяющая разным распределенным агентам объединяться и решать сложные задачи посредством подключения, подобного Интернету.		Агент
КвайАгенты	Обобщенная система агентов поиска информации с моделями большого языка (LLM).	arXiv	Агент
Лангчейн	Получите ваше заявление LLM от прототипа до производства.		Агент
Лангфлоу	Langflow — это пользовательский интерфейс для LangChain, разработанный с использованием React-flow, позволяющий легко экспериментировать и создавать прототипы потоков.		Агент
ЛангГраф Студия	LangGraph Studio предлагает новый способ разработки приложений LLM, предоставляя специализированную среду IDE для агентов, которая обеспечивает визуализацию, взаимодействие и отладку сложных агентных приложений.		Агент
РИПП	Ролевая игра «Язык-агент» для игр с открытым миром.	arXiv	Агент
Агентская система LLama	Агентские компоненты API-интерфейсов Llama Stack.		Агент
ЛамаИндекс	LlamaIndex — это платформа данных для вашего приложения LLM.		Агент
MindSearch	? Многоагентная платформа веб-поисковой системы на основе LLM (например, Perplexity.ai Pro и SearchGPT).		Агент
Смесь агентов (МОА)	Смешение агентов расширяет возможности больших языковых моделей.	arXiv	Агент
MMRроль	MMRole: Комплексная основа для разработки и оценки мультимодальных ролевых агентов.	arXiv	Агент
Moonlander.ai	Начните создавать 3D-игры без какого-либо программирования, используя генеративный искусственный интеллект.		Рамки
MuG Диффузия	MuG Diffusion — это искусственный интеллект для построения графиков для ритм-игр, основанный на Stable Diffusion (одна из самых мощных моделей AIGC) с большой модификацией для включения звуковых волн.		Игра
Оазис	Oasis — это интерактивная модель мира, разработанная Decart и Etched. Основанный на диффузионных преобразователях, Oasis принимает ввод пользователя с клавиатуры и генерирует игровой процесс авторегрессионным способом.		Игра
ОмАгент	Мультимодальная агентская среда для решения сложных задач.		Агент
OpenAgents	Открытая платформа для языковых агентов в дикой природе.		Агент
Опус	Приложение с искусственным интеллектом, которое превращает текст в видеоигру.		Игра
трубкакэт	Платформа с открытым исходным кодом для голосового и мультимодального диалогового искусственного интеллекта.		Агент
Квен-Агент	Qwen-Agent — это платформа для разработки приложений LLM, основанная на следовании инструкциям, использовании инструментов, планировании и возможностях памяти Qwen.		Агент
Раги	Ragas — это платформа, которая помогает вам оценить ваши конвейеры извлечения дополненной генерации (RAG).		Агент
РПБенч-Авто	Автоматизированный конвейер для оценки LLM для ролевых игр.		Игра
СИМА	Универсальный ИИ-агент для виртуальных 3D-сред.		Агент
StoryGames.ai	ИИ для мечтателей, создающих игры.		Игра
SWE-агент	Компьютерные интерфейсы агентов позволяют использовать языковые модели разработки программного обеспечения.	arXiv	Агент
Генератор задач	Агентская платформа на основе задач, основанная на выходных данных StrictJSON агентов LLM.		Агент
ДЕСЯТЬ Агент	TEN Agent — это первый в мире мультимодальный агент, работающий в режиме реального времени, интегрированный с OpenAI Realtime API, RTC, а также функции проверки погоды, веб-поиска, видения и RAG.		Агент
Агент по переводам	Агентический перевод с использованием рабочего процесса отражения.		Агент
Твиттер	Twitter Personality — это веб-приложение, которое анализирует ваш дескриптор Twitter для создания персонализированного профиля личности с помощью Wordware AI Agent.		Агент
Неограниченный	Unbounded: генеративная бесконечная игра моделирования жизни персонажей.	arXiv	Игра
Видео2Игра	Интерактивная, реалистичная и совместимая с браузером среда в реальном времени из одного видео.	arXiv	Игра
В-ИРЛ	Использование виртуального интеллекта в реальной жизни.	arXiv	Агент
агент веб-дизайна	Агент, используемый для веб-дизайна.		Агент
XАгент	Автономный агент LLM для решения сложных задач.		Агент

^ Вернуться к содержанию ^

Код

Источник	Описание	Бумага	Игровой движок	Тип
Переводчик кода AI	Используйте ИИ для перевода кода с одного языка на другой.			Код
aiXcoder-7B	Большая языковая модель кода aiXcoder-7B.			Код
ляп	bloop — быстрая поисковая система по коду, написанная на Rust.			Код
Глава	Интерпретатор кода ChatGPT в блокнотах Jupyter.			Код
КодGeeX	Модель генерации открытого многоязычного кода.	arXiv		Код
КодGeeX2	Более мощная модель генерации многоязычного кода.			Код
КодGeeX4	CodeGeeX4: открытая многоязычная модель генерации кода.			Код
Генератор кода	CodeGen — это модель синтеза программ с открытым исходным кодом. Обучался на ТПУ-v4. Конкурентноспособен с OpenAI Codex.	arXiv		Код
КодГен2	Модели CodeGen2 для синтеза программ.	arXiv		Код
Код Ламы	Code Llama — это большая языковая модель кода, основанная на Llama 2.			Код
КодTF	Универсальная библиотека трансформаторов для современного кода LLM.			Код
КодT5	LLM открытого кода для понимания и генерации кода.			Код
Курсор	Пишите, редактируйте и обсуждайте свой код с помощью GPT-4 в редакторе нового типа.			Код
DeepSeek Кодер	DeepSeek Coder: пусть код пишется сам.	arXiv		Код
Кодекс OpenAI	OpenAI Codex является потомком GPT-3.			Код
ПандыИИ	Pandas AI — это библиотека Python, которая интегрирует возможности генеративного искусственного интеллекта в Pandas, делая фреймы данных диалоговыми.			Код
RobloxScripterAI	RobloxScripterAI — это инструмент генерации кода на базе искусственного интеллекта для Roblox.		Роблокс	Код
Scikit-LLM	Легко интегрируйте мощные языковые модели, такие как ChatGPT, в scikit-learn для расширенных задач анализа текста.			Код
СоТаНа	Помощник по разработке программного обеспечения с открытым исходным кодом.	arXiv		Код
Стабильный код 3B	Кодирование на грани.			Код
Старкодер	? StarCoder — это языковая модель (LM), обученная на исходном коде и тексте на естественном языке.	arXiv		Код
СтарКодер 2	StarCoder2 — это семейство моделей генерации кода (3B, 7B и 15B), обученных на более чем 600 языках программирования из The Stack v2 и некоторых текстах на естественном языке, таких как Wikipedia, Arxiv и GitHub.	arXiv		Код
UnityGen ИИ	UnityGen AI — это плагин для генерации кода на базе искусственного интеллекта для Unity.		Единство	Код
Пустота	Void — это альтернатива Cursor с открытым исходным кодом. Пишите код с помощью лучших инструментов искусственного интеллекта, сохраняйте полный контроль над своими данными и получайте доступ к мощным функциям искусственного интеллекта.			Код

^ Вернуться к содержанию ^

Писатель

Источник	Описание	Тип
AI-писатель	ИИ пишет романы, генерирует фэнтезийные и любовные веб-статьи и т. д. Китайская предварительно обученная генеративная модель.	Писатель
Ноутбук.ай	Notebook.ai — это набор инструментов для писателей, гейм-дизайнеров и ролевых игроков, позволяющий создавать великолепные вселенные — и все, что внутри них.	Писатель
Роман	Редактор WYSIWYG в стиле Notion с автозаполнением на базе искусственного интеллекта.	Писатель
РоманИИ	Управляемый искусственным интеллектом, безболезненно создавайте уникальные истории, захватывающие истории, соблазнительные романы или просто дурачьтесь.	Писатель

^ Вернуться к содержанию ^

Изображение

Источник	Описание	Бумага	Игровой движок	Тип
AnyDoor	Настройка изображения на уровне объекта с нулевым выстрелом.	arXiv		Изображение
Любой текст	Многоязычное визуальное создание и редактирование текста.	arXiv		Изображение
АвтоСтудия	Создание единообразных предметов в многоходовой интерактивной генерации изображений.	arXiv		Изображение
Блендер-ControlNet	Использование ControlNet прямо в Blender.		Блендер	Изображение
БриВЛ	Соединение видения и языковой модели.	arXiv		Изображение
CatVTON	CatVTON: конкатенация — это все, что вам нужно для виртуальной примерки диффузионных моделей.	arXiv		Изображение
CLIPasso	Метод преобразования изображения объекта в эскиз, позволяющий использовать различные уровни абстракции.	arXiv		Изображение
КлипДроп	Создавайте потрясающие визуальные эффекты за считанные секунды.			Изображение
Удобный интерфейс	Мощный и модульный стабильный графический интерфейс диффузии с интерфейсом графов/узлов.			Изображение
Концептуальная лаборатория	Творческая генерация с использованием априорных ограничений диффузии.	arXiv		Изображение
Контрольная сеть	ControlNet — это структура нейронной сети для управления моделями диффузии путем добавления дополнительных условий.	arXiv		Изображение
CSGO	CSGO: композиция стилей контента при преобразовании текста в изображение.	arXiv		Изображение
ДАЛЛ·И 2	DALL·E 2 — это система искусственного интеллекта, которая может создавать реалистичные изображения и произведения искусства на основе описаний на естественном языке.			Изображение
Даштун Студия	Dashtoon Studio — платформа для создания комиксов на базе искусственного интеллекта.			Комикс
Глубокий ИИ	DeepAI предлагает набор инструментов, которые используют ИИ для повышения вашего творчества.			Изображение
ДипФлойд ИФ	IF от DeepFloyd Lab в StabilityAI.			Изображение
Глубина Что угодно V2	Глубина Что угодно V2	arXiv		Изображение
Библиотека карт глубины и позер	Библиотека карт глубины для использования с расширением Control Net для Automatic1111/stable-diffusion-webui.			Изображение
Диффузный на выбор	Обогащение условной окраски изображения в моделях скрытой диффузии для виртуального тестирования.	arXiv		Изображение
Дискотека Диффузия	Франкенштейновское объединение блокнотов, моделей и техник для создания искусственного интеллекта и анимации.			Изображение
ПеретащитеГАН	Интерактивное точечное манипулирование генеративным многообразием изображений.	arXiv		Изображение
Рисовать вещи	Генерация изображений с помощью искусственного интеллекта в вашем кармане.			Изображение
DWPose	Эффективная оценка позы всего тела с помощью двухэтапной дистилляции.	arXiv		Изображение
EasyPhoto	Ваш умный фотогенератор с искусственным интеллектом.			Изображение
Поток	Этот репозиторий содержит минимальный код вывода для преобразования текста в изображение и изображения в изображение с помощью наших скрытых выпрямленных преобразователей потока Flux.			Изображение
Следуй за своим щелчком	Региональная анимация изображений в открытом доступе с помощью коротких подсказок.	arXiv		Изображение
Фукус	Сосредоточьтесь на подсказках и побуждениях.			Изображение
GIFfusion	Создавайте GIF-файлы и видео с помощью Stable Diffusion.			Изображение
Заземленный сегмент-что угодно	Автоматически обнаруживайте, сегментируйте и генерируйте все, что угодно, используя изображения, текст и аудиовходы.	arXiv		Изображение
HivisionIDФотографии	HivisionIDPhotos: легкий и эффективный инструмент для фотографий AI ID.			Изображение
Хуа	Hua — редактор изображений с искусственным интеллектом и Stable Diffusion (и не только).			Изображение
Хунюань-ДиТ	Мощный диффузионный преобразователь с несколькими разрешениями и глубоким знанием китайского языка.	arXiv		Изображение
IC-Light	IC-Light — проект по управлению освещением изображений.			Изображение
Идеограмма	Помогаем людям стать более творческими.			Изображение
Изображение	Imagen — это система искусственного интеллекта, которая создает фотореалистичные изображения из введенного текста.			Изображение
img2img-турбо	Преобразование изображения в изображение за один шаг с помощью SD-Turbo.			Изображение
Img2Prompt	Получайте подсказки из изображений, созданных стабильной диффузией.			Изображение
Бесконечность	Бесконечность: масштабирование побитового авторегрессионного моделирования для синтеза изображений высокого разрешения.	arXiv		Изображение
InstantID	Генерация с нулевым выстрелом, сохраняющая идентичность, за считанные секунды.	arXiv		Изображение
СтажерLM-XComposer2	InternLM-XComposer2 — это новаторская большая модель языка видения (VLLM), превосходящая себя в композиции и понимании текста и изображений в произвольной форме.	arXiv		Изображение
КОАЛА	Самовнимание имеет значение при дистилляции знаний о моделях скрытой диффузии для эффективного использования памяти и быстрого синтеза изображений.			Изображение
Колорс	Колорс: Эффективное обучение модели диффузии для фотореалистичного синтеза текста в изображение.			Изображение
КРЕА	Создавайте изображения и видео с помощью замечательного инструмента дизайна на базе искусственного интеллекта.			Изображение
ЛаВи-Бридж	Объединение различных языковых моделей и моделей генеративного видения для преобразования текста в изображение.	arXiv		Изображение
СлойДиффузия	Распространение слоев прозрачного изображения с использованием скрытой прозрачности.	arXiv		Изображение
Лексика	Стабильная диффузия подсказывает поисковую систему.			Изображение
ЛамаГен	Модель авторегрессии превосходит диффузию: лама для создания масштабируемых изображений.	arXiv		Изображение
Люмина-мГПТ	Lumina-mGPT: гибкая фотореалистичная генерация текста в изображение с помощью мультимодальной генеративной предварительной подготовки.	arXiv		Изображение
МетаСтрельба	MetaShoot — это цифровой двойник фотостудии, разработанный как плагин для Unreal Engine, который дает любому создателю возможность создавать высокореалистичные рендеры самым простым и быстрым способом.		Нереальный движок	Изображение
Середина пути	Midjourney — независимая исследовательская лаборатория, исследующая новые способы мышления и расширяющая творческие способности человеческого рода.			Изображение
МИГК	MIGC: контроллер генерации нескольких экземпляров для синтеза текста в изображение.	arXiv		Изображение
Мимиккисть	Редактирование изображений с нуля с имитацией эталона.	arXiv		Изображение
ОмниГен	OmniGen: унифицированное создание изображений.	arXiv		Изображение
Омост	Omost — это проект по преобразованию возможностей кодирования LLM в возможности генерации изображений (или, точнее, создания изображений).			Изображение
Открытый редактор	Openpose Editor для стабильного-диффузионного веб-интерфейса AUTOMATIC1111.			Изображение
Нарядить кого угодно	Виртуальная примерка сверхвысокого качества для любой одежды и любого человека.			Изображение
КраскиОтменить	PaintsUndo: базовая модель поведения рисования в цифровой живописи.			Изображение
Фотомейкер	Настройка реалистичных фотографий людей с помощью встраивания сложенных идентификаторов.	arXiv		Изображение
Фотозал	Генератор фона AI.			Изображение
Пласк	Генерация изображений AI в облаке.			Изображение
Подскажите.Арт	Центр генераторов.			Изображение
ПуЛИД	Настройка идентификатора Pure и Lightning посредством контрастного выравнивания.	arXiv		Изображение
Преобразование форматированного текста в изображение	Выразительное преобразование текста в изображение с помощью форматированного текста.	arXiv		Изображение
RPG-DiffusionMaster	Освоение диффузии текста в изображение: повторение, планирование и генерация с помощью мультимодальных LLM (PRG).			Изображение
SEED-История	SEED-Story: создание мультимодальной длинной истории с большой языковой моделью.	arXiv		Изображение
Сегментируйте что угодно	Segment Anything Model (SAM): новая модель ИИ от Meta AI, которая может «вырезать» любой объект на любом изображении одним щелчком мыши.	arXiv		Изображение
Сегментируйте что угодно, модель 2 (SAM 2)	SAM 2: Сегментируйте все, что есть в изображениях и видео.	arXiv		Изображение
SD-Webui-ControlNet	Расширение WebUI для ControlNet.			Изображение
SDXL-Молния	Прогрессивная состязательная диффузионная дистилляция.	arXiv		Изображение
SDXS	Одношаговые модели скрытой диффузии в реальном времени с условиями изображения.			Изображение
Стабильный.арт	Плагин Photoshop для Stable Diffusion с автоматическим1111 в качестве серверной части (локально или с помощью Google Colab).			Изображение
Стабильный Каскад	Стабильный каскад состоит из трех моделей: Stage A, Stage B и Stage C, представляющих собой каскад генерации изображений, отсюда и название «Стабильный каскад».			Изображение
Стабильная диффузия	Скрытая модель диффузии текста в изображение.			Изображение
стабильная-diffusion.cpp	Стабильная диффузия на чистом C/C++.			Изображение
Стабильный веб-интерфейс Diffusion	Интерфейс браузера на основе библиотеки Gradio для Stable Diffusion.			Изображение
Стабильный веб-интерфейс Diffusion	Веб-интерфейс для стабильного распространения.			Изображение
Стабильный Diffusion WebUI на китайском языке	Китайская версия стабильной диффузии-webui.			Изображение
Стабильная диффузия XL	Генерация изображений из текста.	arXiv		Изображение
Стабильная диффузия XL Turbo	Генерация текста в изображение в реальном времени.			Изображение
Стабильная диффузия 3.5	Открытая версия Stable Diffusion 3.5 включает несколько вариантов моделей, включая Stable Diffusion 3.5 Large и Stable Diffusion 3.5 Large Turbo.			Изображение
Стабильный дудл	Stable Doodle — это инструмент для создания эскизов, который преобразует простой рисунок в динамическое изображение.			Изображение
СтабильнаяСтудия	StableStudio от Stability AI			Изображение
Сторисмейкер	StoryMaker: на пути к целостным единообразным персонажам при преобразовании текста в изображение.	arXiv		Изображение
ПотокДиффузия	Решение на уровне конвейера для интерактивной генерации в реальном времени.			Изображение
СтильDrop	Преобразование текста в изображение в любом стиле.	arXiv		Изображение
SyncDreamer	Генерация изображений, согласованных с несколькими изображениями, из изображения с одним изображением.	arXiv		Изображение
УльтраПравить	UltraEdit: детальное редактирование изображений в масштабе на основе инструкций.	arXiv		Изображение
УльтраПиксель	UltraPixel: продвижение синтеза изображений сверхвысокого разрешения к новым вершинам.	arXiv		Изображение
Стабильная диффузия Unity ML	Стабильная диффузия Core ML в Unity.		Единство	Изображение
Виспанк Видения	Платформа для преобразования текста в изображение.			Изображение

^ Вернуться к содержанию ^

Текстура

Источник	Описание	Бумага	Игровой движок	Тип
CRM	Одно изображение в 3D-текстурированную сетку с моделью сверточной реконструкции.	arXiv		Текстура
DreamMat	Генерация высококачественных PBR-материалов с помощью моделей диффузии с учетом геометрии и света.	arXiv		Текстура
DreamSpace	Мечтайте о пространстве своей комнаты с помощью текстового панорамного распространения текстур.			Текстура
Текстуры мечты	Стабильная диффузия, встроенная в Blender. Создавайте текстуры, концепт-арт, фоновые ресурсы и многое другое с помощью простой текстовой подсказки.		Блендер	Текстура
InstructHumans	Редактирование анимированных 3D-текстур человека с помощью инструкций.	arXiv		Текстура
Интекс	Интерактивный синтез текста в текстуру посредством унифицированной прорисовки с учетом глубины.	arXiv		Текстура
LLaMA-Сетка	LLaMA-Mesh: объединение создания 3D-сетей с языковыми моделями.	arXiv		сетка
МатериалSeg3D	MaterialSeg3D: сегментация плотных материалов из 2D-априорных материалов для 3D-активов.	arXiv		Текстура
СеткаЧто угодно	MaterialSeg3D: сегментация плотных материалов из 2D-априорных материалов для 3D-активов.	arXiv		сетка
Неураланджело	Высокоточная реконструкция поверхности нейронов.	arXiv		Текстура
Раскрась это	Синтез текста в текстуру посредством глубокой оптимизации сверточных текстурных карт и физически обоснованного рендеринга.			Текстура
Поликам	Создавайте свои собственные 3D-текстуры, просто набрав текст.			Текстура
ТексФьюжн	Синтез 3D-текстур с помощью моделей диффузии изображений, управляемых текстом.	arXiv		Текстура
Текст2Текс	Синтез текстовых текстур с помощью моделей диффузии.	arXiv		Текстура
Текстурная лаборатория	Текстуры, созданные искусственным интеллектом. Вы можете создать свой собственный с помощью текстовой подсказки.			Текстура
С Поли	Создайте текстуры с помощью Poly. Создавайте 3D-материалы с помощью искусственного интеллекта в бесплатном онлайн-редакторе или пользуйтесь поиском в нашей растущей библиотеке сообщества.			Текстура
X-сетка	X-Mesh: к быстрой и точной текстовой 3D-стилизации с помощью динамического текстового руководства.	arXiv		Текстура

^ Вернуться к содержанию ^

Шейдер

Источник	Описание	Бумага	Игровой движок	Тип
ИИ-шейдер	Генератор шейдеров на базе ChatGPT для Unity.		Единство	Шейдер

^ Вернуться к содержанию ^

3D модель

Источник	Описание	Бумага	Игровой движок	Тип
Анимате3D	Animate3D: анимация любой 3D-модели с помощью многопросмотрового распространения видео.	arXiv		3D
Что-нибудь-3D	Сегмент-Что угодно + 3D. Давайте поднимем что угодно до 3D.	arXiv		Модель
Any2Point	Any2Point: расширение возможностей больших моделей любой модальности для эффективного понимания 3D.	arXiv		3D
БлендерGPT	Используйте команды на английском языке для управления Blender с помощью OpenAI GPT-4.		Блендер	Модель
Блендер-GPT	Универсальный помощник Blender на базе интеграции GPT3/4 + Whisper.		Блендер	Модель
Блокадные лаборатории	Цифровая алхимия реальна благодаря Skybox Lab — идеальному решению на базе искусственного интеллекта для создания невероятных впечатлений от скайбокса на 360° из текстовых подсказок.			Модель
CF-3DGS	3D-гауссово разбрызгивание без COLMAP.	arXiv		3D
Генерация персонажей	Генерация персонажей: эффективная генерация 3D-персонажей из отдельных изображений с канонизацией многоракурсных поз.	arXiv		3D
чатGPT-майя	Простой инструмент Maya, использующий открытый искусственный интеллект для выполнения основных задач на основе описательных инструкций.		Майя	Модель
Город Мечтатель	Композиционная генеративная модель неограниченных трехмерных городов.	arXiv		3D
ЦСМ	Создавайте 3D-миры из изображений и видео.			3D
Бросаться	Ваш второй пилот в построении мира в Unreal Engine.		Нереальный движок	3D
DreamCatalyst	DreamCatalyst: быстрое и высококачественное 3D-редактирование посредством контроля возможности редактирования и сохранения идентичности.	arXiv		3D
МечтаGaussian4D	Генеративное 4D гауссово сплаттинг.	arXiv		4D
DUST3R	Геометрическое 3D-видение стало проще.	arXiv		3D
Эдифицируйте 3D	Edify 3D: масштабируемое создание высококачественных 3D-ресурсов.	arXiv		3D
ГАЛА3D	GALA3D: На пути к созданию сложных сцен из текста в 3D с помощью генеративного гауссовского сплаттинга на основе макета.	arXiv		3D
ГауссCtrl	GaussCtrl: многопросмотровое согласованное редактирование 3D-гауссовских пятен на основе текста.	arXiv		3D
ГауссовКуб	Структурированное и явное представление излучения для генеративного 3D-моделирования.	arXiv		3D
Гауссов Мечтатель	Быстрая генерация текста в 3D-гауссово пятно с использованием априорных облаков точек.	arXiv		3D
GenieLabs	Расширьте возможности своей игры с помощью AI-UGC.			3D
ПриветФА	Высокоточное преобразование текста в 3D с расширенным руководством по диффузии.			Модель
голомечтатель	HoloDreamer: создание целостного панорамного трехмерного мира на основе текстовых описаний.	arXiv		3D
Хунюань3D-1.0	Hunyuan3D-1.0: унифицированная платформа для преобразования текста в 3D и изображения в 3D.	arXiv		3D
Инфиниген	Бесконечные фотореалистичные миры с использованием процедурной генерации.	arXiv		3D
Инструкция-NeRF2NeRF	Редактирование 3D-сцен с помощью инструкций.	arXiv		Модель
Интерактивный3D	Создайте то, что хотите, с помощью интерактивной 3D-генерации.	arXiv		3D
Изотропный3D	Преобразование изображения в 3D на основе встраивания одного CLIP.			3D
ЛАТТЕ3D	Крупномасштабный синтез амортизированного текста в расширенном 3D.	arXiv		3D
ЛЕВ	Модели диффузии скрытых точек для создания трехмерных форм.	arXiv		Модель
Лума ИИ	Снимайте в реалистичном 3D. Непревзойденный фотореализм, отражения и детали. Будущее визуальных эффектов теперь для всех!			Модель
люмин ИИ	Творчество на основе искусственного интеллекта.			3D
Сделай это-3D	Высококачественное создание 3D-изображений из одного изображения с использованием технологии Diffusion Prior.	arXiv		Модель
сетчатый	Создавайте потрясающие 3D-игровые ресурсы с помощью ИИ.			3D
Движение	Создатель волшебной 3D-анимации с искусственным интеллектом.			3D
МВДрим	Многопросмотровое распространение для создания 3D-изображений.	arXiv		3D
NVIDIA Мгновенный NeRF	Примитивы мгновенной нейронной графики: молниеносный NeRF и многое другое.			Модель
Один-2-3-45	Преобразование любого отдельного изображения в 3D-сетку за 45 секунд без оптимизации каждой формы.	arXiv		Модель
Краска3D	Рисуйте что угодно в 3D с помощью моделей диффузии текстур без освещения.	arXiv		3D
ПАНИЦ-3D	Стилизованная одноракурсная 3D-реконструкция портретов персонажей аниме.	arXiv		Модель
Точка·E	Диффузия облаков точек для синтеза 3D-моделей.			Модель
Плодовитый Мечтатель	Высокоточное и разнообразное преобразование текста в 3D с вариационной дистилляцией оценок.	arXiv		Модель
СФ3D	SF3D: стабильная и быстрая реконструкция 3D-сетки с УФ-разверткой и распутыванием освещения.	arXiv		3D
Форма	Создавайте 3D-объекты на основе текста или изображений.	arXiv		Модель
Слойд	3D-моделирование никогда не было проще.			Модель
Сплайн ИИ	Сила искусственного интеллекта переходит в третье измерение. Создавайте объекты, анимацию и текстуры с помощью подсказок.			Модель
Стабильный Dreamfusion	Реализация Pytorch модели Dreamfusion для преобразования текста в 3D, основанная на модели Stable Diffusion для преобразования текста в 2D.			Модель
СВ3Д	Новый многоракурсный синтез и генерация 3D из одного изображения с использованием скрытой диффузии видео.	arXiv		3D
Тафи	AI-текст в движок 3D-персонажей.			Модель
3D-GPT	Процедурное 3D-моделирование с использованием больших языковых моделей.	arXiv		3D
3D-LLM	Внедрение трехмерного мира в большие языковые модели.	arXiv		3D
3Dпрессо	Извлеките 3D-модель объекта, снятую на видео.			Модель
3DТопия	Преобразование текста в 3D за 5 минут.	arXiv		3D
3DТопия-XL	3DTopia-XL: Масштабирование создания высококачественных 3D-ресурсов посредством примитивного распространения.	arXiv		3D
тристудия	Единая платформа для создания 3D-контента.			Модель
ТрипоСР	Современная модель с открытым исходным кодом для быстрой 3D-реконструкции с прямой связью по одному изображению.	arXiv		Модель
Уникальный3D	Высококачественное и эффективное создание 3D-сетки из одного изображения.	arXiv		3D
UnityGaussianSplatting	Визуализация игрушечного гауссовского сплаттинга в Unity.		Единство	3D
ViVid-1-к-3	Новый синтез представлений с моделями видеодиффузии.	arXiv		3D
Вокскрафт	Создание готовых к использованию 3D-моделей с помощью искусственного интеллекта.			3D
Чудо3D	Преобразование одного изображения в 3D с использованием междоменной диффузии.	arXiv		3D
От нуля до трех	Преобразование одного изображения в 3D-объект с нуля.	arXiv		Модель

^ Вернуться к содержанию ^

Аватар

Источник	Описание	Бумага	Игровой движок	Тип
АниПортрет	Аудио-синтез фотореалистичной портретной анимации.	arXiv		Аватар
СПОКОЙСТВИЕ	Условно-состязательные латентные модели для управляемых виртуальных персонажей.	arXiv		Аватар
ЧатАватар	Прогрессивное поколение анимируемых трехмерных лиц под руководством текста.			Аватар
Чатдолькит	Chatdollkit позволяет вам превратить вашу 3D -модель в чат -бот.		Единство	Аватар
Dreamtalk	Когда выразительная генерация головы соответствует вероятностным моделям диффузии.	arxiv		Аватар
Duix	Duix - цифровой SDK на основе кремния?			Аватар
Эхомимический	Echomimic: жизненный звуковой портретный анимацию, управляемые аудио, через редактируемые условия для знаковых.	arxiv		Аватар
Emoportraits	Увеличенные эмоциями мультимодальные аватары головы.			Аватар
E3 Gen	Эффективное, выразительное и редактируемое поколение аватаров.	arxiv		Аватар
Эксаватар	Exavatar - выразительный 3 -й гауссовый аватар всего тела.	arxiv		Аватар
Генеаватар	Общее редактирование аватара с общим выражением.	arxiv		Аватар
GeneFace ++	Обобщенные и стабильные 3D-разговоры в реальном времени.			Аватар
Привет	Иерархический звук визуальный синтез для портретной анимации изображения.	arxiv		Аватар
Hallo2	Hallo2: долгосрочная и высокая регламентальная анимация портрета.	arxiv		Аватар
Headsculpt	Создание трехмерных аватаров с текстом.	arxiv		Аватар
Intrinsicavatar	Intrinsicavatar: физически основанный обратный рендеринг динамических людей из монокулярных видео с помощью явного трассировки лучей.	arxiv		Аватар
Линейный	Цифровая аватарная разговорная система.			Аватар
LiveПортрет	LivePortrait: эффективная портретная анимация с управлением строками и ретаргетингом.	arxiv		Аватар
MotionGpt	Человеческое движение как иностранный язык, унифицированная модель генерации движения с использованием LLMS.	arxiv		Аватар
Мусеса	Musepose: основанная на позе структура изображения к видео для виртуального человеческого поколения.			Аватар
Musetalk	В реальном времени высококачественная синхронизация губ с скрытым пространством.			Аватар
Муз	Бесконечная и высокая верность Виртуальная генерация человеческого видео с визуальным параллельным равенством.			Аватар
Портрет4d	Изучение синтеза аватара с одним выстрелом с использованием синтетических данных.	arxiv		Аватар
Готовой игрок меня	Интегрируйте настраиваемые аватары в свою игру или приложение за несколько дней.			Аватар
Родинхд	Rodinhd: генерация 3D-аватара с высокой точностью с диффузионными моделями.	arxiv		Аватар
Styleavatar3d	Использование моделей диффузии с изображением текста для генерации 3D-аватара с высокой точки зрения.	arxiv		Аватар
Text2control3d	Контролируемая генерация 3D-аватара в областях нервного сияния с использованием диффузионной диффузии, управляемой геометрией.	arxiv		Аватар
Topo4d	Содержание топологии гауссово расколоть для захвата 4D головы с высокой точки зрения.	arxiv		Аватар
Unityaiwithchatgpt	Основываясь на Unity, реализуется интерактивный дисплей CATGPT+UnityChan Voice.		Единство	Аватар
Vid2avatar	3D-реконструкция аватара из видео в дикой природе через самоотверженное разложение сцены.	arxiv		Аватар
Влоггер	Мультимодальная диффузия для синтеза воплощенного аватара.			Аватар
Wild2avatar	Определение людей за окклюзиями.	arxiv		Аватар

^ Вернуться к содержанию ^

Анимация

Источник	Описание	Бумага	Тип
Оживить кого -нибудь	Последовательный и контролируемый синтез изображения к видео для анимации персонажа.	arxiv	Анимация
Анимация	Мелкозернистая анимация изображения открытого домена с руководством движения.	arxiv	Анимация
Анимация	Оживить свои персонализированные диффузионные модели текста до изображения без определенной настройки.	arxiv	Анимация
Animatelcm	Давайте ускоряем генерацию видео в течение 4 шагов!	arxiv	Анимация
Animate-X	Animate-X: универсальная анимация изображения персонажа с улучшенным представлением движения.	arxiv	Анимация
Animatezero	Модели диффузии видео-это аниматоры с нулевым выстрелом.	arxiv	Анимация
Анимациягпт	Инструмент AIGC для генерации игровых боевых активов.		Анимация
Дефорум	Дефорум использует стабильную диффузию для создания развивающихся визуальных эффектов ИИ.		Анимация
Рисунки	Результаты: 3D -анимация из отдельных рисунков символов.	arxiv	Анимация
Dreamving	Основная структура генерации видео, основанная на диффузионных моделях.	arxiv	Анимация
FaceFusion	Следующее поколение Face Swapper и Enhancer.		Анимация
FreeInit	Соединение разрыва инициализации в моделях диффузии видео.	arxiv	Анимация
Geneface	Обобщенное и высококачественное звуковое 3D-синтез 3D.	arxiv	Анимация
Идентификатор	Ноль-выстрел, сохраняющий идентификационные генерации человеческого видео.	arxiv	Анимация
Maganimate	Временно последовательная анимация человеческого изображения с использованием диффузионной модели.	arxiv	Анимация
Нува	Dragnuwa-это модель генерации видео на основе диффузии на основе диффузии с открытым доменом, на основе управления текстом, изображений и траектории для достижения управляемого генерации видео.	arxiv	Анимация
Nuwa-Infinity	Nuwa-Infinity-это мультимодальная генеративная модель, которая предназначена для создания высококачественных изображений и видео из данного текста, изображения или видео ввода.		Анимация
Nuwa-xl	Новая диффузия над диффузионной архитектурой для чрезвычайно длинной генерации видео.		Анимация
Omni Animation	ИИ сгенерировал анимацию с высокой точностью.		Анимация
Пиа	Ваш персонализированный аниматор изображения через модули Plugne-Play в моделях текста к изображению.	arxiv	Анимация
Садталкер	Изучение реалистичных 3D-коэффициентов движения для стилизованного звукового отдельного изображения. Говоря об анимации лица.	arxiv	Анимация
Sadtalker-Video-Lip-Sync	Этот проект основан на Sadtalkers Wav2lip для синтеза губ.		Анимация
Стабильная анимация	Мощный инструмент текста к анимации для разработчиков.		Анимация
Talecrafter	Интерактивный инструмент визуализации истории, который поддерживает несколько персонажей.	arxiv	Анимация
Tooncrafter	Tooncrafter: генеративная мультипликационная интерполяция.	arxiv	Анимация
Wav2lip	Точнее видео с синхронизацией губ в дикой природе.	arxiv	Анимация
Wonder Studio	Инструмент искусственного интеллекта, который автоматически анимирует, освещает и составляет персонажи CG в сцену живого действия.		Анимация

^ Вернуться к содержанию ^

Визуальный

Источник	Описание	Бумага	Тип
Камбрий-1	Cambrian-1: полностью открытое, ориентированное на зрение исследование мультимодальных LLM.	arxiv	Мультимодальный LLMS
Cogvlm2	Многомодальная модель с открытым исходным кодом на уровне GPT4V на основе LLAMA3-8B.		Визуальный
Cotracker	Лучше отслеживать вместе.	arxiv	Визуальный
Evf-sam	EVF-SAM: слияние на основе раннего зрений для сегмента, вызванного текстом, что угодно.	arxiv	Визуальный
Facehi	Лучше отслеживать вместе.		Визуальный
Internlm-xcomposer2	Internlm-xcomposer2-это новаторская зрение на языке зрений (VLLM), превосходная в составе и понимании текстового изображения в свободной форме.	arxiv	Визуальный
Кенгуру	Kangaroo: мощная видеоязычная модель, поддерживающая длинно контекстовый видео ввод.		Визуальный
LGVI	На пути к языковому видео внедрение через мультимодальные крупные языковые модели.		Визуальный
Llava ++	Расширение визуальных возможностей с Llama-3 и Phi-3.		Визуальный
Llava-Onevision	Llava-Onevision: легкая визуальная передача задачи.	arxiv	Визуальный
Лонгва	Длинная передача контекста от языка к видению.	arxiv	Визуальный
Масквит	В визуальном предварительном тренировке замаскировано предсказание видео.	arxiv	Визуальный
Minicpm-llama3-v 2.5	Уровень GPT-4V MLLM на вашем телефоне.		Визуальный
МО-ЛЛАВА	Смесь экспертов для больших моделей языка зрения.	arxiv	Визуальный
Motionllm	Понимание поведения человека от человеческих движений и видео.	arxiv	Визуальный
Пллава	Расширение Llava без параметров от изображений на видео для видео для видео.	arxiv	Визуальный
Qwen-Vl	Универсальная модель на языке зрения для понимания, локализации, чтения текста и за ее пределами.	arxiv	Визуальный
Sapiens	Sapiens: Фонд для моделей человеческого зрения.	arxiv	Визуальный
ShareGPT4V	Улучшение больших мультимодальных моделей с лучшими подписями.	arxiv	Визуальный
СОЛО	Соло: единственный трансформатор для масштабируемого моделирования на языке зрения.	arxiv	Визуальный
Видеокам	Видео-CCAM: продвижение понимания видеоязыка с причинными масками.		Визуальный
Видео-лава	Изучение объединенного визуального представления по выравниванию перед проекцией.	arxiv	Визуальный
Видеоллама 2	Добавление пространственного временного моделирования и понимания аудио в видео-LLM.	arxiv	Визуальный
Видео-мам	Первый в истории всеобъемлющий эталон оценки мультимодальных LLMS в видео-анализе.	arxiv	Визуальный
Витрон	Unified Pixel Vision LLM для понимания, создания, сегментирования, редактирования.		Визуальный
Вила	Вила: на предварительном тренировке для моделей визуального языка.	arxiv	Визуальный

^ Вернуться к содержанию ^

Видео

Источник	Описание	Бумага	Тип
360DVD	Контролируемая генерация видео панорамы с 360-градусной моделью диффузии видео.	arxiv	Видео
Анимат-история	Поиск подавленного генерации видео для рассказа истории.	arxiv	Видео
Что -нибудь в любой сцене	Фотореалистическая вставка объекта.		Видео
Искусство • v	Авторегрессивное генерация текста к Video с диффузионными моделями.	arxiv	Видео
Вспомогательный	Познакомьтесь с генеративной видео платформой, которая оживляет ваши идеи.		Видео
Атомовидео	Высокая точность изображения к Video Generation.	arxiv	Видео
FounalRemover	Фоновое средство для удаления позволяет удалить фон из изображений и видео с использованием AI с помощью простого интерфейса командной строки, который является бесплатным и открытым исходным кодом.		Видео
Прокладка	Генерирование богатых и контролируемых движений для синтеза видео.	arxiv	Видео
Кодф	Поля деформации контента для временной последовательной обработки видео.	arxiv	Видео
Cogvideo	Генерировать видео из описания текста.		Видео
Cogvideox	Cogvideox-это версия модели генерации видео с открытым исходным кодом, которая гомологична 清影.		Видео
Cogvlm	Cogvlm-это мощная модель визуального языка с открытым исходным кодом (VLM).		Визуальный
Конр	Genarate яркие танцевальные видео из листов аниме-персонажей нарисованных вручную (ACS).	arxiv	Видео
Декогерировать	Создайте то, что нельзя снять.		Видео
Описание	Описание - это простой, мощный и интересный способ редактирования.		Видео
Диффутон	Редактируемое затенение с высоким разрешением с помощью диффузионных моделей.	arxiv	Видео
дельфин	Общая платформа взаимодействия видео на основе LLMS.		Видео
Domoai	Увеличьте свое творчество с помощью Domoai.		Видео
Dreamcinema	DreamCinema: кинематографическая передача с бесплатной камерой и 3D -персонажем.	arxiv	Видео
Dynamicrafter	Анимирующие изображения с открытыми доменами с помощью априоров диффузии видео.	arxiv	Видео
КРАЙ	Мы вводим Edge, мощный метод для редактируемого поколения танцев, который способен создавать реалистичные, физически правдоподобные танцы, оставаясь верной произвольной входной музыке.	arxiv	Видео
Эмо	Emote Portrait Alive - генерирование экспрессивных портретных видео с диффузионной моделью Audio2Video в слабых условиях.	arxiv	Видео
EMU видео	Факторизация генерации текста к Video с помощью явного кондиционирования изображения.		Видео
Этна	ETNA может генерировать соответствующий видеоконтент на основе коротких текстовых описаний.		Видео
Сказочный	Быстро параллелизированный синтез видео-видео-видео под управлением инструкциями.		Видео
Следуйте за вагоном	Следуйте за вагоном: видео с более высоким разрешением с обширным поколением контента.	arxiv	Видео
Следуйте за своей позой	Позму с позой, с использованием видео, не содержащих позы видео.	arxiv	Видео
Fulljourney	Ваш полный набор инструментов создания ИИ у вас под рукой.		Видео
Gen-2	Многомодальная система ИИ, которая может генерировать новые видео с текстом, изображениями или видеоклипами.		Видео
Генеративная динамика	Генеративная динамика изображения.		Видео
Джинн	Генеративные интерактивные среды.	arxiv	Видео
Genmo	Волшебным образом снимать видео с ИИ.		Видео
Джентрон	Диффузионные трансформаторы для изображения и генерации видео.		Видео
Иген	Иерархическое пространственно-временное развязка для генерации текста к Video.		Видео
Hotshot-xl	Hotshot-XL-это модель Text-GIF AI, обученную работать вместе со стабильной диффузией XL.		Видео
Хунюанвидео	Hunyuanvideo: систематическая структура для большой модели генерации видео.	arxiv	Видео
ИМЕННОЕ ВИДЕО	Учитывая текстовую подсказку, Imagen Video генерирует видео с высокой четкой, используя базовую модель генерации видео и последовательность чередующихся моделей пространственного и временного видео с разрешением.		Видео
Инструкторвидео	Инструктирование видео диффузии с обратной связью с человека.	arxiv	Видео
I2vgen-xl	Высококачественный синтез изображения к видео посредством каскадных диффузионных моделей.	arxiv	Видео
Лави	Высококачественная генерация видео с каскадными скрытыми моделями диффузии.	arxiv	Видео
ЛТХ Студия	LTX Studio — это комплексная платформа для кинопроизводства, управляемая искусственным интеллектом, для авторов, маркетологов, кинематографистов и студий.		Видео
LTX-Video	LTX-Video-первая модель генерации видео на основе DIT, которая может генерировать высококачественные видео в режиме реального времени. Он может генерировать 24 видео -кадров с разрешением 768x512, быстрее, чем нужно для их просмотра.		Видео
Люмьер	Проблемная диффузионная модель для генерации видео.	arxiv	Видео
LVDM	Скрытые модели диффузии видео для высокой точки зрения длинной генерации видео.	arxiv	Видео
Magic -Video	Эффективная генерация видео с скрытыми диффузионными моделями.	arxiv	Видео
Magic-Vide-V2	Многостадийное высокоастетическое генерацию видео.	arxiv	Видео
Волшебный час	ИИ видео для создателей сделало простое.		Видео
Magvit-V2	Токенизатор является ключом к генерации визуальной формы.		Видео
Магвит	Генеративный видео -трансформатор в масках.		Видео
Make-a-video	Make-A-Video-это современная система ИИ, которая генерирует видео из текста.	arxiv	Видео
Сделайте пиксели танцевать	Высоко-динамическое генерация видео.	arxiv	Видео
Делать свой видео	Индивидуальная генерация видео с использованием текстового и структурного руководства.	arxiv	Видео
Микроцинемема	Разделение и подтверждение подхода для генерации текста к Video.	arxiv	Видео
Мимо	MIMO: Синтез управляемого видео с пространственным разложенным моделированием.	arxiv	Видео
Мини-гемини	Добывать потенциал моделей языка многомодальности.		Зрение
MobileVidFactory	Автоматическая диффузионная социальная медиа-генерация для мобильных устройств из текста.		Видео
Моти 1	Mochi 1-это открытая современная модель генерации видео с движением с высокой точки зрения и сильной быстрого приверженности в предварительной оценке.		Видео
Mofa-video	Управляемая анимация изображения с помощью генеративных адаптаций поля движения в модели замороженной диффузионной диффузии изображения к видео.	arxiv	Видео
MoneyPrinterTurbo	Используйте большие модели, чтобы создать короткие видео с одним щелчком.		Видео
Мунэлли	Moonvalley-новая новая генеративная AI-модель текста к Video.		Видео
Мора	Больше похоже на Сору для генерального видео генерации.	arxiv	Видео
Morph Studio	С нашей магией Text-To-Video AI, проявите ваше творчество с помощью вашего подсказки.		Видео
MotionClone	MotionClone: клонирование без тренировок для управляемого генерации видео.	arxiv	Видео
MotionCtrl	Единый и гибкий контроллер движения для генерации видео.	arxiv	Видео
MotionDirector	Настройка движения моделей диффузии текста к Video.	arxiv	Видео
Motionshop	Применение замены персонажей в видео на 3D -аватары.		Видео
Mov2mov	Плагин Mov2mov для Automatic1111/Stable-Diffusion-Webui.		Видео
Moviefactory	Автоматическое создание фильмов из текста с использованием больших генеративных моделей для языка и изображений.	arxiv	Видео
Нейронные рамки	Откройте для себя синтезатор для визуального мира.		Видео
Neverends	Создайте свой мир.		Видео
Открытая сора	Демократизация эффективного видеопроизводства для всех.		Видео
Открытая сора	План открытого сора.		Видео
Фенаки	Модель для генерации видео из текста, с подсказками, которые могут меняться со временем, и видео, которые могут быть дольше, как и несколько минут.	arxiv	Видео
Pika Labs	Pika Labs революционизирует видео с ИИ.		Видео
Пикселинг	Pixeling дает возможность нашим клиентам создавать очень точные, ультрареалистичные и чрезвычайно контролируемые визуальное содержание, включая изображения, видео и 3D-модели.		Видео
ПиксВерс	Создайте захватывающие дух видео с ИИ.		Видео
Опыления	Создание становится легким, быстрым и веселым.		Видео
Повторное использование и рассеяние	Итеративное денирование для поколения текста в Video.	arxiv	Видео
Жуйи	Ruyi-это модель с изображением к видео, способная генерировать видео кинематографического качества с разрешением 768, с частотой кадров 24 кадров в секунду, на общей сложности 5 секунд и 120 кадров.		Видео
Shortgpt	Экспериментальная структура искусственного интеллекта для автоматического создания короткого/видеоконтента.		Видео
Show-1	Жениться на пиксельных и скрытых диффузионных моделях для генерации текста к Video.	arxiv	Видео
Snap Video	Масштабированные пространственно-временные трансформаторы для синтеза текста к видео.	arxiv	Видео
Сора	Создание видео из текста.		Видео
Sorawebui	Sorawebui-это веб-клиент Sora с открытым исходным кодом, который позволяет пользователям легко создавать видео из текста с моделью Sora Openai.		Видео
Stablevideo	Редактирование видео диффузионного видео, управляемого текстовым диффузией.		Видео
Стабильная диффузия видео	Стабильная диффузия видео (SVD) изображение-видео.		Видео
Storydiffusion	Последовательное самопринятие для долгосрочных изображений и генерации видео.	arxiv	Видео
Streamingt2v	Последовательный, динамичный и расширяемый длинный генерацию видео из текста.	arxiv	Видео
Стиликрафтер	Стилизованный стилизованный генератор текста к Video с адаптером стиля.	arxiv	Видео
Тат	Длинное генерация видео с агромическим VQGAN и чувствительным к временным трансформатором.		Видео
Text2video-Zero	Диффузионные модели текста к изображению представляют собой видеогенераторы с нулевым выстрелом.	arxiv	Видео
TF-T2V	Рецепт для масштабирования генерации текста к Video с без текстового видео.	arxiv	Видео
Тора	Tora: траектория, ориентированный на траекторию диффузионный трансформатор для генерации видео.	arxiv	Видео
Трек-все	Все треки-это гибкий и интерактивный инструмент для отслеживания и сегментации видео объекта, основанный на сегменте, и XMEM.	arxiv	Видео
Tune-A-Video	Одно выстрел настройки диффузионных моделей изображения для генерации текста к Video.	arxiv	Видео
Двенадцать	Мультимодальный ИИ, который понимает такие видео, как люди.		Видео
Univg	На пути к генерации видео Unified-Modal.		Видео
VCHITECT-2.0	VCHITECT-2.0: Параллельный трансформатор для масштабирования моделей диффузии видео.		Видео
Vgen	Целостная экосистема генерации видео для создания генерации видео на моделях диффузии.	arxiv	Видео
ViewCrafter	ViewCrafter: приручив модели диффузии видео для синтеза нового вида с высокой точки зрения.	arxiv	Видео
Видео-чатгпт	Video-Chatgpt-это модель видео-разговора, способная создавать содержательный разговор о видео.	arxiv	Видео
Видеокомпозитор	Синтез композиционного видео с управляемостью движения.	arxiv	Видео
VideoCrafter1	Открытые диффузионные модели для высококачественного генерации видео.	arxiv	Видео
VideoCrafter2	Преодоление ограничений данных для высококачественных моделей диффузии видео.	arxiv	Видео
VideoDrafter	Контент-согласованная многоцветная генерация видео с LLM.	arxiv	Видео
Видеолеватор	Повышение качества генерации видео с универсальными диффузионными моделями текста до изображения.	arXiv	Видео
Видеофактор	Обращение внимания в пространственно-временных диффузиях для генерации текста к Video.		Видео
Видеоген	Подход с латентной диффузией, управляемый эталонными, для генерации текста к Video высокой четкости.	arxiv	Видео
Видеолкм	Видео скрытая модель согласованности.	arxiv	Видео
Видео LDMS	Совместите свои задержки: синтез видео с высоким разрешением с скрытыми диффузионными моделями.	arxiv	Видео
Видео-лава	Изучение объединенного визуального представления по выравниванию перед проекцией.	arxiv	Видео
Видеомамба	Космическая модель состояния для эффективного понимания видео.	arxiv	Видео
Видео с мыслью	Видео-размышления: пошаговые видео-рассуждения от восприятия до познания.		Видео
Видеопоэт	Большая языковая модель для генерации видео с нулевым выстрелом.	arxiv	Видео
Движение Виспанка	Создайте реалистичные видео, используя только текст.		Видео
VisualRwkv	VisualRwkv-это визуальная версия языковой модели RWKV, позволяющая RWKV выполнять различные визуальные задачи.		Визуальный
V-JEPA	ВИДЕО СОВЕТСТВЕННОЕ Встроение прогнозной архитектуры.	arxiv	Видео
УОЛТ	Фотореалистическое генерацию видео с диффузионными моделями.	arxiv	Видео
Зороскоп	Zeroscope Text-to-Video.		Видео

^ Вернуться к содержанию ^

Аудио

Источник	Описание	Бумага	Тип
Academicodec	Модель аудиокодека с открытым исходным кодом для академических исследований.		Аудио
Амфион	Инструментарий с открытым исходным кодом, музыка, музыка и генерация речи.	arxiv	Аудио
Архизан	Генерация звука с использованием диффузионных моделей, в Pytorch.		Аудио
Аудиобокс	Современное генерация звука с естественным языком подсказки.		Аудио
Аудиоединирование	НЕОБРАЖЕНИЕ НЕПРАВИЛЬНОЕ НЕПРАВИЛЬНОЕ И ТЕКСТРЕВЕННОЕ РЕДАЛИЧЕСКИЕ АУДИО С помощью инверсии DDPM.	arxiv	Аудио
Аудиоген Кодек	Низкий компрессия 48 кГц стерео нейронной аудиокодек для общего аудио, оптимизируя для верности звука?		Аудио
Audiogpt	Понимание и генерирование речи, музыки, звука и говорящей головы.	arxiv	Аудио
Audiolcm	Генерация текста в Аулио с скрытыми моделями согласованности.	arxiv	Аудио
Audioldm	Генерация текста в Аулио с скрытыми диффузионными моделями.	arxiv	Аудио
Audioldm 2	Изучение целостного поколения звука с самоотверженной предварительной подготовкой.	arxiv	Аудио
Auffusion	Используя силу диффузии и большие языковые модели для генерации текста в Аулио.	arxiv	Аудио
CTAG	Творческое поколение текста к Аудио через программирование синтезатора.		Аудио
Фолейкрафтер	Foleycrafter: Принесите тихие видео в жизнь с жизненными и синхронизированными звуками.	arxiv	Аудио
Магнит	Генерация звука в масках с использованием одного неавторегрессивного трансформатора.		Аудио
Make-An-Audio	Генерация текста в Аулио с быстрого растущей диффузионной модели.	arxiv	Аудио
Make-An-Audio 3	Преобразование текста в аудио через большие диффузионные трансформаторы на основе потока.	arxiv	Аудио
Неврол	Основанный на обучении синтез звука с акустическим переносом.	arxiv	Аудио
Оптимизай	Звуки для создателей, игроков, артистов, видео -производителей.		Аудио
Qwen2-Audio	QWEN2-AUDIO CHAT & Preting Light Audio Language Model, предложенная Alibaba Cloud.	arxiv	Аудио
See-2-Sound	Ноль-выстрел пространственной среды к пространственному звуку.	arxiv	Аудио
Звуковая звезда	Эффективное параллельное генерация звука.	arxiv	Аудио
Стабильный звук	Быстрая поддержанная хранение		Аудио
Стабильный звук открыт	Стабильный звук Open 1.0 генерирует стереоусильнику с переменной длиной (до 47 с) при 44,1 кГц из текстовых подсказок.		Аудио
Синкфузия	Синкфузия: мультимодальный синхронизированный видео-синтез видео-а-а-а-а-Аул.	arxiv	Аудио
ТАНГО	Генерация текста в Аулио с использованием инструкции LLM и скрытой диффузионной модели.		Аудио
VTA-LDM	Видео-до-Аудио поколение со скрытым выравниванием.	arxiv	Аудио
Wavjourney	Создание композиционного звука с большими языковыми моделями.	arxiv	Аудио

^ Вернуться к содержанию ^

Музыка

Источник	Описание	Бумага	Тип
Aiva	Искусственный интеллект составляющий эмоциональную музыку саундтрека.		Музыка
Ампера музыка	Технология индивидуальной музыки, работающая на Amper.		Музыка
БУМИЯ	Создать генеративную музыку. Поделиться этим с миром.		Музыка
Чатмусикан	Создание внутренних музыкальных способностей в LLM.		Музыка
Chord2melody	Автоматическое поколение музыки ИИ.		Музыка
Diff-Bgm	Диффузионная модель для генерации видео -фоновой музыки.	arxiv	Музыка
Fluxmusic	Fluxmusic: генерация текста в музыку с выпрямленным трансформатором потока.	arxiv	Музыка
Gptableton	Проект скрипта для обработки ответа GPT и отправки MIDI-заметок в Ableton Clips с Abletonosc и Python-OSC.		Музыка
Heymusic.ai	ИИ музыкальный генератор		Музыка
Изображение к музыке	AI Image To Music Generator - это инструмент, который использует искусственный интеллект для преобразования изображений в музыку.		Музыка
Джен-1	Текстовое универсальное поколение музыки с всенаправленными диффузионными моделями.		Музыка
Музыкальный автомат	Генеративная модель для музыки.	arxiv	Музыка
Пурпурный	Magenta - это исследовательский проект, изучающий роль машинного обучения в процессе создания искусства и музыки.		Музыка
Мелодия	Эффективное поколение нейронной музыки		Музыка
Муберт	AI Generative Music.		Музыка
Мусенет	Глубокая нейронная сеть, которая может генерировать 4-минутные музыкальные композиции с 10 различными инструментами и может объединить стили от страны до Моцарта до Битлз.		Музыка
MusicGen	Простое и контролируемое поколение музыки.	arxiv	Музыка
Musicldm	Улучшение новизны в генерации текста до музыки с использованием бите-синхронных стратегий микширования.	arxiv	Музыка
МузыкаLM	Создание музыки из текста.	arxiv	Музыка
Приложение рифузии	Riffusion-это приложение для поколения музыки в реальном времени со стабильной диффузией.		Музыка
Сонауто	Sonauto - музыкальный редактор искусственного интеллекта, который превращает подсказки, тексты или мелодии в полные песни в любом стиле.		Музыка
Soundraw	Ай музыкальный генератор для создателей.		Музыка
Soundry Ai	Генеративные инструменты искусственного интеллекта, включая текстовые и бесконечные образцы.		Музыка

^ Вернуться к содержанию ^

Поет голос

Источник	Описание	Бумага	Тип
Diffsinger	Пеяние синтеза голоса с помощью мелкого диффузионного механизма.	arxiv	Поет голос
В поисках, на основе Voice-Conversion-Webui	Простая в использовании структуру SVC, основанная на VIT.		Поет голос
So-vits-Svc	Softvc Vits Singing Conversion.		Поет голос
VI-SVS	Используйте VIT и OpenCpop для разработки синтеза по пейсу; Отличается от Visinger.		Поет голос

^ Вернуться к содержанию ^

Речь

Источник	Описание	Бумага	Игровой движок	Тип
Приложение	Конечный инструмент клонирования голоса, тщательно оптимизированный для непревзойденной мощности, модульности и удобного опыта.			Речь
Audyo	Текст в.			Речь
Лаять	Полученная генеративная аудио модель.			Речь
Bert-Vits2	VITS2 Сэверная цепочка с многоязычным бертом.			Речь
Чаты	Чатттс - это генеративная речевая модель для ежедневного диалога.			Речь
Clapspeech	Изучение просодии из текстового контекста с контрастным языком-аудионым предварительным тренировком.	arxiv		Речь
Cosyvoice	Многоязычная большая модель генерации голоса, обеспечивая вывод, обучение и развертывание полного стека.			Речь
Dex-TTS	Диффузионный экспрессивный текст в речь со стилем моделирования по изменчивости времени.	arxiv		Речь
Эмотиву	Многопрокатанный и контролируемый оперативным двигателем TTS.			Речь
Fliki	Превратите текст в видео с AI -голосами.			Речь
GLM-4-голос	GLM-4-Voice-это сквозная голосовая модель, запущенная ZHIPU AI. GLM-4-Voice может непосредственно понимать и генерировать китайскую и английскую речь, участвовать в голосовых беседах в реальном времени и изменять атрибуты, такие как эмоции, интонация, скорость речи и диалект на основе инструкций пользователей.			Речь
Glow-TTS	Генеративный поток для текста в речь с помощью монотонного поиска выравнивания.	arxiv		Речь
GPT-Sovits	Мощное несколько выстрелов конверсии голоса и Webui текста в речь.			Речь
Лово	Лово-это генератор голоса и текст и текст на речевую платформу для тысяч создателей.			Речь
Махаттс	Большая модель речевой речи с открытым исходным кодом.			Речь
Matcha-TTS	Быстрая архитектура TTS с условным сопоставлением потока.	arxiv		Речь
Мелоттс	Высококачественная многоязычная библиотека текста в речь от myshell.ai. Поддержка английского, испанского, французского, китайского, японского и корейского языков.			Речь
Metavoice-1b	ИИ для речевого интеллекта на уровне человека.			Речь
Наракеет	Легко создавать голосования, используя реалистичный текст в речь.			Речь
Мини-амни	Mini-omni: Языковые модели могут слышать, говорить, думая в потоковой передаче. Mini-Amni-это многомодель с открытым исходным кодом, которая может слышать, говорить, думая. Показывая сквозные речевые входные и потоковые выводы звука в реальном времени.	arxiv		Речь
Одноразовый клонинг	Один выстрел голос клонирующий базу на Unet-TTS.			Речь
OpenVoice	Мгновенный голос клонирование от Myshell.			Речь
Переполнение	Постановление потоков на нейронных преобразователях для лучших ТТ.			Речь
Реалтиты	Realtimetts-это современная библиотека текста в речь (TTS), предназначенная для приложений в реальном времени.			Речь
Sensevoice	SenseVoice - это модель речевого фонда с множественными возможностями понимания речи, включая автоматическое распознавание речи (ASR), идентификацию разговорного языка (LID), распознавание эмоций речи (SER) и обнаружение аудио -событий (AED).			Речь
Речигпт	Расширение возможностей крупных языковых моделей с внутренними межмодальными разговорными способностями.	arxiv		Речь
Речь к тексту-GPT3-UNITY	Это репо, я использую API Whisper и Chatgpt от Openai в Unity.		Единство	Речь
Стабильная речь	Стабильность модели текста в речь.			Речь
Стаблы	Модель TTS следующего поколения с использованием сопоставления потока и DIT, вдохновленная стабильной диффузией 3.			Речь
Стилет 2	На уровне человека на речь через диффузию стиля и тренировки состязания с большими моделями речевого языка.	arxiv		Речь
Tortoise.cpp	Tortoise.cpp: GGML Реализация черепахи-TTS.			Речь
Tortoise-TTS	Система TTS с несколькими Voice, обученная акцентом на качество.			Речь
TTS Generation Webui	TTS Generation Webui (Bark, MusicGen, Tortoise, RVC, Vocos, Demucs).			Речь
Vall-e	Языковые модели нейронного кодека-это с нулевым выстрелом текст к синтезаторам речи.	arxiv		Речь
Vall-e x	Говорите на иностранных языках с помощью собственного голоса: моделирование языка нейронного кодека кросс-лингального нейронного кодека	arxiv		Речь
Вокал	Vocode-это библиотека с открытым исходным кодом для создания голосовых приложений LLM.			Речь
Голосовая коробка	Текстовая многоязычная универсальная речевая генерация в масштабе.	arxiv		Речь
Голосовой	Редактирование речи с нулевым выстрелом и текст в речь в дикой природе.			Речь
Шепот	Шепот-это модель распознавания речи общего назначения.			Речь
Whisperspeech	Система с открытым исходным кодом текста в речь, построенная путем инвертирования шепота.			Речь
XE-Speech	Совместная тренировочная структура неавторегрессивного перекрестного эмоционального конверсии текста в речь и голоса.			Речь
XTTS	XTTS-это библиотека для расширенного поколения текста в речь.			Речь
Yourtts	На пути к нулевым выстрелу многопрофильных TTS и нулевой конверсии голоса для всех.	arxiv		Речь
ZMM-TTS	Синтез с многоязычным и многоязычным речи, обусловленный дискретными речевыми речевыми представлениями.	arxiv		Речь