ai game devtools
1.0.0
Здесь мы будем отслеживать новейшие инструменты разработки игр с использованием искусственного интеллекта, включая LLM, агент, код, писатель, изображение, текстуру, шейдер, 3D-модель, анимацию, видео, аудио, музыку, поющий голос и аналитику.
Источник | Описание | Бумага | Игровой движок | Тип |
---|---|---|---|---|
АгентGPT | ? Собирайте, настраивайте и развертывайте автономные агенты ИИ в своем браузере. | Инструмент | ||
AICommand | Интеграция ChatGPT с редактором Unity. | Единство | Инструмент | |
АЙОС | Операционная система агента LLM. | Инструмент | ||
Ученый ИИ | Ученый по искусственному интеллекту: на пути к полностью автоматизированным открытым научным открытиям. | arXiv | Инструмент | |
Ассистент интерфейса командной строки | Удобный инструмент CLI для использования сервиса ChatGPT. | Инструмент | ||
Авто-GPT | Экспериментальная попытка с открытым исходным кодом сделать GPT-4 полностью автономным. | Инструмент | ||
BabyAGI | Этот скрипт Python является примером системы управления задачами на базе искусственного интеллекта. | Инструмент | ||
?? Пользовательский интерфейс BabyAGI | Пользовательский интерфейс BabyAGI предназначен для упрощения запуска и разработки с помощью babyagi в веб-приложении, например ChatGPT. | Инструмент | ||
Байчуань-7Б | Крупномасштабная языковая модель 7B для предварительного обучения, разработанная Baichuan. | Инструмент | ||
Байчуань-13Б | Большая языковая модель 13B, разработанная Baichuan Intelligent Technology. | Инструмент | ||
Байчуань 2 | Серия больших языковых моделей, разработанных Baichuan Intelligent Technology. | Инструмент | ||
Бишенг | Bisheng — это открытая платформа LLM DevOps для приложений искусственного интеллекта следующего поколения. | Инструмент | ||
Персонаж-LLM | Обучаемый агент для ролевых игр. | arXiv | Инструмент | |
ЧатДев | Коммуникативные агенты для разработки программного обеспечения. | arXiv | Инструмент | |
ЧатGPT-API-единство | Связывает API завершения чата ChatGPT с чистым C# на Unity. | Единство | Инструмент | |
ЧатGPTForUnity | ChatGPT для единства. | Единство | Инструмент | |
ЧатRWKV | ChatRWKV похож на ChatGPT, но основан на языковой модели RWKV (100% RNN) и имеет открытый исходный код. | Инструмент | ||
ЧатЮань | Большая языковая модель для диалога на китайском и английском языках. | Инструмент | ||
Китайский-ЛЛАМА-Альпака-3 | (Китайские Llama-3 LLM), разработанные на основе Meta Llama 3. | Инструмент | ||
Chrome-GPT | Агент AutoGPT, который управляет Chrome на вашем рабочем столе. | Инструмент | ||
CogVLM | CogVLM — мощная базовая модель визуального языка с открытым исходным кодом. | arXiv | Инструмент | |
КорНет | Библиотека для обучения глубоких нейронных сетей. | Инструмент | ||
Космос | Cosmos — это платформа для разработки мировых моделей, состоящая из мировых базовых моделей, токенизаторов и конвейера обработки видео для ускорения разработки физического искусственного интеллекта в лабораториях робототехники и AV. | Магистр права | ||
ДБРКС | DBRX — это большая языковая модель, обученная Databricks. | Инструмент | ||
ДЦЛМ | DataComp для языковых моделей. | arXiv | Инструмент | |
ДипСик-В3 | DeepSeek-V3 — это мощная языковая модель Mixture-of-Experts (MoE) с общим числом параметров 671B, из которых 37B активировано для каждого токена. | arXiv | Магистр права | |
ДемоGPT | Генератор приложений Auto Gen-AI на базе Llama 2 | Инструмент | ||
Дизайн2Код | Автоматизация клиентского проектирования | Инструмент | ||
Девика | Девика — инженер-программист агентного ИИ. | Инструмент | ||
Девон | Парный программист с открытым исходным кодом. | Инструмент | ||
Дора | Создание мощных веб-сайтов, по одному запросу за раз. | Инструмент | ||
Флоуиз | Перетащите пользовательский интерфейс, чтобы создать индивидуальный процесс LLM с помощью LangchainJS. | Инструмент | ||
Близнецы | Gemini изначально создан для мультимодальности — беспрепятственного анализа текста, изображений, видео, аудио и кода. | Инструмент | ||
Джемма | Gemma — это семейство легких современных открытых моделей, созданных на основе исследований и технологий, используемых при создании моделей Google Gemini. | Инструмент | ||
gemma.cpp | легкий, автономный механизм вывода C++ для моделей Google Gemma. | Инструмент | ||
ГЛМ-4 | GLM-4-9B — это версия с открытым исходным кодом последнего поколения предварительно обученных моделей серии GLM-4, выпущенная Zhipu AI. | Инструмент | ||
GPT4Все | Чат-бот обучался на массивной коллекции чистых данных помощника, включая код, истории и диалоги. | Инструмент | ||
ГПТ-4о | GPT-4o («o» от «omni») — это шаг к более естественному взаимодействию человека с компьютером: он принимает в качестве входных данных любую комбинацию текста, аудио, изображения и видео и генерирует любую комбинацию текста, аудио и изображения. выходы. | Инструмент | ||
GPTScript | Разрабатывайте приложения LLM на естественном языке. | Инструмент | ||
Грок-1 | Веса и архитектура нашей модели «Смесь экспертов», состоящей из 314 миллиардов параметров, Grok-1. | Инструмент | ||
ОбниматьсяЧат | Делаем лучшие модели чатов с искусственным интеллектом доступными каждому. | Инструмент | ||
Интеграция Hugging Face API с Unity | Этот пакет Unity обеспечивает простую в использовании интеграцию API Hugging Face Inference, позволяя разработчикам получать доступ к моделям Hugging Face AI и использовать их в своих проектах Unity. | Единство | Инструмент | |
Привязка изображения | ImageBind Одно пространство для встраивания, чтобы связать их все. | arXiv | Инструмент | |
Индекс-1,9Б | Легкий многоязычный LLM SOTA. | Инструмент | ||
InteractML-Unity | InteractML, платформа визуальных сценариев интерактивного машинного обучения для Unity3D. | Единство | Инструмент | |
InteractML-Unreal Engine | Использование машинного обучения в Unreal Engine. | Нереальный движок | Инструмент | |
СтажерLM | InternLM открыла исходный код базовой модели с 7 миллиардами параметров, модели чата, адаптированной для практических сценариев, и системы обучения. | arXiv | Инструмент | |
СтажерLM-XComposer | InternLM-XComposer2 — это новаторская большая модель языка видения (VLLM), превосходящая себя в композиции и понимании текста и изображений в произвольной форме. | arXiv | Инструмент | |
Ян | Перенесите искусственный интеллект на свой рабочий стол. | Инструмент | ||
Ламини | Lamini позволяет любой команде инженеров превзойти LLM общего назначения благодаря RLHF и точной настройке на собственных данных. | Инструмент | ||
ЛаМини-ЛМ | LaMini-LM — это набор небольших по размеру эффективных языковых моделей, извлеченных из ChatGPT и обученных на крупномасштабном наборе данных из 2,58 млн инструкций. | Инструмент | ||
Лангчейн | LangChain — это платформа для разработки приложений на основе языковых моделей. | Инструмент | ||
LangFlow | ⛓️ LangFlow — это пользовательский интерфейс для LangChain, разработанный с использованием React-Flow, позволяющий легко экспериментировать и создавать прототипы потоков. | Инструмент | ||
ЛаВаг | Автоматизируйте автоматизацию с помощью платформы Large Action Model. | Инструмент | ||
Лемур | Открытые базовые модели для языковых агентов. | Инструмент | ||
Лептон ИИ | Платформа Pythonic для упрощения создания сервисов ИИ. | Инструмент | ||
Лит-ЛЛАМА | Реализация языковой модели LLaMA на основе nanoGPT. Поддерживает флэш-внимание, 4-битное квантование Int8 и GPTQ, тонкую настройку адаптера LoRA и LLaMA, предварительное обучение. | Инструмент | ||
llama2-webui | Запускайте Llama 2 локально с пользовательским интерфейсом Gradio на графическом процессоре или процессоре из любого места (Linux/Windows/Mac). | Инструмент | ||
Лама 3 | Официальный сайт Meta Llama 3 на GitHub. | Инструмент | ||
Лама 3.1 | Llama — это доступная открытая модель большого языка (LLM), предназначенная для разработчиков, исследователей и предприятий, позволяющая создавать, экспериментировать и ответственно масштабировать свои идеи генеративного ИИ. | Инструмент | ||
LLaSM | Большая модель языка и речи. | Инструмент | ||
Система ответов LLM | Создайте систему ответов, основанную на недоумении, используя Next.js, Groq, Mixtral, Langchain, OpenAI, Brave и Serper. | Инструмент | ||
llm.c | Обучение LLM простому сырому C/CUDA. | Инструмент | ||
LLMUnity | Создавайте персонажей в Unity с помощью LLM! | Единство | Инструмент | |
LЛокальный поиск | LLocalSearch — это полностью локально работающая поисковая система, использующая агенты LLM. | Инструмент | ||
ЛогическиеИгрыРешатель | Инструмент Python для решения логических игр с использованием искусственного интеллекта, глубокого обучения и компьютерного зрения. | Инструмент | ||
Лонграйтер | LongWriter: создание более 10 000 слов на основе LLM длинного контекста. | arXiv | Инструмент | |
Модель большого мира (LWM) | Модель большого мира (LWM) — это мультимодальная авторегрессионная модель общего назначения с большим контекстом. | arXiv | Инструмент | |
Люмина-T2X | Lumina-T2X — это унифицированная платформа для генерации текста в любой модальности. | arXiv | Инструмент | |
МетаGPT | Мультиагентная платформа | Инструмент | ||
МиниКПМ-2Б | Торцевой LLM превосходит Llama2-13B. | Инструмент | ||
МиниGPT-4 | Улучшение понимания языка видения с помощью усовершенствованных моделей большого языка. | arXiv | Инструмент | |
МиниGPT-5 | Перемежающаяся генерация видения и языка посредством генеративных вокенов. | arXiv | Инструмент | |
Микстрал 8х7Б | Высококачественная разреженная смесь экспертов. | arXiv | Инструмент | |
Мистраль 7Б | Лучшая модель 7B на сегодняшний день — Apache 2.0. | Инструмент | ||
Мистраль Большой | Mistral Large — новая передовая модель генерации текста. Он достигает высочайшего уровня рассуждений. | Инструмент | ||
МЛК, LLM | Предоставьте каждому возможность разрабатывать, оптимизировать и развертывать модели искусственного интеллекта на всех устройствах. | Инструмент | ||
МобиЛлама | На пути к точному и легкому, полностью прозрачному GPT. | arXiv | Инструмент | |
МО-ЛЛАВА | Сочетание экспертов по большим моделям визуального языка. | arXiv | Инструмент | |
Моши | Моши — экспериментальный разговорный ИИ. | Инструмент | ||
Моши | Моши: речево-текстовая основа для диалога в реальном времени. | Инструмент | ||
МОХ | Модель разговорного языка с открытым исходным кодом, дополненная инструментами, разработанная Университетом Фудань. | Инструмент | ||
mPLUG-Сова? | Модульизация наделяет большие языковые модели мультимодальностью. | arXiv | Инструмент | |
Немотрон-4 | Большая многоязычная языковая модель с 15 миллиардами параметров, обученная на 8 триллионах текстовых токенов. | arXiv | Инструмент | |
НЕКСТ-GPT | Мультимодальная модель большого языка «любой к любому». | Инструмент | ||
ОЛМо | Модель открытого языка | arXiv | Инструмент | |
ОмниЛММ | Большие мультимодальные модели для высокой производительности и эффективного развертывания. | Инструмент | ||
ОдинLLM | Одна структура для согласования всех модальностей с языком. | arXiv | Инструмент | |
Открытый помощник | OpenAssistant — это помощник на основе чата, который понимает задачи, может взаимодействовать со сторонними системами и для этого динамически получать информацию. | Инструмент | ||
ОпенДевин | Автономный инженер-программист искусственного интеллекта. | Инструмент | ||
Орион-14Б | Орион-14Б — семейство моделей, включающее фундамент ЛЛМ 14Б и серию моделей. | arXiv | Инструмент | |
Панда | Зарубежная модель китайского языка с открытым исходным кодом, основанная на Llama-7B, -13B, -33B, -65B для непрерывного предварительного обучения на китайском языке. | Инструмент | ||
Перплексика | Поисковая система на базе искусственного интеллекта. | Инструмент | ||
Пи | Чат-бот с искусственным интеллектом, предназначенный для личной помощи и эмоциональной поддержки. | Инструмент | ||
Квен1.5 | Qwen1.5 — улучшенная версия Qwen. | Инструмент | ||
Квен2 | Qwen2 — это серия больших языковых моделей, разработанная командой Qwen, Alibaba Cloud. | Инструмент | ||
Квен-7Б | Официальный репозиторий чата Qwen-7B (通义千问-7B) и предварительно обученной модели большого языка, предложенной Alibaba Cloud. | Инструмент | ||
РепоАгент | RepoAgent — это проект с открытым исходным кодом, основанный на моделях больших языков (LLM), целью которого является предоставление интеллектуального способа документирования проектов. | arXiv | Инструмент | |
Движок здравомыслия AI | Sanity AI Engine для инструмента разработки игр Unity. | Единство | Инструмент | |
ПоискGPT | ? Подключение ChatGPT к Интернету | Инструмент | ||
ПоделитьсяGPT4V | Улучшение больших мультимодальных моделей с помощью более качественных подписей. | Инструмент | ||
Скайворк | Модели серии Skywork предварительно обучены на 3,2 ТБ высококачественных многоязычных (в основном китайских и английских) и кодовых данных. | Инструмент | ||
СтабильныйLM | Стабильность языковых моделей искусственного интеллекта. | arXiv | Инструмент | |
Стэнфордская Альпака | Модель LLaMA, следующая инструкциям. | Инструмент | ||
Веб-интерфейс создания текста | Веб-интерфейс Gradio для запуска больших языковых моделей, таких как LLaMA, llama.cpp, GPT-J, OPT и GALACTICA. | Инструмент | ||
TinyChatEngine | Библиотека вывода LLM на устройстве. | Инструмент | ||
ИнструментСкамейка | Открытая платформа для обучения, обслуживания и оценки большой языковой модели для изучения инструментов. | Инструмент | ||
Unity ЧатGPT | Unity ChatGPT Эксперименты. | Единство | Инструмент | |
Интеграция Unity OpenAI-API | Интегрируйте языковую модель openai GPT-3 и API ChatGPT в проект Unity. | Единство | Инструмент | |
Unreal Engine 5 Лама Лора | Проект проверки концепции, демонстрирующий потенциал использования небольших, обучаемых на месте LLM для создания инструментов документации следующего поколения. | Нереальный движок | Инструмент | |
UnrealGPT | Коллекция виджетов Unreal Engine 5 Editor Utility на базе GPT3/4. | Нереальный движок | Инструмент | |
Видео-LLaVA | Изучение единого визуального представления путем выравнивания перед проецированием. | arXiv | Инструмент | |
ВебGPT | Запустите модель GPT в браузере с помощью WebGPU. | Инструмент | ||
Web3-GPT | Развертывание смарт-контрактов с помощью ИИ | Инструмент | ||
WordGPT | ? Используйте возможности ChatGPT в Microsoft Word | Инструмент | ||
XАгент | Автономный агент LLM для решения сложных задач. | Инструмент | ||
Йи | Серия крупных языковых моделей, обученных разработчиками с нуля. | Инструмент | ||
01 Проект | Компьютер языковой модели с открытым исходным кодом. | Инструмент |
^ Вернуться к содержанию ^
Источник | Описание | Бумага | Игровой движок | Тип |
---|---|---|---|---|
АгентБенч | Комплексный тест для оценки LLM как агентов. | arXiv | Агент | |
Групповой чат агентов | Симулякры интерактивного группового чата для лучшего выявления коллективного непредвиденного поведения. | arXiv | Агент | |
Агент К. | Автоагентный искусственный интеллект, который является саморазвивающимся и модульным. | Агент | ||
Область агента | Начните создавать многоагентные приложения на базе LLM более простым способом. | arXiv | Агент | |
АгентSims | Песочница с открытым исходным кодом для оценки больших языковых моделей. | Агент | ||
Ай-Таун | AI Town — это виртуальный город, где персонажи AI живут, общаются и общаются. | Агент | ||
аниме.подруга | Локальная альтернатива CharacterAI с открытым исходным кодом. | Игра | ||
Астрокада | Создавайте игры с помощью ИИ | Игра | ||
Атомные агенты | Платформа Atomic Agents спроектирована как модульная, расширяемая и простая в использовании. | Агент | ||
АвтоАгенты | Платформа для автоматического создания агентов. | Агент | ||
Автогенерация | Включите приложения больших языковых моделей следующего поколения. | arXiv | Агент | |
поведение | Behaviac — это основа разработки игрового ИИ. | Рамки | ||
Биомы | Biomes — это MMORPG-песочница с открытым исходным кодом, созданная для Интернета с использованием таких веб-технологий, как Next.js, Typescript, React и WebAssembly. | Игра | ||
Буфер мыслей | Мысленно-дополненное рассуждение с использованием больших языковых моделей. | arXiv | Агент | |
Байзер-Агент | Простая, быстрая и распределенная среда агентов для всех. | Агент | ||
Кошачий город | Моделирование кошек с помощью AC(h)atGPT. | Агент | ||
Кошачий город | Моделирование кошек с помощью AC(h)atGPT. | Агент | ||
ПерсонажGLM | Настройка китайских разговорных символов искусственного интеллекта с помощью больших языковых моделей. | arXiv | Агент | |
ЧатДев | Коммуникативные агенты для разработки программного обеспечения. | arXiv | Агент | |
CogAgent | CogAgent — это модель визуального языка с открытым исходным кодом, улучшенная на основе CogVLM. | arXiv | Агент | |
Колыбель | На пути к общему компьютерному управлению. | Агент | ||
экипажИИ | Платформа для организации ролевых игр, автономных агентов ИИ. | Агент | ||
Диди | Dify — это платформа для создания приложений LLM с открытым исходным кодом. | Агент | ||
Проект цифровой жизни | Автономные 3D-персонажи с социальным интеллектом. | arXiv | Агент | |
все-ай | Ваш высококвалифицированный локальный чат-бот-помощник на базе искусственного интеллекта? | Агент | ||
ткань | Fabric — это платформа с открытым исходным кодом для улучшения человеческого потенциала с помощью искусственного интеллекта. | Агент | ||
ФастGPT | FastGPT — это платформа, основанная на знаниях, построенная на основе LLM. | Агент | ||
fastRAG | Эффективная структура расширения и генерации поиска. | Агент | ||
ИграAISDK | Платформа автоматизации игрового искусственного интеллекта на основе изображений. | Рамки | ||
GameNGen | Модели диффузии — это игровые движки реального времени. | arXiv | Игра | |
GameGen-O | GameGen-O: создание видеоигр с открытым миром. | Игра | ||
ГенАгент | GenAgent: создание систем искусственного интеллекта для совместной работы с автоматизированной генерацией рабочих процессов — практические примеры использования ComfyUI. | arXiv | Агент | |
Генеративные агенты | Интерактивные симулякры человеческого поведения. | arXiv | Агент | |
Бытие | Genesis: генеративный и универсальный физический двигатель для робототехники и не только. | Игра | ||
Джинн | Генеративные интерактивные среды. | Игра | ||
гигакс | NPC на базе LLM. | Игра | ||
ГиппоРАГ | Нейробиологически обусловленная долговременная память для больших языковых моделей. | arXiv | Агент | |
Интерактивные NPC с поддержкой LLM | Interactive LLM Powered NPC — это проект с открытым исходным кодом, который полностью меняет ваше взаимодействие с неигровыми персонажами (NPC) в любой игре! | Игра | ||
ИоА | Платформа с открытым исходным кодом для совместной работы агентов ИИ, позволяющая разным распределенным агентам объединяться и решать сложные задачи посредством подключения, подобного Интернету. | Агент | ||
КвайАгенты | Обобщенная система агентов поиска информации с моделями большого языка (LLM). | arXiv | Агент | |
Лангчейн | Получите ваше заявление LLM от прототипа до производства. | Агент | ||
Лангфлоу | Langflow — это пользовательский интерфейс для LangChain, разработанный с использованием React-flow, позволяющий легко экспериментировать и создавать прототипы потоков. | Агент | ||
ЛангГраф Студия | LangGraph Studio предлагает новый способ разработки приложений LLM, предоставляя специализированную среду IDE для агентов, которая обеспечивает визуализацию, взаимодействие и отладку сложных агентных приложений. | Агент | ||
РИПП | Ролевая игра «Язык-агент» для игр с открытым миром. | arXiv | Агент | |
Агентская система LLama | Агентские компоненты API-интерфейсов Llama Stack. | Агент | ||
ЛамаИндекс | LlamaIndex — это платформа данных для вашего приложения LLM. | Агент | ||
MindSearch | ? Многоагентная платформа веб-поисковой системы на основе LLM (например, Perplexity.ai Pro и SearchGPT). | Агент | ||
Смесь агентов (МОА) | Смешение агентов расширяет возможности больших языковых моделей. | arXiv | Агент | |
MMRроль | MMRole: Комплексная основа для разработки и оценки мультимодальных ролевых агентов. | arXiv | Агент | |
Moonlander.ai | Начните создавать 3D-игры без какого-либо программирования, используя генеративный искусственный интеллект. | Рамки | ||
MuG Диффузия | MuG Diffusion — это искусственный интеллект для построения графиков для ритм-игр, основанный на Stable Diffusion (одна из самых мощных моделей AIGC) с большой модификацией для включения звуковых волн. | Игра | ||
Оазис | Oasis — это интерактивная модель мира, разработанная Decart и Etched. Основанный на диффузионных преобразователях, Oasis принимает ввод пользователя с клавиатуры и генерирует игровой процесс авторегрессионным способом. | Игра | ||
ОмАгент | Мультимодальная агентская среда для решения сложных задач. | Агент | ||
OpenAgents | Открытая платформа для языковых агентов в дикой природе. | Агент | ||
Опус | Приложение с искусственным интеллектом, которое превращает текст в видеоигру. | Игра | ||
трубкакэт | Платформа с открытым исходным кодом для голосового и мультимодального диалогового искусственного интеллекта. | Агент | ||
Квен-Агент | Qwen-Agent — это платформа для разработки приложений LLM, основанная на следовании инструкциям, использовании инструментов, планировании и возможностях памяти Qwen. | Агент | ||
Раги | Ragas — это платформа, которая помогает вам оценить ваши конвейеры извлечения дополненной генерации (RAG). | Агент | ||
РПБенч-Авто | Автоматизированный конвейер для оценки LLM для ролевых игр. | Игра | ||
СИМА | Универсальный ИИ-агент для виртуальных 3D-сред. | Агент | ||
StoryGames.ai | ИИ для мечтателей, создающих игры. | Игра | ||
SWE-агент | Компьютерные интерфейсы агентов позволяют использовать языковые модели разработки программного обеспечения. | arXiv | Агент | |
Генератор задач | Агентская платформа на основе задач, основанная на выходных данных StrictJSON агентов LLM. | Агент | ||
ДЕСЯТЬ Агент | TEN Agent — это первый в мире мультимодальный агент, работающий в режиме реального времени, интегрированный с OpenAI Realtime API, RTC, а также функции проверки погоды, веб-поиска, видения и RAG. | Агент | ||
Агент по переводам | Агентический перевод с использованием рабочего процесса отражения. | Агент | ||
Твиттер | Twitter Personality — это веб-приложение, которое анализирует ваш дескриптор Twitter для создания персонализированного профиля личности с помощью Wordware AI Agent. | Агент | ||
Неограниченный | Unbounded: генеративная бесконечная игра моделирования жизни персонажей. | arXiv | Игра | |
Видео2Игра | Интерактивная, реалистичная и совместимая с браузером среда в реальном времени из одного видео. | arXiv | Игра | |
В-ИРЛ | Использование виртуального интеллекта в реальной жизни. | arXiv | Агент | |
агент веб-дизайна | Агент, используемый для веб-дизайна. | Агент | ||
XАгент | Автономный агент LLM для решения сложных задач. | Агент |
^ Вернуться к содержанию ^
Источник | Описание | Бумага | Игровой движок | Тип |
---|---|---|---|---|
Переводчик кода AI | Используйте ИИ для перевода кода с одного языка на другой. | Код | ||
aiXcoder-7B | Большая языковая модель кода aiXcoder-7B. | Код | ||
ляп | bloop — быстрая поисковая система по коду, написанная на Rust. | Код | ||
Глава | Интерпретатор кода ChatGPT в блокнотах Jupyter. | Код | ||
КодGeeX | Модель генерации открытого многоязычного кода. | arXiv | Код | |
КодGeeX2 | Более мощная модель генерации многоязычного кода. | Код | ||
КодGeeX4 | CodeGeeX4: открытая многоязычная модель генерации кода. | Код | ||
Генератор кода | CodeGen — это модель синтеза программ с открытым исходным кодом. Обучался на ТПУ-v4. Конкурентноспособен с OpenAI Codex. | arXiv | Код | |
КодГен2 | Модели CodeGen2 для синтеза программ. | arXiv | Код | |
Код Ламы | Code Llama — это большая языковая модель кода, основанная на Llama 2. | Код | ||
КодTF | Универсальная библиотека трансформаторов для современного кода LLM. | Код | ||
КодT5 | LLM открытого кода для понимания и генерации кода. | Код | ||
Курсор | Пишите, редактируйте и обсуждайте свой код с помощью GPT-4 в редакторе нового типа. | Код | ||
DeepSeek Кодер | DeepSeek Coder: пусть код пишется сам. | arXiv | Код | |
Кодекс OpenAI | OpenAI Codex является потомком GPT-3. | Код | ||
ПандыИИ | Pandas AI — это библиотека Python, которая интегрирует возможности генеративного искусственного интеллекта в Pandas, делая фреймы данных диалоговыми. | Код | ||
RobloxScripterAI | RobloxScripterAI — это инструмент генерации кода на базе искусственного интеллекта для Roblox. | Роблокс | Код | |
Scikit-LLM | Легко интегрируйте мощные языковые модели, такие как ChatGPT, в scikit-learn для расширенных задач анализа текста. | Код | ||
СоТаНа | Помощник по разработке программного обеспечения с открытым исходным кодом. | arXiv | Код | |
Стабильный код 3B | Кодирование на грани. | Код | ||
Старкодер | ? StarCoder — это языковая модель (LM), обученная на исходном коде и тексте на естественном языке. | arXiv | Код | |
СтарКодер 2 | StarCoder2 — это семейство моделей генерации кода (3B, 7B и 15B), обученных на более чем 600 языках программирования из The Stack v2 и некоторых текстах на естественном языке, таких как Wikipedia, Arxiv и GitHub. | arXiv | Код | |
UnityGen ИИ | UnityGen AI — это плагин для генерации кода на базе искусственного интеллекта для Unity. | Единство | Код | |
Пустота | Void — это альтернатива Cursor с открытым исходным кодом. Пишите код с помощью лучших инструментов искусственного интеллекта, сохраняйте полный контроль над своими данными и получайте доступ к мощным функциям искусственного интеллекта. | Код |
^ Вернуться к содержанию ^
Источник | Описание | Бумага | Игровой движок | Тип |
---|---|---|---|---|
AI-писатель | ИИ пишет романы, генерирует фэнтезийные и любовные веб-статьи и т. д. Китайская предварительно обученная генеративная модель. | Писатель | ||
Ноутбук.ай | Notebook.ai — это набор инструментов для писателей, гейм-дизайнеров и ролевых игроков, позволяющий создавать великолепные вселенные — и все, что внутри них. | Писатель | ||
Роман | Редактор WYSIWYG в стиле Notion с автозаполнением на базе искусственного интеллекта. | Писатель | ||
РоманИИ | Управляемый искусственным интеллектом, безболезненно создавайте уникальные истории, захватывающие истории, соблазнительные романы или просто дурачьтесь. | Писатель |
^ Вернуться к содержанию ^
Источник | Описание | Бумага | Игровой движок | Тип |
---|---|---|---|---|
AnyDoor | Настройка изображения на уровне объекта с нулевым выстрелом. | arXiv | Изображение | |
Любой текст | Многоязычное визуальное создание и редактирование текста. | arXiv | Изображение | |
АвтоСтудия | Создание единообразных предметов в многоходовой интерактивной генерации изображений. | arXiv | Изображение | |
Блендер-ControlNet | Использование ControlNet прямо в Blender. | Блендер | Изображение | |
БриВЛ | Соединение видения и языковой модели. | arXiv | Изображение | |
CatVTON | CatVTON: конкатенация — это все, что вам нужно для виртуальной примерки диффузионных моделей. | arXiv | Изображение | |
CLIPasso | Метод преобразования изображения объекта в эскиз, позволяющий использовать различные уровни абстракции. | arXiv | Изображение | |
КлипДроп | Создавайте потрясающие визуальные эффекты за считанные секунды. | Изображение | ||
Удобный интерфейс | Мощный и модульный стабильный графический интерфейс диффузии с интерфейсом графов/узлов. | Изображение | ||
Концептуальная лаборатория | Творческая генерация с использованием априорных ограничений диффузии. | arXiv | Изображение | |
Контрольная сеть | ControlNet — это структура нейронной сети для управления моделями диффузии путем добавления дополнительных условий. | arXiv | Изображение | |
CSGO | CSGO: композиция стилей контента при преобразовании текста в изображение. | arXiv | Изображение | |
ДАЛЛ·И 2 | DALL·E 2 — это система искусственного интеллекта, которая может создавать реалистичные изображения и произведения искусства на основе описаний на естественном языке. | Изображение | ||
Даштун Студия | Dashtoon Studio — платформа для создания комиксов на базе искусственного интеллекта. | Комикс | ||
Глубокий ИИ | DeepAI предлагает набор инструментов, которые используют ИИ для повышения вашего творчества. | Изображение | ||
ДипФлойд ИФ | IF от DeepFloyd Lab в StabilityAI. | Изображение | ||
Глубина Что угодно V2 | Глубина Что угодно V2 | arXiv | Изображение | |
Библиотека карт глубины и позер | Библиотека карт глубины для использования с расширением Control Net для Automatic1111/stable-diffusion-webui. | Изображение | ||
Диффузный на выбор | Обогащение условной окраски изображения в моделях скрытой диффузии для виртуального тестирования. | arXiv | Изображение | |
Дискотека Диффузия | Франкенштейновское объединение блокнотов, моделей и техник для создания искусственного интеллекта и анимации. | Изображение | ||
ПеретащитеГАН | Интерактивное точечное манипулирование генеративным многообразием изображений. | arXiv | Изображение | |
Рисовать вещи | Генерация изображений с помощью искусственного интеллекта в вашем кармане. | Изображение | ||
DWPose | Эффективная оценка позы всего тела с помощью двухэтапной дистилляции. | arXiv | Изображение | |
EasyPhoto | Ваш умный фотогенератор с искусственным интеллектом. | Изображение | ||
Поток | Этот репозиторий содержит минимальный код вывода для преобразования текста в изображение и изображения в изображение с помощью наших скрытых выпрямленных преобразователей потока Flux. | Изображение | ||
Следуй за своим щелчком | Региональная анимация изображений в открытом доступе с помощью коротких подсказок. | arXiv | Изображение | |
Фукус | Сосредоточьтесь на подсказках и побуждениях. | Изображение | ||
GIFfusion | Создавайте GIF-файлы и видео с помощью Stable Diffusion. | Изображение | ||
Заземленный сегмент-что угодно | Автоматически обнаруживайте, сегментируйте и генерируйте все, что угодно, используя изображения, текст и аудиовходы. | arXiv | Изображение | |
HivisionIDФотографии | HivisionIDPhotos: легкий и эффективный инструмент для фотографий AI ID. | Изображение | ||
Хуа | Hua — редактор изображений с искусственным интеллектом и Stable Diffusion (и не только). | Изображение | ||
Хунюань-ДиТ | Мощный диффузионный преобразователь с несколькими разрешениями и глубоким знанием китайского языка. | arXiv | Изображение | |
IC-Light | IC-Light — проект по управлению освещением изображений. | Изображение | ||
Идеограмма | Помогаем людям стать более творческими. | Изображение | ||
Изображение | Imagen — это система искусственного интеллекта, которая создает фотореалистичные изображения из введенного текста. | Изображение | ||
img2img-турбо | Преобразование изображения в изображение за один шаг с помощью SD-Turbo. | Изображение | ||
Img2Prompt | Получайте подсказки из изображений, созданных стабильной диффузией. | Изображение | ||
Бесконечность | Бесконечность: масштабирование побитового авторегрессионного моделирования для синтеза изображений высокого разрешения. | arXiv | Изображение | |
InstantID | Генерация с нулевым выстрелом, сохраняющая идентичность, за считанные секунды. | arXiv | Изображение | |
СтажерLM-XComposer2 | InternLM-XComposer2 — это новаторская большая модель языка видения (VLLM), превосходящая себя в композиции и понимании текста и изображений в произвольной форме. | arXiv | Изображение | |
КОАЛА | Самовнимание имеет значение при дистилляции знаний о моделях скрытой диффузии для эффективного использования памяти и быстрого синтеза изображений. | Изображение | ||
Колорс | Колорс: Эффективное обучение модели диффузии для фотореалистичного синтеза текста в изображение. | Изображение | ||
КРЕА | Создавайте изображения и видео с помощью замечательного инструмента дизайна на базе искусственного интеллекта. | Изображение | ||
ЛаВи-Бридж | Объединение различных языковых моделей и моделей генеративного видения для преобразования текста в изображение. | arXiv | Изображение | |
СлойДиффузия | Распространение слоев прозрачного изображения с использованием скрытой прозрачности. | arXiv | Изображение | |
Лексика | Стабильная диффузия подсказывает поисковую систему. | Изображение | ||
ЛамаГен | Модель авторегрессии превосходит диффузию: лама для создания масштабируемых изображений. | arXiv | Изображение | |
Люмина-мГПТ | Lumina-mGPT: гибкая фотореалистичная генерация текста в изображение с помощью мультимодальной генеративной предварительной подготовки. | arXiv | Изображение | |
МетаСтрельба | MetaShoot — это цифровой двойник фотостудии, разработанный как плагин для Unreal Engine, который дает любому создателю возможность создавать высокореалистичные рендеры самым простым и быстрым способом. | Нереальный движок | Изображение | |
Середина пути | Midjourney — независимая исследовательская лаборатория, исследующая новые способы мышления и расширяющая творческие способности человеческого рода. | Изображение | ||
МИГК | MIGC: контроллер генерации нескольких экземпляров для синтеза текста в изображение. | arXiv | Изображение | |
Мимиккисть | Редактирование изображений с нуля с имитацией эталона. | arXiv | Изображение | |
ОмниГен | OmniGen: унифицированное создание изображений. | arXiv | Изображение | |
Омост | Omost — это проект по преобразованию возможностей кодирования LLM в возможности генерации изображений (или, точнее, создания изображений). | Изображение | ||
Открытый редактор | Openpose Editor для стабильного-диффузионного веб-интерфейса AUTOMATIC1111. | Изображение | ||
Нарядить кого угодно | Виртуальная примерка сверхвысокого качества для любой одежды и любого человека. | Изображение | ||
КраскиОтменить | PaintsUndo: базовая модель поведения рисования в цифровой живописи. | Изображение | ||
Фотомейкер | Настройка реалистичных фотографий людей с помощью встраивания сложенных идентификаторов. | arXiv | Изображение | |
Фотозал | Генератор фона AI. | Изображение | ||
Пласк | Генерация изображений AI в облаке. | Изображение | ||
Подскажите.Арт | Центр генераторов. | Изображение | ||
ПуЛИД | Настройка идентификатора Pure и Lightning посредством контрастного выравнивания. | arXiv | Изображение | |
Преобразование форматированного текста в изображение | Выразительное преобразование текста в изображение с помощью форматированного текста. | arXiv | Изображение | |
RPG-DiffusionMaster | Освоение диффузии текста в изображение: повторение, планирование и генерация с помощью мультимодальных LLM (PRG). | Изображение | ||
SEED-История | SEED-Story: создание мультимодальной длинной истории с большой языковой моделью. | arXiv | Изображение | |
Сегментируйте что угодно | Segment Anything Model (SAM): новая модель ИИ от Meta AI, которая может «вырезать» любой объект на любом изображении одним щелчком мыши. | arXiv | Изображение | |
Сегментируйте что угодно, модель 2 (SAM 2) | SAM 2: Сегментируйте все, что есть в изображениях и видео. | arXiv | Изображение | |
SD-Webui-ControlNet | Расширение WebUI для ControlNet. | Изображение | ||
SDXL-Молния | Прогрессивная состязательная диффузионная дистилляция. | arXiv | Изображение | |
SDXS | Одношаговые модели скрытой диффузии в реальном времени с условиями изображения. | Изображение | ||
Стабильный.арт | Плагин Photoshop для Stable Diffusion с автоматическим1111 в качестве серверной части (локально или с помощью Google Colab). | Изображение | ||
Стабильный Каскад | Стабильный каскад состоит из трех моделей: Stage A, Stage B и Stage C, представляющих собой каскад генерации изображений, отсюда и название «Стабильный каскад». | Изображение | ||
Стабильная диффузия | Скрытая модель диффузии текста в изображение. | Изображение | ||
стабильная-diffusion.cpp | Стабильная диффузия на чистом C/C++. | Изображение | ||
Стабильный веб-интерфейс Diffusion | Интерфейс браузера на основе библиотеки Gradio для Stable Diffusion. | Изображение | ||
Стабильный веб-интерфейс Diffusion | Веб-интерфейс для стабильного распространения. | Изображение | ||
Стабильный Diffusion WebUI на китайском языке | Китайская версия стабильной диффузии-webui. | Изображение | ||
Стабильная диффузия XL | Генерация изображений из текста. | arXiv | Изображение | |
Стабильная диффузия XL Turbo | Генерация текста в изображение в реальном времени. | Изображение | ||
Стабильная диффузия 3.5 | Открытая версия Stable Diffusion 3.5 включает несколько вариантов моделей, включая Stable Diffusion 3.5 Large и Stable Diffusion 3.5 Large Turbo. | Изображение | ||
Стабильный дудл | Stable Doodle — это инструмент для создания эскизов, который преобразует простой рисунок в динамическое изображение. | Изображение | ||
СтабильнаяСтудия | StableStudio от Stability AI | Изображение | ||
Сторисмейкер | StoryMaker: на пути к целостным единообразным персонажам при преобразовании текста в изображение. | arXiv | Изображение | |
ПотокДиффузия | Решение на уровне конвейера для интерактивной генерации в реальном времени. | Изображение | ||
СтильDrop | Преобразование текста в изображение в любом стиле. | arXiv | Изображение | |
SyncDreamer | Генерация изображений, согласованных с несколькими изображениями, из изображения с одним изображением. | arXiv | Изображение | |
УльтраПравить | UltraEdit: детальное редактирование изображений в масштабе на основе инструкций. | arXiv | Изображение | |
УльтраПиксель | UltraPixel: продвижение синтеза изображений сверхвысокого разрешения к новым вершинам. | arXiv | Изображение | |
Стабильная диффузия Unity ML | Стабильная диффузия Core ML в Unity. | Единство | Изображение | |
Виспанк Видения | Платформа для преобразования текста в изображение. | Изображение |
^ Вернуться к содержанию ^
Источник | Описание | Бумага | Игровой движок | Тип |
---|---|---|---|---|
CRM | Одно изображение в 3D-текстурированную сетку с моделью сверточной реконструкции. | arXiv | Текстура | |
DreamMat | Генерация высококачественных PBR-материалов с помощью моделей диффузии с учетом геометрии и света. | arXiv | Текстура | |
DreamSpace | Мечтайте о пространстве своей комнаты с помощью текстового панорамного распространения текстур. | Текстура | ||
Текстуры мечты | Стабильная диффузия, встроенная в Blender. Создавайте текстуры, концепт-арт, фоновые ресурсы и многое другое с помощью простой текстовой подсказки. | Блендер | Текстура | |
InstructHumans | Редактирование анимированных 3D-текстур человека с помощью инструкций. | arXiv | Текстура | |
Интекс | Интерактивный синтез текста в текстуру посредством унифицированной прорисовки с учетом глубины. | arXiv | Текстура | |
LLaMA-Сетка | LLaMA-Mesh: объединение создания 3D-сетей с языковыми моделями. | arXiv | сетка | |
МатериалSeg3D | MaterialSeg3D: сегментация плотных материалов из 2D-априорных материалов для 3D-активов. | arXiv | Текстура | |
СеткаЧто угодно | MaterialSeg3D: сегментация плотных материалов из 2D-априорных материалов для 3D-активов. | arXiv | сетка | |
Неураланджело | Высокоточная реконструкция поверхности нейронов. | arXiv | Текстура | |
Раскрась это | Синтез текста в текстуру посредством глубокой оптимизации сверточных текстурных карт и физически обоснованного рендеринга. | Текстура | ||
Поликам | Создавайте свои собственные 3D-текстуры, просто набрав текст. | Текстура | ||
ТексФьюжн | Синтез 3D-текстур с помощью моделей диффузии изображений, управляемых текстом. | arXiv | Текстура | |
Текст2Текс | Синтез текстовых текстур с помощью моделей диффузии. | arXiv | Текстура | |
Текстурная лаборатория | Текстуры, созданные искусственным интеллектом. Вы можете создать свой собственный с помощью текстовой подсказки. | Текстура | ||
С Поли | Создайте текстуры с помощью Poly. Создавайте 3D-материалы с помощью искусственного интеллекта в бесплатном онлайн-редакторе или пользуйтесь поиском в нашей растущей библиотеке сообщества. | Текстура | ||
X-сетка | X-Mesh: к быстрой и точной текстовой 3D-стилизации с помощью динамического текстового руководства. | arXiv | Текстура |
^ Вернуться к содержанию ^
Источник | Описание | Бумага | Игровой движок | Тип |
---|---|---|---|---|
ИИ-шейдер | Генератор шейдеров на базе ChatGPT для Unity. | Единство | Шейдер |
^ Вернуться к содержанию ^
Источник | Описание | Бумага | Игровой движок | Тип |
---|---|---|---|---|
Анимате3D | Animate3D: анимация любой 3D-модели с помощью многопросмотрового распространения видео. | arXiv | 3D | |
Что-нибудь-3D | Сегмент-Что угодно + 3D. Давайте поднимем что угодно до 3D. | arXiv | Модель | |
Any2Point | Any2Point: расширение возможностей больших моделей любой модальности для эффективного понимания 3D. | arXiv | 3D | |
БлендерGPT | Используйте команды на английском языке для управления Blender с помощью OpenAI GPT-4. | Блендер | Модель | |
Блендер-GPT | Универсальный помощник Blender на базе интеграции GPT3/4 + Whisper. | Блендер | Модель | |
Блокадные лаборатории | Цифровая алхимия реальна благодаря Skybox Lab — идеальному решению на базе искусственного интеллекта для создания невероятных впечатлений от скайбокса на 360° из текстовых подсказок. | Модель | ||
CF-3DGS | 3D-гауссово разбрызгивание без COLMAP. | arXiv | 3D | |
Генерация персонажей | Генерация персонажей: эффективная генерация 3D-персонажей из отдельных изображений с канонизацией многоракурсных поз. | arXiv | 3D | |
чатGPT-майя | Простой инструмент Maya, использующий открытый искусственный интеллект для выполнения основных задач на основе описательных инструкций. | Майя | Модель | |
Город Мечтатель | Композиционная генеративная модель неограниченных трехмерных городов. | arXiv | 3D | |
ЦСМ | Создавайте 3D-миры из изображений и видео. | 3D | ||
Бросаться | Ваш второй пилот в построении мира в Unreal Engine. | Нереальный движок | 3D | |
DreamCatalyst | DreamCatalyst: быстрое и высококачественное 3D-редактирование посредством контроля возможности редактирования и сохранения идентичности. | arXiv | 3D | |
МечтаGaussian4D | Генеративное 4D гауссово сплаттинг. | arXiv | 4D | |
DUST3R | Геометрическое 3D-видение стало проще. | arXiv | 3D | |
Эдифицируйте 3D | Edify 3D: масштабируемое создание высококачественных 3D-ресурсов. | arXiv | 3D | |
ГАЛА3D | GALA3D: На пути к созданию сложных сцен из текста в 3D с помощью генеративного гауссовского сплаттинга на основе макета. | arXiv | 3D | |
ГауссCtrl | GaussCtrl: многопросмотровое согласованное редактирование 3D-гауссовских пятен на основе текста. | arXiv | 3D | |
ГауссовКуб | Структурированное и явное представление излучения для генеративного 3D-моделирования. | arXiv | 3D | |
Гауссов Мечтатель | Быстрая генерация текста в 3D-гауссово пятно с использованием априорных облаков точек. | arXiv | 3D | |
GenieLabs | Расширьте возможности своей игры с помощью AI-UGC. | 3D | ||
ПриветФА | Высокоточное преобразование текста в 3D с расширенным руководством по диффузии. | Модель | ||
голомечтатель | HoloDreamer: создание целостного панорамного трехмерного мира на основе текстовых описаний. | arXiv | 3D | |
Хунюань3D-1.0 | Hunyuan3D-1.0: унифицированная платформа для преобразования текста в 3D и изображения в 3D. | arXiv | 3D | |
Инфиниген | Бесконечные фотореалистичные миры с использованием процедурной генерации. | arXiv | 3D | |
Инструкция-NeRF2NeRF | Редактирование 3D-сцен с помощью инструкций. | arXiv | Модель | |
Интерактивный3D | Создайте то, что хотите, с помощью интерактивной 3D-генерации. | arXiv | 3D | |
Изотропный3D | Преобразование изображения в 3D на основе встраивания одного CLIP. | 3D | ||
ЛАТТЕ3D | Крупномасштабный синтез амортизированного текста в расширенном 3D. | arXiv | 3D | |
ЛЕВ | Модели диффузии скрытых точек для создания трехмерных форм. | arXiv | Модель | |
Лума ИИ | Снимайте в реалистичном 3D. Непревзойденный фотореализм, отражения и детали. Будущее визуальных эффектов теперь для всех! | Модель | ||
люмин ИИ | Творчество на основе искусственного интеллекта. | 3D | ||
Сделай это-3D | Высококачественное создание 3D-изображений из одного изображения с использованием технологии Diffusion Prior. | arXiv | Модель | |
сетчатый | Создавайте потрясающие 3D-игровые ресурсы с помощью ИИ. | 3D | ||
Движение | Создатель волшебной 3D-анимации с искусственным интеллектом. | 3D | ||
МВДрим | Многопросмотровое распространение для создания 3D-изображений. | arXiv | 3D | |
NVIDIA Мгновенный NeRF | Примитивы мгновенной нейронной графики: молниеносный NeRF и многое другое. | Модель | ||
Один-2-3-45 | Преобразование любого отдельного изображения в 3D-сетку за 45 секунд без оптимизации каждой формы. | arXiv | Модель | |
Краска3D | Рисуйте что угодно в 3D с помощью моделей диффузии текстур без освещения. | arXiv | 3D | |
ПАНИЦ-3D | Стилизованная одноракурсная 3D-реконструкция портретов персонажей аниме. | arXiv | Модель | |
Точка·E | Диффузия облаков точек для синтеза 3D-моделей. | Модель | ||
Плодовитый Мечтатель | Высокоточное и разнообразное преобразование текста в 3D с вариационной дистилляцией оценок. | arXiv | Модель | |
СФ3D | SF3D: стабильная и быстрая реконструкция 3D-сетки с УФ-разверткой и распутыванием освещения. | arXiv | 3D | |
Форма | Создавайте 3D-объекты на основе текста или изображений. | arXiv | Модель | |
Слойд | 3D-моделирование никогда не было проще. | Модель | ||
Сплайн ИИ | Сила искусственного интеллекта переходит в третье измерение. Создавайте объекты, анимацию и текстуры с помощью подсказок. | Модель | ||
Стабильный Dreamfusion | Реализация Pytorch модели Dreamfusion для преобразования текста в 3D, основанная на модели Stable Diffusion для преобразования текста в 2D. | Модель | ||
СВ3Д | Новый многоракурсный синтез и генерация 3D из одного изображения с использованием скрытой диффузии видео. | arXiv | 3D | |
Тафи | AI-текст в движок 3D-персонажей. | Модель | ||
3D-GPT | Процедурное 3D-моделирование с использованием больших языковых моделей. | arXiv | 3D | |
3D-LLM | Внедрение трехмерного мира в большие языковые модели. | arXiv | 3D | |
3Dпрессо | Извлеките 3D-модель объекта, снятую на видео. | Модель | ||
3DТопия | Преобразование текста в 3D за 5 минут. | arXiv | 3D | |
3DТопия-XL | 3DTopia-XL: Масштабирование создания высококачественных 3D-ресурсов посредством примитивного распространения. | arXiv | 3D | |
тристудия | Единая платформа для создания 3D-контента. | Модель | ||
ТрипоСР | Современная модель с открытым исходным кодом для быстрой 3D-реконструкции с прямой связью по одному изображению. | arXiv | Модель | |
Уникальный3D | Высококачественное и эффективное создание 3D-сетки из одного изображения. | arXiv | 3D | |
UnityGaussianSplatting | Визуализация игрушечного гауссовского сплаттинга в Unity. | Единство | 3D | |
ViVid-1-к-3 | Новый синтез представлений с моделями видеодиффузии. | arXiv | 3D | |
Вокскрафт | Создание готовых к использованию 3D-моделей с помощью искусственного интеллекта. | 3D | ||
Чудо3D | Преобразование одного изображения в 3D с использованием междоменной диффузии. | arXiv | 3D | |
От нуля до трех | Преобразование одного изображения в 3D-объект с нуля. | arXiv | Модель |
^ Вернуться к содержанию ^
Источник | Описание | Бумага | Игровой движок | Тип |
---|---|---|---|---|
АниПортрет | Аудио-синтез фотореалистичной портретной анимации. | arXiv | Аватар | |
СПОКОЙСТВИЕ | Условно-состязательные латентные модели для управляемых виртуальных персонажей. | arXiv | Аватар | |
ЧатАватар | Прогрессивное поколение анимируемых трехмерных лиц под руководством текста. | Аватар | ||
Чатдолькит | Chatdollkit позволяет вам превратить вашу 3D -модель в чат -бот. | Единство | Аватар | |
Dreamtalk | Когда выразительная генерация головы соответствует вероятностным моделям диффузии. | arxiv | Аватар | |
Duix | Duix - цифровой SDK на основе кремния? | Аватар | ||
Эхомимический | Echomimic: жизненный звуковой портретный анимацию, управляемые аудио, через редактируемые условия для знаковых. | arxiv | Аватар | |
Emoportraits | Увеличенные эмоциями мультимодальные аватары головы. | Аватар | ||
E3 Gen | Эффективное, выразительное и редактируемое поколение аватаров. | arxiv | Аватар | |
Эксаватар | Exavatar - выразительный 3 -й гауссовый аватар всего тела. | arxiv | Аватар | |
Генеаватар | Общее редактирование аватара с общим выражением. | arxiv | Аватар | |
GeneFace ++ | Обобщенные и стабильные 3D-разговоры в реальном времени. | Аватар | ||
Привет | Иерархический звук визуальный синтез для портретной анимации изображения. | arxiv | Аватар | |
Hallo2 | Hallo2: долгосрочная и высокая регламентальная анимация портрета. | arxiv | Аватар | |
Headsculpt | Создание трехмерных аватаров с текстом. | arxiv | Аватар | |
Intrinsicavatar | Intrinsicavatar: физически основанный обратный рендеринг динамических людей из монокулярных видео с помощью явного трассировки лучей. | arxiv | Аватар | |
Линейный | Цифровая аватарная разговорная система. | Аватар | ||
LiveПортрет | LivePortrait: эффективная портретная анимация с управлением строками и ретаргетингом. | arxiv | Аватар | |
MotionGpt | Человеческое движение как иностранный язык, унифицированная модель генерации движения с использованием LLMS. | arxiv | Аватар | |
Мусеса | Musepose: основанная на позе структура изображения к видео для виртуального человеческого поколения. | Аватар | ||
Musetalk | В реальном времени высококачественная синхронизация губ с скрытым пространством. | Аватар | ||
Муз | Бесконечная и высокая верность Виртуальная генерация человеческого видео с визуальным параллельным равенством. | Аватар | ||
Портрет4d | Изучение синтеза аватара с одним выстрелом с использованием синтетических данных. | arxiv | Аватар | |
Готовой игрок меня | Интегрируйте настраиваемые аватары в свою игру или приложение за несколько дней. | Аватар | ||
Родинхд | Rodinhd: генерация 3D-аватара с высокой точностью с диффузионными моделями. | arxiv | Аватар | |
Styleavatar3d | Использование моделей диффузии с изображением текста для генерации 3D-аватара с высокой точки зрения. | arxiv | Аватар | |
Text2control3d | Контролируемая генерация 3D-аватара в областях нервного сияния с использованием диффузионной диффузии, управляемой геометрией. | arxiv | Аватар | |
Topo4d | Содержание топологии гауссово расколоть для захвата 4D головы с высокой точки зрения. | arxiv | Аватар | |
Unityaiwithchatgpt | Основываясь на Unity, реализуется интерактивный дисплей CATGPT+UnityChan Voice. | Единство | Аватар | |
Vid2avatar | 3D-реконструкция аватара из видео в дикой природе через самоотверженное разложение сцены. | arxiv | Аватар | |
Влоггер | Мультимодальная диффузия для синтеза воплощенного аватара. | Аватар | ||
Wild2avatar | Определение людей за окклюзиями. | arxiv | Аватар |
^ Вернуться к содержанию ^
Источник | Описание | Бумага | Игровой движок | Тип |
---|---|---|---|---|
Оживить кого -нибудь | Последовательный и контролируемый синтез изображения к видео для анимации персонажа. | arxiv | Анимация | |
Анимация | Мелкозернистая анимация изображения открытого домена с руководством движения. | arxiv | Анимация | |
Анимация | Оживить свои персонализированные диффузионные модели текста до изображения без определенной настройки. | arxiv | Анимация | |
Animatelcm | Давайте ускоряем генерацию видео в течение 4 шагов! | arxiv | Анимация | |
Animate-X | Animate-X: универсальная анимация изображения персонажа с улучшенным представлением движения. | arxiv | Анимация | |
Animatezero | Модели диффузии видео-это аниматоры с нулевым выстрелом. | arxiv | Анимация | |
Анимациягпт | Инструмент AIGC для генерации игровых боевых активов. | Анимация | ||
Дефорум | Дефорум использует стабильную диффузию для создания развивающихся визуальных эффектов ИИ. | Анимация | ||
Рисунки | Результаты: 3D -анимация из отдельных рисунков символов. | arxiv | Анимация | |
Dreamving | Основная структура генерации видео, основанная на диффузионных моделях. | arxiv | Анимация | |
FaceFusion | Следующее поколение Face Swapper и Enhancer. | Анимация | ||
FreeInit | Соединение разрыва инициализации в моделях диффузии видео. | arxiv | Анимация | |
Geneface | Обобщенное и высококачественное звуковое 3D-синтез 3D. | arxiv | Анимация | |
Идентификатор | Ноль-выстрел, сохраняющий идентификационные генерации человеческого видео. | arxiv | Анимация | |
Maganimate | Временно последовательная анимация человеческого изображения с использованием диффузионной модели. | arxiv | Анимация | |
Нува | Dragnuwa-это модель генерации видео на основе диффузии на основе диффузии с открытым доменом, на основе управления текстом, изображений и траектории для достижения управляемого генерации видео. | arxiv | Анимация | |
Nuwa-Infinity | Nuwa-Infinity-это мультимодальная генеративная модель, которая предназначена для создания высококачественных изображений и видео из данного текста, изображения или видео ввода. | Анимация | ||
Nuwa-xl | Новая диффузия над диффузионной архитектурой для чрезвычайно длинной генерации видео. | Анимация | ||
Omni Animation | ИИ сгенерировал анимацию с высокой точностью. | Анимация | ||
Пиа | Ваш персонализированный аниматор изображения через модули Plugne-Play в моделях текста к изображению. | arxiv | Анимация | |
Садталкер | Изучение реалистичных 3D-коэффициентов движения для стилизованного звукового отдельного изображения. Говоря об анимации лица. | arxiv | Анимация | |
Sadtalker-Video-Lip-Sync | Этот проект основан на Sadtalkers Wav2lip для синтеза губ. | Анимация | ||
Стабильная анимация | Мощный инструмент текста к анимации для разработчиков. | Анимация | ||
Talecrafter | Интерактивный инструмент визуализации истории, который поддерживает несколько персонажей. | arxiv | Анимация | |
Tooncrafter | Tooncrafter: генеративная мультипликационная интерполяция. | arxiv | Анимация | |
Wav2lip | Точнее видео с синхронизацией губ в дикой природе. | arxiv | Анимация | |
Wonder Studio | Инструмент искусственного интеллекта, который автоматически анимирует, освещает и составляет персонажи CG в сцену живого действия. | Анимация |
^ Вернуться к содержанию ^
Источник | Описание | Бумага | Игровой движок | Тип |
---|---|---|---|---|
Камбрий-1 | Cambrian-1: полностью открытое, ориентированное на зрение исследование мультимодальных LLM. | arxiv | Мультимодальный LLMS | |
Cogvlm2 | Многомодальная модель с открытым исходным кодом на уровне GPT4V на основе LLAMA3-8B. | Визуальный | ||
Cotracker | Лучше отслеживать вместе. | arxiv | Визуальный | |
Evf-sam | EVF-SAM: слияние на основе раннего зрений для сегмента, вызванного текстом, что угодно. | arxiv | Визуальный | |
Facehi | Лучше отслеживать вместе. | Визуальный | ||
Internlm-xcomposer2 | Internlm-xcomposer2-это новаторская зрение на языке зрений (VLLM), превосходная в составе и понимании текстового изображения в свободной форме. | arxiv | Визуальный | |
Кенгуру | Kangaroo: мощная видеоязычная модель, поддерживающая длинно контекстовый видео ввод. | Визуальный | ||
LGVI | На пути к языковому видео внедрение через мультимодальные крупные языковые модели. | Визуальный | ||
Llava ++ | Расширение визуальных возможностей с Llama-3 и Phi-3. | Визуальный | ||
Llava-Onevision | Llava-Onevision: легкая визуальная передача задачи. | arxiv | Визуальный | |
Лонгва | Длинная передача контекста от языка к видению. | arxiv | Визуальный | |
Масквит | В визуальном предварительном тренировке замаскировано предсказание видео. | arxiv | Визуальный | |
Minicpm-llama3-v 2.5 | Уровень GPT-4V MLLM на вашем телефоне. | Визуальный | ||
МО-ЛЛАВА | Смесь экспертов для больших моделей языка зрения. | arxiv | Визуальный | |
Motionllm | Понимание поведения человека от человеческих движений и видео. | arxiv | Визуальный | |
Пллава | Расширение Llava без параметров от изображений на видео для видео для видео. | arxiv | Визуальный | |
Qwen-Vl | Универсальная модель на языке зрения для понимания, локализации, чтения текста и за ее пределами. | arxiv | Визуальный | |
Sapiens | Sapiens: Фонд для моделей человеческого зрения. | arxiv | Визуальный | |
ShareGPT4V | Улучшение больших мультимодальных моделей с лучшими подписями. | arxiv | Визуальный | |
СОЛО | Соло: единственный трансформатор для масштабируемого моделирования на языке зрения. | arxiv | Визуальный | |
Видеокам | Видео-CCAM: продвижение понимания видеоязыка с причинными масками. | Визуальный | ||
Видео-лава | Изучение объединенного визуального представления по выравниванию перед проекцией. | arxiv | Визуальный | |
Видеоллама 2 | Добавление пространственного временного моделирования и понимания аудио в видео-LLM. | arxiv | Визуальный | |
Видео-мам | Первый в истории всеобъемлющий эталон оценки мультимодальных LLMS в видео-анализе. | arxiv | Визуальный | |
Витрон | Unified Pixel Vision LLM для понимания, создания, сегментирования, редактирования. | Визуальный | ||
Вила | Вила: на предварительном тренировке для моделей визуального языка. | arxiv | Визуальный |
^ Вернуться к содержанию ^
Источник | Описание | Бумага | Игровой движок | Тип |
---|---|---|---|---|
360DVD | Контролируемая генерация видео панорамы с 360-градусной моделью диффузии видео. | arxiv | Видео | |
Анимат-история | Поиск подавленного генерации видео для рассказа истории. | arxiv | Видео | |
Что -нибудь в любой сцене | Фотореалистическая вставка объекта. | Видео | ||
Искусство • v | Авторегрессивное генерация текста к Video с диффузионными моделями. | arxiv | Видео | |
Вспомогательный | Познакомьтесь с генеративной видео платформой, которая оживляет ваши идеи. | Видео | ||
Атомовидео | Высокая точность изображения к Video Generation. | arxiv | Видео | |
FounalRemover | Фоновое средство для удаления позволяет удалить фон из изображений и видео с использованием AI с помощью простого интерфейса командной строки, который является бесплатным и открытым исходным кодом. | Видео | ||
Прокладка | Генерирование богатых и контролируемых движений для синтеза видео. | arxiv | Видео | |
Кодф | Поля деформации контента для временной последовательной обработки видео. | arxiv | Видео | |
Cogvideo | Генерировать видео из описания текста. | Видео | ||
Cogvideox | Cogvideox-это версия модели генерации видео с открытым исходным кодом, которая гомологична 清影. | Видео | ||
Cogvlm | Cogvlm-это мощная модель визуального языка с открытым исходным кодом (VLM). | Визуальный | ||
Конр | Genarate яркие танцевальные видео из листов аниме-персонажей нарисованных вручную (ACS). | arxiv | Видео | |
Декогерировать | Создайте то, что нельзя снять. | Видео | ||
Описание | Описание - это простой, мощный и интересный способ редактирования. | Видео | ||
Диффутон | Редактируемое затенение с высоким разрешением с помощью диффузионных моделей. | arxiv | Видео | |
дельфин | Общая платформа взаимодействия видео на основе LLMS. | Видео | ||
Domoai | Увеличьте свое творчество с помощью Domoai. | Видео | ||
Dreamcinema | DreamCinema: кинематографическая передача с бесплатной камерой и 3D -персонажем. | arxiv | Видео | |
Dynamicrafter | Анимирующие изображения с открытыми доменами с помощью априоров диффузии видео. | arxiv | Видео | |
КРАЙ | Мы вводим Edge, мощный метод для редактируемого поколения танцев, который способен создавать реалистичные, физически правдоподобные танцы, оставаясь верной произвольной входной музыке. | arxiv | Видео | |
Эмо | Emote Portrait Alive - генерирование экспрессивных портретных видео с диффузионной моделью Audio2Video в слабых условиях. | arxiv | Видео | |
EMU видео | Факторизация генерации текста к Video с помощью явного кондиционирования изображения. | Видео | ||
Этна | ETNA может генерировать соответствующий видеоконтент на основе коротких текстовых описаний. | Видео | ||
Сказочный | Быстро параллелизированный синтез видео-видео-видео под управлением инструкциями. | Видео | ||
Следуйте за вагоном | Следуйте за вагоном: видео с более высоким разрешением с обширным поколением контента. | arxiv | Видео | |
Следуйте за своей позой | Позму с позой, с использованием видео, не содержащих позы видео. | arxiv | Видео | |
Fulljourney | Ваш полный набор инструментов создания ИИ у вас под рукой. | Видео | ||
Gen-2 | Многомодальная система ИИ, которая может генерировать новые видео с текстом, изображениями или видеоклипами. | Видео | ||
Генеративная динамика | Генеративная динамика изображения. | Видео | ||
Джинн | Генеративные интерактивные среды. | arxiv | Видео | |
Genmo | Волшебным образом снимать видео с ИИ. | Видео | ||
Джентрон | Диффузионные трансформаторы для изображения и генерации видео. | Видео | ||
Иген | Иерархическое пространственно-временное развязка для генерации текста к Video. | Видео | ||
Hotshot-xl | Hotshot-XL-это модель Text-GIF AI, обученную работать вместе со стабильной диффузией XL. | Видео | ||
Хунюанвидео | Hunyuanvideo: систематическая структура для большой модели генерации видео. | arxiv | Видео | |
ИМЕННОЕ ВИДЕО | Учитывая текстовую подсказку, Imagen Video генерирует видео с высокой четкой, используя базовую модель генерации видео и последовательность чередующихся моделей пространственного и временного видео с разрешением. | Видео | ||
Инструкторвидео | Инструктирование видео диффузии с обратной связью с человека. | arxiv | Видео | |
I2vgen-xl | Высококачественный синтез изображения к видео посредством каскадных диффузионных моделей. | arxiv | Видео | |
Лави | Высококачественная генерация видео с каскадными скрытыми моделями диффузии. | arxiv | Видео | |
ЛТХ Студия | LTX Studio — это комплексная платформа для кинопроизводства, управляемая искусственным интеллектом, для авторов, маркетологов, кинематографистов и студий. | Видео | ||
LTX-Video | LTX-Video-первая модель генерации видео на основе DIT, которая может генерировать высококачественные видео в режиме реального времени. Он может генерировать 24 видео -кадров с разрешением 768x512, быстрее, чем нужно для их просмотра. | Видео | ||
Люмьер | Проблемная диффузионная модель для генерации видео. | arxiv | Видео | |
LVDM | Скрытые модели диффузии видео для высокой точки зрения длинной генерации видео. | arxiv | Видео | |
Magic -Video | Эффективная генерация видео с скрытыми диффузионными моделями. | arxiv | Видео | |
Magic-Vide-V2 | Многостадийное высокоастетическое генерацию видео. | arxiv | Видео | |
Волшебный час | ИИ видео для создателей сделало простое. | Видео | ||
Magvit-V2 | Токенизатор является ключом к генерации визуальной формы. | Видео | ||
Магвит | Генеративный видео -трансформатор в масках. | Видео | ||
Make-a-video | Make-A-Video-это современная система ИИ, которая генерирует видео из текста. | arxiv | Видео | |
Сделайте пиксели танцевать | Высоко-динамическое генерация видео. | arxiv | Видео | |
Делать свой видео | Индивидуальная генерация видео с использованием текстового и структурного руководства. | arxiv | Видео | |
Микроцинемема | Разделение и подтверждение подхода для генерации текста к Video. | arxiv | Видео | |
Мимо | MIMO: Синтез управляемого видео с пространственным разложенным моделированием. | arxiv | Видео | |
Мини-гемини | Добывать потенциал моделей языка многомодальности. | Зрение | ||
MobileVidFactory | Автоматическая диффузионная социальная медиа-генерация для мобильных устройств из текста. | Видео | ||
Моти 1 | Mochi 1-это открытая современная модель генерации видео с движением с высокой точки зрения и сильной быстрого приверженности в предварительной оценке. | Видео | ||
Mofa-video | Управляемая анимация изображения с помощью генеративных адаптаций поля движения в модели замороженной диффузионной диффузии изображения к видео. | arxiv | Видео | |
MoneyPrinterTurbo | Используйте большие модели, чтобы создать короткие видео с одним щелчком. | Видео | ||
Мунэлли | Moonvalley-новая новая генеративная AI-модель текста к Video. | Видео | ||
Мора | Больше похоже на Сору для генерального видео генерации. | arxiv | Видео | |
Morph Studio | С нашей магией Text-To-Video AI, проявите ваше творчество с помощью вашего подсказки. | Видео | ||
MotionClone | MotionClone: клонирование без тренировок для управляемого генерации видео. | arxiv | Видео | |
MotionCtrl | Единый и гибкий контроллер движения для генерации видео. | arxiv | Видео | |
MotionDirector | Настройка движения моделей диффузии текста к Video. | arxiv | Видео | |
Motionshop | Применение замены персонажей в видео на 3D -аватары. | Видео | ||
Mov2mov | Плагин Mov2mov для Automatic1111/Stable-Diffusion-Webui. | Видео | ||
Moviefactory | Автоматическое создание фильмов из текста с использованием больших генеративных моделей для языка и изображений. | arxiv | Видео | |
Нейронные рамки | Откройте для себя синтезатор для визуального мира. | Видео | ||
Neverends | Создайте свой мир. | Видео | ||
Открытая сора | Демократизация эффективного видеопроизводства для всех. | Видео | ||
Открытая сора | План открытого сора. | Видео | ||
Фенаки | Модель для генерации видео из текста, с подсказками, которые могут меняться со временем, и видео, которые могут быть дольше, как и несколько минут. | arxiv | Видео | |
Pika Labs | Pika Labs революционизирует видео с ИИ. | Видео | ||
Пикселинг | Pixeling дает возможность нашим клиентам создавать очень точные, ультрареалистичные и чрезвычайно контролируемые визуальное содержание, включая изображения, видео и 3D-модели. | Видео | ||
ПиксВерс | Создайте захватывающие дух видео с ИИ. | Видео | ||
Опыления | Создание становится легким, быстрым и веселым. | Видео | ||
Повторное использование и рассеяние | Итеративное денирование для поколения текста в Video. | arxiv | Видео | |
Жуйи | Ruyi-это модель с изображением к видео, способная генерировать видео кинематографического качества с разрешением 768, с частотой кадров 24 кадров в секунду, на общей сложности 5 секунд и 120 кадров. | Видео | ||
Shortgpt | Экспериментальная структура искусственного интеллекта для автоматического создания короткого/видеоконтента. | Видео | ||
Show-1 | Жениться на пиксельных и скрытых диффузионных моделях для генерации текста к Video. | arxiv | Видео | |
Snap Video | Масштабированные пространственно-временные трансформаторы для синтеза текста к видео. | arxiv | Видео | |
Сора | Создание видео из текста. | Видео | ||
Sorawebui | Sorawebui-это веб-клиент Sora с открытым исходным кодом, который позволяет пользователям легко создавать видео из текста с моделью Sora Openai. | Видео | ||
Stablevideo | Редактирование видео диффузионного видео, управляемого текстовым диффузией. | Видео | ||
Стабильная диффузия видео | Стабильная диффузия видео (SVD) изображение-видео. | Видео | ||
Storydiffusion | Последовательное самопринятие для долгосрочных изображений и генерации видео. | arxiv | Видео | |
Streamingt2v | Последовательный, динамичный и расширяемый длинный генерацию видео из текста. | arxiv | Видео | |
Стиликрафтер | Стилизованный стилизованный генератор текста к Video с адаптером стиля. | arxiv | Видео | |
Тат | Длинное генерация видео с агромическим VQGAN и чувствительным к временным трансформатором. | Видео | ||
Text2video-Zero | Диффузионные модели текста к изображению представляют собой видеогенераторы с нулевым выстрелом. | arxiv | Видео | |
TF-T2V | Рецепт для масштабирования генерации текста к Video с без текстового видео. | arxiv | Видео | |
Тора | Tora: траектория, ориентированный на траекторию диффузионный трансформатор для генерации видео. | arxiv | Видео | |
Трек-все | Все треки-это гибкий и интерактивный инструмент для отслеживания и сегментации видео объекта, основанный на сегменте, и XMEM. | arxiv | Видео | |
Tune-A-Video | Одно выстрел настройки диффузионных моделей изображения для генерации текста к Video. | arxiv | Видео | |
Двенадцать | Мультимодальный ИИ, который понимает такие видео, как люди. | Видео | ||
Univg | На пути к генерации видео Unified-Modal. | Видео | ||
VCHITECT-2.0 | VCHITECT-2.0: Параллельный трансформатор для масштабирования моделей диффузии видео. | Видео | ||
Vgen | Целостная экосистема генерации видео для создания генерации видео на моделях диффузии. | arxiv | Видео | |
ViewCrafter | ViewCrafter: приручив модели диффузии видео для синтеза нового вида с высокой точки зрения. | arxiv | Видео | |
Видео-чатгпт | Video-Chatgpt-это модель видео-разговора, способная создавать содержательный разговор о видео. | arxiv | Видео | |
Видеокомпозитор | Синтез композиционного видео с управляемостью движения. | arxiv | Видео | |
VideoCrafter1 | Открытые диффузионные модели для высококачественного генерации видео. | arxiv | Видео | |
VideoCrafter2 | Преодоление ограничений данных для высококачественных моделей диффузии видео. | arxiv | Видео | |
VideoDrafter | Контент-согласованная многоцветная генерация видео с LLM. | arxiv | Видео | |
Видеолеватор | Повышение качества генерации видео с универсальными диффузионными моделями текста до изображения. | arXiv | Видео | |
Видеофактор | Обращение внимания в пространственно-временных диффузиях для генерации текста к Video. | Видео | ||
Видеоген | Подход с латентной диффузией, управляемый эталонными, для генерации текста к Video высокой четкости. | arxiv | Видео | |
Видеолкм | Видео скрытая модель согласованности. | arxiv | Видео | |
Видео LDMS | Совместите свои задержки: синтез видео с высоким разрешением с скрытыми диффузионными моделями. | arxiv | Видео | |
Видео-лава | Изучение объединенного визуального представления по выравниванию перед проекцией. | arxiv | Видео | |
Видеомамба | Космическая модель состояния для эффективного понимания видео. | arxiv | Видео | |
Видео с мыслью | Видео-размышления: пошаговые видео-рассуждения от восприятия до познания. | Видео | ||
Видеопоэт | Большая языковая модель для генерации видео с нулевым выстрелом. | arxiv | Видео | |
Движение Виспанка | Создайте реалистичные видео, используя только текст. | Видео | ||
VisualRwkv | VisualRwkv-это визуальная версия языковой модели RWKV, позволяющая RWKV выполнять различные визуальные задачи. | Визуальный | ||
V-JEPA | ВИДЕО СОВЕТСТВЕННОЕ Встроение прогнозной архитектуры. | arxiv | Видео | |
УОЛТ | Фотореалистическое генерацию видео с диффузионными моделями. | arxiv | Видео | |
Зороскоп | Zeroscope Text-to-Video. | Видео |
^ Вернуться к содержанию ^
Источник | Описание | Бумага | Игровой движок | Тип |
---|---|---|---|---|
Academicodec | Модель аудиокодека с открытым исходным кодом для академических исследований. | Аудио | ||
Амфион | Инструментарий с открытым исходным кодом, музыка, музыка и генерация речи. | arxiv | Аудио | |
Архизан | Генерация звука с использованием диффузионных моделей, в Pytorch. | Аудио | ||
Аудиобокс | Современное генерация звука с естественным языком подсказки. | Аудио | ||
Аудиоединирование | НЕОБРАЖЕНИЕ НЕПРАВИЛЬНОЕ НЕПРАВИЛЬНОЕ И ТЕКСТРЕВЕННОЕ РЕДАЛИЧЕСКИЕ АУДИО С помощью инверсии DDPM. | arxiv | Аудио | |
Аудиоген Кодек | Низкий компрессия 48 кГц стерео нейронной аудиокодек для общего аудио, оптимизируя для верности звука? | Аудио | ||
Audiogpt | Понимание и генерирование речи, музыки, звука и говорящей головы. | arxiv | Аудио | |
Audiolcm | Генерация текста в Аулио с скрытыми моделями согласованности. | arxiv | Аудио | |
Audioldm | Генерация текста в Аулио с скрытыми диффузионными моделями. | arxiv | Аудио | |
Audioldm 2 | Изучение целостного поколения звука с самоотверженной предварительной подготовкой. | arxiv | Аудио | |
Auffusion | Используя силу диффузии и большие языковые модели для генерации текста в Аулио. | arxiv | Аудио | |
CTAG | Творческое поколение текста к Аудио через программирование синтезатора. | Аудио | ||
Фолейкрафтер | Foleycrafter: Принесите тихие видео в жизнь с жизненными и синхронизированными звуками. | arxiv | Аудио | |
Магнит | Генерация звука в масках с использованием одного неавторегрессивного трансформатора. | Аудио | ||
Make-An-Audio | Генерация текста в Аулио с быстрого растущей диффузионной модели. | arxiv | Аудио | |
Make-An-Audio 3 | Преобразование текста в аудио через большие диффузионные трансформаторы на основе потока. | arxiv | Аудио | |
Неврол | Основанный на обучении синтез звука с акустическим переносом. | arxiv | Аудио | |
Оптимизай | Звуки для создателей, игроков, артистов, видео -производителей. | Аудио | ||
Qwen2-Audio | QWEN2-AUDIO CHAT & Preting Light Audio Language Model, предложенная Alibaba Cloud. | arxiv | Аудио | |
See-2-Sound | Ноль-выстрел пространственной среды к пространственному звуку. | arxiv | Аудио | |
Звуковая звезда | Эффективное параллельное генерация звука. | arxiv | Аудио | |
Стабильный звук | Быстрая поддержанная хранение | Аудио | ||
Стабильный звук открыт | Стабильный звук Open 1.0 генерирует стереоусильнику с переменной длиной (до 47 с) при 44,1 кГц из текстовых подсказок. | Аудио | ||
Синкфузия | Синкфузия: мультимодальный синхронизированный видео-синтез видео-а-а-а-а-Аул. | arxiv | Аудио | |
ТАНГО | Генерация текста в Аулио с использованием инструкции LLM и скрытой диффузионной модели. | Аудио | ||
VTA-LDM | Видео-до-Аудио поколение со скрытым выравниванием. | arxiv | Аудио | |
Wavjourney | Создание композиционного звука с большими языковыми моделями. | arxiv | Аудио |
^ Вернуться к содержанию ^
Источник | Описание | Бумага | Игровой движок | Тип |
---|---|---|---|---|
Aiva | Искусственный интеллект составляющий эмоциональную музыку саундтрека. | Музыка | ||
Ампера музыка | Технология индивидуальной музыки, работающая на Amper. | Музыка | ||
БУМИЯ | Создать генеративную музыку. Поделиться этим с миром. | Музыка | ||
Чатмусикан | Создание внутренних музыкальных способностей в LLM. | Музыка | ||
Chord2melody | Автоматическое поколение музыки ИИ. | Музыка | ||
Diff-Bgm | Диффузионная модель для генерации видео -фоновой музыки. | arxiv | Музыка | |
Fluxmusic | Fluxmusic: генерация текста в музыку с выпрямленным трансформатором потока. | arxiv | Музыка | |
Gptableton | Проект скрипта для обработки ответа GPT и отправки MIDI-заметок в Ableton Clips с Abletonosc и Python-OSC. | Музыка | ||
Heymusic.ai | ИИ музыкальный генератор | Музыка | ||
Изображение к музыке | AI Image To Music Generator - это инструмент, который использует искусственный интеллект для преобразования изображений в музыку. | Музыка | ||
Джен-1 | Текстовое универсальное поколение музыки с всенаправленными диффузионными моделями. | Музыка | ||
Музыкальный автомат | Генеративная модель для музыки. | arxiv | Музыка | |
Пурпурный | Magenta - это исследовательский проект, изучающий роль машинного обучения в процессе создания искусства и музыки. | Музыка | ||
Мелодия | Эффективное поколение нейронной музыки | Музыка | ||
Муберт | AI Generative Music. | Музыка | ||
Мусенет | Глубокая нейронная сеть, которая может генерировать 4-минутные музыкальные композиции с 10 различными инструментами и может объединить стили от страны до Моцарта до Битлз. | Музыка | ||
MusicGen | Простое и контролируемое поколение музыки. | arxiv | Музыка | |
Musicldm | Улучшение новизны в генерации текста до музыки с использованием бите-синхронных стратегий микширования. | arxiv | Музыка | |
МузыкаLM | Создание музыки из текста. | arxiv | Музыка | |
Приложение рифузии | Riffusion-это приложение для поколения музыки в реальном времени со стабильной диффузией. | Музыка | ||
Сонауто | Sonauto - музыкальный редактор искусственного интеллекта, который превращает подсказки, тексты или мелодии в полные песни в любом стиле. | Музыка | ||
Soundraw | Ай музыкальный генератор для создателей. | Музыка | ||
Soundry Ai | Генеративные инструменты искусственного интеллекта, включая текстовые и бесконечные образцы. | Музыка |
^ Вернуться к содержанию ^
Источник | Описание | Бумага | Игровой движок | Тип |
---|---|---|---|---|
Diffsinger | Пеяние синтеза голоса с помощью мелкого диффузионного механизма. | arxiv | Поет голос | |
В поисках, на основе Voice-Conversion-Webui | Простая в использовании структуру SVC, основанная на VIT. | Поет голос | ||
So-vits-Svc | Softvc Vits Singing Conversion. | Поет голос | ||
VI-SVS | Используйте VIT и OpenCpop для разработки синтеза по пейсу; Отличается от Visinger. | Поет голос |
^ Вернуться к содержанию ^
Источник | Описание | Бумага | Игровой движок | Тип |
---|---|---|---|---|
Приложение | Конечный инструмент клонирования голоса, тщательно оптимизированный для непревзойденной мощности, модульности и удобного опыта. | Речь | ||
Audyo | Текст в. | Речь | ||
Лаять | Полученная генеративная аудио модель. | Речь | ||
Bert-Vits2 | VITS2 Сэверная цепочка с многоязычным бертом. | Речь | ||
Чаты | Чатттс - это генеративная речевая модель для ежедневного диалога. | Речь | ||
Clapspeech | Изучение просодии из текстового контекста с контрастным языком-аудионым предварительным тренировком. | arxiv | Речь | |
Cosyvoice | Многоязычная большая модель генерации голоса, обеспечивая вывод, обучение и развертывание полного стека. | Речь | ||
Dex-TTS | Диффузионный экспрессивный текст в речь со стилем моделирования по изменчивости времени. | arxiv | Речь | |
Эмотиву | Многопрокатанный и контролируемый оперативным двигателем TTS. | Речь | ||
Fliki | Превратите текст в видео с AI -голосами. | Речь | ||
GLM-4-голос | GLM-4-Voice-это сквозная голосовая модель, запущенная ZHIPU AI. GLM-4-Voice может непосредственно понимать и генерировать китайскую и английскую речь, участвовать в голосовых беседах в реальном времени и изменять атрибуты, такие как эмоции, интонация, скорость речи и диалект на основе инструкций пользователей. | Речь | ||
Glow-TTS | Генеративный поток для текста в речь с помощью монотонного поиска выравнивания. | arxiv | Речь | |
GPT-Sovits | Мощное несколько выстрелов конверсии голоса и Webui текста в речь. | Речь | ||
Лово | Лово-это генератор голоса и текст и текст на речевую платформу для тысяч создателей. | Речь | ||
Махаттс | Большая модель речевой речи с открытым исходным кодом. | Речь | ||
Matcha-TTS | Быстрая архитектура TTS с условным сопоставлением потока. | arxiv | Речь | |
Мелоттс | Высококачественная многоязычная библиотека текста в речь от myshell.ai. Поддержка английского, испанского, французского, китайского, японского и корейского языков. | Речь | ||
Metavoice-1b | ИИ для речевого интеллекта на уровне человека. | Речь | ||
Наракеет | Легко создавать голосования, используя реалистичный текст в речь. | Речь | ||
Мини-амни | Mini-omni: Языковые модели могут слышать, говорить, думая в потоковой передаче. Mini-Amni-это многомодель с открытым исходным кодом, которая может слышать, говорить, думая. Показывая сквозные речевые входные и потоковые выводы звука в реальном времени. | arxiv | Речь | |
Одноразовый клонинг | Один выстрел голос клонирующий базу на Unet-TTS. | Речь | ||
OpenVoice | Мгновенный голос клонирование от Myshell. | Речь | ||
Переполнение | Постановление потоков на нейронных преобразователях для лучших ТТ. | Речь | ||
Реалтиты | Realtimetts-это современная библиотека текста в речь (TTS), предназначенная для приложений в реальном времени. | Речь | ||
Sensevoice | SenseVoice - это модель речевого фонда с множественными возможностями понимания речи, включая автоматическое распознавание речи (ASR), идентификацию разговорного языка (LID), распознавание эмоций речи (SER) и обнаружение аудио -событий (AED). | Речь | ||
Речигпт | Расширение возможностей крупных языковых моделей с внутренними межмодальными разговорными способностями. | arxiv | Речь | |
Речь к тексту-GPT3-UNITY | Это репо, я использую API Whisper и Chatgpt от Openai в Unity. | Единство | Речь | |
Стабильная речь | Стабильность модели текста в речь. | Речь | ||
Стаблы | Модель TTS следующего поколения с использованием сопоставления потока и DIT, вдохновленная стабильной диффузией 3. | Речь | ||
Стилет 2 | На уровне человека на речь через диффузию стиля и тренировки состязания с большими моделями речевого языка. | arxiv | Речь | |
Tortoise.cpp | Tortoise.cpp: GGML Реализация черепахи-TTS. | Речь | ||
Tortoise-TTS | Система TTS с несколькими Voice, обученная акцентом на качество. | Речь | ||
TTS Generation Webui | TTS Generation Webui (Bark, MusicGen, Tortoise, RVC, Vocos, Demucs). | Речь | ||
Vall-e | Языковые модели нейронного кодека-это с нулевым выстрелом текст к синтезаторам речи. | arxiv | Речь | |
Vall-e x | Говорите на иностранных языках с помощью собственного голоса: моделирование языка нейронного кодека кросс-лингального нейронного кодека | arxiv | Речь | |
Вокал | Vocode-это библиотека с открытым исходным кодом для создания голосовых приложений LLM. | Речь | ||
Голосовая коробка | Текстовая многоязычная универсальная речевая генерация в масштабе. | arxiv | Речь | |
Голосовой | Редактирование речи с нулевым выстрелом и текст в речь в дикой природе. | Речь | ||
Шепот | Шепот-это модель распознавания речи общего назначения. | Речь | ||
Whisperspeech | Система с открытым исходным кодом текста в речь, построенная путем инвертирования шепота. | Речь | ||
XE-Speech | Совместная тренировочная структура неавторегрессивного перекрестного эмоционального конверсии текста в речь и голоса. | Речь | ||
XTTS | XTTS-это библиотека для расширенного поколения текста в речь. | Речь | ||
Yourtts | На пути к нулевым выстрелу многопрофильных TTS и нулевой конверсии голоса для всех. | arxiv | Речь | |
ZMM-TTS | Синтез с многоязычным и многоязычным речи, обусловленный дискретными речевыми речевыми представлениями. | arxiv | Речь |
^ Вернуться к содержанию ^
Источник | Описание | Игровой движок | Тип |
---|---|---|---|
Ludo.ai | Помощник по исследованиям и дизайну. | Аналитика |
^ Вернуться к содержанию ^