Descarga de ai game devtools - descarga de código fuente de ai game devtools

¿Herramientas de desarrollo de juegos de IA (AI-GDT)?

Juego de IA

Aquí realizaremos un seguimiento de las últimas herramientas de desarrollo de juegos de IA, incluidas LLM, Agent, Code, Writer, Image, Texture, Shader, 3D Model, Animation, Video, Audio, Music, Singing Voice y Analytics.

Tabla de contenido

Herramienta (LLM de IA)
Juego (Agente)
Código
Escritor
Imagen
Textura
sombreador
modelo 3d
Avatar
Animación
Visual
Video
Audio
Música
voz cantando
Discurso
Analítica

Lista de proyectos

Herramienta (LLM de IA)

Fuente	Descripción	Papel	Motor de juego	Tipo
AgenteGPT	? Reúna, configure e implemente agentes de IA autónomos en su navegador.			Herramienta
Comando AI	Integración de ChatGPT con Unity Editor.		Unidad	Herramienta
AIOS	Sistema operativo del agente LLM.			Herramienta
Científico de IA	El científico de IA: hacia un descubrimiento científico abierto y totalmente automatizado.	arXiv		Herramienta
Asistente CLI	Una cómoda herramienta CLI para utilizar el servicio ChatGPT			Herramienta
GPT automático	Un intento experimental de código abierto para hacer que GPT-4 sea completamente autónomo.			Herramienta
BebéAGI	Este script de Python es un ejemplo de un sistema de gestión de tareas basado en IA.			Herramienta
?? Interfaz de usuario BabyAGI	La interfaz de usuario de BabyAGI está diseñada para facilitar la ejecución y el desarrollo de babyagi en una aplicación web, como ChatGPT.			Herramienta
baichuan-7B	Un modelo de lenguaje de preentrenamiento 7B a gran escala desarrollado por Baichuan.			Herramienta
Baichuan-13B	Un modelo de lenguaje grande 13B desarrollado por Baichuan Intelligent Technology.			Herramienta
Baichuan 2	Una serie de grandes modelos de lenguaje desarrollados por Baichuan Intelligent Technology.			Herramienta
Bisheng	Bisheng es una plataforma abierta de desarrollo de LLM para aplicaciones de inteligencia artificial de próxima generación.			Herramienta
Carácter-LLM	Un agente entrenable para juegos de roles.	arXiv		Herramienta
ChatDev	Agentes Comunicativos para el Desarrollo de Software.	arXiv		Herramienta
ChatGPT-API-unidad	Vincula la API de finalización de chat ChatGPT a C# puro en Unity.		Unidad	Herramienta
ChatGPTParaUnidad	ChatGPT por la unidad.		Unidad	Herramienta
ChatRWKV	ChatRWKV es como ChatGPT pero impulsado por el modelo de lenguaje RWKV (100% RNN) y de código abierto.			Herramienta
ChatYuan	Modelo de lenguaje grande para diálogos en chino e inglés.			Herramienta
China-LLaMA-Alpaca-3	(LLM chinos Llama-3) desarrollados a partir de Meta Llama 3.			Herramienta
Cromo-GPT	Un agente de AutoGPT que controla Chrome en tu escritorio.			Herramienta
CogVLM	CogVLM, un potente modelo básico de lenguaje visual de código abierto.	arXiv		Herramienta
CoreNet	Una biblioteca para entrenar redes neuronales profundas.			Herramienta
Cosmos	Cosmos es una plataforma de desarrollo de modelos mundiales que consta de modelos de base mundial, tokenizadores y procesos de procesamiento de video para acelerar el desarrollo de la IA física en los laboratorios de robótica y AV.			LLM
DBRX	DBRX es un modelo de lenguaje grande entrenado por Databricks.			Herramienta
DCLM	DataComp para modelos de lenguaje.	arXiv		Herramienta
DeepSeek-V3	DeepSeek-V3 es un sólido modelo de lenguaje de mezcla de expertos (MoE) con un total de 671 mil millones de parámetros con 37 mil millones activados para cada token.	arXiv		LLM
DemostraciónGPT	Generador de aplicaciones Auto Gen-AI con el poder de Llama 2			Herramienta
Diseño2Code	Automatización de la ingeniería front-end			Herramienta
Devika	Devika es una ingeniera de software de IA agente.			Herramienta
Devon	Un programador de pares de código abierto.			Herramienta
dora	Generando sitios web potentes, un mensaje a la vez.			Herramienta
fluir	Arrastre y suelte la interfaz de usuario para crear su flujo LLM personalizado utilizando LangchainJS.			Herramienta
Géminis	Gemini está diseñado desde cero para la multimodalidad: razonamiento fluido a través de texto, imágenes, video, audio y código.			Herramienta
Gema	Gemma es una familia de modelos abiertos livianos y de última generación creados a partir de la investigación y la tecnología utilizadas para crear los modelos Google Gemini.			Herramienta
gemma.cpp	Motor de inferencia C++ ligero e independiente para los modelos Gemma de Google.			Herramienta
GLM-4	GLM-4-9B es la versión de código abierto de la última generación de modelos previamente entrenados de la serie GLM-4 lanzada por Zhipu AI.			Herramienta
GPT4Todos	Un chatbot entrenado con una recopilación masiva de datos limpios del asistente, incluidos códigos, historias y diálogos.			Herramienta
GPT-4o	GPT-4o (“o” de “omni”) es un paso hacia una interacción persona-computadora mucho más natural: acepta como entrada cualquier combinación de texto, audio, imagen y video y genera cualquier combinación de texto, audio e imagen. salidas.			Herramienta
GPTscript	Desarrollar aplicaciones LLM en lenguaje natural.			Herramienta
Grok-1	Los pesos y la arquitectura de nuestro modelo de mezcla de expertos de 314 mil millones de parámetros, Grok-1.			Herramienta
AbrazosChat	Poner a disposición de todos los mejores modelos de chat de IA de la comunidad.			Herramienta
Integración de Hugging Face API Unity	Este paquete de Unity proporciona una integración fácil de usar para la API de Hugging Face Inference, lo que permite a los desarrolladores acceder y utilizar modelos de Hugging Face AI dentro de sus proyectos de Unity.		Unidad	Herramienta
Enlace de imagen	ImageBind One incrustando espacio para unirlos a todos.	arXiv		Herramienta
Índice-1.9B	Un LLM multilingüe ligero SOTA.			Herramienta
InteractML-Unidad	InteractML, un marco de scripting visual de aprendizaje automático interactivo para Unity3D.		Unidad	Herramienta
InteractML-Unreal Engine	Llevando el aprendizaje automático a Unreal Engine.		Motor irreal	Herramienta
PasanteLM	InternLM ha abierto un modelo base de 7 mil millones de parámetros, un modelo de chat diseñado para escenarios prácticos y el sistema de capacitación.	arXiv		Herramienta
PasanteLM-XCompositor	InternLM-XComposer2 es un innovador modelo de visión y lenguaje de gran tamaño (VLLM) que se destaca en la composición y comprensión de imágenes y texto de forma libre.	arXiv		Herramienta
Ene	Lleve la IA a su escritorio.			Herramienta
Lamini	Lamini permite que cualquier equipo de ingeniería supere a los LLM de propósito general a través de RLHF y el ajuste de sus propios datos.			Herramienta
LaMini-LM	LaMini-LM es una colección de modelos de lenguaje eficientes y de tamaño pequeño extraídos de ChatGPT y entrenados en un conjunto de datos a gran escala de 2,58 millones de instrucciones.			Herramienta
LangChain	LangChain es un marco para desarrollar aplicaciones basadas en modelos de lenguaje.			Herramienta
LangFlow	⛓️ LangFlow es una interfaz de usuario para LangChain, diseñada con reaccionar-flujo para proporcionar una forma sencilla de experimentar y crear prototipos de flujos.			Herramienta
LaVague	Automatice la automatización con el marco del modelo de acción grande.			Herramienta
Lémur	Modelos básicos abiertos para agentes lingüísticos.			Herramienta
IA leptona	Un marco Pythonic para simplificar la creación de servicios de IA.			Herramienta
Lit-LLaMA	Implementación del modelo de lenguaje LLaMA basado en nanoGPT. Admite atención flash, cuantificación Int8 y GPTQ de 4 bits, ajuste fino de LoRA y LLaMA-Adapter, preentrenamiento.			Herramienta
llama2-webui	Ejecute Llama 2 localmente con la interfaz de usuario de gradio en GPU o CPU desde cualquier lugar (Linux/Windows/Mac).			Herramienta
Llama 3	El sitio oficial de Meta Llama 3 GitHub.			Herramienta
Llama 3.1	Llama es un modelo de lenguaje grande (LLM) abierto y accesible diseñado para que desarrolladores, investigadores y empresas creen, experimenten y escale de manera responsable sus ideas de IA generativa.			Herramienta
LLaSM	Modelo grande de lenguaje y habla.			Herramienta
Motor de respuesta LLM	Cree un motor de respuestas inspirado en la perplejidad utilizando Next.js, Groq, Mixtral, Langchain, OpenAI, Brave y Serper.			Herramienta
llm.c	Formación LLM en C/CUDA simple y sin formato.			Herramienta
LLMUnidad	¡Crea personajes en Unity con LLM!		Unidad	Herramienta
LLocalBúsqueda	LLocalSearch es un motor de búsqueda que se ejecuta completamente localmente y utiliza agentes LLM.			Herramienta
LógicaJuegosSolución	Una herramienta Python para resolver juegos de lógica con IA, Deep Learning y Computer Vision.			Herramienta
escritor largo	LongWriter: Liberando la generación de más de 10,000 palabras a partir de LLM de contexto largo.	arXiv		Herramienta
Modelo de mundo grande (LWM)	Large World Model (LWM) es un modelo autorregresivo multimodal de contexto grande y de propósito general.	arXiv		Herramienta
Lumina-T2X	Lumina-T2X es un marco unificado para generación de texto a cualquier modalidad.	arXiv		Herramienta
MetaGPT	El marco multiagente			Herramienta
MiniCPM-2B	Un LLM final supera a Llama2-13B.			Herramienta
MiniGPT-4	Mejora de la comprensión visión-lenguaje con modelos avanzados de lenguaje grande.	arXiv		Herramienta
MiniGPT-5	Generación de visión y lenguaje entrelazados mediante vocales generativos.	arXiv		Herramienta
Mixtral 8x7B	Una mezcla escasa de expertos de alta calidad.	arXiv		Herramienta
Mistral 7B	El mejor modelo 7B hasta la fecha, Apache 2.0.			Herramienta
Mistral grande	Mistral Large es un nuevo modelo de generación de texto de última generación. Alcanza capacidades de razonamiento de primer nivel.			Herramienta
MLC LLM	Permita que todos desarrollen, optimicen e implementen modelos de IA de forma nativa en los dispositivos de todos.			Herramienta
MobiLlama	Hacia un GPT preciso, ligero y totalmente transparente.	arXiv		Herramienta
Ministerio de Educación-LLaVA	Mezcla de Expertos para Grandes Modelos Visión-Lenguaje.	arXiv		Herramienta
moshi	Moshi es una IA conversacional experimental.			Herramienta
moshi	Moshi: un modelo básico de voz y texto para diálogos en tiempo real.			Herramienta
MUSGO	Un modelo de lenguaje conversacional mejorado con una herramienta de código abierto de la Universidad de Fudan.			Herramienta
mPLUG-Búho?	La modularización potencia los grandes modelos de lenguaje con multimodalidad.	arXiv		Herramienta
Nemotrón-4	Un gran modelo de lenguaje multilingüe de 15 mil millones de parámetros entrenado en 8 billones de tokens de texto.	arXiv		Herramienta
SIGUIENTE-GPT	Modelo de lenguaje grande multimodal cualquiera a cualquier.			Herramienta
OLMo	Modelo de lenguaje abierto	arXiv		Herramienta
OmniLMM	Grandes modelos multimodales para un rendimiento sólido y una implementación eficiente.			Herramienta
UnoLLM	Un marco para alinear todas las modalidades con el lenguaje.	arXiv		Herramienta
Asistente abierto	OpenAssistant es un asistente basado en chat que comprende tareas, puede interactuar con sistemas de terceros y recuperar información dinámicamente para hacerlo.			Herramienta
AbiertoDevin	Un ingeniero de software de IA autónomo.			Herramienta
Orión-14B	Orion-14B es una familia de modelos que incluye un LLM de base 14B y una serie de modelos.	arXiv		Herramienta
Panda	Modelo de lenguaje grande de código abierto chino en el extranjero, basado en Llama-7B, -13B, -33B, -65B para una capacitación previa continua en el campo chino.			Herramienta
perplejidad	Un motor de búsqueda impulsado por IA.			Herramienta
Pi	Chatbot con IA diseñado para asistencia personal y apoyo emocional.			Herramienta
Qwen1.5	Qwen1.5 es la versión mejorada de Qwen.			Herramienta
Qwen2	Qwen2 es la gran serie de modelos de lenguaje desarrollada por el equipo de Qwen, Alibaba Cloud.			Herramienta
Qwen-7B	El repositorio oficial del chat Qwen-7B (通义千问-7B) y el modelo de lenguaje grande previamente entrenado propuesto por Alibaba Cloud.			Herramienta
Agente de repositorio	RepoAgent es un proyecto de código abierto impulsado por modelos de lenguaje grandes (LLM) que tiene como objetivo proporcionar una forma inteligente de documentar proyectos.	arXiv		Herramienta
Motor de inteligencia artificial de cordura	Motor Sanity AI para la herramienta de desarrollo de juegos Unity.		Unidad	Herramienta
BuscarGPT	? Conectando ChatGPT con Internet			Herramienta
CompartirGPT4V	Mejora de modelos multimodales grandes con mejores subtítulos.			Herramienta
Skywork	Los modelos de la serie Skywork están previamente entrenados en 3,2 TB de datos de código y multilingües de alta calidad (principalmente chino e inglés).			Herramienta
EstableLM	Modelos de lenguaje de IA de estabilidad.	arXiv		Herramienta
Alpaca Stanford	Un modelo LLaMA que sigue instrucciones.			Herramienta
UI web de generación de texto	Una interfaz de usuario web de gradio para ejecutar modelos de lenguajes grandes como LLaMA, llama.cpp, GPT-J, OPT y GALACTICA.			Herramienta
TinyChatEngine	Biblioteca de inferencia LLM en el dispositivo.			Herramienta
Banco de herramientas	Una plataforma abierta para capacitar, servir y evaluar modelos de lenguaje grandes para el aprendizaje de herramientas.			Herramienta
Chat de unidadGPT	Experimentos de Unity ChatGPT.		Unidad	Herramienta
Integración de Unity OpenAI-API	Integre el modelo de lenguaje openai GPT-3 y la API ChatGPT en un proyecto de Unity.		Unidad	Herramienta
Unreal Engine 5 Llama LoRA	Un proyecto de prueba de concepto que muestra el potencial de utilizar LLM pequeños y capacitables localmente para crear herramientas de documentación de próxima generación.		Motor irreal	Herramienta
irrealGPT	Una colección de widgets de la utilidad Unreal Engine 5 Editor con tecnología GPT3/4.		Motor irreal	Herramienta
Video-LLaVA	Aprendizaje de la representación visual unida mediante alineación antes de la proyección.	arXiv		Herramienta
WebGPT	Ejecute el modelo GPT en el navegador con WebGPU.			Herramienta
Web3-GPT	Implemente contratos inteligentes con IA			Herramienta
PalabraGPT	? Lleva el poder de ChatGPT a Microsoft Word			Herramienta
XAgente	Un agente autónomo de LLM para la resolución de tareas complejas.			Herramienta
yi	Una serie de grandes modelos de lenguaje entrenados desde cero por desarrolladores.			Herramienta
01 Proyecto	La computadora modelo de lenguaje de código abierto.			Herramienta

^ Volver al contenido ^

Juego (Agente)

Fuente	Descripción	Papel	Tipo
Banco de agentes	Un punto de referencia integral para evaluar los LLM como agentes.	arXiv	Agente
Chat de grupo de agentes	Un simulacro de chat grupal interactivo para provocar mejor el comportamiento emergente colectivo.	arXiv	Agente
Agente K	Un AGI autoagentico, autoevolucionable y modular.		Agente
AgenteScope	Comience a crear aplicaciones multiagente con tecnología LLM de una manera más sencilla.	arXiv	Agente
AgenteSims	Un entorno limitado de código abierto para la evaluación de modelos de lenguaje grandes.		Agente
Ciudad de IA	AI Town es una ciudad virtual donde los personajes de AI viven, charlan y socializan.		Agente
anime.gf	Alternativa local y de código abierto a CharacterAI.		Juego
astrocada	Crea juegos con IA		Juego
Agentes atómicos	El marco de Atomic Agents está diseñado para ser modular, extensible y fácil de usar.		Agente
AutoAgentes	Un marco para la generación automática de agentes.		Agente
Autogeneración	Habilite aplicaciones de modelos de lenguaje grandes de próxima generación.	arXiv	Agente
conductual	Behaviac es un marco para el desarrollo de la IA del juego.		Estructura
Biomas	Biomes es un MMORPG sandbox de código abierto creado para la web que utiliza tecnologías web como Next.js, Typecript, React y WebAssembly.		Juego
Amortiguador de pensamientos	Razonamiento aumentado por pensamiento con modelos de lenguaje grandes.	arXiv	Agente
Agente Byzer	Marco de agente sencillo, rápido y distribuido para todos.		Agente
ciudad del gato	Simulación con gatos impulsada por AC(h)atGPT.		Agente
ciudad del gato	Simulación con gatos impulsada por AC(h)atGPT.		Agente
PersonajeGLM	Personalización de caracteres de IA conversacionales chinos con modelos de lenguaje grandes.	arXiv	Agente
ChatDev	Agentes Comunicativos para el Desarrollo de Software.	arXiv	Agente
Agente Cog	CogAgent es un modelo de lenguaje visual de código abierto mejorado en base a CogVLM.	arXiv	Agente
Cuna	Hacia el control informático general.		Agente
tripulaciónAI	Marco para orquestar agentes de IA autónomos que juegan roles.		Agente
Dificar	Dify es una plataforma de creación de aplicaciones LLM de código abierto.		Agente
Proyecto de vida digital	Personajes 3D autónomos con Inteligencia Social.	arXiv	Agente
todo-ai	¿Su asistente de chatbot local, totalmente competente y con tecnología de inteligencia artificial?		Agente
tela	fabric es un marco de código abierto para mejorar a los humanos utilizando IA.		Agente
GPT rápido	FastGPT es una plataforma basada en el conocimiento construida sobre el LLM.		Agente
rápidoRAG	Marco de generación y aumento de recuperación eficiente.		Agente
JuegoAISDK	Marco de automatización de IA de juegos basado en imágenes.		Estructura
GameNGen	Los modelos de difusión son motores de juegos en tiempo real.	arXiv	Juego
GameGen-O	GameGen-O: Generación de videojuegos de mundo abierto.		Juego
GenAgente	GenAgent: cree sistemas de inteligencia artificial colaborativos con generación de flujo de trabajo automatizado: estudios de casos sobre ComfyUI.	arXiv	Agente
Agentes generativos	Simulacros interactivos del comportamiento humano.	arXiv	Agente
Génesis	Génesis: un motor de física universal y generativo para la robótica y más allá.		Juego
Genio	Entornos Interactivos Generativos.		Juego
gigax	NPC en tiempo de ejecución y con tecnología LLM.		Juego
hiporag	Memoria a largo plazo inspirada neurobiológicamente para modelos de lenguaje grandes.	arXiv	Agente
NPC interactivos impulsados por LLM	Interactive LLM Powered NPCs es un proyecto de código abierto que transforma completamente tu interacción con personajes no jugadores (NPC) en cualquier juego.		Juego
IoA	Un marco de código abierto para agentes colaborativos de IA, que permite a agentes diversos y distribuidos formar equipos y abordar tareas complejas a través de una conectividad similar a Internet.		Agente
KwaiAgentes	Un sistema de agente de búsqueda de información generalizado con modelos de lenguaje grandes (LLM).	arXiv	Agente
LangChain	Obtenga su solicitud de LLM desde el prototipo hasta la producción.		Agente
Langflow	Langflow es una interfaz de usuario para LangChain, diseñada con reaccionar-flujo para proporcionar una forma sencilla de experimentar y crear prototipos de flujos.		Agente
Estudio LangGraph	LangGraph Studio ofrece una nueva forma de desarrollar aplicaciones LLM al proporcionar un IDE de agente especializado que permite la visualización, interacción y depuración de aplicaciones agentes complejas.		Agente
LARP	Juego de rol de agente de lenguaje para juegos de mundo abierto.	arXiv	Agente
Sistema Agente Llama	Componentes agentes de las API de Llama Stack.		Agente
LlamaIndex	LlamaIndex es un marco de datos para su aplicación LLM.		Agente
Búsqueda mental	? Un marco multiagente de motor de búsqueda web basado en LLM (como Perplexity.ai Pro y SearchGPT).		Agente
Mezcla de Agentes (MoA)	La combinación de agentes mejora las capacidades de los modelos de lenguaje grandes.	arXiv	Agente
MMRol	MMRole: un marco integral para desarrollar y evaluar agentes de juego de roles multimodales.	arXiv	Agente
Moonlander.ai	Comience a crear juegos 3D sin codificación utilizando IA generativa.		Estructura
Difusión de taza	MuG Diffusion es una IA de gráficos para juegos de ritmo basada en Stable Diffusion (uno de los modelos AIGC más potentes) con una gran modificación para incorporar ondas de audio.		Juego
Oasis	Oasis es un modelo de mundo interactivo desarrollado por Decart y Etched. Basado en transformadores de difusión, Oasis toma la entrada del teclado del usuario y genera el juego de manera autorregresiva.		Juego
OmAgente	Un marco de agente multimodal para resolver tareas complejas.		Agente
Agentes abiertos	Una plataforma abierta para agentes lingüísticos en la naturaleza.		Agente
Opus	Una aplicación de inteligencia artificial que convierte texto en un videojuego.		Juego
pipagato	Marco de código abierto para voz e IA conversacional multimodal.		Agente
Agente Qwen	Qwen-Agent es un marco para desarrollar aplicaciones LLM basadas en el seguimiento de instrucciones, el uso de herramientas, la planificación y las capacidades de memoria de Qwen.		Agente
ragas	Ragas es un marco que le ayuda a evaluar sus tuberías de generación aumentada de recuperación (RAG).		Agente
RPBench-Auto	Un canal automatizado para evaluar LLM para juegos de roles.		Juego
SIMA	Un agente de IA generalista para entornos virtuales 3D.		Agente
StoryGames.ai	IA para que los soñadores creen juegos.		Juego
agente SWE	Las interfaces de la computadora del agente permiten modelos de lenguaje de ingeniería de software.	arXiv	Agente
Generación de tareas	Un marco agente basado en tareas que se basa en resultados StrictJSON de agentes LLM.		Agente
Agente DIEZ	TEN Agent es el primer agente multimodal en tiempo real del mundo integrado con OpenAI Realtime API, RTC y presenta capacidades de verificación meteorológica, búsqueda web, visión y RAG.		Agente
Agente de traducción	Traducción agente mediante flujo de trabajo de reflexión.		Agente
Gorjeo	Twitter Personality es una aplicación web que analiza su cuenta de Twitter para crear un perfil de personalidad personalizado utilizando Wordware AI Agent.		Agente
Ilimitado	Unbounded: un juego generativo infinito de simulación de vida de personajes.	arXiv	Juego
Video2Juego	Entorno en tiempo real, interactivo, realista y compatible con navegador desde un solo vídeo.	arXiv	Juego
V-IRL	Conectando la inteligencia virtual a la vida real.	arXiv	Agente
Agente de diseño web	Un agente utilizado para el diseño web.		Agente
XAgente	Un agente autónomo de LLM para la resolución de tareas complejas.		Agente

^ Volver al contenido ^

Código

Fuente	Descripción	Papel	Motor de juego	Tipo
Traductor de códigos AI	Utilice IA para traducir código de un idioma a otro.			Código
aiXcoder-7B	Modelo de lenguaje grande de código aiXcoder-7B.			Código
bloop	bloop es un motor de búsqueda de código rápido escrito en Rust.			Código
Capítulo	Intérprete de código ChatGPT en Jupyter Notebooks.			Código
CódigoGeeX	Un modelo abierto de generación de código multilingüe.	arXiv		Código
CódigoGeeX2	Un modelo de generación de código multilingüe más potente.			Código
CódigoGeeX4	CodeGeeX4: modelo abierto de generación de código multilingüe.			Código
CódigoGen	CodeGen es un modelo de código abierto para síntesis de programas. Entrenado en TPU-v4. Competitivo con OpenAI Codex.	arXiv		Código
CódigoGen2	Modelos CodeGen2 para síntesis de programas.	arXiv		Código
Código Llama	Code Llama es un gran modelo de lenguaje para código basado en Llama 2.			Código
CódigoTF	Biblioteca de transformadores integral para LLM de código de última generación.			Código
Código T5	LLM de código abierto para comprensión y generación de código.			Código
Cursor	Escriba, edite y charle sobre su código con GPT-4 en un nuevo tipo de editor.			Código
Codificador DeepSeek	DeepSeek Coder: deje que el código se escriba solo.	arXiv		Código
Códice OpenAI	OpenAI Codex es un descendiente de GPT-3.			Código
PandasAI	Pandas AI es una biblioteca de Python que integra capacidades de inteligencia artificial generativa en Pandas, haciendo que los marcos de datos sean conversacionales.			Código
RobloxScripterAI	RobloxScripterAI es una herramienta de generación de código impulsada por IA para Roblox.		Roblox	Código
Scikit-LLM	Integre perfectamente potentes modelos de lenguaje como ChatGPT en scikit-learn para mejorar las tareas de análisis de texto.			Código
sotana	El asistente de desarrollo de software de código abierto.	arXiv		Código
Código estable 3B	Codificación en el borde.			Código
codificador estrella	? StarCoder es un modelo de lenguaje (LM) entrenado en código fuente y texto en lenguaje natural.	arXiv		Código
Codificador estrella 2	StarCoder2 es una familia de modelos de generación de código (3B, 7B y 15B), entrenados en más de 600 lenguajes de programación de The Stack v2 y algunos textos en lenguaje natural como Wikipedia, Arxiv y GitHub.	arXiv		Código
UnityGen IA	UnityGen AI es un complemento de generación de código impulsado por IA para Unity.		Unidad	Código
Vacío	Void es una alternativa de cursor de código abierto. Escriba código con las mejores herramientas de IA, mantenga el control total sobre sus datos y acceda a potentes funciones de IA.			Código

^ Volver al contenido ^

Escritor

Fuente	Descripción	Tipo
Escritor de IA	La IA escribe novelas, genera artículos web de fantasía y romance, etc. Modelo generativo chino previamente entrenado.	Escritor
Cuaderno.ai	Notebook.ai es un conjunto de herramientas para que escritores, diseñadores de juegos y jugadores de rol creen universos magníficos y todo lo que hay dentro de ellos.	Escritor
Novedoso	Editor WYSIWYG estilo Notion con autocompletado impulsado por IA.	Escritor
Novela AI	Impulsado por la IA, construye sin dolor historias únicas, cuentos emocionantes, romances seductores o simplemente tontea.	Escritor

^ Volver al contenido ^

Imagen

Fuente	Descripción	Papel	Motor de juego	Tipo
Cualquier puerta	Personalización de imágenes a nivel de objeto de disparo cero.	arXiv		Imagen
Cualquier texto	Generación y edición de texto visual multilingüe.	arXiv		Imagen
Autoestudio	Elaboración de temas consistentes en la generación de imágenes interactivas de múltiples turnos.	arXiv		Imagen
Blender-ControlNet	Usando ControlNet directamente en Blender.		Licuadora	Imagen
brivl	Modelo puente entre visión y lenguaje.	arXiv		Imagen
GatoVTON	CatVTON: La concatenación es todo lo que necesita para una prueba virtual con modelos de difusión.	arXiv		Imagen
CLIPasso	Un método para convertir una imagen de un objeto en un boceto, lo que permite distintos niveles de abstracción.	arXiv		Imagen
ClipDrop	Crea imágenes impresionantes en segundos.			Imagen
Cómoda interfaz de usuario	Una GUI de difusión estable, potente y modular con una interfaz de gráfico/nodos.			Imagen
ConceptoLab	Generación creativa utilizando restricciones previas de difusión.	arXiv		Imagen
ControlNet	ControlNet es una estructura de red neuronal para controlar modelos de difusión agregando condiciones adicionales.	arXiv		Imagen
CSGO	CSGO: composición de estilo de contenido en generación de texto a imagen.	arXiv		Imagen
DALL·E 2	DALL·E 2 es un sistema de inteligencia artificial que puede crear imágenes y arte realistas a partir de una descripción en lenguaje natural.			Imagen
Estudio Dashtoon	Dashtoon Studio es una plataforma de creación de cómics impulsada por IA.			Cómic
IA profunda	DeepAI ofrece un conjunto de herramientas que utilizan IA para mejorar su creatividad.			Imagen
DeepFloyd SI	IF por DeepFloyd Lab en StabilityAI.			Imagen
Profundidad Cualquier cosa V2	Profundidad Cualquier cosa V2	arXiv		Imagen
Biblioteca de mapas de profundidad y poser	Biblioteca de mapas de profundidad para usar con la extensión Control Net para Automatic1111/stable-diffusion-webui.			Imagen
Difuso para elegir	Enriquecimiento de la pintura condicionada de imágenes en modelos de difusión latente para prueba virtual.	arXiv		Imagen
Difusión Discoteca	Una fusión frankensteiniana de cuadernos, modelos y técnicas para la generación de Arte y Animaciones con IA.			Imagen
ArrastrarGAN	Manipulación interactiva basada en puntos en la variedad de imágenes generativas.	arXiv		Imagen
dibujar cosas	Generación de imágenes asistida por IA en Your Pocket.			Imagen
DWPose	Estimación efectiva de la postura de todo el cuerpo con destilación en dos etapas.	arXiv		Imagen
Foto fácil	Tu generador de fotos inteligente con IA.			Imagen
Flujo	Este repositorio contiene un código de inferencia mínimo para ejecutar texto a imagen e imagen a imagen con nuestros transformadores de flujo rectificado latente Flux.			Imagen
Sigue tu clic	Animación de imágenes regionales de dominio abierto mediante indicaciones breves.	arXiv		Imagen
Fooocus	Concéntrese en incitar y generar.			Imagen
GIFfusión	Cree GIF y vídeos mediante difusión estable.			Imagen
Segmento conectado a tierra cualquier cosa	Detecte, segmente y genere automáticamente cualquier cosa con entradas de imagen, texto y audio.	arXiv		Imagen
HivisionIDFotos	HivisionIDPhotos: una herramienta ligera y eficiente para fotografías de identificación con IA.			Imagen
hua	Hua es un editor de imágenes de IA con difusión estable (y más).			Imagen
Hunyuan-DiT	Un potente transformador de difusión de resolución múltiple con un conocimiento chino detallado.	arXiv		Imagen
Luz IC	IC-Light es un proyecto para manipular la iluminación de imágenes.			Imagen
Ideograma	Ayudar a las personas a ser más creativas.			Imagen
Imagen	Imagen es un sistema de inteligencia artificial que crea imágenes fotorrealistas a partir de texto ingresado.			Imagen
img2img-turbo	Imagen a imagen en un solo paso con SD-Turbo.			Imagen
Img2Prompt	Reciba indicaciones de imágenes generadas por difusión estable.			Imagen
Infinidad	Infinity: modelado autorregresivo bit a escala para síntesis de imágenes de alta resolución.	arXiv		Imagen
ID instantánea	Generación de preservación de identidad de disparo cero en segundos.	arXiv		Imagen
PasanteLM-XComposer2	InternLM-XComposer2 es un innovador modelo de visión y lenguaje de gran tamaño (VLLM) que se destaca en la composición y comprensión de imágenes y texto de forma libre.	arXiv		Imagen
COALA	La autoatención importa en la destilación del conocimiento de modelos de difusión latente para una síntesis de imágenes rápida y eficiente en la memoria.			Imagen
colores	Kolors: entrenamiento eficaz del modelo de difusión para la síntesis fotorrealista de texto a imagen.			Imagen
KREA	Genere imágenes y vídeos con una encantadora herramienta de diseño impulsada por IA.			Imagen
Puente LaVi	Uniendo diferentes modelos de lenguaje y modelos de visión generativa para la generación de texto a imagen.	arXiv		Imagen
CapaDifusión	Difusión de capas de imágenes transparentes mediante transparencia latente.	arXiv		Imagen
léxica	Una Difusión Estable solicita el motor de búsqueda.			Imagen
LlamaGen	El modelo autorregresivo supera a la difusión: llama para la generación de imágenes escalables.	arXiv		Imagen
Lumina-mGPT	Lumina-mGPT: Ilumine la generación flexible de texto a imagen fotorrealista con preentrenamiento generativo multimodal.	arXiv		Imagen
metadisparar	MetaShoot es un gemelo digital de un estudio fotográfico, desarrollado como un complemento para Unreal Engine que brinda a cualquier creador la capacidad de producir renderizados altamente realistas de la manera más fácil y rápida.		Motor irreal	Imagen
A mitad del viaje	Midjourney es un laboratorio de investigación independiente que explora nuevos medios de pensamiento y amplía los poderes imaginativos de la especie humana.			Imagen
MIGC	MIGC: Controlador de generación de instancias múltiples para síntesis de texto a imagen.	arXiv		Imagen
MimicBrush	Edición de imágenes Zero-shot con imitación de referencia.	arXiv		Imagen
OmniGen	OmniGen: Generación de imágenes unificadas.	arXiv		Imagen
omost	Omost es un proyecto para convertir la capacidad de codificación de LLM en capacidad de generación de imágenes (o más exactamente, composición de imágenes).			Imagen
Editor abierto	Openpose Editor para webui de difusión estable de AUTOMATIC1111.			Imagen
Atuendo a cualquiera	Prueba virtual de altísima calidad para cualquier ropa y cualquier persona.			Imagen
PinturasDeshacer	PaintsUndo: un modelo base de comportamientos de dibujo en pinturas digitales.			Imagen
creador de fotos	Personalización de fotografías humanas realistas mediante la incrustación de ID apilados.	arXiv		Imagen
sala de fotos	Generador de fondo de IA.			Imagen
Plask	Generación de imágenes de IA en la nube.			Imagen
Prompt.Art	El centro de generadores.			Imagen
PULID	Personalización de Pure y Lightning ID mediante alineación contrastiva.	arXiv		Imagen
Texto enriquecido a imagen	Generación expresiva de texto a imagen con texto enriquecido.	arXiv		Imagen
RPG-DifusiónMaster	Dominar la difusión de texto a imagen: recaptación, planificación y generación con LLM multimodales (PRG).			Imagen
Historia de SEMILLAS	SEED-Story: Generación multimodal de historias largas con un modelo de lenguaje grande.	arXiv		Imagen
Segmentar cualquier cosa	Segment Anything Model (SAM): un nuevo modelo de IA de Meta AI que puede "recortar" cualquier objeto, en cualquier imagen, con un solo clic.	arXiv		Imagen
Segmentar cualquier cosa modelo 2 (SAM 2)	SAM 2: segmenta cualquier cosa en imágenes y vídeos.	arXiv		Imagen
sd-webui-controlnet	Extensión WebUI para ControlNet.			Imagen
SDXL-Rayo	Destilación por difusión adversa progresiva.	arXiv		Imagen
SDXS	Modelos de difusión latente de un paso en tiempo real con condiciones de imagen.			Imagen
Estable.art	Complemento de Photoshop para Stable Diffusion con Automatic1111 como backend (localmente o con Google Colab).			Imagen
Cascada estable	Stable Cascade consta de tres modelos: Stage A, Stage B y Stage C, que representan una cascada para generar imágenes, de ahí el nombre "Stable Cascade".			Imagen
Difusión estable	Un modelo latente de difusión de texto a imagen.			Imagen
difusión-estable.cpp	Difusión estable en C/C++ puro.			Imagen
Interfaz de usuario web de difusión estable	Una interfaz de navegador basada en la biblioteca Gradio para Difusión Estable.			Imagen
Interfaz de usuario web de difusión estable	UI basada en web para difusión estable.			Imagen
Difusión estable WebUI chino	Versión china de stable-diffusion-webui.			Imagen
Difusión estable XL	Genera imágenes a partir de texto.	arXiv		Imagen
Difusión estable XL Turbo	Generación de texto a imagen en tiempo real.			Imagen
Difusión estable 3.5	La versión abierta de Stable Diffusion 3.5 incluye múltiples variantes de modelo, incluidos Stable Diffusion 3.5 Large y Stable Diffusion 3.5 Large Turbo.			Imagen
Garabato estable	Stable Doodle es una herramienta de boceto a imagen que convierte un dibujo simple en una imagen dinámica.			Imagen
Estudio estable	StableStudio de Stability AI			Imagen
Creador de historias	StoryMaker: hacia personajes holísticos y consistentes en la generación de texto a imagen.	arXiv		Imagen
CorrienteDifusión	Una solución a nivel de canalización para la generación interactiva en tiempo real.			Imagen
Caída de estilo	Generación de texto a imagen en cualquier estilo.	arXiv		Imagen
SincronizaciónDreamer	Generación de imágenes coherentes con múltiples vistas a partir de una imagen de vista única.	arXiv		Imagen
UltraEditar	UltraEdit: edición de imágenes detallada a escala basada en instrucciones.	arXiv		Imagen
Ultrapíxel	UltraPixel: avance de la síntesis de imágenes de resolución ultraalta a nuevos picos.	arXiv		Imagen
Difusión estable de Unity ML	Difusión estable de Core ML en Unity.		Unidad	Imagen
Visiones vispunk	Plataforma de generación de texto a imagen.			Imagen

^ Volver al contenido ^

Textura

Fuente	Descripción	Papel	Motor de juego	Tipo
CRM	Imagen única a malla texturizada 3D con modelo de reconstrucción convolucional.	arXiv		Textura
Alfombra de ensueño	Generación de materiales PBR de alta calidad con modelos de difusión sensibles a la geometría y la luz.	arXiv		Textura
Espacio de ensueño	Soñando con el espacio de su habitación con propagación de texturas panorámicas basada en texto.			Textura
Texturas de ensueño	Difusión estable integrada en Blender. Crea texturas, arte conceptual, recursos de fondo y más con un simple mensaje de texto.		Licuadora	Textura
Instruir a los humanos	Edición de texturas humanas animadas en 3D con instrucciones.	arXiv		Textura
InteX	Síntesis interactiva de texto a textura a través de Inpainting unificado con reconocimiento de profundidad.	arXiv		Textura
LLaMA-Malla	LLaMA-Mesh: Unificando la generación de mallas 3D con modelos de lenguaje.	arXiv		Malla
MaterialSeg3D	MaterialSeg3D: segmentación de materiales densos a partir de antecedentes 2D para activos 3D.	arXiv		Textura
MallaCualquier cosa	MaterialSeg3D: segmentación de materiales densos a partir de antecedentes 2D para activos 3D.	arXiv		Malla
Neuralangelo	Reconstrucción de la superficie neuronal de alta fidelidad.	arXiv		Textura
pintarlo	Síntesis de texto a textura mediante optimización de mapas de texturas convolucionales profundas y renderizado basado en física.			Textura
policam	Crea tus propias texturas 3D con solo escribir.			Textura
TexFusion	Sintetizando texturas 3D con modelos de difusión de imágenes guiadas por texto.	arXiv		Textura
Texto2Tex	Síntesis de texturas basada en texto mediante modelos de difusión.	arXiv		Textura
Laboratorio de texturas	Texturas generadas por IA. Puedes generar el tuyo propio con un mensaje de texto.			Textura
Con poli	Crea texturas con Poly. Genere materiales 3D con IA en un editor en línea gratuito o busque en nuestra creciente biblioteca comunitaria.			Textura
malla X	X-Mesh: hacia una estilización 3D basada en texto rápida y precisa mediante guía textual dinámica.	arXiv		Textura

^ Volver al contenido ^

sombreador

Fuente	Descripción	Papel	Motor de juego	Tipo
Sombreador de IA	Generador de sombreadores impulsado por ChatGPT para Unity.		Unidad	sombreador

^ Volver al contenido ^

modelo 3d

Fuente	Descripción	Papel	Motor de juego	Tipo
Animar3D	Animate3D: animación de cualquier modelo 3D con difusión de vídeo multivista.	arXiv		3D
Cualquier cosa-3D	Segmentar-cualquier cosa + 3D. Elevemos cualquier cosa a 3D.	arXiv		Modelo
Cualquier2punto	Any2Point: potenciando modelos grandes de cualquier modalidad para una comprensión 3D eficiente.	arXiv		3D
licuadoraGPT	Utilice comandos en inglés para controlar Blender con GPT-4 de OpenAI.		Licuadora	Modelo
Blender-GPT	Un asistente de Blender todo en uno con tecnología GPT3/4 + integración Whisper.		Licuadora	Modelo
Laboratorios de bloqueo	La alquimia digital es real con Skybox Lab, la solución definitiva impulsada por IA para generar increíbles experiencias de skybox de 360° a partir de indicaciones de texto.			Modelo
CF-3DGS	Salpicadura gaussiana 3D sin COLMAP.	arXiv		3D
Generación de personajes	CharacterGen: generación eficiente de personajes en 3D a partir de imágenes individuales con canonicalización de poses de múltiples vistas.	arXiv		3D
chatGPT-maya	Herramienta Maya sencilla que utiliza IA abierta para realizar tareas básicas basadas en instrucciones descriptivas.		maya	Modelo
ciudaddreamer	Modelo generativo composicional de ciudades 3D ilimitadas.	arXiv		3D
CSM	Genera mundos 3D a partir de imágenes y vídeos.			3D
Estrellarse	Tu copiloto para la construcción de mundos en Unreal Engine.		Motor irreal	3D
catalizador de sueños	DreamCatalyst: edición 3D rápida y de alta calidad mediante el control de la editabilidad y la preservación de la identidad.	arXiv		3D
SueñoGaussian4D	Salpicadura gaussiana generativa 4D.	arXiv		4D
DUSt3R	Visión geométrica 3D simplificada.	arXiv		3D
Edificar 3D	Edify 3D: generación de activos 3D escalables de alta calidad.	arXiv		3D
GALA3D	GALA3D: Hacia la generación de escenas complejas de texto a 3D mediante salpicaduras gaussianas generativas guiadas por diseño.	arXiv		3D
Ctrl Gauss	GaussCtrl: Edición de salpicaduras gaussianas 3D basada en texto coherente y multivista.	arXiv		3D
Cubo gaussiano	Una representación de radiación estructurada y explícita para el modelado generativo 3D.	arXiv		3D
Soñador gaussiano	Generación rápida de texto a salpicaduras gaussianas 3D con prioridades de nube de puntos.	arXiv		3D
GenieLabs	Potencia tu juego con AI-UGC.			3D
Hola FA	Texto a 3D de alta fidelidad con guía de difusión avanzada.			Modelo
HoloDreamer	HoloDreamer: Generación holística de mundos panorámicos en 3D a partir de descripciones de texto.	arXiv		3D
Hunyuan3D-1.0	Hunyuan3D-1.0: un marco unificado para la generación de texto a 3D e imagen a 3D.	arXiv		3D
Infinito	Mundos fotorrealistas infinitos mediante generación procedimental.	arXiv		3D
Instruir-NeRF2NeRF	Edición de escenas 3D con instrucciones.	arXiv		Modelo
Interactivo3D	Crea lo que quieras mediante la generación 3D interactiva.	arXiv		3D
Isotrópico3D	Generación de imagen a 3D basada en una única incrustación de CLIP.			3D
LATTE3D	Síntesis 3D mejorada de texto amortizado a gran escala.	arXiv		3D
LEÓN	Modelos de difusión de puntos latentes para generación de formas 3D.	arXiv		Modelo
Luma IA	Capture en 3D realista. Fotorrealismo, reflejos y detalles inigualables. ¡El futuro de VFX es ahora, para todos!			Modelo
lumina AI	Creatividad impulsada por la IA.			3D
Hazlo-3D	Creación 3D de alta fidelidad a partir de una única imagen con difusión previa.	arXiv		Modelo
mallado	Crea impresionantes recursos de juegos en 3D con IA.			3D
movimiento	Creador de animaciones mágicas con IA en 3D.			3D
MVDream	Difusión multivista para generación 3D.	arXiv		3D
NeRF instantáneo de NVIDIA	Primitivas de gráficos neuronales instantáneos: NeRF ultrarrápido y más.			Modelo
Uno-2-3-45	Cualquier imagen única a malla 3D en 45 segundos sin optimización por forma.	arXiv		Modelo
pintura3d	Pinte cualquier cosa en 3D con modelos de difusión de texturas sin iluminación.	arXiv		3D
PÁNICO-3D	Reconstrucción 3D estilizada de vista única a partir de retratos de personajes de anime.	arXiv		Modelo
Punto·E	Difusión de nubes de puntos para síntesis de modelos 3D.			Modelo
Soñador prolífico	Generación diversa y de alta fidelidad de texto a 3D con destilación de partituras variacionales.	arXiv		Modelo
SF3D	SF3D: Reconstrucción de malla 3D rápida y estable con desenvolvimiento UV y desenredo de iluminación.	arXiv		3D
Forma	Genera objetos 3D condicionados a texto o imágenes.	arXiv		Modelo
Sloyd	El modelado 3D nunca ha sido tan fácil.			Modelo
IA estriada	El poder de la IA está llegando a la tercera dimensión. Genere objetos, animaciones y texturas mediante indicaciones.			Modelo
Fusión de sueños estable	Una implementación de pytorch del modelo de texto a 3D Dreamfusion, impulsado por el modelo de texto a 2D de Stable Diffusion.			Modelo
SV3D	Nueva síntesis de vistas múltiples y generación 3D a partir de una sola imagen mediante difusión de video latente.	arXiv		3D
Tafí	Texto AI a motor de personajes 3D.			Modelo
3D-GPT	Modelado 3D procedimental con modelos de lenguaje grandes.	arXiv		3D
3D-LLM	Inyectando el mundo 3D en modelos de lenguaje grandes.	arXiv		3D
3Dpresso	Extraiga un modelo 3D de un objeto, capturado en un vídeo.			Modelo
3DTopia	Generación de texto a 3D en 5 minutos.	arXiv		3D
3DTopia-XL	3DTopia-XL: ampliación de la generación de activos 3D de alta calidad mediante difusión primitiva.	arXiv		3D
tresestudio	Un marco unificado para la generación de contenido 3D.			Modelo
TripoSR	Un modelo de código abierto de última generación para una rápida reconstrucción 3D anticipada a partir de una única imagen.	arXiv		Modelo
Único3D	Generación de mallas 3D eficiente y de alta calidad a partir de una única imagen.	arXiv		3D
UnidadGaussianoSalpicaduras	Visualización de Toy Gaussian Splatting en Unity.		Unidad	3D
ViVid-1-a-3	Síntesis de vistas novedosas con modelos de difusión de vídeo.	arXiv		3D
Voxcraft	Elaboración de modelos 3D listos para usar con IA.			3D
maravilla3d	Imagen única a 3D mediante difusión entre dominios.	arXiv		3D
Cero 1 a 3	Toma cero de una imagen a un objeto 3D.	arXiv		Modelo

^ Volver al contenido ^

Avatar

Fuente	Descripción	Papel	Motor de juego	Tipo
AniRetrato	Síntesis basada en audio de animaciones de retratos fotorrealistas.	arXiv		Avatar
CALMA	Modelos latentes adversarios condicionales para personajes virtuales direccionables.	arXiv		Avatar
ChatAvatar	Generación progresiva de caras 3D animables bajo guía de texto.			Avatar
chatdollkit	ChatdollKit te permite convertir tu modelo 3D en un chatbot.		Unidad	Avatar
charla de ensueño	Cuando la generación de cabeza parlante expresiva cumple con los modelos probabilísticos de difusión.	arXiv		Avatar
Duix	DUIX - ¿SDK digital humano basado en silicio?			Avatar
Ecomímico	Echomimic: animaciones de retratos dirigidas por audio realistas a través de condiciones de referencia editables.	arXiv		Avatar
Emopordratos	Avatares de cabeza multimodal de una sola vez mejoradas con emociones.			Avatar
E3 Gen	Generación de avatares eficientes, expresivos y editables.	arXiv		Avatar
Exavato	EXAVATAR - AVATAR GAUSSIANO 3D EXPRESIVO BURDO 3D.	arxiv		Avatar
Geneavatar	Edición de avatar de cabeza volumétrica de expresión genérica desde una sola imagen.	arXiv		Avatar
GENEFACE ++	Generación generalizada en 3D en tiempo real generalizada y estable.			Avatar
Hola	Síntesis visual jerárquica impulsada por audio para la animación de imágenes de retratos.	arXiv		Avatar
Hallo2	Hallo2: animación de imagen de retrato de larga duración y alta resolución impulsada por audio.	arxiv		Avatar
Escultura	Crafting Avatares de cabeza 3D con texto.	arxiv		Avatar
Intrínsica	Intrinsicavatar: representación inversa de base física de humanos dinámicos de videos monoculares a través del trazado de rayos explícitos.	arxiv		Avatar
Tallador	Sistema de conversación de avatar digital.			Avatar
VivorTrait	LivePorTrait: animación eficiente de retratos con costuras y control de reorientación.	arxiv		Avatar
Motiongpt	El movimiento humano como idioma extranjero, un modelo de generación de lenguaje de movimiento unificado que utiliza LLM.	arXiv		Avatar
Musepose	Musepose: un marco de imagen a video impulsado por pose para la generación humana virtual.			Avatar
Musetalk	Sincronización de labios de alta calidad en tiempo real con el espacio latente en el espacio.			Avatar
Museva	Generación de videos humanos virtuales de longitud infinita y de alta fidelidad con descenso paralelo visual condicionado.			Avatar
Retrat4d	Aprendiendo la síntesis de avatar de cabeza 4D de una sola oportunidad utilizando datos sintéticos.	arxiv		Avatar
Ready Player Me	Integre avatares personalizables en su juego o aplicación en días.			Avatar
Rótula	Rodinhd: generación de avatar 3D de alta fidelidad con modelos de difusión.	arxiv		Avatar
Styleavatar3d	Aprovechando los modelos de difusión de texto de imagen para la generación de avatar 3D de alta fidelidad.	arxiv		Avatar
Text2Control3d	Generación de avatar 3D controlable en campos de radiancia neuronal utilizando el modelo de difusión de texto a imagen guiado por geometría.	arxiv		Avatar
Topo4d	Splatting gaussiano que presenta topología para captura de cabeza 4D de alta fidelidad.	arXiv		Avatar
Unityaiwithchatgpt	Basado en Unity, se realiza ChatGPT+UnityChan Voice Interactive Display.		Unidad	Avatar
Vid2avatar	Reconstrucción de Avatar 3D de Videos en la naturaleza a través de la descomposición de la escena auto-supervisada.	arxiv		Avatar
VLOGGER	Difusión multimodal para la síntesis de avatar incorporada.			Avatar
Wild2avatar	Renderizando a los humanos detrás de las oclusiones.	arxiv		Avatar

^ Volver al contenido ^

Animación

Fuente	Descripción	Papel	Tipo
Animar a cualquiera	Síntesis de imagen a video consistente y controlable para la animación de personajes.	arxiv	Animación
Animateanything	Animación de imagen de dominio abierto de grano fino con orientación de movimiento.	arxiv	Animación
Animado	Anime sus modelos personalizados de difusión de texto a imagen sin un ajuste específico.	arxiv	Animación
Animatelcm	¡Aceleremos la generación de videos en 4 pasos!	arXiv	Animación
Animado-x	Animate-X: animación de imagen de personaje universal con representación de movimiento mejorado.	arxiv	Animación
Animatezero	Los modelos de difusión de video son animadores de imágenes de cero disparos.	arxiv	Animación
Animationgpt	Una herramienta AIGC para generar activos de movimiento de combate de juegos.		Animación
Deforum	Deforum aprovecha la difusión estable para generar imágenes de IA en evolución.		Animación
Empinamiento de dibujos	Dibujos de dibujo: animación 3D de dibujos de un solo personaje.	arxiv	Animación
Dreamoving	Un marco de generación de videos humanos basado en modelos de difusión.	arxiv	Animación
Fusión	Swapper y potenciador de la próxima generación.		Animación
FreeInit	Puente de la brecha de inicialización en modelos de difusión de video.	arxiv	Animación
Género	Síntesis de cara parlante 3D generalizada y de alta fidelidad.	arxiv	Animación
Animador de identificación	Generación de videos humanos que preservan la identidad de la identidad cero.	arXiv	Animación
Mágico	Animación de imagen humana temporalmente consistente utilizando el modelo de difusión.	arxiv	Animación
Nuwa	Dragnuwa es un modelo de generación de video basado en el dominio abierto que toma los controles de texto, imagen y trayectoria como entradas para lograr la generación de videos controlables.	arxiv	Animación
Nuwa-infinidad	Nuwa-Infinity es un modelo generativo multimodal que está diseñado para generar imágenes y videos de alta calidad a partir de texto de texto, imagen o video.		Animación
Nuwa-xl	Una nueva difusión sobre arquitectura de difusión para una generación de videos extremadamente larga.		Animación
Animación Omni	AI generó animaciones de alta fidelidad.		Animación
PIA	Su animador de imagen personalizado a través de módulos plug-and-play en modelos de texto a imagen.	arxiv	Animación
Sadtalker	Aprendiendo coeficientes de movimiento 3D realistas para la animación estilizada de la cara de la imagen de una sola imagen con audio.	arxiv	Animación
Sadtalker-video-lip-sincronización	Este proyecto se basa en Sadtalkers Wav2Lip para la síntesis de labios de video.		Animación
Animación estable	Una poderosa herramienta de texto a animación para desarrolladores.		Animación
Talecrafter	Una herramienta de visualización de historias interactiva que admite múltiples personajes.	arxiv	Animación
Tooncrafter	Tooncrafter: interpolación generativa de dibujos animados.	arxiv	Animación
Wav2lip	Videos de sincronización de labios con precisión en la naturaleza.	arxiv	Animación
Estudio de maravilla	Una herramienta de IA que anima, enciende y compone los personajes CG automáticamente en una escena de acción en vivo.		Animación

^ Volver al contenido ^

Visual

Fuente	Descripción	Papel	Tipo
Cambrian-1	Cambrian-1: una exploración completamente abierta y centrada en la visión de LLM multimodales.	arxiv	LLM multimodal
Cogvlm2	Modelo multimodal de código abierto de nivel GPT4V basado en LLAMA3-8B.		Visual
Cotracker	Es mejor rastrear juntos.	arXiv	Visual
Evf-sam	EVF-SAM: fusión temprana del idioma de visión para el segmento prometido por el texto de cualquier modelo.	arxiv	Visual
Facehi	Es mejor rastrear juntos.		Visual
Internlm-xComposer2	Internlm-xComposer2 es un innovador modelo grande de visión (VLLM) que sobresale en la composición y comprensión de la imagen de texto de forma libre.	arxiv	Visual
Canguro	Kangaroo: un potente modelo de video que admite la entrada de video con contexto largo.		Visual
LGVI	Hacia el video de video basado en el lenguaje a través de modelos de lenguaje grande multimodal.		Visual
Llava ++	Extendiendo las capacidades visuales con LLAMA-3 y PHI-3.		Visual
Llava-Anevisión	Llava-Anevision: transferencia fácil de tareas visuales.	arxiv	Visual
Longva	Transferencia de contexto largo de lenguaje a visión.	arxiv	Visual
Maskvit	Prioridad visual enmascarada para la predicción de video.	arxiv	Visual
Minicpm-llama3-v 2.5	Un nivel de nivel GPT-4V en su teléfono.		Visual
Moe-llava	Mezcla de expertos para grandes modelos en idioma de visión.	arxiv	Visual
Motionllm	Comprender los comportamientos humanos a partir de movimientos y videos humanos.	arxiv	Visual
Pllava	Extensión de Llava sin parámetros de imágenes a videos para subtítulos en video.	arxiv	Visual
Qwen-vl	Un modelo versátil en idioma de visión para comprensión, localización, lectura de texto y más allá.	arxiv	Visual
Sapiens	Sapiens: base para modelos de visión humana.	arxiv	Visual
ShareGPT4V	Mejora de grandes modelos multimodales con mejores subtítulos.	arxiv	Visual
SOLO	Solo: un solo transformador para modelado en idioma de visión escalable.	arxiv	Visual
Videocam	Video-CCAM: Advancing Video-Language Entendimiento con máscaras de atención cruzada causales.		Visual
Video-llava	Aprendiendo la representación visual unida por alineación antes de la proyección.	arxiv	Visual
Videollama 2	Avance de modelado espacial-temporal y comprensión de audio en Video-LLMS.	arxiv	Visual
Videocams	El primer punto de referencia de evaluación integral de los LLM multimodales en el análisis de video.	arxiv	Visual
Vitron	Un Pixel-Level Vision LLM unificado para comprender, generar, segmentar, editar.		Visual
Vila	VILA: Sobre la capacitación previa para modelos de lenguaje visual.	arXiv	Visual

^ Volver al contenido ^

Video

Fuente	Descripción	Papel	Tipo
360dvd	Generación de video panorama controlable con modelo de difusión de video de 360 grados.	arxiv	Video
Animate-a-story	Generación de videos de recuperación de recuperación para contar una historia.	arxiv	Video
Cualquier cosa en cualquier escena	Inserción de objeto de video fotorrealista.		Video
Arte • V	Generación de texto a video automático con modelos de difusión.	arxiv	Video
Asistencia	Conozca la plataforma de video generativa que da vida a sus ideas.		Video
Atomovideo	Generación de imagen a video de alta fidelidad.	arxiv	Video
Backgroundremover	El removedor de fondo le permite eliminar el fondo de las imágenes y el video utilizando AI con una interfaz de línea de comandos simple que es gratuita y de código abierto.		Video
Boximator	Generando movimientos ricos y controlables para la síntesis de video.	arxiv	Video
CODEF	Campos de deformación de contenido para procesamiento de video temporalmente consistente.	arxiv	Video
Cogvideo	Genere videos a partir de descripciones de texto.		Video
Cogvideox	Cogvideox es una versión de código abierto del modelo de generación de videos, que es homólogo a 清影.		Video
Cogvlm	COGVLM es un poderoso modelo de lenguaje visual de código abierto (VLM).		Visual
Conr	Generado videos de baile vívido de hojas de personajes de anime dibujados a mano (ACS).	arxiv	Video
Decohere	Crea lo que no se puede filmar.		Video
Descripción	Descript es la forma simple, potente y divertida de editar.		Video
Difunto	Sombreado de toón editable de alta resolución a través de modelos de difusión.	arXiv	Video
delfín	Plataforma general de interacción de video basada en LLM.		Video
DomoAI	Amplifique su creatividad con Domoai.		Video
Dreamcinema	DreamCinema: transferencia cinematográfica con cámara gratuita y carácter 3D.	arxiv	Video
DynamicRafter	Animando imágenes de dominio abierto con prioras de difusión de video.	arxiv	Video
BORDE	Introducimos Edge, un método poderoso para la generación de danza editable que es capaz de crear bailes realistas y físicamente planibles mientras sigue siendo fiel a la música de entrada arbitraria.	arxiv	Video
emo	EMOTE Retrato Alive - Generación de videos de retratos expresivos con modelo de difusión Audio2Video en condiciones débiles.	arxiv	Video
Video de EMU	Factorizando la generación de texto a video por acondicionamiento explícito de la imagen.		Video
Etna	ETNA puede generar contenido de video correspondiente basado en descripciones de texto cortas.		Video
Hada	Síntesis rápida de video a video guiada por instrucciones paralelizadas.		Video
Sigue a tu canvas	Siga a su canvas: superación de video de mayor resolución con una generación de contenido extensa.	arxiv	Video
Sigue tu pose	Generación de texto a video guiada por pose utilizando videos sin pose.	arxiv	Video
Parto	Su conjunto completo de herramientas de creación de IA a su alcance.		Video
Gen-2	Un sistema de IA multimodal que puede generar videos novedosos con texto, imágenes o videoclips.		Video
Dinámica generativa	Dinámica de imagen generativa.		Video
Genio	Entornos interactivos generativos.	arxiv	Video
Genmo	Hacer mágicamente videos con AI.		Video
Gentrón	Transformadores de difusión para la generación de imágenes y videos.		Video
Higen	Desacoplamiento espacio-temporal jerárquico para la generación de texto a video.		Video
Hotshot-xl	HotShot-XL es un modelo de texto de IA a GIF entrenado para trabajar junto con la difusión estable XL.		Video
Hunyuanvideo	Hunyuanvideo: un marco sistemático para un gran modelo de generación de videos.	arXiv	Video
Video de Imagen	Dado un mensaje de texto, Imagen Video genera videos de alta definición utilizando un modelo de generación de videos base y una secuencia de modelos de súper resolución espaciales y temporales intercalados.		Video
Instructvideo	Instruir modelos de difusión de video con retroalimentación humana.	arxiv	Video
I2vgen-xl	Síntesis de imagen a video de alta calidad a través de modelos de difusión en cascada.	arxiv	Video
Lavie	Generación de videos de alta calidad con modelos de difusión latente en cascada.	arxiv	Video
LTX Studio	LTX Studio es una plataforma holística de cine impulsada por IA para creadores, vendedores, cineastas y estudios.		Video
Video ltx	LTX-Video es el primer modelo de generación de videos basado en DIT que puede generar videos de alta calidad en tiempo real. Puede generar videos de 24 fps a la resolución 768x512, más rápido de lo que se necesita para verlos.		Video
Lumière	Un modelo de difusión de espacio-tiempo para la generación de videos.	arxiv	Video
LVDM	Modelos de difusión de video latente para la generación de videos largos de alta fidelidad.	arxiv	Video
Magicvideo	Generación de videos eficientes con modelos de difusión latente.	arxiv	Video
MagicVideo-V2	Generación de videos de alto nivel de estadio múltiple.	arxiv	Video
Hora Mágica	AI Video para creadores hizo simple.		Video
Magvit-V2	Tokenizer es clave para la generación visual.		Video
Magvit	Transformador de video generativo enmascarado.		Video
Video	Make-A-Video es un sistema AI de última generación que genera videos a partir de texto.	arxiv	Video
Haz bailar píxeles	Generación de videos de alta dinámica.	arxiv	Video
Hacer tu video	Generación de videos personalizados utilizando orientación textual y estructural.	arxiv	Video
Microcinema	Un enfoque de división y conquista para la generación de texto a video.	arxiv	Video
MIMO	MIMO: síntesis de video de caracteres controlable con modelado espacial descompuesto.	arxiv	Video
Mini-gemini	Minería el potencial de los modelos de lenguaje de visión multimodalidad.		Visión
MobileVidFactory	Generación automática de videos de redes sociales basadas en difusión para dispositivos móviles a partir de texto.		Video
Mochi 1	Mochi 1 es un modelo de generación de videos de vanguardia abierto con movimiento de alta fidelidad y una fuerte adherencia rápida en la evaluación preliminar.		Video
Mofa-video	Animación de imagen controlable a través de adaptaciones de campo de movimiento generativo en el modelo de difusión de imagen a video congelado.	arxiv	Video
MoneyPrinterturbo	Use modelos grandes para generar videos cortos con un solo clic.		Video
Valley de luna	Moonvalley es un nuevo y innovador modelo de IA generativo de texto a video.		Video
Mora	Más como Sora para la generación de videos generalistas.	arxiv	Video
Morph Studio	Con nuestra magia AI de texto a video, manifiesta su creatividad a través de su aviso.		Video
Clona	MotionClone: clonación de movimiento sin entrenamiento para la generación de videos controlables.	arxiv	Video
MotionCtrl	Un controlador de movimiento unificado y flexible para la generación de videos.	arxiv	Video
MotionDirector	Personalización de movimiento de modelos de difusión de texto a video.	arxiv	Video
Mrota	Una aplicación para reemplazar a los personajes en video con avatares 3D.		Video
Mov2mov	MOV2MOV Plugin para Automatic1111/Stable-Diffusion-Webui.		Video
Moviefactory	Creación automática de películas a partir de texto utilizando grandes modelos generativos para lenguaje e imágenes.	arxiv	Video
Marcos neuronales	Descubra el sintetizador para el mundo visual.		Video
Sin duda	Crea tu mundo.		Video
Sora abierta	Democratizando la producción de video eficiente para todos.		Video
Sora abierta	Plan de Sora abierto.		Video
Fenaki	Un modelo para generar videos a partir de texto, con indicaciones que pueden cambiar con el tiempo y videos que pueden ser tan largos como varios minutos.	arxiv	Video
Laboratorios de pika	Pika Labs está revolucionando la experiencia en video con AI.		Video
Píxel	Pixeling permite a nuestros clientes crear contenido visual altamente preciso, ultra realista y extremadamente controlable que incluye imágenes, videos y modelos 3D.		Video
PixVerse	Crea videos impresionantes con AI.		Video
Polinización	La creación se vuelve fácil, rápida y divertida.		Video
Reutilizar y difundir	Denosing iterativo para la generación de texto a video.	arxiv	Video
Ruyi	Ruyi es un modelo de imagen a video capaz de generar videos de calidad cinematográfica a una resolución de 768, con una velocidad de cuadro de 24 cuadros por segundo, totalizando 5 segundos y 120 cuadros.		Video
Shortgpt	Un marco experimental de IA para la creación automatizada de contenido corto/video.		Video
Show-1	Casarse con modelos de píxeles y difusión latente para la generación de texto a video.	arxiv	Video
Video	Transformadores espacio-temporales escalados para la síntesis de texto a video.	arxiv	Video
sora	Creando video desde texto.		Video
Sorawebui	Sorawebui es un cliente web Sora de código abierto, lo que permite a los usuarios crear fácilmente videos desde el texto con el modelo Sora de OpenAI.		Video
Video estable	Edición de video de difusión consistencia con consistencia basada en el texto.		Video
Difusión de video estable	Imagen a video de difusión de video estable (SVD).		Video
Difusión de la historia	Autoatación constante para la generación de imágenes y videos de largo alcance.	arxiv	Video
Streamingt2v	Generación de videos largos consistente, dinámico y extensible a partir del texto.	arxiv	Video
Estilecrafter	Nhancing Estilizado de texto a video con adaptador de estilo.	arxiv	Video
Tatuaje	Generación de videos largos con VQGAN Agnóstico en el tiempo y transformador sensible al tiempo.		Video
Text2video-cero	Los modelos de difusión de texto a imagen son generadores de video de disparo cero.	arxiv	Video
TF-T2V	Una receta para ampliar la generación de texto a video con videos sin texto.	arxiv	Video
Torá	Tora: transformador de difusión orientado a la trayectoria para la generación de videos.	arxiv	Video
Pistas	Track-Anything es una herramienta flexible e interactiva para el seguimiento y la segmentación de objetos de video, basada en el segmento cualquier cosa y XMEM.	arxiv	Video
Sintonía	Ajuste de una sola vez de modelos de difusión de imagen para la generación de texto a video.	arxiv	Video
Twelvelabs	AI multimodal que entiende videos como los humanos.		Video
Univg	Hacia la generación de videos modales unificados.		Video
Vchitect-2.0	Vchitect-2.0: Transformador paralelo para ampliar los modelos de difusión de video.		Video
VGen	Un ecosistema holístico de generación de videos para la generación de videos que se basa en modelos de difusión.	arxiv	Video
ViewCrafter	ViewCrafter: modelos de difusión de video para domar para la síntesis de visión novedosa de alta fidelidad.	arxiv	Video
Video-chatgpt	Video-CHATGPT es un modelo de conversación de video capaz de generar una conversación significativa sobre videos.	arxiv	Video
Videocomponente	Síntesis de video compositivo con control de movimiento.	arxiv	Video
Videocrafter1	Modelos de difusión abiertos para la generación de videos de alta calidad.	arxiv	Video
Videocrafter2	Superar limitaciones de datos para modelos de difusión de video de alta calidad.	arxiv	Video
Videodrafter	Generación de videos múltiples consistentes en el contenido con LLM.	arxiv	Video
Videoelevator	Elevar la calidad de la generación de videos con modelos versátiles de difusión de texto a imagen.	arxiv	Video
Videofactorio	Intercambie la atención en las difusiones espacio-temporales para la generación de texto a video.		Video
Videógeno	Un enfoque de difusión latente guiada por referencia para la generación de texto a video de alta definición.	arxiv	Video
Videolcm	Modelo de consistencia de video latente.	arxiv	Video
Video LDMS	Alinee sus latentes: síntesis de video de alta resolución con modelos de difusión latente.	arxiv	Video
Video-llava	Aprendiendo la representación visual unida por alineación antes de la proyección.	arxiv	Video
Vidomamba	Modelo espacial de estado para una comprensión de video eficiente.	arxiv	Video
Video de pensamiento	Video de pensamiento: razonamiento de video paso a paso de la percepción a la cognición.		Video
Videopoet	Un modelo de lenguaje grande para la generación de videos de cero disparos.	arxiv	Video
Movimiento visual	Crea videos realistas usando solo texto.		Video
Visualrwkv	VisualRWKV es la versión visual mejorada del modelo de lenguaje RWKV, lo que permite a RWKV manejar diversas tareas visuales.		Visual
V-JEPA	Arquitectura predictiva de incrustación conjunta de video.	arxiv	Video
Walt	Generación de videos fotorrealistas con modelos de difusión.	arxiv	Video
Cerocopio	Zeroscope Texto a video.		Video

^ Volver al contenido ^

Audio

Fuente	Descripción	Papel	Tipo
Académico	Un modelo de códec de audio de código abierto para la investigación académica.		Audio
Anfión	Un kit de herramientas de audio, música y generación de discursos de código abierto.	arxiv	Audio
Arcisión	Generación de audio utilizando modelos de difusión, en Pytorch.		Audio
caja de audio	Generación de audio unificada con indicaciones de lenguaje natural.		Audio
Audioeditar	Edición de audio no supervisada y basada en texto con inversión DDPM.	arxiv	Audio
Códec de audiogen	Un códec de audio neuronal estéreo de 48 kHz bajo para audio general, optimizando para la fidelidad de audio?		Audio
Audiogpt	Comprender y generar discurso, música, sonido y cabeza parlante.	arxiv	Audio
Audiolcm	Generación de texto a audio con modelos de consistencia latente.	arxiv	Audio
Audioldm	Generación de texto a audio con modelos de difusión latente.	arxiv	Audio
Audioldm 2	Aprendiendo la generación de audio holístico con el pretrenesa auto-supervisado.	arxiv	Audio
Aufusión	Aprovechando el poder de la difusión y los modelos de lenguaje grande para la generación de texto a audio.	arxiv	Audio
CTAG	Generación creativa de texto a audio a través de la programación de sintetizadores.		Audio
Foleycrafter	FoleyCrafter: dar vida a los videos silenciosos con sonidos realistas y sincronizados.	arxiv	Audio
Imán	Generación de audio enmascarada utilizando un solo transformador no autorregivo.		Audio
Acompañamiento	Generación de texto a audio con modelos de difusión mejorados con aviso.	arxiv	Audio
Make-An-Audio 3	Transformando el texto en audio a través de transformadores de difusión grandes basados en flujo.	arxiv	Audio
Neurio	Síntesis de sonido modal basado en el aprendizaje con transferencia acústica.	arxiv	Audio
Optimizante	Suena para creadores, creadores de juegos, artistas, creadores de videos.		Audio
Qwen2-audio	QWEN2-ADIO CHAT & PROTRADO Modelo de lenguaje de audio grande propuesto por Alibaba Cloud.	arxiv	Audio
Ver-2-Sound	Sonido espacial de entorno espacial a shot a cero.	arxiv	Audio
Tormenta de sonido	Generación de audio paralela eficiente.	arxiv	Audio
Audio estable	Difusión de audio latente acondicionada rápida de sincronización.		Audio
Open de audio estable	Open de audio estable 1.0 genera audio estéreo de longitud variable (hasta 47S) a 44.1kHz a partir de indicaciones de texto.		Audio
Sincusión	Syncfusion: síntesis de foley sincronizada de video a audio sincronizada multimodal.	arxiv	Audio
TANGO	Generación de texto a audio utilizando instrucciones Tuned LLM y modelo de difusión latente.		Audio
Vta-ldm	Generación de video a audio con alineación oculta.	arxiv	Audio
Ondulado	Creación de audio de composición con modelos de idiomas grandes.	arxiv	Audio

^ Volver al contenido ^

Música

Fuente	Descripción	Papel	Tipo
Aiva	La inteligencia artificial que compone música de banda sonora emocional.		Música
Amper Music	Tecnología de generación musical personalizada alimentada por Amper.		Música
boomy	Crear música generativa. Compártalo con el mundo.		Música
Chatmusicista	Fomento de habilidades musicales intrínsecas en LLM.		Música
Acordes	Generación de música automática ai.		Música
Diff-bgm	Un modelo de difusión para la generación de música de fondo de video.	arxiv	Música
Fluxmusic	FluxMusic: generación de texto a música con transformador de flujo rectificado.	arxiv	Música
Gptableton	Reduzca el script para procesar la respuesta GPT y el envío de las notas MIDI a los clips Ableton con Abletonosc y Python-OSc.		Música
Heymusic.ai	Generador de música AI		Música
Imagen a la música	AI Image to Music Generator es una herramienta que utiliza inteligencia artificial para convertir imágenes en música.		Música
Jen-1	Generación de música universal guiada por texto con modelos de difusión omnidireccional.		Música
Tocadiscos tragamonedas	Un modelo generativo para la música.	arxiv	Música
Magenta	Magenta es un proyecto de investigación que explora el papel del aprendizaje automático en el proceso de creación de arte y música.		Música
Melodía	Generación de música neuronal eficiente		Música
mubert	AI Música generativa.		Música
Museneta	Una red neuronal profunda que puede generar composiciones musicales de 4 minutos con 10 instrumentos diferentes, y puede combinar estilos de país a Mozart a los Beatles.		Música
MusicGen	Generación de música simple y controlable.	arxiv	Música
Musicldm	Mejora de la novedad en la generación de texto a música utilizando estrategias de mezcla sincronales latidos.	arxiv	Música
MúsicaLM	Generando música a partir de texto.	arxiv	Música
Aplicación de riffusion	Riffusion es una aplicación para la generación de música en tiempo real con difusión estable.		Música
Sonauto	Sonauto es un editor de música AI que convierte las indicaciones, las letras o las melodías en canciones completas en cualquier estilo.		Música
Rango	Generador de música AI para creadores.		Música
Soundry ai	Herramientas de IA generativas que incluyen paquetes de muestras de texto a sonido e infinito.		Música

^ Volver al contenido ^

Voz de canto

Fuente	Descripción	Papel	Tipo
DiffSinger	Síntesis de voz de canto a través del mecanismo de difusión poco profunda.	arXiv	Voz de canto
Recuperación basada en la voz-conversión-webui	Un marco SVC fácil de usar basado en VITS.		Voz de canto
so-vits-svc	SoftVC Vits Singing Voice Conversion.		Voz de canto
VI-SVS	Use VITS y OpenCPop para desarrollar síntesis de voz de canto; Diferente de Visinger.		Voz de canto

^ Volver al contenido ^

Discurso

Fuente	Descripción	Papel	Motor de juego	Tipo
Aplicación	Ultimate Voice Cloning Tool, meticulosamente optimizada para potencia inigualable, modularidad y experiencia fácil de usar.			Discurso
Audyo	Texto en. Audio Out.			Discurso
Ladrar	Modelo de audio generativo prometido por texto.			Discurso
Bert-vits2	VITS2 Backbone con Bert multilingüe.			Discurso
Chattts	Chattts es un modelo de habla generativo para el diálogo diario.			Discurso
Clapspeech	Prosodia de aprendizaje del contexto del texto con el alquiler de audio de lenguaje contrastante.	arxiv		Discurso
Cosivaza	Modelo de generación de voz grande multilingüe, que proporciona inferencia, capacitación e implementación de capacidad de plena.			Discurso
Dex-tts	Texto expresivo a voz basado en difusión con modelado de estilo en la variabilidad del tiempo.	arxiv		Discurso
Emotivo	Un motor TTS multi-votación y controlación rápida.			Discurso
Fliki	Convierta el texto en videos con voces de AI.			Discurso
GLM-4-VOICE	GLM-4-Voice es un modelo de voz de extremo a extremo lanzado por Zhipu AI. GLM-4-Voice puede comprender y generar directamente el habla china e inglesa, participar en conversaciones de voz en tiempo real y cambiar atributos como emoción, entonación, velocidad de voz y dialecto basados en las instrucciones del usuario.			Discurso
Brillo	Un flujo generativo para texto a voz a través de la búsqueda de alineación monotónica.	arxiv		Discurso
Gpt-sovits	Una poderosa conversión de voz de pocos disparos y webui de texto a voz.			Discurso
LOVO	Lovo es el generador de voz de IA y la plataforma de texto a voz para miles de creadores.			Discurso
Mahatts	Un modelo de generación de voz grande de código abierto.			Discurso
Matcha-TTS	Una arquitectura TTS rápida con coincidencia de flujo condicional.	arxiv		Discurso
Melotts	Biblioteca de texto a voz multilingüe de alta calidad por myshell.ai. Admite inglés, español, francés, chino, japonés y coreano.			Discurso
Metavoice-1b	AI para inteligencia del habla a nivel humano.			Discurso
Narakeet	Cree fácilmente voces en off usando texto realista a discurso.			Discurso
Mini	Mini-OMNI: Los modelos de idiomas pueden escuchar, hablar mientras piensan en la transmisión. Mini-OMNI es un modelo de lenguaje grande de código abierto que puede escuchar, hablar mientras piensa. Con la entrada de voz de extremo a extremo en tiempo real y la transmisión de capacidades de conversación de salida de audio.	arxiv		Discurso
Clonación de una voz de una sola vez	Una base de clonación de voz de una toma en unet-tts.			Discurso
OpenVoice	Clonación de voz instantánea de Myshell.			Discurso
Rebosar	Poner flujos sobre los transductores neuronales para mejores TTS.			Discurso
RealTimetts	RealTimetts es una biblioteca de texto a discurso (TTS) de última generación diseñada para aplicaciones en tiempo real.			Discurso
Sensevoice	Sensevoice es un modelo de base del habla con múltiples capacidades de comprensión del habla, incluido el reconocimiento automático de voz (ASR), la identificación del lenguaje hablado (LID), el reconocimiento de emociones del habla (SER) y la detección de eventos de audio (AED).			Discurso
Discurso	Empoderar modelos de lenguaje grande con habilidades de conversación intermodales intrínsecas.	arxiv		Discurso
discurso a texto-gpt3-unidad	Este es el repositorio que uso la API Whisper y Chatgpt de OpenAi en Unity.		Unidad	Discurso
Discurso estable	Modelo de texto a voz de estabilidad de IA.			Discurso
Stabletts	Modelo TTS de próxima generación utilizando el coincidencia de flujo y DIT, inspirado en la difusión estable 3.			Discurso
Styletts 2	Hacia el texto a nivel humano a la expresión a través de la difusión del estilo y la formación adversaria con grandes modelos de lenguaje de voz.	arxiv		Discurso
tortoise.cpp	Tortoise.cpp: Implementación GGML de Tortoise-TTS.			Discurso
Tortuga-tts	Un sistema TTS de múltiples voces entrenado con énfasis en la calidad.			Discurso
TTS Generation Webui	TTS Generation Webui (Bark, MusicGen, Tortoise, RVC, Vocos, Demucs).			Discurso
Vall-E	Los modelos de lenguaje de códec neural son sintetizadores de texto a cero disparos a los del habla.	arxiv		Discurso
Vall-e x	Habla idiomas extranjeros con tu propia voz: modelado de idiomas de códec neural interlingüe	arxiv		Discurso
código de voz	Vocode es una biblioteca de código abierto para construir aplicaciones LLM basadas en voz.			Discurso
Caja de voz	Generación de discursos multilingües guiadas por texto a escala.	arxiv		Discurso
Vocecrafía	Edición del habla y texto a voz en la naturaleza en la naturaleza.			Discurso
Susurro	Whisper es un modelo de reconocimiento de voz de uso general.			Discurso
Porte de susurros	Un sistema de texto a voz de código abierto construido por Whisper invertir.			Discurso
Xe-voz	Marco de capacitación conjunta de la conversión de texto y voz de texto y voz de texto y voz interlingüística no automática.			Discurso
XTTS	XTTS es una biblioteca para la generación avanzada de texto a voz.			Discurso
YourTts	Hacia TTS de múltiples disparos cero y conversión de voz de cero disparos para todos.	arxiv		Discurso
Zmm-tts	Síntesis de discurso multilingüe y multiester de múltiples disparos condicionada en representaciones discretas de habla discretas auto-supervisadas.	arxiv		Discurso