ai game devtools
1.0.0
Aquí realizaremos un seguimiento de las últimas herramientas de desarrollo de juegos de IA, incluidas LLM, Agent, Code, Writer, Image, Texture, Shader, 3D Model, Animation, Video, Audio, Music, Singing Voice y Analytics.
Fuente | Descripción | Papel | Motor de juego | Tipo |
---|---|---|---|---|
AgenteGPT | ? Reúna, configure e implemente agentes de IA autónomos en su navegador. | Herramienta | ||
Comando AI | Integración de ChatGPT con Unity Editor. | Unidad | Herramienta | |
AIOS | Sistema operativo del agente LLM. | Herramienta | ||
Científico de IA | El científico de IA: hacia un descubrimiento científico abierto y totalmente automatizado. | arXiv | Herramienta | |
Asistente CLI | Una cómoda herramienta CLI para utilizar el servicio ChatGPT | Herramienta | ||
GPT automático | Un intento experimental de código abierto para hacer que GPT-4 sea completamente autónomo. | Herramienta | ||
BebéAGI | Este script de Python es un ejemplo de un sistema de gestión de tareas basado en IA. | Herramienta | ||
?? Interfaz de usuario BabyAGI | La interfaz de usuario de BabyAGI está diseñada para facilitar la ejecución y el desarrollo de babyagi en una aplicación web, como ChatGPT. | Herramienta | ||
baichuan-7B | Un modelo de lenguaje de preentrenamiento 7B a gran escala desarrollado por Baichuan. | Herramienta | ||
Baichuan-13B | Un modelo de lenguaje grande 13B desarrollado por Baichuan Intelligent Technology. | Herramienta | ||
Baichuan 2 | Una serie de grandes modelos de lenguaje desarrollados por Baichuan Intelligent Technology. | Herramienta | ||
Bisheng | Bisheng es una plataforma abierta de desarrollo de LLM para aplicaciones de inteligencia artificial de próxima generación. | Herramienta | ||
Carácter-LLM | Un agente entrenable para juegos de roles. | arXiv | Herramienta | |
ChatDev | Agentes Comunicativos para el Desarrollo de Software. | arXiv | Herramienta | |
ChatGPT-API-unidad | Vincula la API de finalización de chat ChatGPT a C# puro en Unity. | Unidad | Herramienta | |
ChatGPTParaUnidad | ChatGPT por la unidad. | Unidad | Herramienta | |
ChatRWKV | ChatRWKV es como ChatGPT pero impulsado por el modelo de lenguaje RWKV (100% RNN) y de código abierto. | Herramienta | ||
ChatYuan | Modelo de lenguaje grande para diálogos en chino e inglés. | Herramienta | ||
China-LLaMA-Alpaca-3 | (LLM chinos Llama-3) desarrollados a partir de Meta Llama 3. | Herramienta | ||
Cromo-GPT | Un agente de AutoGPT que controla Chrome en tu escritorio. | Herramienta | ||
CogVLM | CogVLM, un potente modelo básico de lenguaje visual de código abierto. | arXiv | Herramienta | |
CoreNet | Una biblioteca para entrenar redes neuronales profundas. | Herramienta | ||
Cosmos | Cosmos es una plataforma de desarrollo de modelos mundiales que consta de modelos de base mundial, tokenizadores y procesos de procesamiento de video para acelerar el desarrollo de la IA física en los laboratorios de robótica y AV. | LLM | ||
DBRX | DBRX es un modelo de lenguaje grande entrenado por Databricks. | Herramienta | ||
DCLM | DataComp para modelos de lenguaje. | arXiv | Herramienta | |
DeepSeek-V3 | DeepSeek-V3 es un sólido modelo de lenguaje de mezcla de expertos (MoE) con un total de 671 mil millones de parámetros con 37 mil millones activados para cada token. | arXiv | LLM | |
DemostraciónGPT | Generador de aplicaciones Auto Gen-AI con el poder de Llama 2 | Herramienta | ||
Diseño2Code | Automatización de la ingeniería front-end | Herramienta | ||
Devika | Devika es una ingeniera de software de IA agente. | Herramienta | ||
Devon | Un programador de pares de código abierto. | Herramienta | ||
dora | Generando sitios web potentes, un mensaje a la vez. | Herramienta | ||
fluir | Arrastre y suelte la interfaz de usuario para crear su flujo LLM personalizado utilizando LangchainJS. | Herramienta | ||
Géminis | Gemini está diseñado desde cero para la multimodalidad: razonamiento fluido a través de texto, imágenes, video, audio y código. | Herramienta | ||
Gema | Gemma es una familia de modelos abiertos livianos y de última generación creados a partir de la investigación y la tecnología utilizadas para crear los modelos Google Gemini. | Herramienta | ||
gemma.cpp | Motor de inferencia C++ ligero e independiente para los modelos Gemma de Google. | Herramienta | ||
GLM-4 | GLM-4-9B es la versión de código abierto de la última generación de modelos previamente entrenados de la serie GLM-4 lanzada por Zhipu AI. | Herramienta | ||
GPT4Todos | Un chatbot entrenado con una recopilación masiva de datos limpios del asistente, incluidos códigos, historias y diálogos. | Herramienta | ||
GPT-4o | GPT-4o (“o” de “omni”) es un paso hacia una interacción persona-computadora mucho más natural: acepta como entrada cualquier combinación de texto, audio, imagen y video y genera cualquier combinación de texto, audio e imagen. salidas. | Herramienta | ||
GPTscript | Desarrollar aplicaciones LLM en lenguaje natural. | Herramienta | ||
Grok-1 | Los pesos y la arquitectura de nuestro modelo de mezcla de expertos de 314 mil millones de parámetros, Grok-1. | Herramienta | ||
AbrazosChat | Poner a disposición de todos los mejores modelos de chat de IA de la comunidad. | Herramienta | ||
Integración de Hugging Face API Unity | Este paquete de Unity proporciona una integración fácil de usar para la API de Hugging Face Inference, lo que permite a los desarrolladores acceder y utilizar modelos de Hugging Face AI dentro de sus proyectos de Unity. | Unidad | Herramienta | |
Enlace de imagen | ImageBind One incrustando espacio para unirlos a todos. | arXiv | Herramienta | |
Índice-1.9B | Un LLM multilingüe ligero SOTA. | Herramienta | ||
InteractML-Unidad | InteractML, un marco de scripting visual de aprendizaje automático interactivo para Unity3D. | Unidad | Herramienta | |
InteractML-Unreal Engine | Llevando el aprendizaje automático a Unreal Engine. | Motor irreal | Herramienta | |
PasanteLM | InternLM ha abierto un modelo base de 7 mil millones de parámetros, un modelo de chat diseñado para escenarios prácticos y el sistema de capacitación. | arXiv | Herramienta | |
PasanteLM-XCompositor | InternLM-XComposer2 es un innovador modelo de visión y lenguaje de gran tamaño (VLLM) que se destaca en la composición y comprensión de imágenes y texto de forma libre. | arXiv | Herramienta | |
Ene | Lleve la IA a su escritorio. | Herramienta | ||
Lamini | Lamini permite que cualquier equipo de ingeniería supere a los LLM de propósito general a través de RLHF y el ajuste de sus propios datos. | Herramienta | ||
LaMini-LM | LaMini-LM es una colección de modelos de lenguaje eficientes y de tamaño pequeño extraídos de ChatGPT y entrenados en un conjunto de datos a gran escala de 2,58 millones de instrucciones. | Herramienta | ||
LangChain | LangChain es un marco para desarrollar aplicaciones basadas en modelos de lenguaje. | Herramienta | ||
LangFlow | ⛓️ LangFlow es una interfaz de usuario para LangChain, diseñada con reaccionar-flujo para proporcionar una forma sencilla de experimentar y crear prototipos de flujos. | Herramienta | ||
LaVague | Automatice la automatización con el marco del modelo de acción grande. | Herramienta | ||
Lémur | Modelos básicos abiertos para agentes lingüísticos. | Herramienta | ||
IA leptona | Un marco Pythonic para simplificar la creación de servicios de IA. | Herramienta | ||
Lit-LLaMA | Implementación del modelo de lenguaje LLaMA basado en nanoGPT. Admite atención flash, cuantificación Int8 y GPTQ de 4 bits, ajuste fino de LoRA y LLaMA-Adapter, preentrenamiento. | Herramienta | ||
llama2-webui | Ejecute Llama 2 localmente con la interfaz de usuario de gradio en GPU o CPU desde cualquier lugar (Linux/Windows/Mac). | Herramienta | ||
Llama 3 | El sitio oficial de Meta Llama 3 GitHub. | Herramienta | ||
Llama 3.1 | Llama es un modelo de lenguaje grande (LLM) abierto y accesible diseñado para que desarrolladores, investigadores y empresas creen, experimenten y escale de manera responsable sus ideas de IA generativa. | Herramienta | ||
LLaSM | Modelo grande de lenguaje y habla. | Herramienta | ||
Motor de respuesta LLM | Cree un motor de respuestas inspirado en la perplejidad utilizando Next.js, Groq, Mixtral, Langchain, OpenAI, Brave y Serper. | Herramienta | ||
llm.c | Formación LLM en C/CUDA simple y sin formato. | Herramienta | ||
LLMUnidad | ¡Crea personajes en Unity con LLM! | Unidad | Herramienta | |
LLocalBúsqueda | LLocalSearch es un motor de búsqueda que se ejecuta completamente localmente y utiliza agentes LLM. | Herramienta | ||
LógicaJuegosSolución | Una herramienta Python para resolver juegos de lógica con IA, Deep Learning y Computer Vision. | Herramienta | ||
escritor largo | LongWriter: Liberando la generación de más de 10,000 palabras a partir de LLM de contexto largo. | arXiv | Herramienta | |
Modelo de mundo grande (LWM) | Large World Model (LWM) es un modelo autorregresivo multimodal de contexto grande y de propósito general. | arXiv | Herramienta | |
Lumina-T2X | Lumina-T2X es un marco unificado para generación de texto a cualquier modalidad. | arXiv | Herramienta | |
MetaGPT | El marco multiagente | Herramienta | ||
MiniCPM-2B | Un LLM final supera a Llama2-13B. | Herramienta | ||
MiniGPT-4 | Mejora de la comprensión visión-lenguaje con modelos avanzados de lenguaje grande. | arXiv | Herramienta | |
MiniGPT-5 | Generación de visión y lenguaje entrelazados mediante vocales generativos. | arXiv | Herramienta | |
Mixtral 8x7B | Una mezcla escasa de expertos de alta calidad. | arXiv | Herramienta | |
Mistral 7B | El mejor modelo 7B hasta la fecha, Apache 2.0. | Herramienta | ||
Mistral grande | Mistral Large es un nuevo modelo de generación de texto de última generación. Alcanza capacidades de razonamiento de primer nivel. | Herramienta | ||
MLC LLM | Permita que todos desarrollen, optimicen e implementen modelos de IA de forma nativa en los dispositivos de todos. | Herramienta | ||
MobiLlama | Hacia un GPT preciso, ligero y totalmente transparente. | arXiv | Herramienta | |
Ministerio de Educación-LLaVA | Mezcla de Expertos para Grandes Modelos Visión-Lenguaje. | arXiv | Herramienta | |
moshi | Moshi es una IA conversacional experimental. | Herramienta | ||
moshi | Moshi: un modelo básico de voz y texto para diálogos en tiempo real. | Herramienta | ||
MUSGO | Un modelo de lenguaje conversacional mejorado con una herramienta de código abierto de la Universidad de Fudan. | Herramienta | ||
mPLUG-Búho? | La modularización potencia los grandes modelos de lenguaje con multimodalidad. | arXiv | Herramienta | |
Nemotrón-4 | Un gran modelo de lenguaje multilingüe de 15 mil millones de parámetros entrenado en 8 billones de tokens de texto. | arXiv | Herramienta | |
SIGUIENTE-GPT | Modelo de lenguaje grande multimodal cualquiera a cualquier. | Herramienta | ||
OLMo | Modelo de lenguaje abierto | arXiv | Herramienta | |
OmniLMM | Grandes modelos multimodales para un rendimiento sólido y una implementación eficiente. | Herramienta | ||
UnoLLM | Un marco para alinear todas las modalidades con el lenguaje. | arXiv | Herramienta | |
Asistente abierto | OpenAssistant es un asistente basado en chat que comprende tareas, puede interactuar con sistemas de terceros y recuperar información dinámicamente para hacerlo. | Herramienta | ||
AbiertoDevin | Un ingeniero de software de IA autónomo. | Herramienta | ||
Orión-14B | Orion-14B es una familia de modelos que incluye un LLM de base 14B y una serie de modelos. | arXiv | Herramienta | |
Panda | Modelo de lenguaje grande de código abierto chino en el extranjero, basado en Llama-7B, -13B, -33B, -65B para una capacitación previa continua en el campo chino. | Herramienta | ||
perplejidad | Un motor de búsqueda impulsado por IA. | Herramienta | ||
Pi | Chatbot con IA diseñado para asistencia personal y apoyo emocional. | Herramienta | ||
Qwen1.5 | Qwen1.5 es la versión mejorada de Qwen. | Herramienta | ||
Qwen2 | Qwen2 es la gran serie de modelos de lenguaje desarrollada por el equipo de Qwen, Alibaba Cloud. | Herramienta | ||
Qwen-7B | El repositorio oficial del chat Qwen-7B (通义千问-7B) y el modelo de lenguaje grande previamente entrenado propuesto por Alibaba Cloud. | Herramienta | ||
Agente de repositorio | RepoAgent es un proyecto de código abierto impulsado por modelos de lenguaje grandes (LLM) que tiene como objetivo proporcionar una forma inteligente de documentar proyectos. | arXiv | Herramienta | |
Motor de inteligencia artificial de cordura | Motor Sanity AI para la herramienta de desarrollo de juegos Unity. | Unidad | Herramienta | |
BuscarGPT | ? Conectando ChatGPT con Internet | Herramienta | ||
CompartirGPT4V | Mejora de modelos multimodales grandes con mejores subtítulos. | Herramienta | ||
Skywork | Los modelos de la serie Skywork están previamente entrenados en 3,2 TB de datos de código y multilingües de alta calidad (principalmente chino e inglés). | Herramienta | ||
EstableLM | Modelos de lenguaje de IA de estabilidad. | arXiv | Herramienta | |
Alpaca Stanford | Un modelo LLaMA que sigue instrucciones. | Herramienta | ||
UI web de generación de texto | Una interfaz de usuario web de gradio para ejecutar modelos de lenguajes grandes como LLaMA, llama.cpp, GPT-J, OPT y GALACTICA. | Herramienta | ||
TinyChatEngine | Biblioteca de inferencia LLM en el dispositivo. | Herramienta | ||
Banco de herramientas | Una plataforma abierta para capacitar, servir y evaluar modelos de lenguaje grandes para el aprendizaje de herramientas. | Herramienta | ||
Chat de unidadGPT | Experimentos de Unity ChatGPT. | Unidad | Herramienta | |
Integración de Unity OpenAI-API | Integre el modelo de lenguaje openai GPT-3 y la API ChatGPT en un proyecto de Unity. | Unidad | Herramienta | |
Unreal Engine 5 Llama LoRA | Un proyecto de prueba de concepto que muestra el potencial de utilizar LLM pequeños y capacitables localmente para crear herramientas de documentación de próxima generación. | Motor irreal | Herramienta | |
irrealGPT | Una colección de widgets de la utilidad Unreal Engine 5 Editor con tecnología GPT3/4. | Motor irreal | Herramienta | |
Video-LLaVA | Aprendizaje de la representación visual unida mediante alineación antes de la proyección. | arXiv | Herramienta | |
WebGPT | Ejecute el modelo GPT en el navegador con WebGPU. | Herramienta | ||
Web3-GPT | Implemente contratos inteligentes con IA | Herramienta | ||
PalabraGPT | ? Lleva el poder de ChatGPT a Microsoft Word | Herramienta | ||
XAgente | Un agente autónomo de LLM para la resolución de tareas complejas. | Herramienta | ||
yi | Una serie de grandes modelos de lenguaje entrenados desde cero por desarrolladores. | Herramienta | ||
01 Proyecto | La computadora modelo de lenguaje de código abierto. | Herramienta |
^ Volver al contenido ^
Fuente | Descripción | Papel | Motor de juego | Tipo |
---|---|---|---|---|
Banco de agentes | Un punto de referencia integral para evaluar los LLM como agentes. | arXiv | Agente | |
Chat de grupo de agentes | Un simulacro de chat grupal interactivo para provocar mejor el comportamiento emergente colectivo. | arXiv | Agente | |
Agente K | Un AGI autoagentico, autoevolucionable y modular. | Agente | ||
AgenteScope | Comience a crear aplicaciones multiagente con tecnología LLM de una manera más sencilla. | arXiv | Agente | |
AgenteSims | Un entorno limitado de código abierto para la evaluación de modelos de lenguaje grandes. | Agente | ||
Ciudad de IA | AI Town es una ciudad virtual donde los personajes de AI viven, charlan y socializan. | Agente | ||
anime.gf | Alternativa local y de código abierto a CharacterAI. | Juego | ||
astrocada | Crea juegos con IA | Juego | ||
Agentes atómicos | El marco de Atomic Agents está diseñado para ser modular, extensible y fácil de usar. | Agente | ||
AutoAgentes | Un marco para la generación automática de agentes. | Agente | ||
Autogeneración | Habilite aplicaciones de modelos de lenguaje grandes de próxima generación. | arXiv | Agente | |
conductual | Behaviac es un marco para el desarrollo de la IA del juego. | Estructura | ||
Biomas | Biomes es un MMORPG sandbox de código abierto creado para la web que utiliza tecnologías web como Next.js, Typecript, React y WebAssembly. | Juego | ||
Amortiguador de pensamientos | Razonamiento aumentado por pensamiento con modelos de lenguaje grandes. | arXiv | Agente | |
Agente Byzer | Marco de agente sencillo, rápido y distribuido para todos. | Agente | ||
ciudad del gato | Simulación con gatos impulsada por AC(h)atGPT. | Agente | ||
ciudad del gato | Simulación con gatos impulsada por AC(h)atGPT. | Agente | ||
PersonajeGLM | Personalización de caracteres de IA conversacionales chinos con modelos de lenguaje grandes. | arXiv | Agente | |
ChatDev | Agentes Comunicativos para el Desarrollo de Software. | arXiv | Agente | |
Agente Cog | CogAgent es un modelo de lenguaje visual de código abierto mejorado en base a CogVLM. | arXiv | Agente | |
Cuna | Hacia el control informático general. | Agente | ||
tripulaciónAI | Marco para orquestar agentes de IA autónomos que juegan roles. | Agente | ||
Dificar | Dify es una plataforma de creación de aplicaciones LLM de código abierto. | Agente | ||
Proyecto de vida digital | Personajes 3D autónomos con Inteligencia Social. | arXiv | Agente | |
todo-ai | ¿Su asistente de chatbot local, totalmente competente y con tecnología de inteligencia artificial? | Agente | ||
tela | fabric es un marco de código abierto para mejorar a los humanos utilizando IA. | Agente | ||
GPT rápido | FastGPT es una plataforma basada en el conocimiento construida sobre el LLM. | Agente | ||
rápidoRAG | Marco de generación y aumento de recuperación eficiente. | Agente | ||
JuegoAISDK | Marco de automatización de IA de juegos basado en imágenes. | Estructura | ||
GameNGen | Los modelos de difusión son motores de juegos en tiempo real. | arXiv | Juego | |
GameGen-O | GameGen-O: Generación de videojuegos de mundo abierto. | Juego | ||
GenAgente | GenAgent: cree sistemas de inteligencia artificial colaborativos con generación de flujo de trabajo automatizado: estudios de casos sobre ComfyUI. | arXiv | Agente | |
Agentes generativos | Simulacros interactivos del comportamiento humano. | arXiv | Agente | |
Génesis | Génesis: un motor de física universal y generativo para la robótica y más allá. | Juego | ||
Genio | Entornos Interactivos Generativos. | Juego | ||
gigax | NPC en tiempo de ejecución y con tecnología LLM. | Juego | ||
hiporag | Memoria a largo plazo inspirada neurobiológicamente para modelos de lenguaje grandes. | arXiv | Agente | |
NPC interactivos impulsados por LLM | Interactive LLM Powered NPCs es un proyecto de código abierto que transforma completamente tu interacción con personajes no jugadores (NPC) en cualquier juego. | Juego | ||
IoA | Un marco de código abierto para agentes colaborativos de IA, que permite a agentes diversos y distribuidos formar equipos y abordar tareas complejas a través de una conectividad similar a Internet. | Agente | ||
KwaiAgentes | Un sistema de agente de búsqueda de información generalizado con modelos de lenguaje grandes (LLM). | arXiv | Agente | |
LangChain | Obtenga su solicitud de LLM desde el prototipo hasta la producción. | Agente | ||
Langflow | Langflow es una interfaz de usuario para LangChain, diseñada con reaccionar-flujo para proporcionar una forma sencilla de experimentar y crear prototipos de flujos. | Agente | ||
Estudio LangGraph | LangGraph Studio ofrece una nueva forma de desarrollar aplicaciones LLM al proporcionar un IDE de agente especializado que permite la visualización, interacción y depuración de aplicaciones agentes complejas. | Agente | ||
LARP | Juego de rol de agente de lenguaje para juegos de mundo abierto. | arXiv | Agente | |
Sistema Agente Llama | Componentes agentes de las API de Llama Stack. | Agente | ||
LlamaIndex | LlamaIndex es un marco de datos para su aplicación LLM. | Agente | ||
Búsqueda mental | ? Un marco multiagente de motor de búsqueda web basado en LLM (como Perplexity.ai Pro y SearchGPT). | Agente | ||
Mezcla de Agentes (MoA) | La combinación de agentes mejora las capacidades de los modelos de lenguaje grandes. | arXiv | Agente | |
MMRol | MMRole: un marco integral para desarrollar y evaluar agentes de juego de roles multimodales. | arXiv | Agente | |
Moonlander.ai | Comience a crear juegos 3D sin codificación utilizando IA generativa. | Estructura | ||
Difusión de taza | MuG Diffusion es una IA de gráficos para juegos de ritmo basada en Stable Diffusion (uno de los modelos AIGC más potentes) con una gran modificación para incorporar ondas de audio. | Juego | ||
Oasis | Oasis es un modelo de mundo interactivo desarrollado por Decart y Etched. Basado en transformadores de difusión, Oasis toma la entrada del teclado del usuario y genera el juego de manera autorregresiva. | Juego | ||
OmAgente | Un marco de agente multimodal para resolver tareas complejas. | Agente | ||
Agentes abiertos | Una plataforma abierta para agentes lingüísticos en la naturaleza. | Agente | ||
Opus | Una aplicación de inteligencia artificial que convierte texto en un videojuego. | Juego | ||
pipagato | Marco de código abierto para voz e IA conversacional multimodal. | Agente | ||
Agente Qwen | Qwen-Agent es un marco para desarrollar aplicaciones LLM basadas en el seguimiento de instrucciones, el uso de herramientas, la planificación y las capacidades de memoria de Qwen. | Agente | ||
ragas | Ragas es un marco que le ayuda a evaluar sus tuberías de generación aumentada de recuperación (RAG). | Agente | ||
RPBench-Auto | Un canal automatizado para evaluar LLM para juegos de roles. | Juego | ||
SIMA | Un agente de IA generalista para entornos virtuales 3D. | Agente | ||
StoryGames.ai | IA para que los soñadores creen juegos. | Juego | ||
agente SWE | Las interfaces de la computadora del agente permiten modelos de lenguaje de ingeniería de software. | arXiv | Agente | |
Generación de tareas | Un marco agente basado en tareas que se basa en resultados StrictJSON de agentes LLM. | Agente | ||
Agente DIEZ | TEN Agent es el primer agente multimodal en tiempo real del mundo integrado con OpenAI Realtime API, RTC y presenta capacidades de verificación meteorológica, búsqueda web, visión y RAG. | Agente | ||
Agente de traducción | Traducción agente mediante flujo de trabajo de reflexión. | Agente | ||
Gorjeo | Twitter Personality es una aplicación web que analiza su cuenta de Twitter para crear un perfil de personalidad personalizado utilizando Wordware AI Agent. | Agente | ||
Ilimitado | Unbounded: un juego generativo infinito de simulación de vida de personajes. | arXiv | Juego | |
Video2Juego | Entorno en tiempo real, interactivo, realista y compatible con navegador desde un solo vídeo. | arXiv | Juego | |
V-IRL | Conectando la inteligencia virtual a la vida real. | arXiv | Agente | |
Agente de diseño web | Un agente utilizado para el diseño web. | Agente | ||
XAgente | Un agente autónomo de LLM para la resolución de tareas complejas. | Agente |
^ Volver al contenido ^
Fuente | Descripción | Papel | Motor de juego | Tipo |
---|---|---|---|---|
Traductor de códigos AI | Utilice IA para traducir código de un idioma a otro. | Código | ||
aiXcoder-7B | Modelo de lenguaje grande de código aiXcoder-7B. | Código | ||
bloop | bloop es un motor de búsqueda de código rápido escrito en Rust. | Código | ||
Capítulo | Intérprete de código ChatGPT en Jupyter Notebooks. | Código | ||
CódigoGeeX | Un modelo abierto de generación de código multilingüe. | arXiv | Código | |
CódigoGeeX2 | Un modelo de generación de código multilingüe más potente. | Código | ||
CódigoGeeX4 | CodeGeeX4: modelo abierto de generación de código multilingüe. | Código | ||
CódigoGen | CodeGen es un modelo de código abierto para síntesis de programas. Entrenado en TPU-v4. Competitivo con OpenAI Codex. | arXiv | Código | |
CódigoGen2 | Modelos CodeGen2 para síntesis de programas. | arXiv | Código | |
Código Llama | Code Llama es un gran modelo de lenguaje para código basado en Llama 2. | Código | ||
CódigoTF | Biblioteca de transformadores integral para LLM de código de última generación. | Código | ||
Código T5 | LLM de código abierto para comprensión y generación de código. | Código | ||
Cursor | Escriba, edite y charle sobre su código con GPT-4 en un nuevo tipo de editor. | Código | ||
Codificador DeepSeek | DeepSeek Coder: deje que el código se escriba solo. | arXiv | Código | |
Códice OpenAI | OpenAI Codex es un descendiente de GPT-3. | Código | ||
PandasAI | Pandas AI es una biblioteca de Python que integra capacidades de inteligencia artificial generativa en Pandas, haciendo que los marcos de datos sean conversacionales. | Código | ||
RobloxScripterAI | RobloxScripterAI es una herramienta de generación de código impulsada por IA para Roblox. | Roblox | Código | |
Scikit-LLM | Integre perfectamente potentes modelos de lenguaje como ChatGPT en scikit-learn para mejorar las tareas de análisis de texto. | Código | ||
sotana | El asistente de desarrollo de software de código abierto. | arXiv | Código | |
Código estable 3B | Codificación en el borde. | Código | ||
codificador estrella | ? StarCoder es un modelo de lenguaje (LM) entrenado en código fuente y texto en lenguaje natural. | arXiv | Código | |
Codificador estrella 2 | StarCoder2 es una familia de modelos de generación de código (3B, 7B y 15B), entrenados en más de 600 lenguajes de programación de The Stack v2 y algunos textos en lenguaje natural como Wikipedia, Arxiv y GitHub. | arXiv | Código | |
UnityGen IA | UnityGen AI es un complemento de generación de código impulsado por IA para Unity. | Unidad | Código | |
Vacío | Void es una alternativa de cursor de código abierto. Escriba código con las mejores herramientas de IA, mantenga el control total sobre sus datos y acceda a potentes funciones de IA. | Código |
^ Volver al contenido ^
Fuente | Descripción | Papel | Motor de juego | Tipo |
---|---|---|---|---|
Escritor de IA | La IA escribe novelas, genera artículos web de fantasía y romance, etc. Modelo generativo chino previamente entrenado. | Escritor | ||
Cuaderno.ai | Notebook.ai es un conjunto de herramientas para que escritores, diseñadores de juegos y jugadores de rol creen universos magníficos y todo lo que hay dentro de ellos. | Escritor | ||
Novedoso | Editor WYSIWYG estilo Notion con autocompletado impulsado por IA. | Escritor | ||
Novela AI | Impulsado por la IA, construye sin dolor historias únicas, cuentos emocionantes, romances seductores o simplemente tontea. | Escritor |
^ Volver al contenido ^
Fuente | Descripción | Papel | Motor de juego | Tipo |
---|---|---|---|---|
Cualquier puerta | Personalización de imágenes a nivel de objeto de disparo cero. | arXiv | Imagen | |
Cualquier texto | Generación y edición de texto visual multilingüe. | arXiv | Imagen | |
Autoestudio | Elaboración de temas consistentes en la generación de imágenes interactivas de múltiples turnos. | arXiv | Imagen | |
Blender-ControlNet | Usando ControlNet directamente en Blender. | Licuadora | Imagen | |
brivl | Modelo puente entre visión y lenguaje. | arXiv | Imagen | |
GatoVTON | CatVTON: La concatenación es todo lo que necesita para una prueba virtual con modelos de difusión. | arXiv | Imagen | |
CLIPasso | Un método para convertir una imagen de un objeto en un boceto, lo que permite distintos niveles de abstracción. | arXiv | Imagen | |
ClipDrop | Crea imágenes impresionantes en segundos. | Imagen | ||
Cómoda interfaz de usuario | Una GUI de difusión estable, potente y modular con una interfaz de gráfico/nodos. | Imagen | ||
ConceptoLab | Generación creativa utilizando restricciones previas de difusión. | arXiv | Imagen | |
ControlNet | ControlNet es una estructura de red neuronal para controlar modelos de difusión agregando condiciones adicionales. | arXiv | Imagen | |
CSGO | CSGO: composición de estilo de contenido en generación de texto a imagen. | arXiv | Imagen | |
DALL·E 2 | DALL·E 2 es un sistema de inteligencia artificial que puede crear imágenes y arte realistas a partir de una descripción en lenguaje natural. | Imagen | ||
Estudio Dashtoon | Dashtoon Studio es una plataforma de creación de cómics impulsada por IA. | Cómic | ||
IA profunda | DeepAI ofrece un conjunto de herramientas que utilizan IA para mejorar su creatividad. | Imagen | ||
DeepFloyd SI | IF por DeepFloyd Lab en StabilityAI. | Imagen | ||
Profundidad Cualquier cosa V2 | Profundidad Cualquier cosa V2 | arXiv | Imagen | |
Biblioteca de mapas de profundidad y poser | Biblioteca de mapas de profundidad para usar con la extensión Control Net para Automatic1111/stable-diffusion-webui. | Imagen | ||
Difuso para elegir | Enriquecimiento de la pintura condicionada de imágenes en modelos de difusión latente para prueba virtual. | arXiv | Imagen | |
Difusión Discoteca | Una fusión frankensteiniana de cuadernos, modelos y técnicas para la generación de Arte y Animaciones con IA. | Imagen | ||
ArrastrarGAN | Manipulación interactiva basada en puntos en la variedad de imágenes generativas. | arXiv | Imagen | |
dibujar cosas | Generación de imágenes asistida por IA en Your Pocket. | Imagen | ||
DWPose | Estimación efectiva de la postura de todo el cuerpo con destilación en dos etapas. | arXiv | Imagen | |
Foto fácil | Tu generador de fotos inteligente con IA. | Imagen | ||
Flujo | Este repositorio contiene un código de inferencia mínimo para ejecutar texto a imagen e imagen a imagen con nuestros transformadores de flujo rectificado latente Flux. | Imagen | ||
Sigue tu clic | Animación de imágenes regionales de dominio abierto mediante indicaciones breves. | arXiv | Imagen | |
Fooocus | Concéntrese en incitar y generar. | Imagen | ||
GIFfusión | Cree GIF y vídeos mediante difusión estable. | Imagen | ||
Segmento conectado a tierra cualquier cosa | Detecte, segmente y genere automáticamente cualquier cosa con entradas de imagen, texto y audio. | arXiv | Imagen | |
HivisionIDFotos | HivisionIDPhotos: una herramienta ligera y eficiente para fotografías de identificación con IA. | Imagen | ||
hua | Hua es un editor de imágenes de IA con difusión estable (y más). | Imagen | ||
Hunyuan-DiT | Un potente transformador de difusión de resolución múltiple con un conocimiento chino detallado. | arXiv | Imagen | |
Luz IC | IC-Light es un proyecto para manipular la iluminación de imágenes. | Imagen | ||
Ideograma | Ayudar a las personas a ser más creativas. | Imagen | ||
Imagen | Imagen es un sistema de inteligencia artificial que crea imágenes fotorrealistas a partir de texto ingresado. | Imagen | ||
img2img-turbo | Imagen a imagen en un solo paso con SD-Turbo. | Imagen | ||
Img2Prompt | Reciba indicaciones de imágenes generadas por difusión estable. | Imagen | ||
Infinidad | Infinity: modelado autorregresivo bit a escala para síntesis de imágenes de alta resolución. | arXiv | Imagen | |
ID instantánea | Generación de preservación de identidad de disparo cero en segundos. | arXiv | Imagen | |
PasanteLM-XComposer2 | InternLM-XComposer2 es un innovador modelo de visión y lenguaje de gran tamaño (VLLM) que se destaca en la composición y comprensión de imágenes y texto de forma libre. | arXiv | Imagen | |
COALA | La autoatención importa en la destilación del conocimiento de modelos de difusión latente para una síntesis de imágenes rápida y eficiente en la memoria. | Imagen | ||
colores | Kolors: entrenamiento eficaz del modelo de difusión para la síntesis fotorrealista de texto a imagen. | Imagen | ||
KREA | Genere imágenes y vídeos con una encantadora herramienta de diseño impulsada por IA. | Imagen | ||
Puente LaVi | Uniendo diferentes modelos de lenguaje y modelos de visión generativa para la generación de texto a imagen. | arXiv | Imagen | |
CapaDifusión | Difusión de capas de imágenes transparentes mediante transparencia latente. | arXiv | Imagen | |
léxica | Una Difusión Estable solicita el motor de búsqueda. | Imagen | ||
LlamaGen | El modelo autorregresivo supera a la difusión: llama para la generación de imágenes escalables. | arXiv | Imagen | |
Lumina-mGPT | Lumina-mGPT: Ilumine la generación flexible de texto a imagen fotorrealista con preentrenamiento generativo multimodal. | arXiv | Imagen | |
metadisparar | MetaShoot es un gemelo digital de un estudio fotográfico, desarrollado como un complemento para Unreal Engine que brinda a cualquier creador la capacidad de producir renderizados altamente realistas de la manera más fácil y rápida. | Motor irreal | Imagen | |
A mitad del viaje | Midjourney es un laboratorio de investigación independiente que explora nuevos medios de pensamiento y amplía los poderes imaginativos de la especie humana. | Imagen | ||
MIGC | MIGC: Controlador de generación de instancias múltiples para síntesis de texto a imagen. | arXiv | Imagen | |
MimicBrush | Edición de imágenes Zero-shot con imitación de referencia. | arXiv | Imagen | |
OmniGen | OmniGen: Generación de imágenes unificadas. | arXiv | Imagen | |
omost | Omost es un proyecto para convertir la capacidad de codificación de LLM en capacidad de generación de imágenes (o más exactamente, composición de imágenes). | Imagen | ||
Editor abierto | Openpose Editor para webui de difusión estable de AUTOMATIC1111. | Imagen | ||
Atuendo a cualquiera | Prueba virtual de altísima calidad para cualquier ropa y cualquier persona. | Imagen | ||
PinturasDeshacer | PaintsUndo: un modelo base de comportamientos de dibujo en pinturas digitales. | Imagen | ||
creador de fotos | Personalización de fotografías humanas realistas mediante la incrustación de ID apilados. | arXiv | Imagen | |
sala de fotos | Generador de fondo de IA. | Imagen | ||
Plask | Generación de imágenes de IA en la nube. | Imagen | ||
Prompt.Art | El centro de generadores. | Imagen | ||
PULID | Personalización de Pure y Lightning ID mediante alineación contrastiva. | arXiv | Imagen | |
Texto enriquecido a imagen | Generación expresiva de texto a imagen con texto enriquecido. | arXiv | Imagen | |
RPG-DifusiónMaster | Dominar la difusión de texto a imagen: recaptación, planificación y generación con LLM multimodales (PRG). | Imagen | ||
Historia de SEMILLAS | SEED-Story: Generación multimodal de historias largas con un modelo de lenguaje grande. | arXiv | Imagen | |
Segmentar cualquier cosa | Segment Anything Model (SAM): un nuevo modelo de IA de Meta AI que puede "recortar" cualquier objeto, en cualquier imagen, con un solo clic. | arXiv | Imagen | |
Segmentar cualquier cosa modelo 2 (SAM 2) | SAM 2: segmenta cualquier cosa en imágenes y vídeos. | arXiv | Imagen | |
sd-webui-controlnet | Extensión WebUI para ControlNet. | Imagen | ||
SDXL-Rayo | Destilación por difusión adversa progresiva. | arXiv | Imagen | |
SDXS | Modelos de difusión latente de un paso en tiempo real con condiciones de imagen. | Imagen | ||
Estable.art | Complemento de Photoshop para Stable Diffusion con Automatic1111 como backend (localmente o con Google Colab). | Imagen | ||
Cascada estable | Stable Cascade consta de tres modelos: Stage A, Stage B y Stage C, que representan una cascada para generar imágenes, de ahí el nombre "Stable Cascade". | Imagen | ||
Difusión estable | Un modelo latente de difusión de texto a imagen. | Imagen | ||
difusión-estable.cpp | Difusión estable en C/C++ puro. | Imagen | ||
Interfaz de usuario web de difusión estable | Una interfaz de navegador basada en la biblioteca Gradio para Difusión Estable. | Imagen | ||
Interfaz de usuario web de difusión estable | UI basada en web para difusión estable. | Imagen | ||
Difusión estable WebUI chino | Versión china de stable-diffusion-webui. | Imagen | ||
Difusión estable XL | Genera imágenes a partir de texto. | arXiv | Imagen | |
Difusión estable XL Turbo | Generación de texto a imagen en tiempo real. | Imagen | ||
Difusión estable 3.5 | La versión abierta de Stable Diffusion 3.5 incluye múltiples variantes de modelo, incluidos Stable Diffusion 3.5 Large y Stable Diffusion 3.5 Large Turbo. | Imagen | ||
Garabato estable | Stable Doodle es una herramienta de boceto a imagen que convierte un dibujo simple en una imagen dinámica. | Imagen | ||
Estudio estable | StableStudio de Stability AI | Imagen | ||
Creador de historias | StoryMaker: hacia personajes holísticos y consistentes en la generación de texto a imagen. | arXiv | Imagen | |
CorrienteDifusión | Una solución a nivel de canalización para la generación interactiva en tiempo real. | Imagen | ||
Caída de estilo | Generación de texto a imagen en cualquier estilo. | arXiv | Imagen | |
SincronizaciónDreamer | Generación de imágenes coherentes con múltiples vistas a partir de una imagen de vista única. | arXiv | Imagen | |
UltraEditar | UltraEdit: edición de imágenes detallada a escala basada en instrucciones. | arXiv | Imagen | |
Ultrapíxel | UltraPixel: avance de la síntesis de imágenes de resolución ultraalta a nuevos picos. | arXiv | Imagen | |
Difusión estable de Unity ML | Difusión estable de Core ML en Unity. | Unidad | Imagen | |
Visiones vispunk | Plataforma de generación de texto a imagen. | Imagen |
^ Volver al contenido ^
Fuente | Descripción | Papel | Motor de juego | Tipo |
---|---|---|---|---|
CRM | Imagen única a malla texturizada 3D con modelo de reconstrucción convolucional. | arXiv | Textura | |
Alfombra de ensueño | Generación de materiales PBR de alta calidad con modelos de difusión sensibles a la geometría y la luz. | arXiv | Textura | |
Espacio de ensueño | Soñando con el espacio de su habitación con propagación de texturas panorámicas basada en texto. | Textura | ||
Texturas de ensueño | Difusión estable integrada en Blender. Crea texturas, arte conceptual, recursos de fondo y más con un simple mensaje de texto. | Licuadora | Textura | |
Instruir a los humanos | Edición de texturas humanas animadas en 3D con instrucciones. | arXiv | Textura | |
InteX | Síntesis interactiva de texto a textura a través de Inpainting unificado con reconocimiento de profundidad. | arXiv | Textura | |
LLaMA-Malla | LLaMA-Mesh: Unificando la generación de mallas 3D con modelos de lenguaje. | arXiv | Malla | |
MaterialSeg3D | MaterialSeg3D: segmentación de materiales densos a partir de antecedentes 2D para activos 3D. | arXiv | Textura | |
MallaCualquier cosa | MaterialSeg3D: segmentación de materiales densos a partir de antecedentes 2D para activos 3D. | arXiv | Malla | |
Neuralangelo | Reconstrucción de la superficie neuronal de alta fidelidad. | arXiv | Textura | |
pintarlo | Síntesis de texto a textura mediante optimización de mapas de texturas convolucionales profundas y renderizado basado en física. | Textura | ||
policam | Crea tus propias texturas 3D con solo escribir. | Textura | ||
TexFusion | Sintetizando texturas 3D con modelos de difusión de imágenes guiadas por texto. | arXiv | Textura | |
Texto2Tex | Síntesis de texturas basada en texto mediante modelos de difusión. | arXiv | Textura | |
Laboratorio de texturas | Texturas generadas por IA. Puedes generar el tuyo propio con un mensaje de texto. | Textura | ||
Con poli | Crea texturas con Poly. Genere materiales 3D con IA en un editor en línea gratuito o busque en nuestra creciente biblioteca comunitaria. | Textura | ||
malla X | X-Mesh: hacia una estilización 3D basada en texto rápida y precisa mediante guía textual dinámica. | arXiv | Textura |
^ Volver al contenido ^
Fuente | Descripción | Papel | Motor de juego | Tipo |
---|---|---|---|---|
Sombreador de IA | Generador de sombreadores impulsado por ChatGPT para Unity. | Unidad | sombreador |
^ Volver al contenido ^
Fuente | Descripción | Papel | Motor de juego | Tipo |
---|---|---|---|---|
Animar3D | Animate3D: animación de cualquier modelo 3D con difusión de vídeo multivista. | arXiv | 3D | |
Cualquier cosa-3D | Segmentar-cualquier cosa + 3D. Elevemos cualquier cosa a 3D. | arXiv | Modelo | |
Cualquier2punto | Any2Point: potenciando modelos grandes de cualquier modalidad para una comprensión 3D eficiente. | arXiv | 3D | |
licuadoraGPT | Utilice comandos en inglés para controlar Blender con GPT-4 de OpenAI. | Licuadora | Modelo | |
Blender-GPT | Un asistente de Blender todo en uno con tecnología GPT3/4 + integración Whisper. | Licuadora | Modelo | |
Laboratorios de bloqueo | La alquimia digital es real con Skybox Lab, la solución definitiva impulsada por IA para generar increíbles experiencias de skybox de 360° a partir de indicaciones de texto. | Modelo | ||
CF-3DGS | Salpicadura gaussiana 3D sin COLMAP. | arXiv | 3D | |
Generación de personajes | CharacterGen: generación eficiente de personajes en 3D a partir de imágenes individuales con canonicalización de poses de múltiples vistas. | arXiv | 3D | |
chatGPT-maya | Herramienta Maya sencilla que utiliza IA abierta para realizar tareas básicas basadas en instrucciones descriptivas. | maya | Modelo | |
ciudaddreamer | Modelo generativo composicional de ciudades 3D ilimitadas. | arXiv | 3D | |
CSM | Genera mundos 3D a partir de imágenes y vídeos. | 3D | ||
Estrellarse | Tu copiloto para la construcción de mundos en Unreal Engine. | Motor irreal | 3D | |
catalizador de sueños | DreamCatalyst: edición 3D rápida y de alta calidad mediante el control de la editabilidad y la preservación de la identidad. | arXiv | 3D | |
SueñoGaussian4D | Salpicadura gaussiana generativa 4D. | arXiv | 4D | |
DUSt3R | Visión geométrica 3D simplificada. | arXiv | 3D | |
Edificar 3D | Edify 3D: generación de activos 3D escalables de alta calidad. | arXiv | 3D | |
GALA3D | GALA3D: Hacia la generación de escenas complejas de texto a 3D mediante salpicaduras gaussianas generativas guiadas por diseño. | arXiv | 3D | |
Ctrl Gauss | GaussCtrl: Edición de salpicaduras gaussianas 3D basada en texto coherente y multivista. | arXiv | 3D | |
Cubo gaussiano | Una representación de radiación estructurada y explícita para el modelado generativo 3D. | arXiv | 3D | |
Soñador gaussiano | Generación rápida de texto a salpicaduras gaussianas 3D con prioridades de nube de puntos. | arXiv | 3D | |
GenieLabs | Potencia tu juego con AI-UGC. | 3D | ||
Hola FA | Texto a 3D de alta fidelidad con guía de difusión avanzada. | Modelo | ||
HoloDreamer | HoloDreamer: Generación holística de mundos panorámicos en 3D a partir de descripciones de texto. | arXiv | 3D | |
Hunyuan3D-1.0 | Hunyuan3D-1.0: un marco unificado para la generación de texto a 3D e imagen a 3D. | arXiv | 3D | |
Infinito | Mundos fotorrealistas infinitos mediante generación procedimental. | arXiv | 3D | |
Instruir-NeRF2NeRF | Edición de escenas 3D con instrucciones. | arXiv | Modelo | |
Interactivo3D | Crea lo que quieras mediante la generación 3D interactiva. | arXiv | 3D | |
Isotrópico3D | Generación de imagen a 3D basada en una única incrustación de CLIP. | 3D | ||
LATTE3D | Síntesis 3D mejorada de texto amortizado a gran escala. | arXiv | 3D | |
LEÓN | Modelos de difusión de puntos latentes para generación de formas 3D. | arXiv | Modelo | |
Luma IA | Capture en 3D realista. Fotorrealismo, reflejos y detalles inigualables. ¡El futuro de VFX es ahora, para todos! | Modelo | ||
lumina AI | Creatividad impulsada por la IA. | 3D | ||
Hazlo-3D | Creación 3D de alta fidelidad a partir de una única imagen con difusión previa. | arXiv | Modelo | |
mallado | Crea impresionantes recursos de juegos en 3D con IA. | 3D | ||
movimiento | Creador de animaciones mágicas con IA en 3D. | 3D | ||
MVDream | Difusión multivista para generación 3D. | arXiv | 3D | |
NeRF instantáneo de NVIDIA | Primitivas de gráficos neuronales instantáneos: NeRF ultrarrápido y más. | Modelo | ||
Uno-2-3-45 | Cualquier imagen única a malla 3D en 45 segundos sin optimización por forma. | arXiv | Modelo | |
pintura3d | Pinte cualquier cosa en 3D con modelos de difusión de texturas sin iluminación. | arXiv | 3D | |
PÁNICO-3D | Reconstrucción 3D estilizada de vista única a partir de retratos de personajes de anime. | arXiv | Modelo | |
Punto·E | Difusión de nubes de puntos para síntesis de modelos 3D. | Modelo | ||
Soñador prolífico | Generación diversa y de alta fidelidad de texto a 3D con destilación de partituras variacionales. | arXiv | Modelo | |
SF3D | SF3D: Reconstrucción de malla 3D rápida y estable con desenvolvimiento UV y desenredo de iluminación. | arXiv | 3D | |
Forma | Genera objetos 3D condicionados a texto o imágenes. | arXiv | Modelo | |
Sloyd | El modelado 3D nunca ha sido tan fácil. | Modelo | ||
IA estriada | El poder de la IA está llegando a la tercera dimensión. Genere objetos, animaciones y texturas mediante indicaciones. | Modelo | ||
Fusión de sueños estable | Una implementación de pytorch del modelo de texto a 3D Dreamfusion, impulsado por el modelo de texto a 2D de Stable Diffusion. | Modelo | ||
SV3D | Nueva síntesis de vistas múltiples y generación 3D a partir de una sola imagen mediante difusión de video latente. | arXiv | 3D | |
Tafí | Texto AI a motor de personajes 3D. | Modelo | ||
3D-GPT | Modelado 3D procedimental con modelos de lenguaje grandes. | arXiv | 3D | |
3D-LLM | Inyectando el mundo 3D en modelos de lenguaje grandes. | arXiv | 3D | |
3Dpresso | Extraiga un modelo 3D de un objeto, capturado en un vídeo. | Modelo | ||
3DTopia | Generación de texto a 3D en 5 minutos. | arXiv | 3D | |
3DTopia-XL | 3DTopia-XL: ampliación de la generación de activos 3D de alta calidad mediante difusión primitiva. | arXiv | 3D | |
tresestudio | Un marco unificado para la generación de contenido 3D. | Modelo | ||
TripoSR | Un modelo de código abierto de última generación para una rápida reconstrucción 3D anticipada a partir de una única imagen. | arXiv | Modelo | |
Único3D | Generación de mallas 3D eficiente y de alta calidad a partir de una única imagen. | arXiv | 3D | |
UnidadGaussianoSalpicaduras | Visualización de Toy Gaussian Splatting en Unity. | Unidad | 3D | |
ViVid-1-a-3 | Síntesis de vistas novedosas con modelos de difusión de vídeo. | arXiv | 3D | |
Voxcraft | Elaboración de modelos 3D listos para usar con IA. | 3D | ||
maravilla3d | Imagen única a 3D mediante difusión entre dominios. | arXiv | 3D | |
Cero 1 a 3 | Toma cero de una imagen a un objeto 3D. | arXiv | Modelo |
^ Volver al contenido ^
Fuente | Descripción | Papel | Motor de juego | Tipo |
---|---|---|---|---|
AniRetrato | Síntesis basada en audio de animaciones de retratos fotorrealistas. | arXiv | Avatar | |
CALMA | Modelos latentes adversarios condicionales para personajes virtuales direccionables. | arXiv | Avatar | |
ChatAvatar | Generación progresiva de caras 3D animables bajo guía de texto. | Avatar | ||
chatdollkit | ChatdollKit te permite convertir tu modelo 3D en un chatbot. | Unidad | Avatar | |
charla de ensueño | Cuando la generación de cabeza parlante expresiva cumple con los modelos probabilísticos de difusión. | arXiv | Avatar | |
Duix | DUIX - ¿SDK digital humano basado en silicio? | Avatar | ||
Ecomímico | Echomimic: animaciones de retratos dirigidas por audio realistas a través de condiciones de referencia editables. | arXiv | Avatar | |
Emopordratos | Avatares de cabeza multimodal de una sola vez mejoradas con emociones. | Avatar | ||
E3 Gen | Generación de avatares eficientes, expresivos y editables. | arXiv | Avatar | |
Exavato | EXAVATAR - AVATAR GAUSSIANO 3D EXPRESIVO BURDO 3D. | arxiv | Avatar | |
Geneavatar | Edición de avatar de cabeza volumétrica de expresión genérica desde una sola imagen. | arXiv | Avatar | |
GENEFACE ++ | Generación generalizada en 3D en tiempo real generalizada y estable. | Avatar | ||
Hola | Síntesis visual jerárquica impulsada por audio para la animación de imágenes de retratos. | arXiv | Avatar | |
Hallo2 | Hallo2: animación de imagen de retrato de larga duración y alta resolución impulsada por audio. | arxiv | Avatar | |
Escultura | Crafting Avatares de cabeza 3D con texto. | arxiv | Avatar | |
Intrínsica | Intrinsicavatar: representación inversa de base física de humanos dinámicos de videos monoculares a través del trazado de rayos explícitos. | arxiv | Avatar | |
Tallador | Sistema de conversación de avatar digital. | Avatar | ||
VivorTrait | LivePorTrait: animación eficiente de retratos con costuras y control de reorientación. | arxiv | Avatar | |
Motiongpt | El movimiento humano como idioma extranjero, un modelo de generación de lenguaje de movimiento unificado que utiliza LLM. | arXiv | Avatar | |
Musepose | Musepose: un marco de imagen a video impulsado por pose para la generación humana virtual. | Avatar | ||
Musetalk | Sincronización de labios de alta calidad en tiempo real con el espacio latente en el espacio. | Avatar | ||
Museva | Generación de videos humanos virtuales de longitud infinita y de alta fidelidad con descenso paralelo visual condicionado. | Avatar | ||
Retrat4d | Aprendiendo la síntesis de avatar de cabeza 4D de una sola oportunidad utilizando datos sintéticos. | arxiv | Avatar | |
Ready Player Me | Integre avatares personalizables en su juego o aplicación en días. | Avatar | ||
Rótula | Rodinhd: generación de avatar 3D de alta fidelidad con modelos de difusión. | arxiv | Avatar | |
Styleavatar3d | Aprovechando los modelos de difusión de texto de imagen para la generación de avatar 3D de alta fidelidad. | arxiv | Avatar | |
Text2Control3d | Generación de avatar 3D controlable en campos de radiancia neuronal utilizando el modelo de difusión de texto a imagen guiado por geometría. | arxiv | Avatar | |
Topo4d | Splatting gaussiano que presenta topología para captura de cabeza 4D de alta fidelidad. | arXiv | Avatar | |
Unityaiwithchatgpt | Basado en Unity, se realiza ChatGPT+UnityChan Voice Interactive Display. | Unidad | Avatar | |
Vid2avatar | Reconstrucción de Avatar 3D de Videos en la naturaleza a través de la descomposición de la escena auto-supervisada. | arxiv | Avatar | |
VLOGGER | Difusión multimodal para la síntesis de avatar incorporada. | Avatar | ||
Wild2avatar | Renderizando a los humanos detrás de las oclusiones. | arxiv | Avatar |
^ Volver al contenido ^
Fuente | Descripción | Papel | Motor de juego | Tipo |
---|---|---|---|---|
Animar a cualquiera | Síntesis de imagen a video consistente y controlable para la animación de personajes. | arxiv | Animación | |
Animateanything | Animación de imagen de dominio abierto de grano fino con orientación de movimiento. | arxiv | Animación | |
Animado | Anime sus modelos personalizados de difusión de texto a imagen sin un ajuste específico. | arxiv | Animación | |
Animatelcm | ¡Aceleremos la generación de videos en 4 pasos! | arXiv | Animación | |
Animado-x | Animate-X: animación de imagen de personaje universal con representación de movimiento mejorado. | arxiv | Animación | |
Animatezero | Los modelos de difusión de video son animadores de imágenes de cero disparos. | arxiv | Animación | |
Animationgpt | Una herramienta AIGC para generar activos de movimiento de combate de juegos. | Animación | ||
Deforum | Deforum aprovecha la difusión estable para generar imágenes de IA en evolución. | Animación | ||
Empinamiento de dibujos | Dibujos de dibujo: animación 3D de dibujos de un solo personaje. | arxiv | Animación | |
Dreamoving | Un marco de generación de videos humanos basado en modelos de difusión. | arxiv | Animación | |
Fusión | Swapper y potenciador de la próxima generación. | Animación | ||
FreeInit | Puente de la brecha de inicialización en modelos de difusión de video. | arxiv | Animación | |
Género | Síntesis de cara parlante 3D generalizada y de alta fidelidad. | arxiv | Animación | |
Animador de identificación | Generación de videos humanos que preservan la identidad de la identidad cero. | arXiv | Animación | |
Mágico | Animación de imagen humana temporalmente consistente utilizando el modelo de difusión. | arxiv | Animación | |
Nuwa | Dragnuwa es un modelo de generación de video basado en el dominio abierto que toma los controles de texto, imagen y trayectoria como entradas para lograr la generación de videos controlables. | arxiv | Animación | |
Nuwa-infinidad | Nuwa-Infinity es un modelo generativo multimodal que está diseñado para generar imágenes y videos de alta calidad a partir de texto de texto, imagen o video. | Animación | ||
Nuwa-xl | Una nueva difusión sobre arquitectura de difusión para una generación de videos extremadamente larga. | Animación | ||
Animación Omni | AI generó animaciones de alta fidelidad. | Animación | ||
PIA | Su animador de imagen personalizado a través de módulos plug-and-play en modelos de texto a imagen. | arxiv | Animación | |
Sadtalker | Aprendiendo coeficientes de movimiento 3D realistas para la animación estilizada de la cara de la imagen de una sola imagen con audio. | arxiv | Animación | |
Sadtalker-video-lip-sincronización | Este proyecto se basa en Sadtalkers Wav2Lip para la síntesis de labios de video. | Animación | ||
Animación estable | Una poderosa herramienta de texto a animación para desarrolladores. | Animación | ||
Talecrafter | Una herramienta de visualización de historias interactiva que admite múltiples personajes. | arxiv | Animación | |
Tooncrafter | Tooncrafter: interpolación generativa de dibujos animados. | arxiv | Animación | |
Wav2lip | Videos de sincronización de labios con precisión en la naturaleza. | arxiv | Animación | |
Estudio de maravilla | Una herramienta de IA que anima, enciende y compone los personajes CG automáticamente en una escena de acción en vivo. | Animación |
^ Volver al contenido ^
Fuente | Descripción | Papel | Motor de juego | Tipo |
---|---|---|---|---|
Cambrian-1 | Cambrian-1: una exploración completamente abierta y centrada en la visión de LLM multimodales. | arxiv | LLM multimodal | |
Cogvlm2 | Modelo multimodal de código abierto de nivel GPT4V basado en LLAMA3-8B. | Visual | ||
Cotracker | Es mejor rastrear juntos. | arXiv | Visual | |
Evf-sam | EVF-SAM: fusión temprana del idioma de visión para el segmento prometido por el texto de cualquier modelo. | arxiv | Visual | |
Facehi | Es mejor rastrear juntos. | Visual | ||
Internlm-xComposer2 | Internlm-xComposer2 es un innovador modelo grande de visión (VLLM) que sobresale en la composición y comprensión de la imagen de texto de forma libre. | arxiv | Visual | |
Canguro | Kangaroo: un potente modelo de video que admite la entrada de video con contexto largo. | Visual | ||
LGVI | Hacia el video de video basado en el lenguaje a través de modelos de lenguaje grande multimodal. | Visual | ||
Llava ++ | Extendiendo las capacidades visuales con LLAMA-3 y PHI-3. | Visual | ||
Llava-Anevisión | Llava-Anevision: transferencia fácil de tareas visuales. | arxiv | Visual | |
Longva | Transferencia de contexto largo de lenguaje a visión. | arxiv | Visual | |
Maskvit | Prioridad visual enmascarada para la predicción de video. | arxiv | Visual | |
Minicpm-llama3-v 2.5 | Un nivel de nivel GPT-4V en su teléfono. | Visual | ||
Moe-llava | Mezcla de expertos para grandes modelos en idioma de visión. | arxiv | Visual | |
Motionllm | Comprender los comportamientos humanos a partir de movimientos y videos humanos. | arxiv | Visual | |
Pllava | Extensión de Llava sin parámetros de imágenes a videos para subtítulos en video. | arxiv | Visual | |
Qwen-vl | Un modelo versátil en idioma de visión para comprensión, localización, lectura de texto y más allá. | arxiv | Visual | |
Sapiens | Sapiens: base para modelos de visión humana. | arxiv | Visual | |
ShareGPT4V | Mejora de grandes modelos multimodales con mejores subtítulos. | arxiv | Visual | |
SOLO | Solo: un solo transformador para modelado en idioma de visión escalable. | arxiv | Visual | |
Videocam | Video-CCAM: Advancing Video-Language Entendimiento con máscaras de atención cruzada causales. | Visual | ||
Video-llava | Aprendiendo la representación visual unida por alineación antes de la proyección. | arxiv | Visual | |
Videollama 2 | Avance de modelado espacial-temporal y comprensión de audio en Video-LLMS. | arxiv | Visual | |
Videocams | El primer punto de referencia de evaluación integral de los LLM multimodales en el análisis de video. | arxiv | Visual | |
Vitron | Un Pixel-Level Vision LLM unificado para comprender, generar, segmentar, editar. | Visual | ||
Vila | VILA: Sobre la capacitación previa para modelos de lenguaje visual. | arXiv | Visual |
^ Volver al contenido ^
Fuente | Descripción | Papel | Motor de juego | Tipo |
---|---|---|---|---|
360dvd | Generación de video panorama controlable con modelo de difusión de video de 360 grados. | arxiv | Video | |
Animate-a-story | Generación de videos de recuperación de recuperación para contar una historia. | arxiv | Video | |
Cualquier cosa en cualquier escena | Inserción de objeto de video fotorrealista. | Video | ||
Arte • V | Generación de texto a video automático con modelos de difusión. | arxiv | Video | |
Asistencia | Conozca la plataforma de video generativa que da vida a sus ideas. | Video | ||
Atomovideo | Generación de imagen a video de alta fidelidad. | arxiv | Video | |
Backgroundremover | El removedor de fondo le permite eliminar el fondo de las imágenes y el video utilizando AI con una interfaz de línea de comandos simple que es gratuita y de código abierto. | Video | ||
Boximator | Generando movimientos ricos y controlables para la síntesis de video. | arxiv | Video | |
CODEF | Campos de deformación de contenido para procesamiento de video temporalmente consistente. | arxiv | Video | |
Cogvideo | Genere videos a partir de descripciones de texto. | Video | ||
Cogvideox | Cogvideox es una versión de código abierto del modelo de generación de videos, que es homólogo a 清影. | Video | ||
Cogvlm | COGVLM es un poderoso modelo de lenguaje visual de código abierto (VLM). | Visual | ||
Conr | Generado videos de baile vívido de hojas de personajes de anime dibujados a mano (ACS). | arxiv | Video | |
Decohere | Crea lo que no se puede filmar. | Video | ||
Descripción | Descript es la forma simple, potente y divertida de editar. | Video | ||
Difunto | Sombreado de toón editable de alta resolución a través de modelos de difusión. | arXiv | Video | |
delfín | Plataforma general de interacción de video basada en LLM. | Video | ||
DomoAI | Amplifique su creatividad con Domoai. | Video | ||
Dreamcinema | DreamCinema: transferencia cinematográfica con cámara gratuita y carácter 3D. | arxiv | Video | |
DynamicRafter | Animando imágenes de dominio abierto con prioras de difusión de video. | arxiv | Video | |
BORDE | Introducimos Edge, un método poderoso para la generación de danza editable que es capaz de crear bailes realistas y físicamente planibles mientras sigue siendo fiel a la música de entrada arbitraria. | arxiv | Video | |
emo | EMOTE Retrato Alive - Generación de videos de retratos expresivos con modelo de difusión Audio2Video en condiciones débiles. | arxiv | Video | |
Video de EMU | Factorizando la generación de texto a video por acondicionamiento explícito de la imagen. | Video | ||
Etna | ETNA puede generar contenido de video correspondiente basado en descripciones de texto cortas. | Video | ||
Hada | Síntesis rápida de video a video guiada por instrucciones paralelizadas. | Video | ||
Sigue a tu canvas | Siga a su canvas: superación de video de mayor resolución con una generación de contenido extensa. | arxiv | Video | |
Sigue tu pose | Generación de texto a video guiada por pose utilizando videos sin pose. | arxiv | Video | |
Parto | Su conjunto completo de herramientas de creación de IA a su alcance. | Video | ||
Gen-2 | Un sistema de IA multimodal que puede generar videos novedosos con texto, imágenes o videoclips. | Video | ||
Dinámica generativa | Dinámica de imagen generativa. | Video | ||
Genio | Entornos interactivos generativos. | arxiv | Video | |
Genmo | Hacer mágicamente videos con AI. | Video | ||
Gentrón | Transformadores de difusión para la generación de imágenes y videos. | Video | ||
Higen | Desacoplamiento espacio-temporal jerárquico para la generación de texto a video. | Video | ||
Hotshot-xl | HotShot-XL es un modelo de texto de IA a GIF entrenado para trabajar junto con la difusión estable XL. | Video | ||
Hunyuanvideo | Hunyuanvideo: un marco sistemático para un gran modelo de generación de videos. | arXiv | Video | |
Video de Imagen | Dado un mensaje de texto, Imagen Video genera videos de alta definición utilizando un modelo de generación de videos base y una secuencia de modelos de súper resolución espaciales y temporales intercalados. | Video | ||
Instructvideo | Instruir modelos de difusión de video con retroalimentación humana. | arxiv | Video | |
I2vgen-xl | Síntesis de imagen a video de alta calidad a través de modelos de difusión en cascada. | arxiv | Video | |
Lavie | Generación de videos de alta calidad con modelos de difusión latente en cascada. | arxiv | Video | |
LTX Studio | LTX Studio es una plataforma holística de cine impulsada por IA para creadores, vendedores, cineastas y estudios. | Video | ||
Video ltx | LTX-Video es el primer modelo de generación de videos basado en DIT que puede generar videos de alta calidad en tiempo real. Puede generar videos de 24 fps a la resolución 768x512, más rápido de lo que se necesita para verlos. | Video | ||
Lumière | Un modelo de difusión de espacio-tiempo para la generación de videos. | arxiv | Video | |
LVDM | Modelos de difusión de video latente para la generación de videos largos de alta fidelidad. | arxiv | Video | |
Magicvideo | Generación de videos eficientes con modelos de difusión latente. | arxiv | Video | |
MagicVideo-V2 | Generación de videos de alto nivel de estadio múltiple. | arxiv | Video | |
Hora Mágica | AI Video para creadores hizo simple. | Video | ||
Magvit-V2 | Tokenizer es clave para la generación visual. | Video | ||
Magvit | Transformador de video generativo enmascarado. | Video | ||
Video | Make-A-Video es un sistema AI de última generación que genera videos a partir de texto. | arxiv | Video | |
Haz bailar píxeles | Generación de videos de alta dinámica. | arxiv | Video | |
Hacer tu video | Generación de videos personalizados utilizando orientación textual y estructural. | arxiv | Video | |
Microcinema | Un enfoque de división y conquista para la generación de texto a video. | arxiv | Video | |
MIMO | MIMO: síntesis de video de caracteres controlable con modelado espacial descompuesto. | arxiv | Video | |
Mini-gemini | Minería el potencial de los modelos de lenguaje de visión multimodalidad. | Visión | ||
MobileVidFactory | Generación automática de videos de redes sociales basadas en difusión para dispositivos móviles a partir de texto. | Video | ||
Mochi 1 | Mochi 1 es un modelo de generación de videos de vanguardia abierto con movimiento de alta fidelidad y una fuerte adherencia rápida en la evaluación preliminar. | Video | ||
Mofa-video | Animación de imagen controlable a través de adaptaciones de campo de movimiento generativo en el modelo de difusión de imagen a video congelado. | arxiv | Video | |
MoneyPrinterturbo | Use modelos grandes para generar videos cortos con un solo clic. | Video | ||
Valley de luna | Moonvalley es un nuevo y innovador modelo de IA generativo de texto a video. | Video | ||
Mora | Más como Sora para la generación de videos generalistas. | arxiv | Video | |
Morph Studio | Con nuestra magia AI de texto a video, manifiesta su creatividad a través de su aviso. | Video | ||
Clona | MotionClone: clonación de movimiento sin entrenamiento para la generación de videos controlables. | arxiv | Video | |
MotionCtrl | Un controlador de movimiento unificado y flexible para la generación de videos. | arxiv | Video | |
MotionDirector | Personalización de movimiento de modelos de difusión de texto a video. | arxiv | Video | |
Mrota | Una aplicación para reemplazar a los personajes en video con avatares 3D. | Video | ||
Mov2mov | MOV2MOV Plugin para Automatic1111/Stable-Diffusion-Webui. | Video | ||
Moviefactory | Creación automática de películas a partir de texto utilizando grandes modelos generativos para lenguaje e imágenes. | arxiv | Video | |
Marcos neuronales | Descubra el sintetizador para el mundo visual. | Video | ||
Sin duda | Crea tu mundo. | Video | ||
Sora abierta | Democratizando la producción de video eficiente para todos. | Video | ||
Sora abierta | Plan de Sora abierto. | Video | ||
Fenaki | Un modelo para generar videos a partir de texto, con indicaciones que pueden cambiar con el tiempo y videos que pueden ser tan largos como varios minutos. | arxiv | Video | |
Laboratorios de pika | Pika Labs está revolucionando la experiencia en video con AI. | Video | ||
Píxel | Pixeling permite a nuestros clientes crear contenido visual altamente preciso, ultra realista y extremadamente controlable que incluye imágenes, videos y modelos 3D. | Video | ||
PixVerse | Crea videos impresionantes con AI. | Video | ||
Polinización | La creación se vuelve fácil, rápida y divertida. | Video | ||
Reutilizar y difundir | Denosing iterativo para la generación de texto a video. | arxiv | Video | |
Ruyi | Ruyi es un modelo de imagen a video capaz de generar videos de calidad cinematográfica a una resolución de 768, con una velocidad de cuadro de 24 cuadros por segundo, totalizando 5 segundos y 120 cuadros. | Video | ||
Shortgpt | Un marco experimental de IA para la creación automatizada de contenido corto/video. | Video | ||
Show-1 | Casarse con modelos de píxeles y difusión latente para la generación de texto a video. | arxiv | Video | |
Video | Transformadores espacio-temporales escalados para la síntesis de texto a video. | arxiv | Video | |
sora | Creando video desde texto. | Video | ||
Sorawebui | Sorawebui es un cliente web Sora de código abierto, lo que permite a los usuarios crear fácilmente videos desde el texto con el modelo Sora de OpenAI. | Video | ||
Video estable | Edición de video de difusión consistencia con consistencia basada en el texto. | Video | ||
Difusión de video estable | Imagen a video de difusión de video estable (SVD). | Video | ||
Difusión de la historia | Autoatación constante para la generación de imágenes y videos de largo alcance. | arxiv | Video | |
Streamingt2v | Generación de videos largos consistente, dinámico y extensible a partir del texto. | arxiv | Video | |
Estilecrafter | Nhancing Estilizado de texto a video con adaptador de estilo. | arxiv | Video | |
Tatuaje | Generación de videos largos con VQGAN Agnóstico en el tiempo y transformador sensible al tiempo. | Video | ||
Text2video-cero | Los modelos de difusión de texto a imagen son generadores de video de disparo cero. | arxiv | Video | |
TF-T2V | Una receta para ampliar la generación de texto a video con videos sin texto. | arxiv | Video | |
Torá | Tora: transformador de difusión orientado a la trayectoria para la generación de videos. | arxiv | Video | |
Pistas | Track-Anything es una herramienta flexible e interactiva para el seguimiento y la segmentación de objetos de video, basada en el segmento cualquier cosa y XMEM. | arxiv | Video | |
Sintonía | Ajuste de una sola vez de modelos de difusión de imagen para la generación de texto a video. | arxiv | Video | |
Twelvelabs | AI multimodal que entiende videos como los humanos. | Video | ||
Univg | Hacia la generación de videos modales unificados. | Video | ||
Vchitect-2.0 | Vchitect-2.0: Transformador paralelo para ampliar los modelos de difusión de video. | Video | ||
VGen | Un ecosistema holístico de generación de videos para la generación de videos que se basa en modelos de difusión. | arxiv | Video | |
ViewCrafter | ViewCrafter: modelos de difusión de video para domar para la síntesis de visión novedosa de alta fidelidad. | arxiv | Video | |
Video-chatgpt | Video-CHATGPT es un modelo de conversación de video capaz de generar una conversación significativa sobre videos. | arxiv | Video | |
Videocomponente | Síntesis de video compositivo con control de movimiento. | arxiv | Video | |
Videocrafter1 | Modelos de difusión abiertos para la generación de videos de alta calidad. | arxiv | Video | |
Videocrafter2 | Superar limitaciones de datos para modelos de difusión de video de alta calidad. | arxiv | Video | |
Videodrafter | Generación de videos múltiples consistentes en el contenido con LLM. | arxiv | Video | |
Videoelevator | Elevar la calidad de la generación de videos con modelos versátiles de difusión de texto a imagen. | arxiv | Video | |
Videofactorio | Intercambie la atención en las difusiones espacio-temporales para la generación de texto a video. | Video | ||
Videógeno | Un enfoque de difusión latente guiada por referencia para la generación de texto a video de alta definición. | arxiv | Video | |
Videolcm | Modelo de consistencia de video latente. | arxiv | Video | |
Video LDMS | Alinee sus latentes: síntesis de video de alta resolución con modelos de difusión latente. | arxiv | Video | |
Video-llava | Aprendiendo la representación visual unida por alineación antes de la proyección. | arxiv | Video | |
Vidomamba | Modelo espacial de estado para una comprensión de video eficiente. | arxiv | Video | |
Video de pensamiento | Video de pensamiento: razonamiento de video paso a paso de la percepción a la cognición. | Video | ||
Videopoet | Un modelo de lenguaje grande para la generación de videos de cero disparos. | arxiv | Video | |
Movimiento visual | Crea videos realistas usando solo texto. | Video | ||
Visualrwkv | VisualRWKV es la versión visual mejorada del modelo de lenguaje RWKV, lo que permite a RWKV manejar diversas tareas visuales. | Visual | ||
V-JEPA | Arquitectura predictiva de incrustación conjunta de video. | arxiv | Video | |
Walt | Generación de videos fotorrealistas con modelos de difusión. | arxiv | Video | |
Cerocopio | Zeroscope Texto a video. | Video |
^ Volver al contenido ^
Fuente | Descripción | Papel | Motor de juego | Tipo |
---|---|---|---|---|
Académico | Un modelo de códec de audio de código abierto para la investigación académica. | Audio | ||
Anfión | Un kit de herramientas de audio, música y generación de discursos de código abierto. | arxiv | Audio | |
Arcisión | Generación de audio utilizando modelos de difusión, en Pytorch. | Audio | ||
caja de audio | Generación de audio unificada con indicaciones de lenguaje natural. | Audio | ||
Audioeditar | Edición de audio no supervisada y basada en texto con inversión DDPM. | arxiv | Audio | |
Códec de audiogen | Un códec de audio neuronal estéreo de 48 kHz bajo para audio general, optimizando para la fidelidad de audio? | Audio | ||
Audiogpt | Comprender y generar discurso, música, sonido y cabeza parlante. | arxiv | Audio | |
Audiolcm | Generación de texto a audio con modelos de consistencia latente. | arxiv | Audio | |
Audioldm | Generación de texto a audio con modelos de difusión latente. | arxiv | Audio | |
Audioldm 2 | Aprendiendo la generación de audio holístico con el pretrenesa auto-supervisado. | arxiv | Audio | |
Aufusión | Aprovechando el poder de la difusión y los modelos de lenguaje grande para la generación de texto a audio. | arxiv | Audio | |
CTAG | Generación creativa de texto a audio a través de la programación de sintetizadores. | Audio | ||
Foleycrafter | FoleyCrafter: dar vida a los videos silenciosos con sonidos realistas y sincronizados. | arxiv | Audio | |
Imán | Generación de audio enmascarada utilizando un solo transformador no autorregivo. | Audio | ||
Acompañamiento | Generación de texto a audio con modelos de difusión mejorados con aviso. | arxiv | Audio | |
Make-An-Audio 3 | Transformando el texto en audio a través de transformadores de difusión grandes basados en flujo. | arxiv | Audio | |
Neurio | Síntesis de sonido modal basado en el aprendizaje con transferencia acústica. | arxiv | Audio | |
Optimizante | Suena para creadores, creadores de juegos, artistas, creadores de videos. | Audio | ||
Qwen2-audio | QWEN2-ADIO CHAT & PROTRADO Modelo de lenguaje de audio grande propuesto por Alibaba Cloud. | arxiv | Audio | |
Ver-2-Sound | Sonido espacial de entorno espacial a shot a cero. | arxiv | Audio | |
Tormenta de sonido | Generación de audio paralela eficiente. | arxiv | Audio | |
Audio estable | Difusión de audio latente acondicionada rápida de sincronización. | Audio | ||
Open de audio estable | Open de audio estable 1.0 genera audio estéreo de longitud variable (hasta 47S) a 44.1kHz a partir de indicaciones de texto. | Audio | ||
Sincusión | Syncfusion: síntesis de foley sincronizada de video a audio sincronizada multimodal. | arxiv | Audio | |
TANGO | Generación de texto a audio utilizando instrucciones Tuned LLM y modelo de difusión latente. | Audio | ||
Vta-ldm | Generación de video a audio con alineación oculta. | arxiv | Audio | |
Ondulado | Creación de audio de composición con modelos de idiomas grandes. | arxiv | Audio |
^ Volver al contenido ^
Fuente | Descripción | Papel | Motor de juego | Tipo |
---|---|---|---|---|
Aiva | La inteligencia artificial que compone música de banda sonora emocional. | Música | ||
Amper Music | Tecnología de generación musical personalizada alimentada por Amper. | Música | ||
boomy | Crear música generativa. Compártalo con el mundo. | Música | ||
Chatmusicista | Fomento de habilidades musicales intrínsecas en LLM. | Música | ||
Acordes | Generación de música automática ai. | Música | ||
Diff-bgm | Un modelo de difusión para la generación de música de fondo de video. | arxiv | Música | |
Fluxmusic | FluxMusic: generación de texto a música con transformador de flujo rectificado. | arxiv | Música | |
Gptableton | Reduzca el script para procesar la respuesta GPT y el envío de las notas MIDI a los clips Ableton con Abletonosc y Python-OSc. | Música | ||
Heymusic.ai | Generador de música AI | Música | ||
Imagen a la música | AI Image to Music Generator es una herramienta que utiliza inteligencia artificial para convertir imágenes en música. | Música | ||
Jen-1 | Generación de música universal guiada por texto con modelos de difusión omnidireccional. | Música | ||
Tocadiscos tragamonedas | Un modelo generativo para la música. | arxiv | Música | |
Magenta | Magenta es un proyecto de investigación que explora el papel del aprendizaje automático en el proceso de creación de arte y música. | Música | ||
Melodía | Generación de música neuronal eficiente | Música | ||
mubert | AI Música generativa. | Música | ||
Museneta | Una red neuronal profunda que puede generar composiciones musicales de 4 minutos con 10 instrumentos diferentes, y puede combinar estilos de país a Mozart a los Beatles. | Música | ||
MusicGen | Generación de música simple y controlable. | arxiv | Música | |
Musicldm | Mejora de la novedad en la generación de texto a música utilizando estrategias de mezcla sincronales latidos. | arxiv | Música | |
MúsicaLM | Generando música a partir de texto. | arxiv | Música | |
Aplicación de riffusion | Riffusion es una aplicación para la generación de música en tiempo real con difusión estable. | Música | ||
Sonauto | Sonauto es un editor de música AI que convierte las indicaciones, las letras o las melodías en canciones completas en cualquier estilo. | Música | ||
Rango | Generador de música AI para creadores. | Música | ||
Soundry ai | Herramientas de IA generativas que incluyen paquetes de muestras de texto a sonido e infinito. | Música |
^ Volver al contenido ^
Fuente | Descripción | Papel | Motor de juego | Tipo |
---|---|---|---|---|
DiffSinger | Síntesis de voz de canto a través del mecanismo de difusión poco profunda. | arXiv | Voz de canto | |
Recuperación basada en la voz-conversión-webui | Un marco SVC fácil de usar basado en VITS. | Voz de canto | ||
so-vits-svc | SoftVC Vits Singing Voice Conversion. | Voz de canto | ||
VI-SVS | Use VITS y OpenCPop para desarrollar síntesis de voz de canto; Diferente de Visinger. | Voz de canto |
^ Volver al contenido ^
Fuente | Descripción | Papel | Motor de juego | Tipo |
---|---|---|---|---|
Aplicación | Ultimate Voice Cloning Tool, meticulosamente optimizada para potencia inigualable, modularidad y experiencia fácil de usar. | Discurso | ||
Audyo | Texto en. Audio Out. | Discurso | ||
Ladrar | Modelo de audio generativo prometido por texto. | Discurso | ||
Bert-vits2 | VITS2 Backbone con Bert multilingüe. | Discurso | ||
Chattts | Chattts es un modelo de habla generativo para el diálogo diario. | Discurso | ||
Clapspeech | Prosodia de aprendizaje del contexto del texto con el alquiler de audio de lenguaje contrastante. | arxiv | Discurso | |
Cosivaza | Modelo de generación de voz grande multilingüe, que proporciona inferencia, capacitación e implementación de capacidad de plena. | Discurso | ||
Dex-tts | Texto expresivo a voz basado en difusión con modelado de estilo en la variabilidad del tiempo. | arxiv | Discurso | |
Emotivo | Un motor TTS multi-votación y controlación rápida. | Discurso | ||
Fliki | Convierta el texto en videos con voces de AI. | Discurso | ||
GLM-4-VOICE | GLM-4-Voice es un modelo de voz de extremo a extremo lanzado por Zhipu AI. GLM-4-Voice puede comprender y generar directamente el habla china e inglesa, participar en conversaciones de voz en tiempo real y cambiar atributos como emoción, entonación, velocidad de voz y dialecto basados en las instrucciones del usuario. | Discurso | ||
Brillo | Un flujo generativo para texto a voz a través de la búsqueda de alineación monotónica. | arxiv | Discurso | |
Gpt-sovits | Una poderosa conversión de voz de pocos disparos y webui de texto a voz. | Discurso | ||
LOVO | Lovo es el generador de voz de IA y la plataforma de texto a voz para miles de creadores. | Discurso | ||
Mahatts | Un modelo de generación de voz grande de código abierto. | Discurso | ||
Matcha-TTS | Una arquitectura TTS rápida con coincidencia de flujo condicional. | arxiv | Discurso | |
Melotts | Biblioteca de texto a voz multilingüe de alta calidad por myshell.ai. Admite inglés, español, francés, chino, japonés y coreano. | Discurso | ||
Metavoice-1b | AI para inteligencia del habla a nivel humano. | Discurso | ||
Narakeet | Cree fácilmente voces en off usando texto realista a discurso. | Discurso | ||
Mini | Mini-OMNI: Los modelos de idiomas pueden escuchar, hablar mientras piensan en la transmisión. Mini-OMNI es un modelo de lenguaje grande de código abierto que puede escuchar, hablar mientras piensa. Con la entrada de voz de extremo a extremo en tiempo real y la transmisión de capacidades de conversación de salida de audio. | arxiv | Discurso | |
Clonación de una voz de una sola vez | Una base de clonación de voz de una toma en unet-tts. | Discurso | ||
OpenVoice | Clonación de voz instantánea de Myshell. | Discurso | ||
Rebosar | Poner flujos sobre los transductores neuronales para mejores TTS. | Discurso | ||
RealTimetts | RealTimetts es una biblioteca de texto a discurso (TTS) de última generación diseñada para aplicaciones en tiempo real. | Discurso | ||
Sensevoice | Sensevoice es un modelo de base del habla con múltiples capacidades de comprensión del habla, incluido el reconocimiento automático de voz (ASR), la identificación del lenguaje hablado (LID), el reconocimiento de emociones del habla (SER) y la detección de eventos de audio (AED). | Discurso | ||
Discurso | Empoderar modelos de lenguaje grande con habilidades de conversación intermodales intrínsecas. | arxiv | Discurso | |
discurso a texto-gpt3-unidad | Este es el repositorio que uso la API Whisper y Chatgpt de OpenAi en Unity. | Unidad | Discurso | |
Discurso estable | Modelo de texto a voz de estabilidad de IA. | Discurso | ||
Stabletts | Modelo TTS de próxima generación utilizando el coincidencia de flujo y DIT, inspirado en la difusión estable 3. | Discurso | ||
Styletts 2 | Hacia el texto a nivel humano a la expresión a través de la difusión del estilo y la formación adversaria con grandes modelos de lenguaje de voz. | arxiv | Discurso | |
tortoise.cpp | Tortoise.cpp: Implementación GGML de Tortoise-TTS. | Discurso | ||
Tortuga-tts | Un sistema TTS de múltiples voces entrenado con énfasis en la calidad. | Discurso | ||
TTS Generation Webui | TTS Generation Webui (Bark, MusicGen, Tortoise, RVC, Vocos, Demucs). | Discurso | ||
Vall-E | Los modelos de lenguaje de códec neural son sintetizadores de texto a cero disparos a los del habla. | arxiv | Discurso | |
Vall-e x | Habla idiomas extranjeros con tu propia voz: modelado de idiomas de códec neural interlingüe | arxiv | Discurso | |
código de voz | Vocode es una biblioteca de código abierto para construir aplicaciones LLM basadas en voz. | Discurso | ||
Caja de voz | Generación de discursos multilingües guiadas por texto a escala. | arxiv | Discurso | |
Vocecrafía | Edición del habla y texto a voz en la naturaleza en la naturaleza. | Discurso | ||
Susurro | Whisper es un modelo de reconocimiento de voz de uso general. | Discurso | ||
Porte de susurros | Un sistema de texto a voz de código abierto construido por Whisper invertir. | Discurso | ||
Xe-voz | Marco de capacitación conjunta de la conversión de texto y voz de texto y voz de texto y voz interlingüística no automática. | Discurso | ||
XTTS | XTTS es una biblioteca para la generación avanzada de texto a voz. | Discurso | ||
YourTts | Hacia TTS de múltiples disparos cero y conversión de voz de cero disparos para todos. | arxiv | Discurso | |
Zmm-tts | Síntesis de discurso multilingüe y multiester de múltiples disparos condicionada en representaciones discretas de habla discretas auto-supervisadas. | arxiv | Discurso |
^ Volver al contenido ^
Fuente | Descripción | Motor de juego | Tipo |
---|---|---|---|
Ludo.ai | Asistente de investigación y diseño de juegos. | Analítica |
^ Volver al contenido ^