Download do ai game devtools - download do código-fonte ai game devtools

Ferramentas de desenvolvimento de jogos de IA (AI-GDT)?

Jogo de IA

Aqui acompanharemos as mais recentes ferramentas de desenvolvimento de jogos de IA, incluindo LLM, Agente, Código, Escritor, Imagem, Textura, Shader, Modelo 3D, Animação, Vídeo, Áudio, Música, Voz Cantada e Análise.

Índice

Ferramenta (AI LLM)
Jogo (Agente)
Código
Escritor
Imagem
Textura
Sombreador
Modelo 3D
avatar
Animação
Visual
Vídeo
Áudio
Música
Cantando Voz
Discurso
Análise

Lista de Projetos

Ferramenta (AI LLM)

Fonte	Descrição	Papel	Motor de jogo	Tipo
AgenteGPT	? Monte, configure e implante agentes de IA autônomos em seu navegador.			Ferramenta
AICommand	Integração ChatGPT com Unity Editor.		Unidade	Ferramenta
AIOS	Sistema operacional do agente LLM.			Ferramenta
Cientista de IA	O Cientista de IA: Rumo à Descoberta Científica Aberta Totalmente Automatizada.	arXiv		Ferramenta
CLI assistente	Uma ferramenta CLI confortável para usar o serviço ChatGPT			Ferramenta
Auto-GPT	Uma tentativa experimental de código aberto para tornar o GPT-4 totalmente autônomo.			Ferramenta
BebêAGI	Este script Python é um exemplo de sistema de gerenciamento de tarefas baseado em IA.			Ferramenta
?? IU do bebêAGI	A UI do BabyAGI foi projetada para facilitar a execução e o desenvolvimento com o babyagi em um aplicativo da web, como um ChatGPT.			Ferramenta
baichuan-7B	Um modelo de linguagem de pré-treinamento 7B em grande escala desenvolvido por Baichuan.			Ferramenta
Baichuan-13B	Um modelo de linguagem grande 13B desenvolvido pela Baichuan Intelligent Technology.			Ferramenta
Bai Chuan 2	Uma série de grandes modelos de linguagem desenvolvidos pela Baichuan Intelligent Technology.			Ferramenta
Bisheng	Bisheng é uma plataforma aberta LLM devops para aplicativos de IA de próxima geração.			Ferramenta
Personagem-LLM	Um agente treinável para dramatização.	arXiv		Ferramenta
ChatDev	Agentes Comunicativos para Desenvolvimento de Software.	arXiv		Ferramenta
Unidade ChatGPT-API	Vincula a API de conclusão de bate-papo ChatGPT ao C# puro no Unity.		Unidade	Ferramenta
ChatGPTForUnity	ChatGPT pela unidade.		Unidade	Ferramenta
Bate-papoRWKV	ChatRWKV é como ChatGPT, mas desenvolvido com modelo de linguagem RWKV (100% RNN) e código aberto.			Ferramenta
Bate-papoYuan	Modelo de Grande Linguagem para Diálogo em Chinês e Inglês.			Ferramenta
Chinês-LLaMA-Alpaca-3	(LLMs chineses Llama-3) desenvolvidos a partir do Meta Llama 3.			Ferramenta
Chrome-GPT	Um agente AutoGPT que controla o Chrome no seu desktop.			Ferramenta
CogVLM	CogVLM, um poderoso modelo de base de linguagem visual de código aberto.	arXiv		Ferramenta
CoreNet	Uma biblioteca para treinar redes neurais profundas.			Ferramenta
Cosmos	Cosmos é uma plataforma mundial de desenvolvimento de modelos que consiste em modelos de base mundial, tokenizadores e pipeline de processamento de vídeo para acelerar o desenvolvimento de IA física em laboratórios de robótica e AV.			LLM
DBRX	DBRX é um grande modelo de linguagem treinado pela Databricks.			Ferramenta
DCLM	DataComp para modelos de linguagem.	arXiv		Ferramenta
DeepSeek-V3	DeepSeek-V3 é um forte modelo de linguagem Mixture-of-Experts (MoE) com 671B de parâmetros totais com 37B ativados para cada token.	arXiv		LLM
DemoGPT	Gerador de aplicativo Auto Gen-AI com o poder do Llama 2			Ferramenta
Design2Code	Automatizando a engenharia front-end			Ferramenta
Devika	Devika é engenheira de software Agentic AI.			Ferramenta
Devon	Um programador de pares de código aberto.			Ferramenta
Dora	Gerando sites poderosos, um prompt por vez.			Ferramenta
Fluir	Arraste e solte a interface do usuário para criar seu fluxo LLM personalizado usando LangchainJS.			Ferramenta
Gêmeos	O Gemini foi desenvolvido desde o início para a multimodalidade – raciocínio perfeito em texto, imagens, vídeo, áudio e código.			Ferramenta
Gema	Gemma é uma família de modelos abertos leves e de última geração, construídos a partir de pesquisa e tecnologia usada para criar modelos do Google Gemini.			Ferramenta
gemma.cpp	mecanismo de inferência C++ leve e autônomo para os modelos Gemma do Google.			Ferramenta
GLM-4	GLM-4-9B é a versão de código aberto da última geração de modelos pré-treinados da série GLM-4 lançada pela Zhipu AI.			Ferramenta
GPT4Todos	Um chatbot treinado em uma enorme coleção de dados limpos de assistentes, incluindo código, histórias e diálogos.			Ferramenta
GPT-4o	GPT-4o (“o” para “omni”) é um passo em direção a uma interação humano-computador muito mais natural – aceita como entrada qualquer combinação de texto, áudio, imagem e vídeo e gera qualquer combinação de texto, áudio e imagem saídas.			Ferramenta
GPTScript	Desenvolva aplicativos LLM em linguagem natural.			Ferramenta
Grok-1	Os pesos e a arquitetura de nosso modelo de mistura de especialistas de 314 bilhões de parâmetros, Grok-1.			Ferramenta
AbraçosChat	Disponibilizando os melhores modelos de chat de IA da comunidade para todos.			Ferramenta
Abraçando a integração da API Unity Face	Este pacote Unity fornece uma integração fácil de usar para a API Hugging Face Inference, permitindo que os desenvolvedores acessem e usem modelos Hugging Face AI em seus projetos Unity.		Unidade	Ferramenta
ImagemBind	ImageBind One Embedding Space para vincular todos eles.	arXiv		Ferramenta
Índice-1.9B	Um LLM multilíngue leve SOTA.			Ferramenta
Unidade InteractML	InteractML, uma estrutura de script visual de aprendizado de máquina interativo para Unity3D.		Unidade	Ferramenta
InteractML-Unreal Engine	Trazendo o aprendizado de máquina para o Unreal Engine.		Motor irreal	Ferramenta
EstagiárioLM	InternLM abriu o código-fonte de um modelo base de 7 bilhões de parâmetros, um modelo de chat adaptado para cenários práticos e o sistema de treinamento.	arXiv		Ferramenta
EstagiárioLM-XComposer	InternLM-XComposer2 é um modelo grande de linguagem de visão (VLLM) inovador que se destaca na composição e compreensão de texto-imagem de formato livre.	arXiv		Ferramenta
janeiro	Leve a IA para o seu desktop.			Ferramenta
Lamini	Lamini permite que qualquer equipe de engenharia supere LLMs de uso geral por meio de RLHF e ajuste fino em seus próprios dados.			Ferramenta
LaMini-LM	LaMini-LM é uma coleção de modelos de linguagem eficientes e de pequeno porte, destilados do ChatGPT e treinados em um conjunto de dados em grande escala de 2,58 milhões de instruções.			Ferramenta
LangChain	LangChain é uma estrutura para desenvolvimento de aplicativos baseados em modelos de linguagem.			Ferramenta
LangFlow	⛓️ LangFlow é uma UI para LangChain, projetada com react-flow para fornecer uma maneira fácil de experimentar e prototipar fluxos.			Ferramenta
Lavague	Automatize a automação com a estrutura Large Action Model.			Ferramenta
Lêmure	Modelos de base aberta para agentes linguísticos.			Ferramenta
Lépton IA	Uma estrutura Pythonic para simplificar a construção de serviços de IA.			Ferramenta
Lit-LLaMA	Implementação do modelo de linguagem LLaMA baseado em nanoGPT. Suporta atenção flash, quantização Int8 e GPTQ de 4 bits, ajuste fino de adaptador LoRA e LLaMA, pré-treinamento.			Ferramenta
lhama2-webui	Execute o Llama 2 localmente com Gradio UI na GPU ou CPU de qualquer lugar (Linux/Windows/Mac).			Ferramenta
Lhama 3	O site oficial do GitHub do Meta Llama 3.			Ferramenta
Lhama 3.1	Llama é um modelo de linguagem grande (LLM) acessível e aberto, projetado para desenvolvedores, pesquisadores e empresas construírem, experimentarem e dimensionarem com responsabilidade suas ideias generativas de IA.			Ferramenta
LLaSM	Grande modelo de linguagem e fala.			Ferramenta
Mecanismo de resposta LLM	Construa um mecanismo de resposta inspirado na perplexidade usando Next.js, Groq, Mixtral, Langchain, OpenAI, Brave e Serper.			Ferramenta
llm.c	Treinamento LLM em C/CUDA simples e bruto.			Ferramenta
LLMUnidade	Crie personagens no Unity com LLMs!		Unidade	Ferramenta
LLocalSearch	LLocalSearch é um mecanismo de pesquisa totalmente executado localmente usando Agentes LLM.			Ferramenta
LogicGamesSolver	Uma ferramenta Python para resolver jogos de lógica com IA, Deep Learning e Visão Computacional.			Ferramenta
LongWriter	LongWriter: liberando a geração de mais de 10.000 palavras a partir de LLMs de contexto longo.	arXiv		Ferramenta
Modelo de Mundo Grande (LWM)	Large World Model (LWM) é um modelo autoregressivo multimodal de grande contexto de uso geral.	arXiv		Ferramenta
Lumina-T2X	Lumina-T2X é uma estrutura unificada para geração de texto para qualquer modalidade.	arXiv		Ferramenta
MetaGPT	A estrutura multiagente			Ferramenta
MiniCPM-2B	Um LLM final supera o Llama2-13B.			Ferramenta
MiniGPT-4	Aprimorando a compreensão da linguagem visual com modelos avançados de linguagem ampla.	arXiv		Ferramenta
MiniGPT-5	Geração intercalada de visão e linguagem por meio de Vokens generativos.	arXiv		Ferramenta
Mixtral 8x7B	Uma mistura esparsa de especialistas de alta qualidade.	arXiv		Ferramenta
Mistral 7B	O melhor modelo 7B até hoje, Apache 2.0.			Ferramenta
Mistral Grande	Mistral Large é um novo modelo de geração de texto de última geração. Atinge capacidades de raciocínio de alto nível.			Ferramenta
MLC LLM	Permita que todos desenvolvam, otimizem e implantem modelos de IA nativamente nos dispositivos de todos.			Ferramenta
MobiLlama	Rumo a um GPT preciso e leve, totalmente transparente.	arXiv		Ferramenta
MoE-LLaVA	Mistura de especialistas para grandes modelos de linguagem visual.	arXiv		Ferramenta
Moshi	Moshi é uma IA de conversação experimental.			Ferramenta
Moshi	Moshi: um modelo básico de fala-texto para diálogo em tempo real.			Ferramenta
MUSGO	Um modelo de linguagem conversacional aumentada por ferramenta de código aberto da Universidade Fudan.			Ferramenta
mPLUG-Coruja?	A modularização capacita grandes modelos de linguagem com multimodalidade.	arXiv		Ferramenta
Nemotron-4	Um grande modelo de linguagem multilíngue com 15 bilhões de parâmetros treinado em 8 trilhões de tokens de texto.	arXiv		Ferramenta
NExT-GPT	Modelo de linguagem grande multimodal qualquer para qualquer.			Ferramenta
OLMo	Modelo de linguagem aberta	arXiv		Ferramenta
OmniLMM	Grandes modelos multimodais para forte desempenho e implantação eficiente.			Ferramenta
OneLLM	Uma estrutura para alinhar todas as modalidades com a linguagem.	arXiv		Ferramenta
Assistente aberto	OpenAssistant é um assistente baseado em chat que entende tarefas, pode interagir com sistemas de terceiros e recuperar informações dinamicamente para fazer isso.			Ferramenta
OpenDevin	Um engenheiro de software de IA autônomo.			Ferramenta
Órion-14B	Orion-14B é uma família de modelos que inclui um LLM de base 14B e uma série de modelos.	arXiv		Ferramenta
Panda	Modelo de linguagem grande de código aberto chinês no exterior, baseado em Llama-7B, -13B, -33B, -65B para pré-treinamento contínuo na área chinesa.			Ferramenta
Perplexa	Um mecanismo de pesquisa baseado em IA.			Ferramenta
Pi	Chatbot AI projetado para assistência pessoal e suporte emocional.			Ferramenta
Qwen1.5	Qwen1.5 é a versão melhorada do Qwen.			Ferramenta
Qwen2	Qwen2 é a grande série de modelos de linguagem desenvolvida pela equipe Qwen, Alibaba Cloud.			Ferramenta
Qwen-7B	O repositório oficial do bate-papo Qwen-7B (通义千问-7B) e do modelo de linguagem grande pré-treinado proposto pelo Alibaba Cloud.			Ferramenta
RepoAgente	RepoAgent é um projeto de código aberto conduzido por Large Language Models (LLMs) que visa fornecer uma maneira inteligente de documentar projetos.	arXiv		Ferramenta
Mecanismo de IA de sanidade	Sanity AI Engine para a ferramenta de desenvolvimento de jogos Unity.		Unidade	Ferramenta
PesquisaGPT	? Conectando ChatGPT à Internet			Ferramenta
CompartilharGPT4V	Melhorando grandes modelos multimodais com melhores legendas.			Ferramenta
Skywork	Os modelos da série Skywork são pré-treinados em 3,2 TB de dados de código e multilíngues de alta qualidade (principalmente chinês e inglês).			Ferramenta
EstávelLM	Modelos de linguagem de IA de estabilidade.	arXiv		Ferramenta
Alpaca de Stanford	Um modelo LLaMA que segue instruções.			Ferramenta
IU da web de geração de texto	Uma UI web gradio para executar grandes modelos de linguagem como LLaMA, llama.cpp, GPT-J, OPT e GALACTICA.			Ferramenta
Motor TinyChat	Biblioteca de inferência LLM no dispositivo.			Ferramenta
Banco de ferramentas	Uma plataforma aberta para treinamento, atendimento e avaliação de grandes modelos de linguagem para aprendizado de ferramentas.			Ferramenta
Unidade de bate-papoGPT	Experimentos Unity ChatGPT.		Unidade	Ferramenta
Integração Unity OpenAI-API	Integre o modelo de linguagem openai GPT-3 e a API ChatGPT em um projeto Unity.		Unidade	Ferramenta
Unreal Engine 5 Lhama LoRA	Um projeto de prova de conceito que mostra o potencial do uso de LLMs pequenos e localmente treináveis para criar ferramentas de documentação de próxima geração.		Motor irreal	Ferramenta
UnrealGPT	Uma coleção de widgets do Unreal Engine 5 Editor Utility alimentados por GPT3/4.		Motor irreal	Ferramenta
Vídeo-LLaVA	Aprendendo a representação visual unida por alinhamento antes da projeção.	arXiv		Ferramenta
WebGPT	Execute o modelo GPT no navegador com WebGPU.			Ferramenta
Web3-GPT	Implante contratos inteligentes com IA			Ferramenta
WordGPT	? Leve o poder do ChatGPT para o Microsoft Word			Ferramenta
Agente X	Um agente LLM autônomo para resolução de tarefas complexas.			Ferramenta
Sim	Uma série de grandes modelos de linguagem treinados do zero por desenvolvedores.			Ferramenta
01 Projeto	O computador modelo de linguagem de código aberto.			Ferramenta

^ Voltar ao conteúdo ^

Jogo (Agente)

Fonte	Descrição	Papel	Tipo
Banco de Agente	Uma referência abrangente para avaliar LLMs como agentes.	arXiv	Agente
Bate-papo em grupo de agentes	Um simulacro de bate-papo em grupo interativo para melhor provocar o comportamento emergente coletivo.	arXiv	Agente
Agente K	Um AGI autoagente que evolui automaticamente e é modular.		Agente
AgenteScope	Comece a criar aplicativos multiagentes habilitados para LLM de maneira mais fácil.	arXiv	Agente
AgenteSims	Um sandbox de código aberto para avaliação de modelos de linguagem grande.		Agente
Cidade IA	AI Town é uma cidade virtual onde personagens de IA vivem, conversam e socializam.		Agente
anime.gf	Alternativa local e de código aberto para CharacterAI.		Jogo
Astrocade	Crie jogos com IA		Jogo
Agentes Atômicos	A estrutura do Atomic Agents foi projetada para ser modular, extensível e fácil de usar.		Agente
AutoAgentes	Uma estrutura para geração automática de agentes.		Agente
Geração automática	Habilite aplicativos de modelo de linguagem grande de última geração.	arXiv	Agente
comportamental	Behaviac é uma estrutura de desenvolvimento de IA de jogos.		Estrutura
Biomas	Biomes é um MMORPG sandbox de código aberto construído para a web usando tecnologias da web como Next.js, Typescript, React e WebAssembly.		Jogo
Amortecedor de pensamentos	Raciocínio Aumentado pelo Pensamento com Grandes Modelos de Linguagem.	arXiv	Agente
Agente Byzer	Estrutura de agente fácil, rápida e distribuída para todos.		Agente
Cidade dos Gatos	Simulação alimentada por AC(h)atGPT com gatos.		Agente
Cidade dos Gatos	Simulação alimentada por AC(h)atGPT com gatos.		Agente
PersonagemGLM	Personalização de caracteres de IA de conversação em chinês com grandes modelos de linguagem.	arXiv	Agente
ChatDev	Agentes Comunicativos para Desenvolvimento de Software.	arXiv	Agente
Agente Cog	CogAgent é um modelo de linguagem visual de código aberto aprimorado com base no CogVLM.	arXiv	Agente
Berço	Rumo ao controle geral do computador.		Agente
tripulaçãoAI	Estrutura para orquestrar agentes de IA autônomos e role-playing.		Agente
Modificar	Dify é uma plataforma de construção de aplicativos LLM de código aberto.		Agente
Projeto Vida Digital	Personagens 3D autônomos com inteligência social.	arXiv	Agente
tudo-ai	Seu assistente de chatbot local totalmente proficiente, com tecnologia de IA?		Agente
tecido	fabric é uma estrutura de código aberto para aprimorar humanos usando IA.		Agente
FastGPT	FastGPT é uma plataforma baseada em conhecimento construída no LLM.		Agente
rápidoRAG	Estrutura de geração e aumento de recuperação eficiente.		Agente
JogoAISDK	Estrutura de automação de IA de jogos baseada em imagens.		Estrutura
GameNGen	Modelos de difusão são motores de jogos em tempo real.	arXiv	Jogo
GameGen-O	GameGen-O: Geração de videogame em mundo aberto.		Jogo
Agente Gen	GenAgent: Construa Sistemas de IA Colaborativos com Geração Automatizada de Fluxo de Trabalho - Estudos de Caso no ComfyUI.	arXiv	Agente
Agentes Geradores	Simulacros Interativos do Comportamento Humano.	arXiv	Agente
Gênese	Genesis: um mecanismo de física generativo e universal para robótica e muito mais.		Jogo
Gênio	Ambientes interativos generativos.		Jogo
gigax	Tempo de execução, NPCs com tecnologia LLM.		Jogo
HippoRAG	Memória de longo prazo inspirada neurobiologicamente para grandes modelos de linguagem.	arXiv	Agente
NPCs interativos com tecnologia LLM	Interactive LLM Powered NPCs, é um projeto de código aberto que transforma completamente sua interação com personagens não-jogadores (NPCs) em qualquer jogo!		Jogo
IoA	Uma estrutura de código aberto para agentes colaborativos de IA, permitindo que diversos agentes distribuídos se unam e lidem com tarefas complexas por meio de conectividade semelhante à da Internet.		Agente
Agentes Kwai	Um sistema generalizado de agente de busca de informações com Large Language Models (LLMs).	arXiv	Agente
LangChain	Leve seu aplicativo LLM do protótipo à produção.		Agente
Fluxo Lang	Langflow é uma UI para LangChain, projetada com react-flow para fornecer uma maneira fácil de experimentar e prototipar fluxos.		Agente
Estúdio LangGraph	LangGraph Studio oferece uma nova maneira de desenvolver aplicativos LLM, fornecendo um IDE de agente especializado que permite visualização, interação e depuração de aplicativos de agente complexos.		Agente
LARP	Role Play de Agente de Linguagem para jogos de mundo aberto.	arXiv	Agente
Sistema Agente Llama	Componentes agentes das APIs Llama Stack.		Agente
LhamaIndex	LlamaIndex é uma estrutura de dados para seu aplicativo LLM.		Agente
MindSearch	? Uma estrutura multiagente de mecanismo de pesquisa na Web baseada em LLM (como Perplexity.ai Pro e SearchGPT).		Agente
Mistura de Agentes (MoA)	A mistura de agentes aprimora as capacidades do grande modelo de linguagem.	arXiv	Agente
Função MMR	MMRole: Uma Estrutura Abrangente para Desenvolver e Avaliar Agentes Multimodais de RPG.	arXiv	Agente
Moonlander.ai	Comece a criar jogos 3D sem qualquer codificação usando IA generativa.		Estrutura
Difusão Mug	MuG Diffusion é uma IA de gráficos para jogos de ritmo baseada em Stable Diffusion (um dos modelos AIGC mais poderosos) com uma grande modificação para incorporar ondas de áudio.		Jogo
Oásis	Oasis é um modelo de mundo interativo desenvolvido pela Decart e Etched. Baseado em transformadores de difusão, o Oasis recebe a entrada do teclado do usuário e gera a jogabilidade de maneira autorregressiva.		Jogo
Agente Om	Uma estrutura de agente multimodal para resolver tarefas complexas.		Agente
Agentes Abertos	Uma plataforma aberta para agentes linguísticos em liberdade.		Agente
obra	Um aplicativo de IA que transforma texto em um videogame.		Jogo
Pipecat	Estrutura de código aberto para voz e IA conversacional multimodal.		Agente
Agente Qwen	Qwen-Agent é uma estrutura para o desenvolvimento de aplicativos LLM com base no seguimento de instruções, uso de ferramentas, planejamento e recursos de memória do Qwen.		Agente
Ragas	Ragas é uma estrutura que ajuda você a avaliar seus pipelines de Retrieval Augmented Generation (RAG).		Agente
RPBench-Auto	Um pipeline automatizado para avaliar LLMs para role-playing.		Jogo
SIMA	Um agente generalista de IA para ambientes virtuais 3D.		Agente
StoryGames.ai	IA para sonhadores fazem jogos.		Jogo
Agente SWE	Interfaces de computador agente permitem modelos de linguagem de engenharia de software.	arXiv	Agente
TaskGen	Uma estrutura de agente baseada em tarefas baseada em saídas StrictJSON de agentes LLM.		Agente
DEZ Agente	TEN Agent é o primeiro agente multimodal em tempo real do mundo integrado com a API OpenAI Realtime, RTC, e apresenta verificações meteorológicas, pesquisa na web, visão e recursos RAG.		Agente
Agente de tradução	Tradução agente usando fluxo de trabalho de reflexão.		Agente
Twitter	Twitter Personality é um aplicativo da web que analisa seu identificador do Twitter para criar um perfil de personalidade personalizado usando o Wordware AI Agent.		Agente
Ilimitado	Ilimitado: um jogo generativo infinito de simulação de vida de personagem.	arXiv	Jogo
Video2Game	Ambiente em tempo real, interativo, realista e compatível com navegador a partir de um único vídeo.	arXiv	Jogo
V-IRL	Fundamentando a inteligência virtual na vida real.	arXiv	Agente
Agente WebDesign	Um agente usado para webdesign.		Agente
Agente X	Um agente LLM autônomo para resolução de tarefas complexas.		Agente

^ Voltar ao conteúdo ^

Código

Fonte	Descrição	Papel	Motor de jogo	Tipo
Tradutor de código AI	Use IA para traduzir código de um idioma para outro.			Código
aiXcoder-7B	Modelo de linguagem grande de código aiXcoder-7B.			Código
erro	bloop é um mecanismo de busca de código rápido escrito em Rust.			Código
Capítulo	Intérprete de código ChatGPT em notebooks Jupyter.			Código
CodeGeeX	Um modelo aberto de geração de código multilíngue.	arXiv		Código
CodeGeeX2	Um modelo de geração de código multilíngue mais poderoso.			Código
CodeGeeX4	CodeGeeX4: modelo aberto de geração de código multilíngue.			Código
CodeGen	CodeGen é um modelo de código aberto para síntese de programas. Treinado em TPU-v4. Competitivo com OpenAI Codex.	arXiv		Código
CódigoGen2	Modelos CodeGen2 para síntese de programas.	arXiv		Código
Código Lhama	Code Llama é um grande modelo de linguagem para código baseado no Llama 2.			Código
CódigoTF	Biblioteca de transformadores completa para Code LLM de última geração.			Código
CódigoT5	LLMs de código aberto para compreensão e geração de código.			Código
Cursor	Escreva, edite e converse sobre seu código com GPT-4 em um novo tipo de editor.			Código
Codificador DeepSeek	DeepSeek Coder: deixe o código se escrever.	arXiv		Código
Códice OpenAI	OpenAI Codex é descendente do GPT-3.			Código
PandasAI	Pandas AI é uma biblioteca Python que integra recursos generativos de inteligência artificial ao Pandas, tornando os dataframes conversacionais.			Código
RobloxScripterAI	RobloxScripterAI é uma ferramenta de geração de código com tecnologia de IA para Roblox.		Roblox	Código
Scikit-LLM	Integre perfeitamente modelos de linguagem poderosos como ChatGPT ao scikit-learn para tarefas aprimoradas de análise de texto.			Código
SoTaNa	O assistente de desenvolvimento de software de código aberto.	arXiv		Código
Código Estável 3B	Codificação no Edge.			Código
StarCoder	? StarCoder é um modelo de linguagem (LM) treinado em código-fonte e texto em linguagem natural.	arXiv		Código
Star Coder 2	StarCoder2 é uma família de modelos de geração de código (3B, 7B e 15B), treinados em mais de 600 linguagens de programação do The Stack v2 e alguns textos em linguagem natural, como Wikipedia, Arxiv e problemas do GitHub.	arXiv		Código
IA UnityGen	UnityGen AI é um plugin de geração de código baseado em IA para Unity.		Unidade	Código
Vazio	Void é uma alternativa de Cursor de código aberto. Escreva código com as melhores ferramentas de IA, mantenha controle total sobre seus dados e acesse recursos poderosos de IA.			Código

^ Voltar ao conteúdo ^

Escritor

Fonte	Descrição	Tipo
Escritor de IA	A IA escreve romances, gera artigos de fantasia e romance na web, etc. Modelo generativo chinês pré-treinado.	Escritor
Caderno.ai	Notebook.ai é um conjunto de ferramentas para escritores, designers de jogos e roleplayers criarem universos magníficos – e tudo dentro deles.	Escritor
Romance	Editor WYSIWYG no estilo Notion com preenchimentos automáticos alimentados por IA.	Escritor
Novela AI	Impulsionado pela IA, construa sem dor histórias únicas, contos emocionantes, romances sedutores ou apenas divirta-se.	Escritor

^ Voltar ao conteúdo ^

Imagem

Fonte	Descrição	Papel	Motor de jogo	Tipo
Qualquer porta	Personalização de imagem em nível de objeto de disparo zero.	arXiv		Imagem
Qualquer texto	Geração e edição de texto visual multilíngue.	arXiv		Imagem
AutoStudio	Criação de assuntos consistentes na geração de imagens interativas multivoltas.	arXiv		Imagem
Blender-ControlNet	Usando ControlNet direto no Blender.		Liquidificador	Imagem
BriVL	Unindo Visão e Modelo de Linguagem.	arXiv		Imagem
CatVTON	CatVTON: Concatenação é tudo que você precisa para teste virtual com modelos de difusão.	arXiv		Imagem
CLIPasso	Um método para converter a imagem de um objeto em um esboço, permitindo vários níveis de abstração.	arXiv		Imagem
ClipDrop	Crie visuais impressionantes em segundos.			Imagem
UI confortável	Uma GUI de difusão estável, poderosa e modular, com uma interface de gráficos/nós.			Imagem
Laboratório de conceitos	Geração criativa usando restrições anteriores de difusão.	arXiv		Imagem
ControlNet	ControlNet é uma estrutura de rede neural para controlar modelos de difusão adicionando condições extras.	arXiv		Imagem
CSGO	CSGO: composição de estilo de conteúdo na geração de texto para imagem.	arXiv		Imagem
DALL·E 2	DALL·E 2 é um sistema de IA que pode criar imagens e arte realistas a partir de uma descrição em linguagem natural.			Imagem
Estúdio Dashtoon	Dashtoon Studio é uma plataforma de criação de quadrinhos com tecnologia de IA.			Quadrinhos
DeepAI	DeepAI oferece um conjunto de ferramentas que usam IA para aprimorar sua criatividade.			Imagem
DeepFloyd SE	SE por DeepFloyd Lab em StabilityAI.			Imagem
Profundidade Qualquer coisa V2	Profundidade Qualquer coisa V2	arXiv		Imagem
Biblioteca de mapas de profundidade e poser	Biblioteca de mapas de profundidade para uso com a extensão Control Net para Automatic1111/stable-diffusion-webui.			Imagem
Difundir para escolher	Enriquecendo a pintura condicionada de imagem em modelos de difusão latente para teste virtual.	arXiv		Imagem
Difusão Discoteca	Um amálgama frankensteiniano de cadernos, modelos e técnicas para a geração de arte e animações de IA.			Imagem
ArrastarGAN	Manipulação interativa baseada em pontos no coletor de imagens generativas.	arXiv		Imagem
Desenhe coisas	Geração de imagens assistida por IA no seu bolso.			Imagem
DWPose	Estimativa eficaz da postura de corpo inteiro com destilação em dois estágios.	arXiv		Imagem
Foto Fácil	Seu gerador de fotos inteligente AI.			Imagem
Fluxo	Este repositório contém código de inferência mínimo para executar texto para imagem e imagem para imagem com nossos transformadores de fluxo retificado latente Flux.			Imagem
Siga seu clique	Animação de imagem regional de domínio aberto por meio de prompts curtos.	arXiv		Imagem
Fooocus	Concentre-se em solicitar e gerar.			Imagem
GIFfusão	Crie GIFs e vídeos usando difusão estável.			Imagem
Segmento aterrado-qualquer coisa	Detecte, segmente e gere qualquer coisa automaticamente com entradas de imagem, texto e áudio.	arXiv		Imagem
HivisionIDFotos	HivisionIDPhotos: uma ferramenta de fotos de identificação de IA leve e eficiente.			Imagem
Hua	Hua é um editor de imagens AI com Stable Diffusion (e mais).			Imagem
Hunyuan-DiT	Um poderoso transformador de difusão multi-resolução com compreensão refinada do chinês.	arXiv		Imagem
IC-Luz	IC-Light é um projeto para manipular a iluminação de imagens.			Imagem
Ideograma	Ajudar as pessoas a se tornarem mais criativas.			Imagem
Imagem	Imagen é um sistema de IA que cria imagens fotorrealistas a partir de texto de entrada.			Imagem
img2img-turbo	Imagem a imagem em uma etapa com SD-Turbo.			Imagem
Img2Prompt	Receba avisos de imagens geradas por difusão estável.			Imagem
Infinidade	Infinity: Dimensionamento de modelagem autoregressiva bit a bit para síntese de imagens de alta resolução.	arXiv		Imagem
ID Instantâneo	Geração de preservação de identidade zero-shot em segundos.	arXiv		Imagem
EstagiárioLM-XComposer2	InternLM-XComposer2 é um modelo grande de linguagem de visão (VLLM) inovador que se destaca na composição e compreensão de texto-imagem de formato livre.	arXiv		Imagem
COALA	A autoatenção é importante na destilação de conhecimento de modelos de difusão latente para síntese de imagens rápida e com eficiência de memória.			Imagem
Cores	Kolors: Treinamento Eficaz de Modelo de Difusão para Síntese Fotorrealística de Texto para Imagem.			Imagem
KREA	Gere imagens e vídeos com uma deliciosa ferramenta de design com tecnologia de IA.			Imagem
Ponte LaVi	Unindo diferentes modelos de linguagem e modelos de visão generativa para geração de texto para imagem.	arXiv		Imagem
Camada Difusão	Difusão de camada de imagem transparente usando transparência latente.	arXiv		Imagem
Léxica	Um mecanismo de pesquisa de prompts de difusão estável.			Imagem
LhamaGen	Modelo autorregressivo supera a difusão: lama para geração de imagens escaláveis.	arXiv		Imagem
Lumina-mGPT	Lumina-mGPT: Illuminate geração fotorrealística flexível de texto para imagem com pré-treinamento generativo multimodal.	arXiv		Imagem
MetaShoot	MetaShoot é um gêmeo digital de um estúdio fotográfico, desenvolvido como um plugin para Unreal Engine que dá a qualquer criador a capacidade de produzir renderizações altamente realistas da maneira mais fácil e rápida.		Motor irreal	Imagem
Meio da jornada	Midjourney é um laboratório de pesquisa independente que explora novos meios de pensamento e expande os poderes imaginativos da espécie humana.			Imagem
MIGC	MIGC: Controlador de geração de múltiplas instâncias para síntese de texto para imagem.	arXiv		Imagem
MimicBrush	Edição de imagem zero-shot com imitação de referência.	arXiv		Imagem
OmniGen	OmniGen: Geração Unificada de Imagens.	arXiv		Imagem
O mais	Omost é um projeto para converter a capacidade de codificação do LLM em capacidade de geração de imagens (ou mais precisamente, composição de imagens).			Imagem
Editor Openpose	Editor Openpose para webui de difusão estável do AUTOMATIC1111.			Imagem
Vista qualquer pessoa	Prova virtual de altíssima qualidade para qualquer roupa e qualquer pessoa.			Imagem
Desfazer Tintas	PaintsUndo: um modelo básico de comportamentos de desenho em pinturas digitais.			Imagem
FotoMaker	Personalização de fotos humanas realistas por meio da incorporação de ID empilhada.	arXiv		Imagem
Sala fotográfica	Gerador de fundo de IA.			Imagem
Plask	Geração de imagens de IA na nuvem.			Imagem
Alerta.Arte	O Centro de Geradores.			Imagem
PuLID	Personalização Pure e Lightning ID por meio de alinhamento contrastivo.	arXiv		Imagem
Rich Text-to-Image	Geração expressiva de texto para imagem com Rich Text.	arXiv		Imagem
RPG-DiffusionMaster	Dominando a difusão de texto para imagem: recapitulação, planejamento e geração com LLMs multimodais (PRG).			Imagem
História SEED	SEED-Story: geração multimodal de histórias longas com modelo de linguagem grande.	arXiv		Imagem
Segmente qualquer coisa	Segment Anything Model (SAM): um novo modelo de IA da Meta AI que pode “cortar” qualquer objeto, em qualquer imagem, com um único clique.	arXiv		Imagem
Segmente qualquer coisa Modelo 2 (SAM 2)	SAM 2: Segmente qualquer coisa em imagens e vídeos.	arXiv		Imagem
sd-webui-controlnet	Extensão WebUI para ControlNet.			Imagem
SDXL-Relâmpago	Destilação de difusão adversária progressiva.	arXiv		Imagem
SDXS	Modelos de difusão latente em uma etapa em tempo real com condições de imagem.			Imagem
Arte estável	Plug-in do Photoshop para Stable Diffusion com Automatic1111 como backend (localmente ou com Google Colab).			Imagem
Cascata Estável	O Stable Cascade consiste em três modelos: Stage A, Stage B e Stage C, representando uma cascata para geração de imagens, daí o nome “Stable Cascade”.			Imagem
Difusão Estável	Um modelo de difusão latente de texto para imagem.			Imagem
difusão estável.cpp	Difusão estável em C/C++ puro.			Imagem
IU da web de difusão estável	Uma interface de navegador baseada na biblioteca Gradio para difusão estável.			Imagem
IU da web de difusão estável	UI baseada na Web para difusão estável.			Imagem
Difusão estável WebUI chinês	Versão chinesa do stable-diffusion-webui.			Imagem
Difusão Estável XL	Gere imagens a partir de texto.	arXiv		Imagem
Difusão Estável XL Turbo	Geração de texto para imagem em tempo real.			Imagem
Difusão Estável 3.5	A versão aberta do Stable Diffusion 3.5 inclui diversas variantes de modelo, incluindo Stable Diffusion 3.5 Large e Stable Diffusion 3.5 Large Turbo.			Imagem
Doodle Estável	Stable Doodle é uma ferramenta de esboço em imagem que converte um desenho simples em uma imagem dinâmica.			Imagem
Estúdio Estável	StableStudio por Estabilidade AI			Imagem
Criador de histórias	StoryMaker: Rumo a personagens holísticos consistentes na geração de texto para imagem.	arXiv		Imagem
StreamDifusão	Uma solução em nível de pipeline para geração interativa em tempo real.			Imagem
EstiloDrop	Geração de texto para imagem em qualquer estilo.	arXiv		Imagem
SyncDreamer	Gerando imagens consistentes com múltiplas visualizações a partir de uma imagem de visualização única.	arXiv		Imagem
Ultra	UltraEdit: edição de imagens refinadas em escala baseada em instruções.	arXiv		Imagem
UltraPixel	UltraPixel: Avançando na síntese de imagens de ultra-alta resolução para novos picos.	arXiv		Imagem
Difusão estável do Unity ML	Difusão estável do Core ML no Unity.		Unidade	Imagem
Visões Vispunk	Plataforma de geração de texto para imagem.			Imagem

^ Voltar ao conteúdo ^

Textura

Fonte	Descrição	Papel	Motor de jogo	Tipo
CRM	Imagem única para malha texturizada 3D com modelo de reconstrução convolucional.	arXiv		Textura
DreamMat	Geração de materiais PBR de alta qualidade com modelos de difusão com reconhecimento de geometria e luz.	arXiv		Textura
DreamSpace	Sonhando com o espaço do seu quarto com propagação de textura panorâmica baseada em texto.			Textura
Texturas de sonho	Difusão estável integrada ao Blender. Crie texturas, arte conceitual, recursos de plano de fundo e muito mais com um simples prompt de texto.		Liquidificador	Textura
Instruir Humanos	Edição de texturas humanas 3D animadas com instruções.	arXiv		Textura
Intex	Síntese interativa de texto para textura por meio de pintura unificada com reconhecimento de profundidade.	arXiv		Textura
Malha LLaMA	LLaMA-Mesh: Unificando Geração de Malha 3D com Modelos de Linguagem.	arXiv		Malha
MaterialSeg3D	MaterialSeg3D: segmentação de materiais densos de anteriores 2D para ativos 3D.	arXiv		Textura
MalhaQualquer coisa	MaterialSeg3D: segmentação de materiais densos de anteriores 2D para ativos 3D.	arXiv		Malha
Neuralângelo	Reconstrução de superfície neural de alta fidelidade.	arXiv		Textura
Pinte	Síntese de texto para textura por meio de otimização de mapa de textura convolucional profunda e renderização com base física.			Textura
Policâmara	Crie suas próprias texturas 3D apenas digitando.			Textura
TexFusion	Sintetizando Texturas 3D com Modelos de Difusão de Imagens Guiadas por Texto.	arXiv		Textura
Texto2Tex	Síntese de textura baseada em texto por meio de modelos de difusão.	arXiv		Textura
Laboratório de Textura	Texturas geradas por IA. Você pode gerar o seu próprio com um prompt de texto.			Textura
Com Poli	Crie texturas com Poly. Gere materiais 3D com IA em um editor online gratuito ou pesquise em nossa crescente biblioteca comunitária.			Textura
Malha X	X-Mesh: rumo à estilização 3D baseada em texto rápida e precisa por meio de orientação textual dinâmica.	arXiv		Textura

^ Voltar ao conteúdo ^

Sombreador

Fonte	Descrição	Papel	Motor de jogo	Tipo
Sombreador de IA	Gerador de shader alimentado por ChatGPT para Unity.		Unidade	Sombreador

^ Voltar ao conteúdo ^

Modelo 3D

Fonte	Descrição	Papel	Motor de jogo	Tipo
Animar3D	Animate3D: Animando qualquer modelo 3D com difusão de vídeo multivisualização.	arXiv		3D
Qualquer coisa-3D	Segmento-Qualquer coisa + 3D. Vamos elevar qualquer coisa para 3D.	arXiv		Modelo
Qualquer2ponto	Any2Point: capacitando modelos grandes de qualquer modalidade para compreensão 3D eficiente.	arXiv		3D
LiquidificadorGPT	Use comandos em inglês para controlar o Blender com GPT-4 da OpenAI.		Liquidificador	Modelo
Blender-GPT	Um assistente Blender completo com integração GPT3/4 + Whisper.		Liquidificador	Modelo
Laboratórios de bloqueio	A alquimia digital é real com o Skybox Lab - a solução definitiva com tecnologia de IA para gerar incríveis experiências de skybox em 360° a partir de prompts de texto.			Modelo
CF-3DGS	Respingos gaussianos 3D sem COLMAP.	arXiv		3D
CharacterGen	CharacterGen: geração eficiente de caracteres 3D a partir de imagens únicas com canonização de pose multivisualização.	arXiv		3D
chatGPT-maya	Ferramenta Maya simples que utiliza IA aberta para executar tarefas básicas com base em instruções descritivas.		Maia	Modelo
CidadeDreamer	Modelo generativo composicional de cidades 3D ilimitadas.	arXiv		3D
CSM	Gere mundos 3D a partir de imagens e vídeos.			3D
Traço	Seu copiloto para construção de mundos no Unreal Engine.		Motor irreal	3D
DreamCatalyst	DreamCatalyst: Edição 3D rápida e de alta qualidade por meio do controle de editabilidade e preservação de identidade.	arXiv		3D
DreamGaussian4D	Respingos Gaussianos 4D Gerativos.	arXiv		4D
DUST3R	Visão geométrica 3D facilitada.	arXiv		3D
Edificar 3D	Edify 3D: geração escalonável de ativos 3D de alta qualidade.	arXiv		3D
GALA3D	GALA3D: Rumo à geração de cenas complexas de texto para 3D por meio de placas gaussianas generativas guiadas por layout.	arXiv		3D
GaussCtrl	GaussCtrl: Edição de salpicos gaussianos 3D consistentes com múltiplas visualizações e baseada em texto.	arXiv		3D
GaussianoCubo	Uma representação de radiação estruturada e explícita para modelagem generativa 3D.	arXiv		3D
Gaussian Dreamer	Geração rápida de texto para splatting gaussiano 3D com Point Cloud Priors.	arXiv		3D
GenieLabs	Capacite seu jogo com AI-UGC.			3D
HiFA	Texto para 3D de alta fidelidade com orientação avançada de difusão.			Modelo
HoloDreamer	HoloDreamer: geração holística de mundo panorâmico 3D a partir de descrições de texto.	arXiv		3D
Hunyuan3D-1.0	Hunyuan3D-1.0: Uma estrutura unificada para geração de texto para 3D e imagem para 3D.	arXiv		3D
Infinigêneo	Mundos fotorrealistas infinitos usando geração processual.	arXiv		3D
Instruir-NeRF2NeRF	Edição de cenas 3D com instruções.	arXiv		Modelo
Interativo3D	Crie o que você deseja com a geração 3D interativa.	arXiv		3D
Isotrópico3D	Geração de imagem para 3D com base em uma única incorporação de CLIP.			3D
LATTE3D	Síntese de texto amortizado em grande escala para 3D aprimorado.	arXiv		3D
LEÃO	Modelos de difusão de ponto latente para geração de formas 3D.	arXiv		Modelo
Luma IA	Capture em 3D realista. Fotorrealismo, reflexos e detalhes incomparáveis. O futuro do VFX é agora, para todos!			Modelo
lumina IA	Criatividade alimentada por IA.			3D
Faça-It-3D	Criação 3D de alta fidelidade a partir de uma única imagem com difusão prévia.	arXiv		Modelo
Malhado	Crie ativos de jogos 3D impressionantes com IA.			3D
Movimento	Criador mágico de animação 3D AI.			3D
MVDream	Difusão multivisualização para geração 3D.	arXiv		3D
NeRF Instantâneo NVIDIA	Primitivos gráficos neurais instantâneos: NeRF extremamente rápido e muito mais.			Modelo
Um-2-3-45	Qualquer imagem única em malha 3D em 45 segundos sem otimização por forma.	arXiv		Modelo
Pintar3D	Pinte qualquer coisa em 3D com modelos de difusão de textura sem iluminação.	arXiv		3D
PAniC-3D	Reconstrução 3D estilizada de visão única a partir de retratos de personagens de anime.	arXiv		Modelo
Ponto·E	Difusão de nuvens de pontos para síntese de modelos 3D.			Modelo
ProlíficoDreamer	Geração diversificada e de alta fidelidade de texto para 3D com destilação de pontuação variacional.	arXiv		Modelo
SF3D	SF3D: Reconstrução de malha 3D rápida e estável com desembrulhamento UV e desembaraço de iluminação.	arXiv		3D
Forma	Gere objetos 3D condicionados a texto ou imagens.	arXiv		Modelo
Sloyd	A modelagem 3D nunca foi tão fácil.			Modelo
Spline IA	O poder da IA está chegando à 3ª dimensão. Gere objetos, animações e texturas usando prompts.			Modelo
Dreamfusion estável	Uma implementação pytorch do modelo de texto para 3D Dreamfusion, alimentado pelo modelo de texto para 2D Stable Diffusion.			Modelo
SV3D	Nova síntese multivisualização e geração 3D a partir de uma única imagem usando difusão de vídeo latente.	arXiv		3D
Tafi	Texto AI para mecanismo de caracteres 3D.			Modelo
3D-GPT	Modelagem 3D Processual com Grandes Modelos de Linguagem.	arXiv		3D
3D-LLM	Injetando o mundo 3D em grandes modelos de linguagem.	arXiv		3D
3Dpressão	Extraia um modelo 3D de um objeto, capturado em vídeo.			Modelo
3DTopia	Geração de texto para 3D em 5 minutos.	arXiv		3D
3DTopia-XL	3DTopia-XL: Dimensionamento da geração de ativos 3D de alta qualidade por meio de difusão primitiva.	arXiv		3D
três estúdio	Uma estrutura unificada para geração de conteúdo 3D.			Modelo
TripoSR	Um modelo de código aberto de última geração para reconstrução 3D feedforward rápida a partir de uma única imagem.	arXiv		Modelo
Único3D	Geração de malha 3D eficiente e de alta qualidade a partir de uma única imagem.	arXiv		3D
UnidadeGaussianaSplatting	Visualização de Toy Gaussian Splatting no Unity.		Unidade	3D
ViVid-1 para 3	Síntese de nova visualização com modelos de difusão de vídeo.	arXiv		3D
Voxcraft	Criação de modelos 3D prontos para uso com IA.			3D
Maravilha3D	Imagem única para 3D usando difusão entre domínios.	arXiv		3D
Zero-1 a 3	Foto zero de uma imagem para objeto 3D.	arXiv		Modelo

^ Voltar ao conteúdo ^

avatar

Fonte	Descrição	Papel	Motor de jogo	Tipo
AniRetrato	Síntese orientada por áudio de animações de retratos fotorrealistas.	arxiv		avatar
CALMA	Modelos latentes adversários condicionais para caracteres virtuais diretos.	arxiv		avatar
Chatavatar	Geração progressiva de faces 3D animatáveis sob orientação de texto.			avatar
ChatDollKit	O ChatDollKit permite que você transforme seu modelo 3D em um chatbot.		Unidade	avatar
DreamTalk	Quando a geração expressiva de falantes -falantes atende a modelos probabilísticos de difusão.	arxiv		avatar
Duix	Duix - SDK humano digital baseado em silício?			avatar
Echomimic	ECOMIMIC: Animações de retratos orientadas a áudio realistas através de condições de referência editáveis.	arxiv		avatar
Emoportraits	Avatares multimodais com uma tiro multimodal com emoção.			avatar
E3 gen	Geração de avatars eficiente, expressiva e editável.	arxiv		avatar
Exavatar	Exavatar - Avatar Gaussiano 3D de corpo inteiro expressivo.	arxiv		avatar
Geneavatar	Edição genérica de avatar da cabeça volumétrica genérica de uma única imagem.	arxiv		avatar
Geneface ++	Geração de rosto em tempo real em tempo real e estável em tempo real.			avatar
Hallo	Síntese visual hierárquica orientada para áudio para animação de imagem de retrato.	arxiv		avatar
Hallo2	HALO2: Animação de imagem de retrato de longa duração e alta resolução.	arxiv		avatar
Cabeça de cabeça	Criação de avatares de cabeça 3D com texto.	arxiv		avatar
Intrinsicavatar	Intrinsicavatar: renderização inversa baseada fisicamente de humanos dinâmicos de vídeos monoculares por meio de rastreamento explícito de raios.	arxiv		avatar
Linly-Talker	Sistema de conversação de avatar digital.			avatar
LivePortrait	LivePortrait: Animação de retrato eficiente com controle de costura e redirecionamento.	arxiv		avatar
MotionGPT	O movimento humano como língua estrangeira, um modelo de geração de idioma de movimento unificado usando LLMS.	arxiv		avatar
MusePose	MUSOPOSE: Uma estrutura de imagem para vídeo orientada a pose para a geração humana virtual.			avatar
MuseTalk	Sincronização labial de alta qualidade em tempo real com espaço latente que inclui.			avatar
Musev	Geração de vídeo humano virtual de comprimento infinito e alta fidelidade com denoising paralelo visual condicionado.			avatar
Retrato4d	Aprendendo síntese de avatar de cabeça 4D com um tiro 4D usando dados sintéticos.	arxiv		avatar
Player me jogador pronto	Integre os avatares personalizáveis ao seu jogo ou aplicativo em dias.			avatar
Rodinhd	Rodinhd: geração de avatar 3D de alta fidelidade com modelos de difusão.	arxiv		avatar
StyleAvatar3D	Aproveitando modelos de difusão de texto de imagem para geração de avatar de alta fidelidade.	arxiv		avatar
Text2Control3D	Geração de avatar 3D controlável em campos de radiação neural usando o modelo de difusão de texto para imagem guiado por geometria.	arxiv		avatar
Topo4d	Topologia que preserva a divisão gaussiana para captura de cabeça 4D de alta fidelidade.	arXiv		avatar
Unityaiwithchatgpt	Com base na unidade, o monitor interativo de voz ChatGPT+UnityChan é realizado.		Unidade	avatar
Vid2avatar	Reconstrução de avatar em 3D a partir de vídeos em The Wild através da decomposição de cenas auto-supervisionadas.	arxiv		avatar
Vlogger	Difusão multimodal para síntese de avatar incorporado.			avatar
Wild2avatar	Tornando os seres humanos por trás de oclusões.	arxiv		avatar

^ Voltar ao conteúdo ^

Animação

Fonte	Descrição	Papel	Tipo
Animar qualquer um	Síntese de imagem para vídeo consistente e controlável para animação de caracteres.	arxiv	Animação
Animador de tudo	Animação de imagem de domínio aberto de granulação fina com orientação de movimento.	arxiv	Animação
Animatediff	Anime seus modelos de difusão de texto para imagem personalizados sem ajuste específico.	arxiv	Animação
Animatelcm	Vamos acelerar a geração de vídeo em 4 etapas!	arxiv	Animação
Animate-x	Animate-X: animação de imagem de caracteres universal com representação aprimorada de movimento.	arxiv	Animação
AnimateZero	Os modelos de difusão de vídeo são animadores de imagem zero.	arxiv	Animação
AnimationGpt	Uma ferramenta da AIGC para gerar ativos de movimento de combate ao jogo.		Animação
DeForum	O DeForum aproveita a difusão estável para gerar visuais de IA em evolução.		Animação
DesenheSpinup	Drawingspinup: animação 3D de desenhos de um único caractere.	arxiv	Animação
Dreamoving	Uma estrutura de geração de vídeo humana baseada em modelos de difusão.	arxiv	Animação
Facefusion	Próxima geração Swapper e intensificador.		Animação
Freeinit	Bridging de lacuna de inicialização nos modelos de difusão de vídeo.	arxiv	Animação
Geneface	Síntese de rosto em 3D em áudio generalizada e de alta fidelidade.	arxiv	Animação
ID-Animador	Geração de vídeo humano que preserva a identidade zero.	arxiv	Animação
Maganimate	Animação de imagem humana consistente temporalmente consistente usando o modelo de difusão.	arxiv	Animação
Nuwa	O Dragnuwa é um modelo de geração de vídeo baseado em difusão em domínio aberto, leva os controles de texto, imagem e trajetória como entradas para obter geração de vídeo controlável.	arxiv	Animação
Nuwa-Infinity	O Nuwa-Infinity é um modelo generativo multimodal projetado para gerar imagens e vídeos de alta qualidade a partir de determinadas entrada de texto, imagem ou vídeo.		Animação
Nuwa-xl	Uma nova arquitetura de difusão sobre difusão para geração de vídeo extremamente longa.		Animação
Omni animação	AI gerou animações de alta fidelidade.		Animação
Pia	Seu animador de imagem personalizado por meio de módulos plug-and-play em modelos de texto para imagem.	arxiv	Animação
Sadtalker	Aprendendo coeficientes de movimento em 3D realistas para a animação estilizada de uma imagem única de imagem.	arxiv	Animação
SadTalker-Video-LIP-SYNC	Este projeto é baseado no SadTalkers wav2lip para síntese de lábios de vídeo.		Animação
Animação estável	Uma poderosa ferramenta de texto para animação para desenvolvedores.		Animação
Talecrafter	Uma ferramenta de visualização de história interativa que suporta vários caracteres.	arxiv	Animação
ToonCrafter	TOONCRAFTER: Interpolação generativa de desenhos animados.	arxiv	Animação
Wav2lip	Vídeos com sincronização de lábios com precisão na natureza.	arxiv	Animação
Wonder Studio	Uma ferramenta de IA que anima automaticamente, ilumina e compõe caracteres de CG em uma cena de ação ao vivo.		Animação

^ Voltar ao conteúdo ^

Visual

Fonte	Descrição	Papel	Tipo
Cambriano-1	Cambriano-1: Uma exploração totalmente aberta e centrada na visão de LLMs multimodais.	arxiv	LLMS multimodal
Cogvlm2	Modelo multimodal de código aberto de nível GPT4V baseado no LLAMA3-8B.		Visual
Cotracker	É melhor rastrear juntos.	arxiv	Visual
EVF-SAM	EVF-SAM: Fusão inicial da linguagem da visão para o segmento promovido por texto qualquer modelo.	arxiv	Visual
Facehi	É melhor rastrear juntos.		Visual
Internlm-xcomposer2	O InternLM-XComposer2 é um modelo grande de grande linguagem de visão (VLLM) que se destaca na composição e compreensão de imagem de texto livre.	arxiv	Visual
Canguru	Kangaroo: Um poderoso modelo de idioma de vídeo que suporta entrada de vídeo de longo contexto.		Visual
LGVI	Em direção ao vídeo orientado a idiomas que inclui modelos multimodais de grandes idiomas.		Visual
Llava ++	Estendendo os recursos visuais com llama-3 e phi-3.		Visual
Llava-onevision	LLAVA-ONEVISION: Fácil transferência de tarefas visuais.	arxiv	Visual
Longva	Transferência de contexto longo da linguagem para a visão.	arxiv	Visual
Maskvit	O pré-treinamento visual mascarado para previsão de vídeo.	arxiv	Visual
Minicpm-llama3-V 2.5	Um MLLM de nível GPT-4V no seu telefone.		Visual
Moe-Llava	Mistura de especialistas para grandes modelos de linguagem da visão.	arxiv	Visual
Motionllm	Compreendendo comportamentos humanos de movimentos e vídeos humanos.	arxiv	Visual
Pllava	Extensão de Llava livre de parâmetros de imagens para vídeos para legendas densas em vídeo.	arxiv	Visual
QWEN-VL	Um modelo versátil da linguagem da visão para compreensão, localização, leitura de texto e além.	arxiv	Visual
sapiens	Sapiens: Fundação para modelos de visão humana.	arxiv	Visual
ShareGpt4V	Melhorando grandes modelos multimodais com melhores legendas.	arxiv	Visual
SOLO	Solo: um único transformador para modelagem escalável em linguagem de visão.	arxiv	Visual
Video-ccam	Video-CCAM: Avançando o entendimento em linguagem de vídeo com máscaras causais de atendimento cruzado.		Visual
Video-Llava	Aprendendo a representação visual unida por alinhamento antes da projeção.	arxiv	Visual
Videollama 2	Avançando a modelagem espacial-temporal e a compreensão de áudio em vídeo-llms.	arxiv	Visual
Video-mme	A primeira referência abrangente de avaliação de LLMs multimodais na análise de vídeo.	arxiv	Visual
Vitron	Uma visão unificada de pixels Vision LLM para entender, gerar, segmentar, editar.		Visual
Vila	Vila: em pré-treinamento para modelos de linguagem visual.	arxiv	Visual

^ Voltar ao conteúdo ^

Vídeo

Fonte	Descrição	Papel	Tipo
360DVD	Geração de vídeo panorama controlável com modelo de difusão de vídeo em 360 graus.	arxiv	Vídeo
Animate-uma-história	Geração de vídeos agrupada por recuperação para contar uma história.	arxiv	Vídeo
Qualquer coisa em qualquer cena	Inserção de objeto de vídeo fotorrealista.		Vídeo
ART • v	Geração de texto para video automático com modelos de difusão.	arxiv	Vídeo
Assistivo	Conheça a plataforma de vídeo generativa que dá vida às suas idéias.		Vídeo
AtomOvideo	Geração de imagem para video de alta fidelidade.	arxiv	Vídeo
BackgroundRemover	O removedor de fundo permite remover o plano de fundo de imagens e vídeo usando AI com uma interface simples da linha de comando que é gratuita e de código aberto.		Vídeo
Boximator	Gerando movimentos ricos e controláveis para a síntese de vídeo.	arxiv	Vídeo
Codef	Campos de deformação de conteúdo para processamento de vídeo temporalmente consistente.	arxiv	Vídeo
Cogvideo	Gere vídeos a partir de descrições de texto.		Vídeo
Cogvideox	O CogVideox é uma versão de código aberto do modelo de geração de vídeo, que é homólogo de 清影.		Vídeo
Cogvlm	O COGVLM é um poderoso Modelo de Linguagem Visual (VLM) de código aberto.		Visual
Conr	Vídeos genarados de dança vívida de folhas de personagens de anime desenhadas à mão (ACS).	arxiv	Vídeo
Dechohere	Crie o que não pode ser filmado.		Vídeo
Descritivo	Descript é a maneira simples, poderosa e divertida de editar.		Vídeo
Diffutoon	Sombreamento editável de alta resolução por meio de modelos de difusão.	arxiv	Vídeo
golfinho	Plataforma geral de interação de vídeo com base no LLMS.		Vídeo
DomoAI	Amplifique sua criatividade com Domoai.		Vídeo
Dreamcinema	DreamCinema: transferência cinematográfica com câmera gratuita e caractere 3D.	arxiv	Vídeo
Dynamicrafter	Animando imagens de domínio aberto com gravadores de difusão em vídeo.	arxiv	Vídeo
BORDA	Introduzimos Edge, um método poderoso para a geração de dança editável capaz de criar danças realistas e fisicamente plausíveis, mantendo fiéis à música de entrada arbitrária.	arxiv	Vídeo
Emo	Emote Retrato Alive - Gerando vídeos de retratos expressivos com modelo de difusão de áudio2Video em condições fracas.	arxiv	Vídeo
Vídeo emu	Fatorizar a geração de texto para vídeo por condicionamento explícito de imagem.		Vídeo
Etna	O ETNA pode gerar conteúdo de vídeo correspondente com base em descrições de texto curto.		Vídeo
Fada	Síntese de vídeo a vídeo guiada por instrução rápida paralela.		Vídeo
Siga-your-canvas	Siga-Your-Canvas: Oppainting de vídeo de alta resolução com extensa geração de conteúdo.	arxiv	Vídeo
Siga sua pose	Geração de texto para video guiada por pose usando vídeos sem pose.	arxiv	Vídeo
FullJourney	Seu conjunto completo de ferramentas de criação de IA na ponta dos dedos.		Vídeo
Gen-2	Um sistema de IA multimodal que pode gerar novos vídeos com texto, imagens ou videoclipes.		Vídeo
Dinâmica generativa	Dinâmica de imagem generativa.		Vídeo
Gênio	Ambientes interativos generativos.	arxiv	Vídeo
Genmo	Faça magicamente vídeos com IA.		Vídeo
Gentron	Transformadores de difusão para geração de imagem e vídeo.		Vídeo
Higen	Desaparelamento espaço-temporal hierárquico para geração de texto para vídeo.		Vídeo
Hotshot-xl	O HotShot-XL é um modelo de texto para GIF da IA treinado para trabalhar ao lado de difusão estável XL.		Vídeo
Hunyuanvideo	Hunyuanvideo: uma estrutura sistemática para um modelo de geração de vídeo grande.	arxiv	Vídeo
Imagen Video	Dado um prompt de texto, o Imagen Video gera vídeos de alta definição usando um modelo de geração de vídeo base e uma sequência de modelos de super-resolução espacial e temporal intercalados.		Vídeo
InstructVideo	Instruindo modelos de difusão em vídeo com feedback humano.	arxiv	Vídeo
I2vgen-xl	Síntese de imagem para videão de alta qualidade por meio de modelos de difusão em cascata.	arxiv	Vídeo
Lavie	Geração de vídeo de alta qualidade com modelos de difusão latente em cascata.	arxiv	Vídeo
LTX Studio	O LTX Studio é uma plataforma de cinema holística e orientada pela IA para criadores, profissionais de marketing, cineastas e estúdios.		Vídeo
LTX-VIDEO	O LTX-Video é o primeiro modelo de geração de vídeo baseado em DIT que pode gerar vídeos de alta qualidade em tempo real. Ele pode gerar vídeos de 24 fps na resolução de 768x512, mais rápida do que é necessário para assisti -los.		Vídeo
Lumière	Um modelo de difusão espaço-tempo para geração de vídeo.	arxiv	Vídeo
Lvdm	Modelos de difusão em vídeo latentes para geração de vídeo longa de alta fidelidade.	arxiv	Vídeo
MagicVideo	Geração de vídeo eficiente com modelos de difusão latente.	arxiv	Vídeo
MagicVideo-V2	Geração de vídeo de alta estética em vários estágios.	arxiv	Vídeo
Hora mágica	Vídeo da IA para criadores simplificados.		Vídeo
Magvit-V2	O tokenizer é a chave para a geração visual.		Vídeo
Magvit	Transformador de vídeo generativo mascarado.		Vídeo
Make-a-video	Make-a-Video é um sistema de AI de última geração que gera vídeos do texto.	arxiv	Vídeo
Faça pixels dançar	Geração de vídeo de alta dinâmica.	arxiv	Vídeo
Faça-Your-Video	Geração de vídeo personalizada usando orientação textual e estrutural.	arxiv	Vídeo
Microcinema	Uma abordagem de divisão e conquista para geração de texto para vídeo.	arxiv	Vídeo
MIMO	MIMO: síntese de vídeo de caracteres controláveis com modelagem espacial decomposta.	arxiv	Vídeo
Mini-gimini	Minerando o potencial dos modelos de linguagem de visão de modalidade multiminâmica.		Visão
MobileVidFactory	Geração de vídeo de mídia social baseada em difusão automática para dispositivos móveis do texto.		Vídeo
Mochi 1	O Mochi 1 é um modelo de geração de vídeo de ponta aberto com movimento de alta fidelidade e forte adesão rápida na avaliação preliminar.		Vídeo
Mofa-video	Animação de imagem controlável por meio de adaptações de campo de movimento generativo no modelo de difusão de imagem para vídeo congelado.	arxiv	Vídeo
MoneyPrinterturbo	Use modelos grandes para gerar vídeos curtos com um clique.		Vídeo
MoonValley	MoonValley é um novo modelo de IA generativo de texto para vídeo.		Vídeo
mora	Mais como Sora para geração de vídeo generalista.	arxiv	Vídeo
Morph Studio	Com a nossa magia de texto para video, manifeste sua criatividade através do seu prompt.		Vídeo
MotionClone	MotionClone: Clonagem de movimento sem treinamento para geração de vídeo controlável.	arxiv	Vídeo
MotionCtrl	Um controlador de movimento unificado e flexível para geração de vídeo.	arxiv	Vídeo
MotionDirector	Personalização de movimento dos modelos de difusão de texto para vídeo.	arxiv	Vídeo
MotionShop	Uma aplicação de substituir os caracteres no vídeo por avatares 3D.		Vídeo
MOV2MOV	MOV2MOV Plugin para automático1111/stable-difusão-webui.		Vídeo
Moveriefactory	Criação automática de filmes a partir de texto usando grandes modelos generativos para idiomas e imagens.	arxiv	Vídeo
Quadros neurais	Descubra o sintetizador para o mundo visual.		Vídeo
Nunca termina	Crie seu mundo.		Vídeo
Sora aberta	Democratizando a produção de vídeo eficiente para todos.		Vídeo
Sora aberta	Plano de Sora Aberta.		Vídeo
Fenaki	Um modelo para gerar vídeos a partir de texto, com instruções que podem mudar com o tempo e vídeos que podem levar até vários minutos.	arxiv	Vídeo
Pika Labs	O Pika Labs está revolucionando a experiência de criação de vídeo com a IA.		Vídeo
Pixeling	O Pixeling capacita nossos clientes a criar conteúdo visual altamente preciso, ultra-realista e extremamente controlável, incluindo imagens, vídeos e modelos 3D.		Vídeo
PixVerse	Crie vídeos de tirar o fôlego com a IA.		Vídeo
Polinizações	Criar fica fácil, rápido e divertido.		Vídeo
Reutilizar e difundir	Denoising iterativo para geração de texto para vídeo.	arxiv	Vídeo
Ruyi	Ruyi é um modelo de imagem para vídeo capaz de gerar vídeos de qualidade cinematográfica a uma resolução de 768, com uma taxa de quadros de 24 quadros por segundo, totalizando 5 segundos e 120 quadros.		Vídeo
Shortgpt	Uma estrutura experimental de IA para criação automatizada de conteúdo de curta/vídeo.		Vídeo
Show-1	Casar os modelos de pixel e difusão latente para geração de texto para vídeo.	arxiv	Vídeo
Snap Video	Transformadores espaço-temporais em escala para a síntese de texto em vídeo.	arxiv	Vídeo
Sora	Criando vídeo a partir de texto.		Vídeo
Sorawebui	O Sorawebui é um cliente da SORA Web de código aberto, permitindo que os usuários criem vídeos facilmente do texto com o modelo SORA do OpenAI.		Vídeo
StableVideo	Edição de vídeo de difusão de consistência orientada por texto.		Vídeo
Difusão de vídeo estável	Imagem a Video de Difusão de Vídeo estável (SVD).		Vídeo
StoryDiffusion	Auto-atimento consistente para geração de imagem e vídeo de longo alcance.	arxiv	Vídeo
StreamingT2V	Geração de vídeo longa, dinâmica e extensível e dinâmica e extensível a partir do texto.	arxiv	Vídeo
StyleCrafter	Geração de texto para vídeo estilizada com um adaptador de estilo.	arxiv	Vídeo
Tats	Longa geração de vídeo com vqgan e transformador sensível ao tempo.		Vídeo
Text2Video-zero	Os modelos de difusão de texto para imagem são geradores de vídeo zero.	arxiv	Vídeo
TF-T2V	Uma receita para ampliar a geração de texto para vídeo com vídeos sem texto.	arxiv	Vídeo
Torá	TORA: Transformador de difusão orientado a trajetória para geração de vídeo.	arxiv	Vídeo
Faixa anything	O track-anything é uma ferramenta flexível e interativa para rastreamento e segmentação de objetos de vídeo, com base no segmento de qualquer coisa e no XMEM.	arxiv	Vídeo
Tune-a-Video	Ajuste de um tiro de modelos de difusão de imagem para geração de texto para vídeo.	arxiv	Vídeo
Doze alojados	AI multimodal que entende vídeos como humanos.		Vídeo
Univg	Para geração de vídeo-modal unificada.		Vídeo
VCHITECT-2.0	VCHITECT-2.0: Transformador paralelo para ampliar modelos de difusão de vídeo.		Vídeo
VGen	Um ecossistema holístico de geração de vídeo para geração de vídeo construindo modelos de difusão.	arxiv	Vídeo
ViewCrafter	Viewcrafter: Modelos de difusão de vídeo domineando para síntese de vistas de alta fidelidade.	arxiv	Vídeo
Video-chatgpt	O vídeo-chatgpt é um modelo de conversa capaz de gerar conversas significativas sobre vídeos.	arxiv	Vídeo
Videocomposer	Síntese de vídeo composicional com controlabilidade de movimento.	arxiv	Vídeo
Videocrafter1	Modelos de difusão aberta para geração de vídeo de alta qualidade.	arxiv	Vídeo
Videocrafter2	Superando as limitações de dados para modelos de difusão de vídeo de alta qualidade.	arxiv	Vídeo
Videodrafter	Geração de vídeo multi-cena consistente com conteúdo com LLM.	arxiv	Vídeo
VideoElevator	Elevando a qualidade da geração de vídeo com modelos de difusão de texto a imagem versáteis.	arxiv	Vídeo
Videofactory	Torne a atenção nas difusões espaço-temporais para a geração de texto para vídeo.		Vídeo
VideoGen	Uma abordagem de difusão latente guiada por referência para geração de texto para vídeo de alta definição.	arxiv	Vídeo
Videolcm	Modelo de consistência latente em vídeo.	arxiv	Vídeo
Vídeo LDMS	Alinhe seus latentes: síntese de vídeo de alta resolução com modelos de difusão latente.	arxiv	Vídeo
Video-Llava	Aprendendo a representação visual unida por alinhamento antes da projeção.	arxiv	Vídeo
Videomamba	Modelo de espaço de estado para uma compreensão eficiente em vídeo.	arxiv	Vídeo
Vídeo de pensamento	Vídeo de pensamento: raciocínio em vídeo passo a passo da percepção à cognição.		Vídeo
Videopoet	Um grande modelo de idioma para geração de vídeo com tiro zero.	arxiv	Vídeo
Movimento vispunk	Crie vídeos realistas usando apenas texto.		Vídeo
Visualrwkv	O VisualRWKV é a versão visual aprimorada do modelo de linguagem RWKV, permitindo que o RWKV lide com várias tarefas visuais.		Visual
V-JEPA	Vídeo Incorporação conjunta de arquitetura preditiva.	arxiv	Vídeo
Walt	Geração de vídeo fotorrealista com modelos de difusão.	arxiv	Vídeo
Zeroscópio	Zeroscópio Text-to-video.		Vídeo

^ Voltar ao conteúdo ^

Áudio

Fonte	Descrição	Papel	Tipo
Academicodec	Um modelo de codec de áudio de código aberto para pesquisa acadêmica.		Áudio
Anfion	Um kit de ferramentas de geração de áudio, música e geração de fala.	arxiv	Áudio
Archisound	Geração de áudio usando modelos de difusão, em Pytorch.		Áudio
AudioBox	Geração de áudio unificada com avisos de linguagem natural.		Áudio
Audioediting	Edição de áudio não supervisionada e baseada em texto zero usando a inversão do DDPM.	arxiv	Áudio
Codec Audiogen	Um codec de áudio neural estéreo de baixa compressão de 48kHz para áudio geral, otimizando para fidelidade de áudio?		Áudio
Audiogpt	Compreender e gerar fala, música, som e cabeça de falar.	arxiv	Áudio
Audiolcm	Geração de texto para áudio com modelos de consistência latente.	arxiv	Áudio
Audioldm	Geração de texto para áudio com modelos de difusão latente.	arxiv	Áudio
Audioldm 2	Aprendendo geração holística de áudio com pré-treinamento auto-supervisionado.	arxiv	Áudio
Aufusão	Aproveitando o poder da difusão e modelos de linguagem grande para geração de texto para áudio.	arxiv	Áudio
CTAG	Geração criativa de texto para áudio via programação do sintetizador.		Áudio
Foleycrafter	Foleycrafter: traga vídeos silenciosos com vida com sons realistas e sincronizados.	arxiv	Áudio
Ímã	Geração de áudio mascarada usando um único transformador não autorregressivo.		Áudio
Make-an-Audio	Geração de texto para áudio com modelos de difusão rápida aprimorada.	arxiv	Áudio
Make-an-Audio 3	Transformando o texto em áudio por meio de grandes transformadores de difusão baseados em fluxo.	arxiv	Áudio
NeuralSound	Síntese de som modal baseado em aprendizado com transferência acústica.	arxiv	Áudio
Optimizerai	Sons para criadores, fabricantes de jogos, artistas, criadores de vídeos.		Áudio
QWEN2-AUDIO	QWEN2-AUDIO CHAT e modelo de linguagem de áudio grande pré-terenciada proposta pela Alibaba Cloud.	arxiv	Áudio
See-2-Sound	Som de ambiente espacial para zero t-thot para espacial.	arxiv	Áudio
SOLSTORM	Geração de áudio paralela eficiente.	arxiv	Áudio
Áudio estável	Difusão de áudio latente condicionado ao tempo rápido.		Áudio
Áudio estável aberto	O Audio estável Open 1.0 gera áudio estéreo de comprimento de variável (até 47s) a 44,1kHz a partir de prompts de texto.		Áudio
Syncfusion	Syncfusion: síntese multimodal sincronizada em vídeo-audio foley.	arxiv	Áudio
TANGO	Geração de texto para áudio usando o Modelo de LLM sintonizado de instrução e difusão latente.		Áudio
VTA-LDM	Geração de vídeo a áudio com alinhamento oculto.	arxiv	Áudio
Wavjourney	Criação de áudio composicional com grandes modelos de idiomas.	arxiv	Áudio

^ Voltar ao conteúdo ^

Música

Fonte	Descrição	Papel	Tipo
Aiva	A inteligência artificial compondo música de trilha sonora emocional.		Música
Música amper	Tecnologia de geração de música personalizada alimentada pela Amper.		Música
Boomy	Crie música generativa. Compartilhe com o mundo.		Música
Chatmusician	Promovendo habilidades musicais intrínsecas no LLM.		Música
Chord2Melody	Geração de música automática AI.		Música
Diff-bgm	Um modelo de difusão para geração de música em vídeo em vídeo.	arxiv	Música
FluxMusic	FluxMusic: geração de texto para música com transformador de fluxo retificado.	arxiv	Música
GptableTon	Rascunho de script para processar a resposta GPT e enviar as notas MIDI para os clipes Ableton com Abletonosc e Python-OSC.		Música
Heymusic.ai	Gerador de música AI		Música
Imagem para música	A IA Image to Music Generator é uma ferramenta que usa inteligência artificial para converter imagens em música.		Música
Jen-1	Geração de música universal guiada por texto com modelos de difusão omnidirecional.		Música
Juke-box	Um modelo generativo para música.	arxiv	Música
Magenta	Magenta é um projeto de pesquisa que explora o papel do aprendizado de máquina no processo de criação de arte e música.		Música
Melodia	Geração de música neural eficiente		Música
Mubert	Ai música generativa.		Música
Musenet	Uma profunda rede neural que pode gerar composições musicais de 4 minutos com 10 instrumentos diferentes e pode combinar estilos de país a Mozart e os Beatles.		Música
MusicGen	Geração de música simples e controlável.	arxiv	Música
Musicldm	Aumentar a novidade na geração de texto para música usando estratégias de mistura síncrona de batida.	arxiv	Música
MúsicaLM	Gerando música a partir de texto.	arxiv	Música
Aplicativo de riffusion	A Riffusion é um aplicativo para geração de música em tempo real com difusão estável.		Música
Sonauto	Sonauto é um editor de música da AI que transforma instruções, letras ou melodias em músicas completas em qualquer estilo.		Música
Soundraw	Ai Gerador de Música para Criadores.		Música
Soundry AI	Ferramentas de IA generativas, incluindo pacotes de amostras de texto a som e infinito.		Música

^ Voltar ao conteúdo ^

Voz cantando

Fonte	Descrição	Papel	Tipo
DiffSinger	Cantando a síntese de voz via mecanismo de difusão superficial.	arxiv	Voz cantando
Voice-Voice-Voice-Voice-Voice-Webui	Uma estrutura SVC fácil de usar com base em Vits.		Voz cantando
SO-VITS-SVC	SoftVC Vits Cantando a conversão de voz.		Voz cantando
Vi-svs	Use Vits e OpenCpop para desenvolver a síntese de voz cantada; Diferente de Visinger.		Voz cantando

^ Voltar ao conteúdo ^

Discurso

Fonte	Descrição	Papel	Motor de jogo	Tipo
Applio	Ferramenta de clonagem de voz final, meticulosamente otimizada para poder incomparável, modularidade e experiência amigável.			Discurso
Audyo	Texto em. Audio out.			Discurso
Latido	Modelo de áudio generativo promovido por texto.			Discurso
Bert-vits2	Vits2 Backbone com Bert multilíngue.			Discurso
Chattts	Chattts é um modelo de fala generativo para o diálogo diário.			Discurso
Clapspeech	Aprendendo a prosódia do contexto de texto com o pré-treinamento contrastante de linguagem-audio.	arxiv		Discurso
Cosyvoice	Modelo de geração de voz grande multilíngue, fornecendo capacidade de inferência, treinamento e implantação.			Discurso
Dex-tts	Expressivo em expressão baseado em difusão com modelagem de estilo na variabilidade do tempo.	arxiv		Discurso
Emotivice	Um motor TTS com várias vozes e prompts controlados.			Discurso
Flicki	Transforme o texto em vídeos com vozes de IA.			Discurso
GLM-4-Voice	GLM-4-Voice é um modelo de voz de ponta a ponta lançado pela Zhipu AI. O GLM-4-Voice pode entender e gerar diretamente a fala chinesa e inglesa, se envolver em conversas em vozis em tempo real e alterar atributos como emoção, entonação, taxa de fala e dialeto com base nas instruções do usuário.			Discurso
Brilho-tts	Um fluxo generativo para a fala em fala através da pesquisa de alinhamento monotônico.	arxiv		Discurso
GPT-Sovits	Uma poderosa conversão de voz de poucas fotos e webui de texto em fala.			Discurso
LovO	Loves é o gerador de voz AI e a plataforma de fala para milhares de criadores.			Discurso
Mahatts	Um modelo de geração de fala de grande porte de código aberto.			Discurso
Matcha-tts	Uma arquitetura TTS rápida com correspondência de fluxo condicional.	arxiv		Discurso
Melotts	Biblioteca de texto em fala em fala de alta qualidade por myshell.ai. Suporte inglês, espanhol, francês, chinês, japonês e coreano.			Discurso
Metavoice-1b	AI para inteligência de fala em nível humano.			Discurso
Narakeet	Crie facilmente dublagens usando texto realista para a fala.			Discurso
Mini-omni	Mini-omni: Os modelos de idiomas podem ouvir, conversar enquanto pensam em streaming. O Mini-OMNI é um modelo de linguagem grande multimodelo de código aberto que pode ouvir, conversar enquanto pensa. Apresentando a entrada de fala de ponta a ponta em tempo real e o streaming de capacidades de conversação de saída de áudio.	arxiv		Discurso
Cloneração de uma tira de voz	Base de clonagem de voz de um tiro no UNET-TTS.			Discurso
OpenVoice	Clonagem de voz instantânea por Myshell.			Discurso
Transbordamento	Colocando fluxos no topo dos transdutores neurais para melhores TTs.			Discurso
Realtimetts	O Realtimetts é uma biblioteca de texto para fala (TTS), projetada para aplicativos em tempo real.			Discurso
SenseVoice	O SenseVoice é um modelo de base de fala com recursos de entendimento de vários discursos, incluindo reconhecimento automático de fala (ASR), identificação de linguagem falada (LID), reconhecimento de emoção de fala (SER) e detecção de eventos de áudio (AED).			Discurso
Speechgpt	Capacitando grandes modelos de linguagem com habilidades de conversação cruzadas intrínsecas.	arxiv		Discurso
Spean-text-GPT3-Unidade	Este é o repo que eu uso a API Whisper e Chatgpt do OpenAi em Unity.		Unidade	Discurso
Discurso estável	Estabilidade O modelo de texto em fala da AI.			Discurso
Stabletts	Modelo TTS de próxima geração usando correspondência de fluxo e DIT, inspirada na difusão estável 3.			Discurso
Styletts 2	Rumo ao texto em nível humano-fala através da difusão de estilo e treinamento adversário com grandes modelos de linguagem de fala.	arxiv		Discurso
Tortoise.cpp	Tortoise.cpp: Implementação de GGML de tartaruga-tts.			Discurso
Tortoise-tts	Um sistema TTS com várias vozes treinou com ênfase na qualidade.			Discurso
TTS Generation Webui	TTS Generation Webui (Bark, MusicGen, Tortoise, RVC, Vocos, Demucs).			Discurso
VAL-E	Os modelos de idiomas de codec neural são texto zero para sintetizadores de fala.	arxiv		Discurso
Vall-e x	Fale línguas estrangeiras com sua própria voz: modelagem de idiomas neural de codec transversal	arxiv		Discurso
Vocode	O Vocode é uma biblioteca de código aberto para criar aplicativos LLM baseados em voz.			Discurso
Caixa de voz	Geração de fala universal multilíngue guiada por texto em escala.	arxiv		Discurso
Voicecraft	Edição de fala zero-tiro e fala em fala na natureza.			Discurso
Sussurrar	Whisper é um modelo de reconhecimento de fala geral.			Discurso
Whisperspeech	Um sistema de texto para fala em código aberto criado invertendo o Whisper.			Discurso
XE-fala	Estrutura de treinamento conjunto da conversão emocional de texto em voz e expressão e conversão de voz cruzada e de voz cruzada.			Discurso
XTTS	XTTS é uma biblioteca para geração avançada de texto em fala.			Discurso
Yourtts	Em direção a Zero Shot Multi-Speaker TTS e conversão de voz com tiro zero para todos.	arxiv		Discurso
Zmm-tts	Síntese de fala multilíngue e multispicando zero-tiro condicionada a representações discretas de fala auto-supervisionadas.	arxiv		Discurso