ai game devtools
1.0.0
Aqui acompanharemos as mais recentes ferramentas de desenvolvimento de jogos de IA, incluindo LLM, Agente, Código, Escritor, Imagem, Textura, Shader, Modelo 3D, Animação, Vídeo, Áudio, Música, Voz Cantada e Análise.
Fonte | Descrição | Papel | Motor de jogo | Tipo |
---|---|---|---|---|
AgenteGPT | ? Monte, configure e implante agentes de IA autônomos em seu navegador. | Ferramenta | ||
AICommand | Integração ChatGPT com Unity Editor. | Unidade | Ferramenta | |
AIOS | Sistema operacional do agente LLM. | Ferramenta | ||
Cientista de IA | O Cientista de IA: Rumo à Descoberta Científica Aberta Totalmente Automatizada. | arXiv | Ferramenta | |
CLI assistente | Uma ferramenta CLI confortável para usar o serviço ChatGPT | Ferramenta | ||
Auto-GPT | Uma tentativa experimental de código aberto para tornar o GPT-4 totalmente autônomo. | Ferramenta | ||
BebêAGI | Este script Python é um exemplo de sistema de gerenciamento de tarefas baseado em IA. | Ferramenta | ||
?? IU do bebêAGI | A UI do BabyAGI foi projetada para facilitar a execução e o desenvolvimento com o babyagi em um aplicativo da web, como um ChatGPT. | Ferramenta | ||
baichuan-7B | Um modelo de linguagem de pré-treinamento 7B em grande escala desenvolvido por Baichuan. | Ferramenta | ||
Baichuan-13B | Um modelo de linguagem grande 13B desenvolvido pela Baichuan Intelligent Technology. | Ferramenta | ||
Bai Chuan 2 | Uma série de grandes modelos de linguagem desenvolvidos pela Baichuan Intelligent Technology. | Ferramenta | ||
Bisheng | Bisheng é uma plataforma aberta LLM devops para aplicativos de IA de próxima geração. | Ferramenta | ||
Personagem-LLM | Um agente treinável para dramatização. | arXiv | Ferramenta | |
ChatDev | Agentes Comunicativos para Desenvolvimento de Software. | arXiv | Ferramenta | |
Unidade ChatGPT-API | Vincula a API de conclusão de bate-papo ChatGPT ao C# puro no Unity. | Unidade | Ferramenta | |
ChatGPTForUnity | ChatGPT pela unidade. | Unidade | Ferramenta | |
Bate-papoRWKV | ChatRWKV é como ChatGPT, mas desenvolvido com modelo de linguagem RWKV (100% RNN) e código aberto. | Ferramenta | ||
Bate-papoYuan | Modelo de Grande Linguagem para Diálogo em Chinês e Inglês. | Ferramenta | ||
Chinês-LLaMA-Alpaca-3 | (LLMs chineses Llama-3) desenvolvidos a partir do Meta Llama 3. | Ferramenta | ||
Chrome-GPT | Um agente AutoGPT que controla o Chrome no seu desktop. | Ferramenta | ||
CogVLM | CogVLM, um poderoso modelo de base de linguagem visual de código aberto. | arXiv | Ferramenta | |
CoreNet | Uma biblioteca para treinar redes neurais profundas. | Ferramenta | ||
Cosmos | Cosmos é uma plataforma mundial de desenvolvimento de modelos que consiste em modelos de base mundial, tokenizadores e pipeline de processamento de vídeo para acelerar o desenvolvimento de IA física em laboratórios de robótica e AV. | LLM | ||
DBRX | DBRX é um grande modelo de linguagem treinado pela Databricks. | Ferramenta | ||
DCLM | DataComp para modelos de linguagem. | arXiv | Ferramenta | |
DeepSeek-V3 | DeepSeek-V3 é um forte modelo de linguagem Mixture-of-Experts (MoE) com 671B de parâmetros totais com 37B ativados para cada token. | arXiv | LLM | |
DemoGPT | Gerador de aplicativo Auto Gen-AI com o poder do Llama 2 | Ferramenta | ||
Design2Code | Automatizando a engenharia front-end | Ferramenta | ||
Devika | Devika é engenheira de software Agentic AI. | Ferramenta | ||
Devon | Um programador de pares de código aberto. | Ferramenta | ||
Dora | Gerando sites poderosos, um prompt por vez. | Ferramenta | ||
Fluir | Arraste e solte a interface do usuário para criar seu fluxo LLM personalizado usando LangchainJS. | Ferramenta | ||
Gêmeos | O Gemini foi desenvolvido desde o início para a multimodalidade – raciocínio perfeito em texto, imagens, vídeo, áudio e código. | Ferramenta | ||
Gema | Gemma é uma família de modelos abertos leves e de última geração, construídos a partir de pesquisa e tecnologia usada para criar modelos do Google Gemini. | Ferramenta | ||
gemma.cpp | mecanismo de inferência C++ leve e autônomo para os modelos Gemma do Google. | Ferramenta | ||
GLM-4 | GLM-4-9B é a versão de código aberto da última geração de modelos pré-treinados da série GLM-4 lançada pela Zhipu AI. | Ferramenta | ||
GPT4Todos | Um chatbot treinado em uma enorme coleção de dados limpos de assistentes, incluindo código, histórias e diálogos. | Ferramenta | ||
GPT-4o | GPT-4o (“o” para “omni”) é um passo em direção a uma interação humano-computador muito mais natural – aceita como entrada qualquer combinação de texto, áudio, imagem e vídeo e gera qualquer combinação de texto, áudio e imagem saídas. | Ferramenta | ||
GPTScript | Desenvolva aplicativos LLM em linguagem natural. | Ferramenta | ||
Grok-1 | Os pesos e a arquitetura de nosso modelo de mistura de especialistas de 314 bilhões de parâmetros, Grok-1. | Ferramenta | ||
AbraçosChat | Disponibilizando os melhores modelos de chat de IA da comunidade para todos. | Ferramenta | ||
Abraçando a integração da API Unity Face | Este pacote Unity fornece uma integração fácil de usar para a API Hugging Face Inference, permitindo que os desenvolvedores acessem e usem modelos Hugging Face AI em seus projetos Unity. | Unidade | Ferramenta | |
ImagemBind | ImageBind One Embedding Space para vincular todos eles. | arXiv | Ferramenta | |
Índice-1.9B | Um LLM multilíngue leve SOTA. | Ferramenta | ||
Unidade InteractML | InteractML, uma estrutura de script visual de aprendizado de máquina interativo para Unity3D. | Unidade | Ferramenta | |
InteractML-Unreal Engine | Trazendo o aprendizado de máquina para o Unreal Engine. | Motor irreal | Ferramenta | |
EstagiárioLM | InternLM abriu o código-fonte de um modelo base de 7 bilhões de parâmetros, um modelo de chat adaptado para cenários práticos e o sistema de treinamento. | arXiv | Ferramenta | |
EstagiárioLM-XComposer | InternLM-XComposer2 é um modelo grande de linguagem de visão (VLLM) inovador que se destaca na composição e compreensão de texto-imagem de formato livre. | arXiv | Ferramenta | |
janeiro | Leve a IA para o seu desktop. | Ferramenta | ||
Lamini | Lamini permite que qualquer equipe de engenharia supere LLMs de uso geral por meio de RLHF e ajuste fino em seus próprios dados. | Ferramenta | ||
LaMini-LM | LaMini-LM é uma coleção de modelos de linguagem eficientes e de pequeno porte, destilados do ChatGPT e treinados em um conjunto de dados em grande escala de 2,58 milhões de instruções. | Ferramenta | ||
LangChain | LangChain é uma estrutura para desenvolvimento de aplicativos baseados em modelos de linguagem. | Ferramenta | ||
LangFlow | ⛓️ LangFlow é uma UI para LangChain, projetada com react-flow para fornecer uma maneira fácil de experimentar e prototipar fluxos. | Ferramenta | ||
Lavague | Automatize a automação com a estrutura Large Action Model. | Ferramenta | ||
Lêmure | Modelos de base aberta para agentes linguísticos. | Ferramenta | ||
Lépton IA | Uma estrutura Pythonic para simplificar a construção de serviços de IA. | Ferramenta | ||
Lit-LLaMA | Implementação do modelo de linguagem LLaMA baseado em nanoGPT. Suporta atenção flash, quantização Int8 e GPTQ de 4 bits, ajuste fino de adaptador LoRA e LLaMA, pré-treinamento. | Ferramenta | ||
lhama2-webui | Execute o Llama 2 localmente com Gradio UI na GPU ou CPU de qualquer lugar (Linux/Windows/Mac). | Ferramenta | ||
Lhama 3 | O site oficial do GitHub do Meta Llama 3. | Ferramenta | ||
Lhama 3.1 | Llama é um modelo de linguagem grande (LLM) acessível e aberto, projetado para desenvolvedores, pesquisadores e empresas construírem, experimentarem e dimensionarem com responsabilidade suas ideias generativas de IA. | Ferramenta | ||
LLaSM | Grande modelo de linguagem e fala. | Ferramenta | ||
Mecanismo de resposta LLM | Construa um mecanismo de resposta inspirado na perplexidade usando Next.js, Groq, Mixtral, Langchain, OpenAI, Brave e Serper. | Ferramenta | ||
llm.c | Treinamento LLM em C/CUDA simples e bruto. | Ferramenta | ||
LLMUnidade | Crie personagens no Unity com LLMs! | Unidade | Ferramenta | |
LLocalSearch | LLocalSearch é um mecanismo de pesquisa totalmente executado localmente usando Agentes LLM. | Ferramenta | ||
LogicGamesSolver | Uma ferramenta Python para resolver jogos de lógica com IA, Deep Learning e Visão Computacional. | Ferramenta | ||
LongWriter | LongWriter: liberando a geração de mais de 10.000 palavras a partir de LLMs de contexto longo. | arXiv | Ferramenta | |
Modelo de Mundo Grande (LWM) | Large World Model (LWM) é um modelo autoregressivo multimodal de grande contexto de uso geral. | arXiv | Ferramenta | |
Lumina-T2X | Lumina-T2X é uma estrutura unificada para geração de texto para qualquer modalidade. | arXiv | Ferramenta | |
MetaGPT | A estrutura multiagente | Ferramenta | ||
MiniCPM-2B | Um LLM final supera o Llama2-13B. | Ferramenta | ||
MiniGPT-4 | Aprimorando a compreensão da linguagem visual com modelos avançados de linguagem ampla. | arXiv | Ferramenta | |
MiniGPT-5 | Geração intercalada de visão e linguagem por meio de Vokens generativos. | arXiv | Ferramenta | |
Mixtral 8x7B | Uma mistura esparsa de especialistas de alta qualidade. | arXiv | Ferramenta | |
Mistral 7B | O melhor modelo 7B até hoje, Apache 2.0. | Ferramenta | ||
Mistral Grande | Mistral Large é um novo modelo de geração de texto de última geração. Atinge capacidades de raciocínio de alto nível. | Ferramenta | ||
MLC LLM | Permita que todos desenvolvam, otimizem e implantem modelos de IA nativamente nos dispositivos de todos. | Ferramenta | ||
MobiLlama | Rumo a um GPT preciso e leve, totalmente transparente. | arXiv | Ferramenta | |
MoE-LLaVA | Mistura de especialistas para grandes modelos de linguagem visual. | arXiv | Ferramenta | |
Moshi | Moshi é uma IA de conversação experimental. | Ferramenta | ||
Moshi | Moshi: um modelo básico de fala-texto para diálogo em tempo real. | Ferramenta | ||
MUSGO | Um modelo de linguagem conversacional aumentada por ferramenta de código aberto da Universidade Fudan. | Ferramenta | ||
mPLUG-Coruja? | A modularização capacita grandes modelos de linguagem com multimodalidade. | arXiv | Ferramenta | |
Nemotron-4 | Um grande modelo de linguagem multilíngue com 15 bilhões de parâmetros treinado em 8 trilhões de tokens de texto. | arXiv | Ferramenta | |
NExT-GPT | Modelo de linguagem grande multimodal qualquer para qualquer. | Ferramenta | ||
OLMo | Modelo de linguagem aberta | arXiv | Ferramenta | |
OmniLMM | Grandes modelos multimodais para forte desempenho e implantação eficiente. | Ferramenta | ||
OneLLM | Uma estrutura para alinhar todas as modalidades com a linguagem. | arXiv | Ferramenta | |
Assistente aberto | OpenAssistant é um assistente baseado em chat que entende tarefas, pode interagir com sistemas de terceiros e recuperar informações dinamicamente para fazer isso. | Ferramenta | ||
OpenDevin | Um engenheiro de software de IA autônomo. | Ferramenta | ||
Órion-14B | Orion-14B é uma família de modelos que inclui um LLM de base 14B e uma série de modelos. | arXiv | Ferramenta | |
Panda | Modelo de linguagem grande de código aberto chinês no exterior, baseado em Llama-7B, -13B, -33B, -65B para pré-treinamento contínuo na área chinesa. | Ferramenta | ||
Perplexa | Um mecanismo de pesquisa baseado em IA. | Ferramenta | ||
Pi | Chatbot AI projetado para assistência pessoal e suporte emocional. | Ferramenta | ||
Qwen1.5 | Qwen1.5 é a versão melhorada do Qwen. | Ferramenta | ||
Qwen2 | Qwen2 é a grande série de modelos de linguagem desenvolvida pela equipe Qwen, Alibaba Cloud. | Ferramenta | ||
Qwen-7B | O repositório oficial do bate-papo Qwen-7B (通义千问-7B) e do modelo de linguagem grande pré-treinado proposto pelo Alibaba Cloud. | Ferramenta | ||
RepoAgente | RepoAgent é um projeto de código aberto conduzido por Large Language Models (LLMs) que visa fornecer uma maneira inteligente de documentar projetos. | arXiv | Ferramenta | |
Mecanismo de IA de sanidade | Sanity AI Engine para a ferramenta de desenvolvimento de jogos Unity. | Unidade | Ferramenta | |
PesquisaGPT | ? Conectando ChatGPT à Internet | Ferramenta | ||
CompartilharGPT4V | Melhorando grandes modelos multimodais com melhores legendas. | Ferramenta | ||
Skywork | Os modelos da série Skywork são pré-treinados em 3,2 TB de dados de código e multilíngues de alta qualidade (principalmente chinês e inglês). | Ferramenta | ||
EstávelLM | Modelos de linguagem de IA de estabilidade. | arXiv | Ferramenta | |
Alpaca de Stanford | Um modelo LLaMA que segue instruções. | Ferramenta | ||
IU da web de geração de texto | Uma UI web gradio para executar grandes modelos de linguagem como LLaMA, llama.cpp, GPT-J, OPT e GALACTICA. | Ferramenta | ||
Motor TinyChat | Biblioteca de inferência LLM no dispositivo. | Ferramenta | ||
Banco de ferramentas | Uma plataforma aberta para treinamento, atendimento e avaliação de grandes modelos de linguagem para aprendizado de ferramentas. | Ferramenta | ||
Unidade de bate-papoGPT | Experimentos Unity ChatGPT. | Unidade | Ferramenta | |
Integração Unity OpenAI-API | Integre o modelo de linguagem openai GPT-3 e a API ChatGPT em um projeto Unity. | Unidade | Ferramenta | |
Unreal Engine 5 Lhama LoRA | Um projeto de prova de conceito que mostra o potencial do uso de LLMs pequenos e localmente treináveis para criar ferramentas de documentação de próxima geração. | Motor irreal | Ferramenta | |
UnrealGPT | Uma coleção de widgets do Unreal Engine 5 Editor Utility alimentados por GPT3/4. | Motor irreal | Ferramenta | |
Vídeo-LLaVA | Aprendendo a representação visual unida por alinhamento antes da projeção. | arXiv | Ferramenta | |
WebGPT | Execute o modelo GPT no navegador com WebGPU. | Ferramenta | ||
Web3-GPT | Implante contratos inteligentes com IA | Ferramenta | ||
WordGPT | ? Leve o poder do ChatGPT para o Microsoft Word | Ferramenta | ||
Agente X | Um agente LLM autônomo para resolução de tarefas complexas. | Ferramenta | ||
Sim | Uma série de grandes modelos de linguagem treinados do zero por desenvolvedores. | Ferramenta | ||
01 Projeto | O computador modelo de linguagem de código aberto. | Ferramenta |
^ Voltar ao conteúdo ^
Fonte | Descrição | Papel | Motor de jogo | Tipo |
---|---|---|---|---|
Banco de Agente | Uma referência abrangente para avaliar LLMs como agentes. | arXiv | Agente | |
Bate-papo em grupo de agentes | Um simulacro de bate-papo em grupo interativo para melhor provocar o comportamento emergente coletivo. | arXiv | Agente | |
Agente K | Um AGI autoagente que evolui automaticamente e é modular. | Agente | ||
AgenteScope | Comece a criar aplicativos multiagentes habilitados para LLM de maneira mais fácil. | arXiv | Agente | |
AgenteSims | Um sandbox de código aberto para avaliação de modelos de linguagem grande. | Agente | ||
Cidade IA | AI Town é uma cidade virtual onde personagens de IA vivem, conversam e socializam. | Agente | ||
anime.gf | Alternativa local e de código aberto para CharacterAI. | Jogo | ||
Astrocade | Crie jogos com IA | Jogo | ||
Agentes Atômicos | A estrutura do Atomic Agents foi projetada para ser modular, extensível e fácil de usar. | Agente | ||
AutoAgentes | Uma estrutura para geração automática de agentes. | Agente | ||
Geração automática | Habilite aplicativos de modelo de linguagem grande de última geração. | arXiv | Agente | |
comportamental | Behaviac é uma estrutura de desenvolvimento de IA de jogos. | Estrutura | ||
Biomas | Biomes é um MMORPG sandbox de código aberto construído para a web usando tecnologias da web como Next.js, Typescript, React e WebAssembly. | Jogo | ||
Amortecedor de pensamentos | Raciocínio Aumentado pelo Pensamento com Grandes Modelos de Linguagem. | arXiv | Agente | |
Agente Byzer | Estrutura de agente fácil, rápida e distribuída para todos. | Agente | ||
Cidade dos Gatos | Simulação alimentada por AC(h)atGPT com gatos. | Agente | ||
Cidade dos Gatos | Simulação alimentada por AC(h)atGPT com gatos. | Agente | ||
PersonagemGLM | Personalização de caracteres de IA de conversação em chinês com grandes modelos de linguagem. | arXiv | Agente | |
ChatDev | Agentes Comunicativos para Desenvolvimento de Software. | arXiv | Agente | |
Agente Cog | CogAgent é um modelo de linguagem visual de código aberto aprimorado com base no CogVLM. | arXiv | Agente | |
Berço | Rumo ao controle geral do computador. | Agente | ||
tripulaçãoAI | Estrutura para orquestrar agentes de IA autônomos e role-playing. | Agente | ||
Modificar | Dify é uma plataforma de construção de aplicativos LLM de código aberto. | Agente | ||
Projeto Vida Digital | Personagens 3D autônomos com inteligência social. | arXiv | Agente | |
tudo-ai | Seu assistente de chatbot local totalmente proficiente, com tecnologia de IA? | Agente | ||
tecido | fabric é uma estrutura de código aberto para aprimorar humanos usando IA. | Agente | ||
FastGPT | FastGPT é uma plataforma baseada em conhecimento construída no LLM. | Agente | ||
rápidoRAG | Estrutura de geração e aumento de recuperação eficiente. | Agente | ||
JogoAISDK | Estrutura de automação de IA de jogos baseada em imagens. | Estrutura | ||
GameNGen | Modelos de difusão são motores de jogos em tempo real. | arXiv | Jogo | |
GameGen-O | GameGen-O: Geração de videogame em mundo aberto. | Jogo | ||
Agente Gen | GenAgent: Construa Sistemas de IA Colaborativos com Geração Automatizada de Fluxo de Trabalho - Estudos de Caso no ComfyUI. | arXiv | Agente | |
Agentes Geradores | Simulacros Interativos do Comportamento Humano. | arXiv | Agente | |
Gênese | Genesis: um mecanismo de física generativo e universal para robótica e muito mais. | Jogo | ||
Gênio | Ambientes interativos generativos. | Jogo | ||
gigax | Tempo de execução, NPCs com tecnologia LLM. | Jogo | ||
HippoRAG | Memória de longo prazo inspirada neurobiologicamente para grandes modelos de linguagem. | arXiv | Agente | |
NPCs interativos com tecnologia LLM | Interactive LLM Powered NPCs, é um projeto de código aberto que transforma completamente sua interação com personagens não-jogadores (NPCs) em qualquer jogo! | Jogo | ||
IoA | Uma estrutura de código aberto para agentes colaborativos de IA, permitindo que diversos agentes distribuídos se unam e lidem com tarefas complexas por meio de conectividade semelhante à da Internet. | Agente | ||
Agentes Kwai | Um sistema generalizado de agente de busca de informações com Large Language Models (LLMs). | arXiv | Agente | |
LangChain | Leve seu aplicativo LLM do protótipo à produção. | Agente | ||
Fluxo Lang | Langflow é uma UI para LangChain, projetada com react-flow para fornecer uma maneira fácil de experimentar e prototipar fluxos. | Agente | ||
Estúdio LangGraph | LangGraph Studio oferece uma nova maneira de desenvolver aplicativos LLM, fornecendo um IDE de agente especializado que permite visualização, interação e depuração de aplicativos de agente complexos. | Agente | ||
LARP | Role Play de Agente de Linguagem para jogos de mundo aberto. | arXiv | Agente | |
Sistema Agente Llama | Componentes agentes das APIs Llama Stack. | Agente | ||
LhamaIndex | LlamaIndex é uma estrutura de dados para seu aplicativo LLM. | Agente | ||
MindSearch | ? Uma estrutura multiagente de mecanismo de pesquisa na Web baseada em LLM (como Perplexity.ai Pro e SearchGPT). | Agente | ||
Mistura de Agentes (MoA) | A mistura de agentes aprimora as capacidades do grande modelo de linguagem. | arXiv | Agente | |
Função MMR | MMRole: Uma Estrutura Abrangente para Desenvolver e Avaliar Agentes Multimodais de RPG. | arXiv | Agente | |
Moonlander.ai | Comece a criar jogos 3D sem qualquer codificação usando IA generativa. | Estrutura | ||
Difusão Mug | MuG Diffusion é uma IA de gráficos para jogos de ritmo baseada em Stable Diffusion (um dos modelos AIGC mais poderosos) com uma grande modificação para incorporar ondas de áudio. | Jogo | ||
Oásis | Oasis é um modelo de mundo interativo desenvolvido pela Decart e Etched. Baseado em transformadores de difusão, o Oasis recebe a entrada do teclado do usuário e gera a jogabilidade de maneira autorregressiva. | Jogo | ||
Agente Om | Uma estrutura de agente multimodal para resolver tarefas complexas. | Agente | ||
Agentes Abertos | Uma plataforma aberta para agentes linguísticos em liberdade. | Agente | ||
obra | Um aplicativo de IA que transforma texto em um videogame. | Jogo | ||
Pipecat | Estrutura de código aberto para voz e IA conversacional multimodal. | Agente | ||
Agente Qwen | Qwen-Agent é uma estrutura para o desenvolvimento de aplicativos LLM com base no seguimento de instruções, uso de ferramentas, planejamento e recursos de memória do Qwen. | Agente | ||
Ragas | Ragas é uma estrutura que ajuda você a avaliar seus pipelines de Retrieval Augmented Generation (RAG). | Agente | ||
RPBench-Auto | Um pipeline automatizado para avaliar LLMs para role-playing. | Jogo | ||
SIMA | Um agente generalista de IA para ambientes virtuais 3D. | Agente | ||
StoryGames.ai | IA para sonhadores fazem jogos. | Jogo | ||
Agente SWE | Interfaces de computador agente permitem modelos de linguagem de engenharia de software. | arXiv | Agente | |
TaskGen | Uma estrutura de agente baseada em tarefas baseada em saídas StrictJSON de agentes LLM. | Agente | ||
DEZ Agente | TEN Agent é o primeiro agente multimodal em tempo real do mundo integrado com a API OpenAI Realtime, RTC, e apresenta verificações meteorológicas, pesquisa na web, visão e recursos RAG. | Agente | ||
Agente de tradução | Tradução agente usando fluxo de trabalho de reflexão. | Agente | ||
Twitter Personality é um aplicativo da web que analisa seu identificador do Twitter para criar um perfil de personalidade personalizado usando o Wordware AI Agent. | Agente | |||
Ilimitado | Ilimitado: um jogo generativo infinito de simulação de vida de personagem. | arXiv | Jogo | |
Video2Game | Ambiente em tempo real, interativo, realista e compatível com navegador a partir de um único vídeo. | arXiv | Jogo | |
V-IRL | Fundamentando a inteligência virtual na vida real. | arXiv | Agente | |
Agente WebDesign | Um agente usado para webdesign. | Agente | ||
Agente X | Um agente LLM autônomo para resolução de tarefas complexas. | Agente |
^ Voltar ao conteúdo ^
Fonte | Descrição | Papel | Motor de jogo | Tipo |
---|---|---|---|---|
Tradutor de código AI | Use IA para traduzir código de um idioma para outro. | Código | ||
aiXcoder-7B | Modelo de linguagem grande de código aiXcoder-7B. | Código | ||
erro | bloop é um mecanismo de busca de código rápido escrito em Rust. | Código | ||
Capítulo | Intérprete de código ChatGPT em notebooks Jupyter. | Código | ||
CodeGeeX | Um modelo aberto de geração de código multilíngue. | arXiv | Código | |
CodeGeeX2 | Um modelo de geração de código multilíngue mais poderoso. | Código | ||
CodeGeeX4 | CodeGeeX4: modelo aberto de geração de código multilíngue. | Código | ||
CodeGen | CodeGen é um modelo de código aberto para síntese de programas. Treinado em TPU-v4. Competitivo com OpenAI Codex. | arXiv | Código | |
CódigoGen2 | Modelos CodeGen2 para síntese de programas. | arXiv | Código | |
Código Lhama | Code Llama é um grande modelo de linguagem para código baseado no Llama 2. | Código | ||
CódigoTF | Biblioteca de transformadores completa para Code LLM de última geração. | Código | ||
CódigoT5 | LLMs de código aberto para compreensão e geração de código. | Código | ||
Cursor | Escreva, edite e converse sobre seu código com GPT-4 em um novo tipo de editor. | Código | ||
Codificador DeepSeek | DeepSeek Coder: deixe o código se escrever. | arXiv | Código | |
Códice OpenAI | OpenAI Codex é descendente do GPT-3. | Código | ||
PandasAI | Pandas AI é uma biblioteca Python que integra recursos generativos de inteligência artificial ao Pandas, tornando os dataframes conversacionais. | Código | ||
RobloxScripterAI | RobloxScripterAI é uma ferramenta de geração de código com tecnologia de IA para Roblox. | Roblox | Código | |
Scikit-LLM | Integre perfeitamente modelos de linguagem poderosos como ChatGPT ao scikit-learn para tarefas aprimoradas de análise de texto. | Código | ||
SoTaNa | O assistente de desenvolvimento de software de código aberto. | arXiv | Código | |
Código Estável 3B | Codificação no Edge. | Código | ||
StarCoder | ? StarCoder é um modelo de linguagem (LM) treinado em código-fonte e texto em linguagem natural. | arXiv | Código | |
Star Coder 2 | StarCoder2 é uma família de modelos de geração de código (3B, 7B e 15B), treinados em mais de 600 linguagens de programação do The Stack v2 e alguns textos em linguagem natural, como Wikipedia, Arxiv e problemas do GitHub. | arXiv | Código | |
IA UnityGen | UnityGen AI é um plugin de geração de código baseado em IA para Unity. | Unidade | Código | |
Vazio | Void é uma alternativa de Cursor de código aberto. Escreva código com as melhores ferramentas de IA, mantenha controle total sobre seus dados e acesse recursos poderosos de IA. | Código |
^ Voltar ao conteúdo ^
Fonte | Descrição | Papel | Motor de jogo | Tipo |
---|---|---|---|---|
Escritor de IA | A IA escreve romances, gera artigos de fantasia e romance na web, etc. Modelo generativo chinês pré-treinado. | Escritor | ||
Caderno.ai | Notebook.ai é um conjunto de ferramentas para escritores, designers de jogos e roleplayers criarem universos magníficos – e tudo dentro deles. | Escritor | ||
Romance | Editor WYSIWYG no estilo Notion com preenchimentos automáticos alimentados por IA. | Escritor | ||
Novela AI | Impulsionado pela IA, construa sem dor histórias únicas, contos emocionantes, romances sedutores ou apenas divirta-se. | Escritor |
^ Voltar ao conteúdo ^
Fonte | Descrição | Papel | Motor de jogo | Tipo |
---|---|---|---|---|
Qualquer porta | Personalização de imagem em nível de objeto de disparo zero. | arXiv | Imagem | |
Qualquer texto | Geração e edição de texto visual multilíngue. | arXiv | Imagem | |
AutoStudio | Criação de assuntos consistentes na geração de imagens interativas multivoltas. | arXiv | Imagem | |
Blender-ControlNet | Usando ControlNet direto no Blender. | Liquidificador | Imagem | |
BriVL | Unindo Visão e Modelo de Linguagem. | arXiv | Imagem | |
CatVTON | CatVTON: Concatenação é tudo que você precisa para teste virtual com modelos de difusão. | arXiv | Imagem | |
CLIPasso | Um método para converter a imagem de um objeto em um esboço, permitindo vários níveis de abstração. | arXiv | Imagem | |
ClipDrop | Crie visuais impressionantes em segundos. | Imagem | ||
UI confortável | Uma GUI de difusão estável, poderosa e modular, com uma interface de gráficos/nós. | Imagem | ||
Laboratório de conceitos | Geração criativa usando restrições anteriores de difusão. | arXiv | Imagem | |
ControlNet | ControlNet é uma estrutura de rede neural para controlar modelos de difusão adicionando condições extras. | arXiv | Imagem | |
CSGO | CSGO: composição de estilo de conteúdo na geração de texto para imagem. | arXiv | Imagem | |
DALL·E 2 | DALL·E 2 é um sistema de IA que pode criar imagens e arte realistas a partir de uma descrição em linguagem natural. | Imagem | ||
Estúdio Dashtoon | Dashtoon Studio é uma plataforma de criação de quadrinhos com tecnologia de IA. | Quadrinhos | ||
DeepAI | DeepAI oferece um conjunto de ferramentas que usam IA para aprimorar sua criatividade. | Imagem | ||
DeepFloyd SE | SE por DeepFloyd Lab em StabilityAI. | Imagem | ||
Profundidade Qualquer coisa V2 | Profundidade Qualquer coisa V2 | arXiv | Imagem | |
Biblioteca de mapas de profundidade e poser | Biblioteca de mapas de profundidade para uso com a extensão Control Net para Automatic1111/stable-diffusion-webui. | Imagem | ||
Difundir para escolher | Enriquecendo a pintura condicionada de imagem em modelos de difusão latente para teste virtual. | arXiv | Imagem | |
Difusão Discoteca | Um amálgama frankensteiniano de cadernos, modelos e técnicas para a geração de arte e animações de IA. | Imagem | ||
ArrastarGAN | Manipulação interativa baseada em pontos no coletor de imagens generativas. | arXiv | Imagem | |
Desenhe coisas | Geração de imagens assistida por IA no seu bolso. | Imagem | ||
DWPose | Estimativa eficaz da postura de corpo inteiro com destilação em dois estágios. | arXiv | Imagem | |
Foto Fácil | Seu gerador de fotos inteligente AI. | Imagem | ||
Fluxo | Este repositório contém código de inferência mínimo para executar texto para imagem e imagem para imagem com nossos transformadores de fluxo retificado latente Flux. | Imagem | ||
Siga seu clique | Animação de imagem regional de domínio aberto por meio de prompts curtos. | arXiv | Imagem | |
Fooocus | Concentre-se em solicitar e gerar. | Imagem | ||
GIFfusão | Crie GIFs e vídeos usando difusão estável. | Imagem | ||
Segmento aterrado-qualquer coisa | Detecte, segmente e gere qualquer coisa automaticamente com entradas de imagem, texto e áudio. | arXiv | Imagem | |
HivisionIDFotos | HivisionIDPhotos: uma ferramenta de fotos de identificação de IA leve e eficiente. | Imagem | ||
Hua | Hua é um editor de imagens AI com Stable Diffusion (e mais). | Imagem | ||
Hunyuan-DiT | Um poderoso transformador de difusão multi-resolução com compreensão refinada do chinês. | arXiv | Imagem | |
IC-Luz | IC-Light é um projeto para manipular a iluminação de imagens. | Imagem | ||
Ideograma | Ajudar as pessoas a se tornarem mais criativas. | Imagem | ||
Imagem | Imagen é um sistema de IA que cria imagens fotorrealistas a partir de texto de entrada. | Imagem | ||
img2img-turbo | Imagem a imagem em uma etapa com SD-Turbo. | Imagem | ||
Img2Prompt | Receba avisos de imagens geradas por difusão estável. | Imagem | ||
Infinidade | Infinity: Dimensionamento de modelagem autoregressiva bit a bit para síntese de imagens de alta resolução. | arXiv | Imagem | |
ID Instantâneo | Geração de preservação de identidade zero-shot em segundos. | arXiv | Imagem | |
EstagiárioLM-XComposer2 | InternLM-XComposer2 é um modelo grande de linguagem de visão (VLLM) inovador que se destaca na composição e compreensão de texto-imagem de formato livre. | arXiv | Imagem | |
COALA | A autoatenção é importante na destilação de conhecimento de modelos de difusão latente para síntese de imagens rápida e com eficiência de memória. | Imagem | ||
Cores | Kolors: Treinamento Eficaz de Modelo de Difusão para Síntese Fotorrealística de Texto para Imagem. | Imagem | ||
KREA | Gere imagens e vídeos com uma deliciosa ferramenta de design com tecnologia de IA. | Imagem | ||
Ponte LaVi | Unindo diferentes modelos de linguagem e modelos de visão generativa para geração de texto para imagem. | arXiv | Imagem | |
Camada Difusão | Difusão de camada de imagem transparente usando transparência latente. | arXiv | Imagem | |
Léxica | Um mecanismo de pesquisa de prompts de difusão estável. | Imagem | ||
LhamaGen | Modelo autorregressivo supera a difusão: lama para geração de imagens escaláveis. | arXiv | Imagem | |
Lumina-mGPT | Lumina-mGPT: Illuminate geração fotorrealística flexível de texto para imagem com pré-treinamento generativo multimodal. | arXiv | Imagem | |
MetaShoot | MetaShoot é um gêmeo digital de um estúdio fotográfico, desenvolvido como um plugin para Unreal Engine que dá a qualquer criador a capacidade de produzir renderizações altamente realistas da maneira mais fácil e rápida. | Motor irreal | Imagem | |
Meio da jornada | Midjourney é um laboratório de pesquisa independente que explora novos meios de pensamento e expande os poderes imaginativos da espécie humana. | Imagem | ||
MIGC | MIGC: Controlador de geração de múltiplas instâncias para síntese de texto para imagem. | arXiv | Imagem | |
MimicBrush | Edição de imagem zero-shot com imitação de referência. | arXiv | Imagem | |
OmniGen | OmniGen: Geração Unificada de Imagens. | arXiv | Imagem | |
O mais | Omost é um projeto para converter a capacidade de codificação do LLM em capacidade de geração de imagens (ou mais precisamente, composição de imagens). | Imagem | ||
Editor Openpose | Editor Openpose para webui de difusão estável do AUTOMATIC1111. | Imagem | ||
Vista qualquer pessoa | Prova virtual de altíssima qualidade para qualquer roupa e qualquer pessoa. | Imagem | ||
Desfazer Tintas | PaintsUndo: um modelo básico de comportamentos de desenho em pinturas digitais. | Imagem | ||
FotoMaker | Personalização de fotos humanas realistas por meio da incorporação de ID empilhada. | arXiv | Imagem | |
Sala fotográfica | Gerador de fundo de IA. | Imagem | ||
Plask | Geração de imagens de IA na nuvem. | Imagem | ||
Alerta.Arte | O Centro de Geradores. | Imagem | ||
PuLID | Personalização Pure e Lightning ID por meio de alinhamento contrastivo. | arXiv | Imagem | |
Rich Text-to-Image | Geração expressiva de texto para imagem com Rich Text. | arXiv | Imagem | |
RPG-DiffusionMaster | Dominando a difusão de texto para imagem: recapitulação, planejamento e geração com LLMs multimodais (PRG). | Imagem | ||
História SEED | SEED-Story: geração multimodal de histórias longas com modelo de linguagem grande. | arXiv | Imagem | |
Segmente qualquer coisa | Segment Anything Model (SAM): um novo modelo de IA da Meta AI que pode “cortar” qualquer objeto, em qualquer imagem, com um único clique. | arXiv | Imagem | |
Segmente qualquer coisa Modelo 2 (SAM 2) | SAM 2: Segmente qualquer coisa em imagens e vídeos. | arXiv | Imagem | |
sd-webui-controlnet | Extensão WebUI para ControlNet. | Imagem | ||
SDXL-Relâmpago | Destilação de difusão adversária progressiva. | arXiv | Imagem | |
SDXS | Modelos de difusão latente em uma etapa em tempo real com condições de imagem. | Imagem | ||
Arte estável | Plug-in do Photoshop para Stable Diffusion com Automatic1111 como backend (localmente ou com Google Colab). | Imagem | ||
Cascata Estável | O Stable Cascade consiste em três modelos: Stage A, Stage B e Stage C, representando uma cascata para geração de imagens, daí o nome “Stable Cascade”. | Imagem | ||
Difusão Estável | Um modelo de difusão latente de texto para imagem. | Imagem | ||
difusão estável.cpp | Difusão estável em C/C++ puro. | Imagem | ||
IU da web de difusão estável | Uma interface de navegador baseada na biblioteca Gradio para difusão estável. | Imagem | ||
IU da web de difusão estável | UI baseada na Web para difusão estável. | Imagem | ||
Difusão estável WebUI chinês | Versão chinesa do stable-diffusion-webui. | Imagem | ||
Difusão Estável XL | Gere imagens a partir de texto. | arXiv | Imagem | |
Difusão Estável XL Turbo | Geração de texto para imagem em tempo real. | Imagem | ||
Difusão Estável 3.5 | A versão aberta do Stable Diffusion 3.5 inclui diversas variantes de modelo, incluindo Stable Diffusion 3.5 Large e Stable Diffusion 3.5 Large Turbo. | Imagem | ||
Doodle Estável | Stable Doodle é uma ferramenta de esboço em imagem que converte um desenho simples em uma imagem dinâmica. | Imagem | ||
Estúdio Estável | StableStudio por Estabilidade AI | Imagem | ||
Criador de histórias | StoryMaker: Rumo a personagens holísticos consistentes na geração de texto para imagem. | arXiv | Imagem | |
StreamDifusão | Uma solução em nível de pipeline para geração interativa em tempo real. | Imagem | ||
EstiloDrop | Geração de texto para imagem em qualquer estilo. | arXiv | Imagem | |
SyncDreamer | Gerando imagens consistentes com múltiplas visualizações a partir de uma imagem de visualização única. | arXiv | Imagem | |
Ultra | UltraEdit: edição de imagens refinadas em escala baseada em instruções. | arXiv | Imagem | |
UltraPixel | UltraPixel: Avançando na síntese de imagens de ultra-alta resolução para novos picos. | arXiv | Imagem | |
Difusão estável do Unity ML | Difusão estável do Core ML no Unity. | Unidade | Imagem | |
Visões Vispunk | Plataforma de geração de texto para imagem. | Imagem |
^ Voltar ao conteúdo ^
Fonte | Descrição | Papel | Motor de jogo | Tipo |
---|---|---|---|---|
CRM | Imagem única para malha texturizada 3D com modelo de reconstrução convolucional. | arXiv | Textura | |
DreamMat | Geração de materiais PBR de alta qualidade com modelos de difusão com reconhecimento de geometria e luz. | arXiv | Textura | |
DreamSpace | Sonhando com o espaço do seu quarto com propagação de textura panorâmica baseada em texto. | Textura | ||
Texturas de sonho | Difusão estável integrada ao Blender. Crie texturas, arte conceitual, recursos de plano de fundo e muito mais com um simples prompt de texto. | Liquidificador | Textura | |
Instruir Humanos | Edição de texturas humanas 3D animadas com instruções. | arXiv | Textura | |
Intex | Síntese interativa de texto para textura por meio de pintura unificada com reconhecimento de profundidade. | arXiv | Textura | |
Malha LLaMA | LLaMA-Mesh: Unificando Geração de Malha 3D com Modelos de Linguagem. | arXiv | Malha | |
MaterialSeg3D | MaterialSeg3D: segmentação de materiais densos de anteriores 2D para ativos 3D. | arXiv | Textura | |
MalhaQualquer coisa | MaterialSeg3D: segmentação de materiais densos de anteriores 2D para ativos 3D. | arXiv | Malha | |
Neuralângelo | Reconstrução de superfície neural de alta fidelidade. | arXiv | Textura | |
Pinte | Síntese de texto para textura por meio de otimização de mapa de textura convolucional profunda e renderização com base física. | Textura | ||
Policâmara | Crie suas próprias texturas 3D apenas digitando. | Textura | ||
TexFusion | Sintetizando Texturas 3D com Modelos de Difusão de Imagens Guiadas por Texto. | arXiv | Textura | |
Texto2Tex | Síntese de textura baseada em texto por meio de modelos de difusão. | arXiv | Textura | |
Laboratório de Textura | Texturas geradas por IA. Você pode gerar o seu próprio com um prompt de texto. | Textura | ||
Com Poli | Crie texturas com Poly. Gere materiais 3D com IA em um editor online gratuito ou pesquise em nossa crescente biblioteca comunitária. | Textura | ||
Malha X | X-Mesh: rumo à estilização 3D baseada em texto rápida e precisa por meio de orientação textual dinâmica. | arXiv | Textura |
^ Voltar ao conteúdo ^
Fonte | Descrição | Papel | Motor de jogo | Tipo |
---|---|---|---|---|
Sombreador de IA | Gerador de shader alimentado por ChatGPT para Unity. | Unidade | Sombreador |
^ Voltar ao conteúdo ^
Fonte | Descrição | Papel | Motor de jogo | Tipo |
---|---|---|---|---|
Animar3D | Animate3D: Animando qualquer modelo 3D com difusão de vídeo multivisualização. | arXiv | 3D | |
Qualquer coisa-3D | Segmento-Qualquer coisa + 3D. Vamos elevar qualquer coisa para 3D. | arXiv | Modelo | |
Qualquer2ponto | Any2Point: capacitando modelos grandes de qualquer modalidade para compreensão 3D eficiente. | arXiv | 3D | |
LiquidificadorGPT | Use comandos em inglês para controlar o Blender com GPT-4 da OpenAI. | Liquidificador | Modelo | |
Blender-GPT | Um assistente Blender completo com integração GPT3/4 + Whisper. | Liquidificador | Modelo | |
Laboratórios de bloqueio | A alquimia digital é real com o Skybox Lab - a solução definitiva com tecnologia de IA para gerar incríveis experiências de skybox em 360° a partir de prompts de texto. | Modelo | ||
CF-3DGS | Respingos gaussianos 3D sem COLMAP. | arXiv | 3D | |
CharacterGen | CharacterGen: geração eficiente de caracteres 3D a partir de imagens únicas com canonização de pose multivisualização. | arXiv | 3D | |
chatGPT-maya | Ferramenta Maya simples que utiliza IA aberta para executar tarefas básicas com base em instruções descritivas. | Maia | Modelo | |
CidadeDreamer | Modelo generativo composicional de cidades 3D ilimitadas. | arXiv | 3D | |
CSM | Gere mundos 3D a partir de imagens e vídeos. | 3D | ||
Traço | Seu copiloto para construção de mundos no Unreal Engine. | Motor irreal | 3D | |
DreamCatalyst | DreamCatalyst: Edição 3D rápida e de alta qualidade por meio do controle de editabilidade e preservação de identidade. | arXiv | 3D | |
DreamGaussian4D | Respingos Gaussianos 4D Gerativos. | arXiv | 4D | |
DUST3R | Visão geométrica 3D facilitada. | arXiv | 3D | |
Edificar 3D | Edify 3D: geração escalonável de ativos 3D de alta qualidade. | arXiv | 3D | |
GALA3D | GALA3D: Rumo à geração de cenas complexas de texto para 3D por meio de placas gaussianas generativas guiadas por layout. | arXiv | 3D | |
GaussCtrl | GaussCtrl: Edição de salpicos gaussianos 3D consistentes com múltiplas visualizações e baseada em texto. | arXiv | 3D | |
GaussianoCubo | Uma representação de radiação estruturada e explícita para modelagem generativa 3D. | arXiv | 3D | |
Gaussian Dreamer | Geração rápida de texto para splatting gaussiano 3D com Point Cloud Priors. | arXiv | 3D | |
GenieLabs | Capacite seu jogo com AI-UGC. | 3D | ||
HiFA | Texto para 3D de alta fidelidade com orientação avançada de difusão. | Modelo | ||
HoloDreamer | HoloDreamer: geração holística de mundo panorâmico 3D a partir de descrições de texto. | arXiv | 3D | |
Hunyuan3D-1.0 | Hunyuan3D-1.0: Uma estrutura unificada para geração de texto para 3D e imagem para 3D. | arXiv | 3D | |
Infinigêneo | Mundos fotorrealistas infinitos usando geração processual. | arXiv | 3D | |
Instruir-NeRF2NeRF | Edição de cenas 3D com instruções. | arXiv | Modelo | |
Interativo3D | Crie o que você deseja com a geração 3D interativa. | arXiv | 3D | |
Isotrópico3D | Geração de imagem para 3D com base em uma única incorporação de CLIP. | 3D | ||
LATTE3D | Síntese de texto amortizado em grande escala para 3D aprimorado. | arXiv | 3D | |
LEÃO | Modelos de difusão de ponto latente para geração de formas 3D. | arXiv | Modelo | |
Luma IA | Capture em 3D realista. Fotorrealismo, reflexos e detalhes incomparáveis. O futuro do VFX é agora, para todos! | Modelo | ||
lumina IA | Criatividade alimentada por IA. | 3D | ||
Faça-It-3D | Criação 3D de alta fidelidade a partir de uma única imagem com difusão prévia. | arXiv | Modelo | |
Malhado | Crie ativos de jogos 3D impressionantes com IA. | 3D | ||
Movimento | Criador mágico de animação 3D AI. | 3D | ||
MVDream | Difusão multivisualização para geração 3D. | arXiv | 3D | |
NeRF Instantâneo NVIDIA | Primitivos gráficos neurais instantâneos: NeRF extremamente rápido e muito mais. | Modelo | ||
Um-2-3-45 | Qualquer imagem única em malha 3D em 45 segundos sem otimização por forma. | arXiv | Modelo | |
Pintar3D | Pinte qualquer coisa em 3D com modelos de difusão de textura sem iluminação. | arXiv | 3D | |
PAniC-3D | Reconstrução 3D estilizada de visão única a partir de retratos de personagens de anime. | arXiv | Modelo | |
Ponto·E | Difusão de nuvens de pontos para síntese de modelos 3D. | Modelo | ||
ProlíficoDreamer | Geração diversificada e de alta fidelidade de texto para 3D com destilação de pontuação variacional. | arXiv | Modelo | |
SF3D | SF3D: Reconstrução de malha 3D rápida e estável com desembrulhamento UV e desembaraço de iluminação. | arXiv | 3D | |
Forma | Gere objetos 3D condicionados a texto ou imagens. | arXiv | Modelo | |
Sloyd | A modelagem 3D nunca foi tão fácil. | Modelo | ||
Spline IA | O poder da IA está chegando à 3ª dimensão. Gere objetos, animações e texturas usando prompts. | Modelo | ||
Dreamfusion estável | Uma implementação pytorch do modelo de texto para 3D Dreamfusion, alimentado pelo modelo de texto para 2D Stable Diffusion. | Modelo | ||
SV3D | Nova síntese multivisualização e geração 3D a partir de uma única imagem usando difusão de vídeo latente. | arXiv | 3D | |
Tafi | Texto AI para mecanismo de caracteres 3D. | Modelo | ||
3D-GPT | Modelagem 3D Processual com Grandes Modelos de Linguagem. | arXiv | 3D | |
3D-LLM | Injetando o mundo 3D em grandes modelos de linguagem. | arXiv | 3D | |
3Dpressão | Extraia um modelo 3D de um objeto, capturado em vídeo. | Modelo | ||
3DTopia | Geração de texto para 3D em 5 minutos. | arXiv | 3D | |
3DTopia-XL | 3DTopia-XL: Dimensionamento da geração de ativos 3D de alta qualidade por meio de difusão primitiva. | arXiv | 3D | |
três estúdio | Uma estrutura unificada para geração de conteúdo 3D. | Modelo | ||
TripoSR | Um modelo de código aberto de última geração para reconstrução 3D feedforward rápida a partir de uma única imagem. | arXiv | Modelo | |
Único3D | Geração de malha 3D eficiente e de alta qualidade a partir de uma única imagem. | arXiv | 3D | |
UnidadeGaussianaSplatting | Visualização de Toy Gaussian Splatting no Unity. | Unidade | 3D | |
ViVid-1 para 3 | Síntese de nova visualização com modelos de difusão de vídeo. | arXiv | 3D | |
Voxcraft | Criação de modelos 3D prontos para uso com IA. | 3D | ||
Maravilha3D | Imagem única para 3D usando difusão entre domínios. | arXiv | 3D | |
Zero-1 a 3 | Foto zero de uma imagem para objeto 3D. | arXiv | Modelo |
^ Voltar ao conteúdo ^
Fonte | Descrição | Papel | Motor de jogo | Tipo |
---|---|---|---|---|
AniRetrato | Síntese orientada por áudio de animações de retratos fotorrealistas. | arxiv | avatar | |
CALMA | Modelos latentes adversários condicionais para caracteres virtuais diretos. | arxiv | avatar | |
Chatavatar | Geração progressiva de faces 3D animatáveis sob orientação de texto. | avatar | ||
ChatDollKit | O ChatDollKit permite que você transforme seu modelo 3D em um chatbot. | Unidade | avatar | |
DreamTalk | Quando a geração expressiva de falantes -falantes atende a modelos probabilísticos de difusão. | arxiv | avatar | |
Duix | Duix - SDK humano digital baseado em silício? | avatar | ||
Echomimic | ECOMIMIC: Animações de retratos orientadas a áudio realistas através de condições de referência editáveis. | arxiv | avatar | |
Emoportraits | Avatares multimodais com uma tiro multimodal com emoção. | avatar | ||
E3 gen | Geração de avatars eficiente, expressiva e editável. | arxiv | avatar | |
Exavatar | Exavatar - Avatar Gaussiano 3D de corpo inteiro expressivo. | arxiv | avatar | |
Geneavatar | Edição genérica de avatar da cabeça volumétrica genérica de uma única imagem. | arxiv | avatar | |
Geneface ++ | Geração de rosto em tempo real em tempo real e estável em tempo real. | avatar | ||
Hallo | Síntese visual hierárquica orientada para áudio para animação de imagem de retrato. | arxiv | avatar | |
Hallo2 | HALO2: Animação de imagem de retrato de longa duração e alta resolução. | arxiv | avatar | |
Cabeça de cabeça | Criação de avatares de cabeça 3D com texto. | arxiv | avatar | |
Intrinsicavatar | Intrinsicavatar: renderização inversa baseada fisicamente de humanos dinâmicos de vídeos monoculares por meio de rastreamento explícito de raios. | arxiv | avatar | |
Linly-Talker | Sistema de conversação de avatar digital. | avatar | ||
LivePortrait | LivePortrait: Animação de retrato eficiente com controle de costura e redirecionamento. | arxiv | avatar | |
MotionGPT | O movimento humano como língua estrangeira, um modelo de geração de idioma de movimento unificado usando LLMS. | arxiv | avatar | |
MusePose | MUSOPOSE: Uma estrutura de imagem para vídeo orientada a pose para a geração humana virtual. | avatar | ||
MuseTalk | Sincronização labial de alta qualidade em tempo real com espaço latente que inclui. | avatar | ||
Musev | Geração de vídeo humano virtual de comprimento infinito e alta fidelidade com denoising paralelo visual condicionado. | avatar | ||
Retrato4d | Aprendendo síntese de avatar de cabeça 4D com um tiro 4D usando dados sintéticos. | arxiv | avatar | |
Player me jogador pronto | Integre os avatares personalizáveis ao seu jogo ou aplicativo em dias. | avatar | ||
Rodinhd | Rodinhd: geração de avatar 3D de alta fidelidade com modelos de difusão. | arxiv | avatar | |
StyleAvatar3D | Aproveitando modelos de difusão de texto de imagem para geração de avatar de alta fidelidade. | arxiv | avatar | |
Text2Control3D | Geração de avatar 3D controlável em campos de radiação neural usando o modelo de difusão de texto para imagem guiado por geometria. | arxiv | avatar | |
Topo4d | Topologia que preserva a divisão gaussiana para captura de cabeça 4D de alta fidelidade. | arXiv | avatar | |
Unityaiwithchatgpt | Com base na unidade, o monitor interativo de voz ChatGPT+UnityChan é realizado. | Unidade | avatar | |
Vid2avatar | Reconstrução de avatar em 3D a partir de vídeos em The Wild através da decomposição de cenas auto-supervisionadas. | arxiv | avatar | |
Vlogger | Difusão multimodal para síntese de avatar incorporado. | avatar | ||
Wild2avatar | Tornando os seres humanos por trás de oclusões. | arxiv | avatar |
^ Voltar ao conteúdo ^
Fonte | Descrição | Papel | Motor de jogo | Tipo |
---|---|---|---|---|
Animar qualquer um | Síntese de imagem para vídeo consistente e controlável para animação de caracteres. | arxiv | Animação | |
Animador de tudo | Animação de imagem de domínio aberto de granulação fina com orientação de movimento. | arxiv | Animação | |
Animatediff | Anime seus modelos de difusão de texto para imagem personalizados sem ajuste específico. | arxiv | Animação | |
Animatelcm | Vamos acelerar a geração de vídeo em 4 etapas! | arxiv | Animação | |
Animate-x | Animate-X: animação de imagem de caracteres universal com representação aprimorada de movimento. | arxiv | Animação | |
AnimateZero | Os modelos de difusão de vídeo são animadores de imagem zero. | arxiv | Animação | |
AnimationGpt | Uma ferramenta da AIGC para gerar ativos de movimento de combate ao jogo. | Animação | ||
DeForum | O DeForum aproveita a difusão estável para gerar visuais de IA em evolução. | Animação | ||
DesenheSpinup | Drawingspinup: animação 3D de desenhos de um único caractere. | arxiv | Animação | |
Dreamoving | Uma estrutura de geração de vídeo humana baseada em modelos de difusão. | arxiv | Animação | |
Facefusion | Próxima geração Swapper e intensificador. | Animação | ||
Freeinit | Bridging de lacuna de inicialização nos modelos de difusão de vídeo. | arxiv | Animação | |
Geneface | Síntese de rosto em 3D em áudio generalizada e de alta fidelidade. | arxiv | Animação | |
ID-Animador | Geração de vídeo humano que preserva a identidade zero. | arxiv | Animação | |
Maganimate | Animação de imagem humana consistente temporalmente consistente usando o modelo de difusão. | arxiv | Animação | |
Nuwa | O Dragnuwa é um modelo de geração de vídeo baseado em difusão em domínio aberto, leva os controles de texto, imagem e trajetória como entradas para obter geração de vídeo controlável. | arxiv | Animação | |
Nuwa-Infinity | O Nuwa-Infinity é um modelo generativo multimodal projetado para gerar imagens e vídeos de alta qualidade a partir de determinadas entrada de texto, imagem ou vídeo. | Animação | ||
Nuwa-xl | Uma nova arquitetura de difusão sobre difusão para geração de vídeo extremamente longa. | Animação | ||
Omni animação | AI gerou animações de alta fidelidade. | Animação | ||
Pia | Seu animador de imagem personalizado por meio de módulos plug-and-play em modelos de texto para imagem. | arxiv | Animação | |
Sadtalker | Aprendendo coeficientes de movimento em 3D realistas para a animação estilizada de uma imagem única de imagem. | arxiv | Animação | |
SadTalker-Video-LIP-SYNC | Este projeto é baseado no SadTalkers wav2lip para síntese de lábios de vídeo. | Animação | ||
Animação estável | Uma poderosa ferramenta de texto para animação para desenvolvedores. | Animação | ||
Talecrafter | Uma ferramenta de visualização de história interativa que suporta vários caracteres. | arxiv | Animação | |
ToonCrafter | TOONCRAFTER: Interpolação generativa de desenhos animados. | arxiv | Animação | |
Wav2lip | Vídeos com sincronização de lábios com precisão na natureza. | arxiv | Animação | |
Wonder Studio | Uma ferramenta de IA que anima automaticamente, ilumina e compõe caracteres de CG em uma cena de ação ao vivo. | Animação |
^ Voltar ao conteúdo ^
Fonte | Descrição | Papel | Motor de jogo | Tipo |
---|---|---|---|---|
Cambriano-1 | Cambriano-1: Uma exploração totalmente aberta e centrada na visão de LLMs multimodais. | arxiv | LLMS multimodal | |
Cogvlm2 | Modelo multimodal de código aberto de nível GPT4V baseado no LLAMA3-8B. | Visual | ||
Cotracker | É melhor rastrear juntos. | arxiv | Visual | |
EVF-SAM | EVF-SAM: Fusão inicial da linguagem da visão para o segmento promovido por texto qualquer modelo. | arxiv | Visual | |
Facehi | É melhor rastrear juntos. | Visual | ||
Internlm-xcomposer2 | O InternLM-XComposer2 é um modelo grande de grande linguagem de visão (VLLM) que se destaca na composição e compreensão de imagem de texto livre. | arxiv | Visual | |
Canguru | Kangaroo: Um poderoso modelo de idioma de vídeo que suporta entrada de vídeo de longo contexto. | Visual | ||
LGVI | Em direção ao vídeo orientado a idiomas que inclui modelos multimodais de grandes idiomas. | Visual | ||
Llava ++ | Estendendo os recursos visuais com llama-3 e phi-3. | Visual | ||
Llava-onevision | LLAVA-ONEVISION: Fácil transferência de tarefas visuais. | arxiv | Visual | |
Longva | Transferência de contexto longo da linguagem para a visão. | arxiv | Visual | |
Maskvit | O pré-treinamento visual mascarado para previsão de vídeo. | arxiv | Visual | |
Minicpm-llama3-V 2.5 | Um MLLM de nível GPT-4V no seu telefone. | Visual | ||
Moe-Llava | Mistura de especialistas para grandes modelos de linguagem da visão. | arxiv | Visual | |
Motionllm | Compreendendo comportamentos humanos de movimentos e vídeos humanos. | arxiv | Visual | |
Pllava | Extensão de Llava livre de parâmetros de imagens para vídeos para legendas densas em vídeo. | arxiv | Visual | |
QWEN-VL | Um modelo versátil da linguagem da visão para compreensão, localização, leitura de texto e além. | arxiv | Visual | |
sapiens | Sapiens: Fundação para modelos de visão humana. | arxiv | Visual | |
ShareGpt4V | Melhorando grandes modelos multimodais com melhores legendas. | arxiv | Visual | |
SOLO | Solo: um único transformador para modelagem escalável em linguagem de visão. | arxiv | Visual | |
Video-ccam | Video-CCAM: Avançando o entendimento em linguagem de vídeo com máscaras causais de atendimento cruzado. | Visual | ||
Video-Llava | Aprendendo a representação visual unida por alinhamento antes da projeção. | arxiv | Visual | |
Videollama 2 | Avançando a modelagem espacial-temporal e a compreensão de áudio em vídeo-llms. | arxiv | Visual | |
Video-mme | A primeira referência abrangente de avaliação de LLMs multimodais na análise de vídeo. | arxiv | Visual | |
Vitron | Uma visão unificada de pixels Vision LLM para entender, gerar, segmentar, editar. | Visual | ||
Vila | Vila: em pré-treinamento para modelos de linguagem visual. | arxiv | Visual |
^ Voltar ao conteúdo ^
Fonte | Descrição | Papel | Motor de jogo | Tipo |
---|---|---|---|---|
360DVD | Geração de vídeo panorama controlável com modelo de difusão de vídeo em 360 graus. | arxiv | Vídeo | |
Animate-uma-história | Geração de vídeos agrupada por recuperação para contar uma história. | arxiv | Vídeo | |
Qualquer coisa em qualquer cena | Inserção de objeto de vídeo fotorrealista. | Vídeo | ||
ART • v | Geração de texto para video automático com modelos de difusão. | arxiv | Vídeo | |
Assistivo | Conheça a plataforma de vídeo generativa que dá vida às suas idéias. | Vídeo | ||
AtomOvideo | Geração de imagem para video de alta fidelidade. | arxiv | Vídeo | |
BackgroundRemover | O removedor de fundo permite remover o plano de fundo de imagens e vídeo usando AI com uma interface simples da linha de comando que é gratuita e de código aberto. | Vídeo | ||
Boximator | Gerando movimentos ricos e controláveis para a síntese de vídeo. | arxiv | Vídeo | |
Codef | Campos de deformação de conteúdo para processamento de vídeo temporalmente consistente. | arxiv | Vídeo | |
Cogvideo | Gere vídeos a partir de descrições de texto. | Vídeo | ||
Cogvideox | O CogVideox é uma versão de código aberto do modelo de geração de vídeo, que é homólogo de 清影. | Vídeo | ||
Cogvlm | O COGVLM é um poderoso Modelo de Linguagem Visual (VLM) de código aberto. | Visual | ||
Conr | Vídeos genarados de dança vívida de folhas de personagens de anime desenhadas à mão (ACS). | arxiv | Vídeo | |
Dechohere | Crie o que não pode ser filmado. | Vídeo | ||
Descritivo | Descript é a maneira simples, poderosa e divertida de editar. | Vídeo | ||
Diffutoon | Sombreamento editável de alta resolução por meio de modelos de difusão. | arxiv | Vídeo | |
golfinho | Plataforma geral de interação de vídeo com base no LLMS. | Vídeo | ||
DomoAI | Amplifique sua criatividade com Domoai. | Vídeo | ||
Dreamcinema | DreamCinema: transferência cinematográfica com câmera gratuita e caractere 3D. | arxiv | Vídeo | |
Dynamicrafter | Animando imagens de domínio aberto com gravadores de difusão em vídeo. | arxiv | Vídeo | |
BORDA | Introduzimos Edge, um método poderoso para a geração de dança editável capaz de criar danças realistas e fisicamente plausíveis, mantendo fiéis à música de entrada arbitrária. | arxiv | Vídeo | |
Emo | Emote Retrato Alive - Gerando vídeos de retratos expressivos com modelo de difusão de áudio2Video em condições fracas. | arxiv | Vídeo | |
Vídeo emu | Fatorizar a geração de texto para vídeo por condicionamento explícito de imagem. | Vídeo | ||
Etna | O ETNA pode gerar conteúdo de vídeo correspondente com base em descrições de texto curto. | Vídeo | ||
Fada | Síntese de vídeo a vídeo guiada por instrução rápida paralela. | Vídeo | ||
Siga-your-canvas | Siga-Your-Canvas: Oppainting de vídeo de alta resolução com extensa geração de conteúdo. | arxiv | Vídeo | |
Siga sua pose | Geração de texto para video guiada por pose usando vídeos sem pose. | arxiv | Vídeo | |
FullJourney | Seu conjunto completo de ferramentas de criação de IA na ponta dos dedos. | Vídeo | ||
Gen-2 | Um sistema de IA multimodal que pode gerar novos vídeos com texto, imagens ou videoclipes. | Vídeo | ||
Dinâmica generativa | Dinâmica de imagem generativa. | Vídeo | ||
Gênio | Ambientes interativos generativos. | arxiv | Vídeo | |
Genmo | Faça magicamente vídeos com IA. | Vídeo | ||
Gentron | Transformadores de difusão para geração de imagem e vídeo. | Vídeo | ||
Higen | Desaparelamento espaço-temporal hierárquico para geração de texto para vídeo. | Vídeo | ||
Hotshot-xl | O HotShot-XL é um modelo de texto para GIF da IA treinado para trabalhar ao lado de difusão estável XL. | Vídeo | ||
Hunyuanvideo | Hunyuanvideo: uma estrutura sistemática para um modelo de geração de vídeo grande. | arxiv | Vídeo | |
Imagen Video | Dado um prompt de texto, o Imagen Video gera vídeos de alta definição usando um modelo de geração de vídeo base e uma sequência de modelos de super-resolução espacial e temporal intercalados. | Vídeo | ||
InstructVideo | Instruindo modelos de difusão em vídeo com feedback humano. | arxiv | Vídeo | |
I2vgen-xl | Síntese de imagem para videão de alta qualidade por meio de modelos de difusão em cascata. | arxiv | Vídeo | |
Lavie | Geração de vídeo de alta qualidade com modelos de difusão latente em cascata. | arxiv | Vídeo | |
LTX Studio | O LTX Studio é uma plataforma de cinema holística e orientada pela IA para criadores, profissionais de marketing, cineastas e estúdios. | Vídeo | ||
LTX-VIDEO | O LTX-Video é o primeiro modelo de geração de vídeo baseado em DIT que pode gerar vídeos de alta qualidade em tempo real. Ele pode gerar vídeos de 24 fps na resolução de 768x512, mais rápida do que é necessário para assisti -los. | Vídeo | ||
Lumière | Um modelo de difusão espaço-tempo para geração de vídeo. | arxiv | Vídeo | |
Lvdm | Modelos de difusão em vídeo latentes para geração de vídeo longa de alta fidelidade. | arxiv | Vídeo | |
MagicVideo | Geração de vídeo eficiente com modelos de difusão latente. | arxiv | Vídeo | |
MagicVideo-V2 | Geração de vídeo de alta estética em vários estágios. | arxiv | Vídeo | |
Hora mágica | Vídeo da IA para criadores simplificados. | Vídeo | ||
Magvit-V2 | O tokenizer é a chave para a geração visual. | Vídeo | ||
Magvit | Transformador de vídeo generativo mascarado. | Vídeo | ||
Make-a-video | Make-a-Video é um sistema de AI de última geração que gera vídeos do texto. | arxiv | Vídeo | |
Faça pixels dançar | Geração de vídeo de alta dinâmica. | arxiv | Vídeo | |
Faça-Your-Video | Geração de vídeo personalizada usando orientação textual e estrutural. | arxiv | Vídeo | |
Microcinema | Uma abordagem de divisão e conquista para geração de texto para vídeo. | arxiv | Vídeo | |
MIMO | MIMO: síntese de vídeo de caracteres controláveis com modelagem espacial decomposta. | arxiv | Vídeo | |
Mini-gimini | Minerando o potencial dos modelos de linguagem de visão de modalidade multiminâmica. | Visão | ||
MobileVidFactory | Geração de vídeo de mídia social baseada em difusão automática para dispositivos móveis do texto. | Vídeo | ||
Mochi 1 | O Mochi 1 é um modelo de geração de vídeo de ponta aberto com movimento de alta fidelidade e forte adesão rápida na avaliação preliminar. | Vídeo | ||
Mofa-video | Animação de imagem controlável por meio de adaptações de campo de movimento generativo no modelo de difusão de imagem para vídeo congelado. | arxiv | Vídeo | |
MoneyPrinterturbo | Use modelos grandes para gerar vídeos curtos com um clique. | Vídeo | ||
MoonValley | MoonValley é um novo modelo de IA generativo de texto para vídeo. | Vídeo | ||
mora | Mais como Sora para geração de vídeo generalista. | arxiv | Vídeo | |
Morph Studio | Com a nossa magia de texto para video, manifeste sua criatividade através do seu prompt. | Vídeo | ||
MotionClone | MotionClone: Clonagem de movimento sem treinamento para geração de vídeo controlável. | arxiv | Vídeo | |
MotionCtrl | Um controlador de movimento unificado e flexível para geração de vídeo. | arxiv | Vídeo | |
MotionDirector | Personalização de movimento dos modelos de difusão de texto para vídeo. | arxiv | Vídeo | |
MotionShop | Uma aplicação de substituir os caracteres no vídeo por avatares 3D. | Vídeo | ||
MOV2MOV | MOV2MOV Plugin para automático1111/stable-difusão-webui. | Vídeo | ||
Moveriefactory | Criação automática de filmes a partir de texto usando grandes modelos generativos para idiomas e imagens. | arxiv | Vídeo | |
Quadros neurais | Descubra o sintetizador para o mundo visual. | Vídeo | ||
Nunca termina | Crie seu mundo. | Vídeo | ||
Sora aberta | Democratizando a produção de vídeo eficiente para todos. | Vídeo | ||
Sora aberta | Plano de Sora Aberta. | Vídeo | ||
Fenaki | Um modelo para gerar vídeos a partir de texto, com instruções que podem mudar com o tempo e vídeos que podem levar até vários minutos. | arxiv | Vídeo | |
Pika Labs | O Pika Labs está revolucionando a experiência de criação de vídeo com a IA. | Vídeo | ||
Pixeling | O Pixeling capacita nossos clientes a criar conteúdo visual altamente preciso, ultra-realista e extremamente controlável, incluindo imagens, vídeos e modelos 3D. | Vídeo | ||
PixVerse | Crie vídeos de tirar o fôlego com a IA. | Vídeo | ||
Polinizações | Criar fica fácil, rápido e divertido. | Vídeo | ||
Reutilizar e difundir | Denoising iterativo para geração de texto para vídeo. | arxiv | Vídeo | |
Ruyi | Ruyi é um modelo de imagem para vídeo capaz de gerar vídeos de qualidade cinematográfica a uma resolução de 768, com uma taxa de quadros de 24 quadros por segundo, totalizando 5 segundos e 120 quadros. | Vídeo | ||
Shortgpt | Uma estrutura experimental de IA para criação automatizada de conteúdo de curta/vídeo. | Vídeo | ||
Show-1 | Casar os modelos de pixel e difusão latente para geração de texto para vídeo. | arxiv | Vídeo | |
Snap Video | Transformadores espaço-temporais em escala para a síntese de texto em vídeo. | arxiv | Vídeo | |
Sora | Criando vídeo a partir de texto. | Vídeo | ||
Sorawebui | O Sorawebui é um cliente da SORA Web de código aberto, permitindo que os usuários criem vídeos facilmente do texto com o modelo SORA do OpenAI. | Vídeo | ||
StableVideo | Edição de vídeo de difusão de consistência orientada por texto. | Vídeo | ||
Difusão de vídeo estável | Imagem a Video de Difusão de Vídeo estável (SVD). | Vídeo | ||
StoryDiffusion | Auto-atimento consistente para geração de imagem e vídeo de longo alcance. | arxiv | Vídeo | |
StreamingT2V | Geração de vídeo longa, dinâmica e extensível e dinâmica e extensível a partir do texto. | arxiv | Vídeo | |
StyleCrafter | Geração de texto para vídeo estilizada com um adaptador de estilo. | arxiv | Vídeo | |
Tats | Longa geração de vídeo com vqgan e transformador sensível ao tempo. | Vídeo | ||
Text2Video-zero | Os modelos de difusão de texto para imagem são geradores de vídeo zero. | arxiv | Vídeo | |
TF-T2V | Uma receita para ampliar a geração de texto para vídeo com vídeos sem texto. | arxiv | Vídeo | |
Torá | TORA: Transformador de difusão orientado a trajetória para geração de vídeo. | arxiv | Vídeo | |
Faixa anything | O track-anything é uma ferramenta flexível e interativa para rastreamento e segmentação de objetos de vídeo, com base no segmento de qualquer coisa e no XMEM. | arxiv | Vídeo | |
Tune-a-Video | Ajuste de um tiro de modelos de difusão de imagem para geração de texto para vídeo. | arxiv | Vídeo | |
Doze alojados | AI multimodal que entende vídeos como humanos. | Vídeo | ||
Univg | Para geração de vídeo-modal unificada. | Vídeo | ||
VCHITECT-2.0 | VCHITECT-2.0: Transformador paralelo para ampliar modelos de difusão de vídeo. | Vídeo | ||
VGen | Um ecossistema holístico de geração de vídeo para geração de vídeo construindo modelos de difusão. | arxiv | Vídeo | |
ViewCrafter | Viewcrafter: Modelos de difusão de vídeo domineando para síntese de vistas de alta fidelidade. | arxiv | Vídeo | |
Video-chatgpt | O vídeo-chatgpt é um modelo de conversa capaz de gerar conversas significativas sobre vídeos. | arxiv | Vídeo | |
Videocomposer | Síntese de vídeo composicional com controlabilidade de movimento. | arxiv | Vídeo | |
Videocrafter1 | Modelos de difusão aberta para geração de vídeo de alta qualidade. | arxiv | Vídeo | |
Videocrafter2 | Superando as limitações de dados para modelos de difusão de vídeo de alta qualidade. | arxiv | Vídeo | |
Videodrafter | Geração de vídeo multi-cena consistente com conteúdo com LLM. | arxiv | Vídeo | |
VideoElevator | Elevando a qualidade da geração de vídeo com modelos de difusão de texto a imagem versáteis. | arxiv | Vídeo | |
Videofactory | Torne a atenção nas difusões espaço-temporais para a geração de texto para vídeo. | Vídeo | ||
VideoGen | Uma abordagem de difusão latente guiada por referência para geração de texto para vídeo de alta definição. | arxiv | Vídeo | |
Videolcm | Modelo de consistência latente em vídeo. | arxiv | Vídeo | |
Vídeo LDMS | Alinhe seus latentes: síntese de vídeo de alta resolução com modelos de difusão latente. | arxiv | Vídeo | |
Video-Llava | Aprendendo a representação visual unida por alinhamento antes da projeção. | arxiv | Vídeo | |
Videomamba | Modelo de espaço de estado para uma compreensão eficiente em vídeo. | arxiv | Vídeo | |
Vídeo de pensamento | Vídeo de pensamento: raciocínio em vídeo passo a passo da percepção à cognição. | Vídeo | ||
Videopoet | Um grande modelo de idioma para geração de vídeo com tiro zero. | arxiv | Vídeo | |
Movimento vispunk | Crie vídeos realistas usando apenas texto. | Vídeo | ||
Visualrwkv | O VisualRWKV é a versão visual aprimorada do modelo de linguagem RWKV, permitindo que o RWKV lide com várias tarefas visuais. | Visual | ||
V-JEPA | Vídeo Incorporação conjunta de arquitetura preditiva. | arxiv | Vídeo | |
Walt | Geração de vídeo fotorrealista com modelos de difusão. | arxiv | Vídeo | |
Zeroscópio | Zeroscópio Text-to-video. | Vídeo |
^ Voltar ao conteúdo ^
Fonte | Descrição | Papel | Motor de jogo | Tipo |
---|---|---|---|---|
Academicodec | Um modelo de codec de áudio de código aberto para pesquisa acadêmica. | Áudio | ||
Anfion | Um kit de ferramentas de geração de áudio, música e geração de fala. | arxiv | Áudio | |
Archisound | Geração de áudio usando modelos de difusão, em Pytorch. | Áudio | ||
AudioBox | Geração de áudio unificada com avisos de linguagem natural. | Áudio | ||
Audioediting | Edição de áudio não supervisionada e baseada em texto zero usando a inversão do DDPM. | arxiv | Áudio | |
Codec Audiogen | Um codec de áudio neural estéreo de baixa compressão de 48kHz para áudio geral, otimizando para fidelidade de áudio? | Áudio | ||
Audiogpt | Compreender e gerar fala, música, som e cabeça de falar. | arxiv | Áudio | |
Audiolcm | Geração de texto para áudio com modelos de consistência latente. | arxiv | Áudio | |
Audioldm | Geração de texto para áudio com modelos de difusão latente. | arxiv | Áudio | |
Audioldm 2 | Aprendendo geração holística de áudio com pré-treinamento auto-supervisionado. | arxiv | Áudio | |
Aufusão | Aproveitando o poder da difusão e modelos de linguagem grande para geração de texto para áudio. | arxiv | Áudio | |
CTAG | Geração criativa de texto para áudio via programação do sintetizador. | Áudio | ||
Foleycrafter | Foleycrafter: traga vídeos silenciosos com vida com sons realistas e sincronizados. | arxiv | Áudio | |
Ímã | Geração de áudio mascarada usando um único transformador não autorregressivo. | Áudio | ||
Make-an-Audio | Geração de texto para áudio com modelos de difusão rápida aprimorada. | arxiv | Áudio | |
Make-an-Audio 3 | Transformando o texto em áudio por meio de grandes transformadores de difusão baseados em fluxo. | arxiv | Áudio | |
NeuralSound | Síntese de som modal baseado em aprendizado com transferência acústica. | arxiv | Áudio | |
Optimizerai | Sons para criadores, fabricantes de jogos, artistas, criadores de vídeos. | Áudio | ||
QWEN2-AUDIO | QWEN2-AUDIO CHAT e modelo de linguagem de áudio grande pré-terenciada proposta pela Alibaba Cloud. | arxiv | Áudio | |
See-2-Sound | Som de ambiente espacial para zero t-thot para espacial. | arxiv | Áudio | |
SOLSTORM | Geração de áudio paralela eficiente. | arxiv | Áudio | |
Áudio estável | Difusão de áudio latente condicionado ao tempo rápido. | Áudio | ||
Áudio estável aberto | O Audio estável Open 1.0 gera áudio estéreo de comprimento de variável (até 47s) a 44,1kHz a partir de prompts de texto. | Áudio | ||
Syncfusion | Syncfusion: síntese multimodal sincronizada em vídeo-audio foley. | arxiv | Áudio | |
TANGO | Geração de texto para áudio usando o Modelo de LLM sintonizado de instrução e difusão latente. | Áudio | ||
VTA-LDM | Geração de vídeo a áudio com alinhamento oculto. | arxiv | Áudio | |
Wavjourney | Criação de áudio composicional com grandes modelos de idiomas. | arxiv | Áudio |
^ Voltar ao conteúdo ^
Fonte | Descrição | Papel | Motor de jogo | Tipo |
---|---|---|---|---|
Aiva | A inteligência artificial compondo música de trilha sonora emocional. | Música | ||
Música amper | Tecnologia de geração de música personalizada alimentada pela Amper. | Música | ||
Boomy | Crie música generativa. Compartilhe com o mundo. | Música | ||
Chatmusician | Promovendo habilidades musicais intrínsecas no LLM. | Música | ||
Chord2Melody | Geração de música automática AI. | Música | ||
Diff-bgm | Um modelo de difusão para geração de música em vídeo em vídeo. | arxiv | Música | |
FluxMusic | FluxMusic: geração de texto para música com transformador de fluxo retificado. | arxiv | Música | |
GptableTon | Rascunho de script para processar a resposta GPT e enviar as notas MIDI para os clipes Ableton com Abletonosc e Python-OSC. | Música | ||
Heymusic.ai | Gerador de música AI | Música | ||
Imagem para música | A IA Image to Music Generator é uma ferramenta que usa inteligência artificial para converter imagens em música. | Música | ||
Jen-1 | Geração de música universal guiada por texto com modelos de difusão omnidirecional. | Música | ||
Juke-box | Um modelo generativo para música. | arxiv | Música | |
Magenta | Magenta é um projeto de pesquisa que explora o papel do aprendizado de máquina no processo de criação de arte e música. | Música | ||
Melodia | Geração de música neural eficiente | Música | ||
Mubert | Ai música generativa. | Música | ||
Musenet | Uma profunda rede neural que pode gerar composições musicais de 4 minutos com 10 instrumentos diferentes e pode combinar estilos de país a Mozart e os Beatles. | Música | ||
MusicGen | Geração de música simples e controlável. | arxiv | Música | |
Musicldm | Aumentar a novidade na geração de texto para música usando estratégias de mistura síncrona de batida. | arxiv | Música | |
MúsicaLM | Gerando música a partir de texto. | arxiv | Música | |
Aplicativo de riffusion | A Riffusion é um aplicativo para geração de música em tempo real com difusão estável. | Música | ||
Sonauto | Sonauto é um editor de música da AI que transforma instruções, letras ou melodias em músicas completas em qualquer estilo. | Música | ||
Soundraw | Ai Gerador de Música para Criadores. | Música | ||
Soundry AI | Ferramentas de IA generativas, incluindo pacotes de amostras de texto a som e infinito. | Música |
^ Voltar ao conteúdo ^
Fonte | Descrição | Papel | Motor de jogo | Tipo |
---|---|---|---|---|
DiffSinger | Cantando a síntese de voz via mecanismo de difusão superficial. | arxiv | Voz cantando | |
Voice-Voice-Voice-Voice-Voice-Webui | Uma estrutura SVC fácil de usar com base em Vits. | Voz cantando | ||
SO-VITS-SVC | SoftVC Vits Cantando a conversão de voz. | Voz cantando | ||
Vi-svs | Use Vits e OpenCpop para desenvolver a síntese de voz cantada; Diferente de Visinger. | Voz cantando |
^ Voltar ao conteúdo ^
Fonte | Descrição | Papel | Motor de jogo | Tipo |
---|---|---|---|---|
Applio | Ferramenta de clonagem de voz final, meticulosamente otimizada para poder incomparável, modularidade e experiência amigável. | Discurso | ||
Audyo | Texto em. Audio out. | Discurso | ||
Latido | Modelo de áudio generativo promovido por texto. | Discurso | ||
Bert-vits2 | Vits2 Backbone com Bert multilíngue. | Discurso | ||
Chattts | Chattts é um modelo de fala generativo para o diálogo diário. | Discurso | ||
Clapspeech | Aprendendo a prosódia do contexto de texto com o pré-treinamento contrastante de linguagem-audio. | arxiv | Discurso | |
Cosyvoice | Modelo de geração de voz grande multilíngue, fornecendo capacidade de inferência, treinamento e implantação. | Discurso | ||
Dex-tts | Expressivo em expressão baseado em difusão com modelagem de estilo na variabilidade do tempo. | arxiv | Discurso | |
Emotivice | Um motor TTS com várias vozes e prompts controlados. | Discurso | ||
Flicki | Transforme o texto em vídeos com vozes de IA. | Discurso | ||
GLM-4-Voice | GLM-4-Voice é um modelo de voz de ponta a ponta lançado pela Zhipu AI. O GLM-4-Voice pode entender e gerar diretamente a fala chinesa e inglesa, se envolver em conversas em vozis em tempo real e alterar atributos como emoção, entonação, taxa de fala e dialeto com base nas instruções do usuário. | Discurso | ||
Brilho-tts | Um fluxo generativo para a fala em fala através da pesquisa de alinhamento monotônico. | arxiv | Discurso | |
GPT-Sovits | Uma poderosa conversão de voz de poucas fotos e webui de texto em fala. | Discurso | ||
LovO | Loves é o gerador de voz AI e a plataforma de fala para milhares de criadores. | Discurso | ||
Mahatts | Um modelo de geração de fala de grande porte de código aberto. | Discurso | ||
Matcha-tts | Uma arquitetura TTS rápida com correspondência de fluxo condicional. | arxiv | Discurso | |
Melotts | Biblioteca de texto em fala em fala de alta qualidade por myshell.ai. Suporte inglês, espanhol, francês, chinês, japonês e coreano. | Discurso | ||
Metavoice-1b | AI para inteligência de fala em nível humano. | Discurso | ||
Narakeet | Crie facilmente dublagens usando texto realista para a fala. | Discurso | ||
Mini-omni | Mini-omni: Os modelos de idiomas podem ouvir, conversar enquanto pensam em streaming. O Mini-OMNI é um modelo de linguagem grande multimodelo de código aberto que pode ouvir, conversar enquanto pensa. Apresentando a entrada de fala de ponta a ponta em tempo real e o streaming de capacidades de conversação de saída de áudio. | arxiv | Discurso | |
Cloneração de uma tira de voz | Base de clonagem de voz de um tiro no UNET-TTS. | Discurso | ||
OpenVoice | Clonagem de voz instantânea por Myshell. | Discurso | ||
Transbordamento | Colocando fluxos no topo dos transdutores neurais para melhores TTs. | Discurso | ||
Realtimetts | O Realtimetts é uma biblioteca de texto para fala (TTS), projetada para aplicativos em tempo real. | Discurso | ||
SenseVoice | O SenseVoice é um modelo de base de fala com recursos de entendimento de vários discursos, incluindo reconhecimento automático de fala (ASR), identificação de linguagem falada (LID), reconhecimento de emoção de fala (SER) e detecção de eventos de áudio (AED). | Discurso | ||
Speechgpt | Capacitando grandes modelos de linguagem com habilidades de conversação cruzadas intrínsecas. | arxiv | Discurso | |
Spean-text-GPT3-Unidade | Este é o repo que eu uso a API Whisper e Chatgpt do OpenAi em Unity. | Unidade | Discurso | |
Discurso estável | Estabilidade O modelo de texto em fala da AI. | Discurso | ||
Stabletts | Modelo TTS de próxima geração usando correspondência de fluxo e DIT, inspirada na difusão estável 3. | Discurso | ||
Styletts 2 | Rumo ao texto em nível humano-fala através da difusão de estilo e treinamento adversário com grandes modelos de linguagem de fala. | arxiv | Discurso | |
Tortoise.cpp | Tortoise.cpp: Implementação de GGML de tartaruga-tts. | Discurso | ||
Tortoise-tts | Um sistema TTS com várias vozes treinou com ênfase na qualidade. | Discurso | ||
TTS Generation Webui | TTS Generation Webui (Bark, MusicGen, Tortoise, RVC, Vocos, Demucs). | Discurso | ||
VAL-E | Os modelos de idiomas de codec neural são texto zero para sintetizadores de fala. | arxiv | Discurso | |
Vall-e x | Fale línguas estrangeiras com sua própria voz: modelagem de idiomas neural de codec transversal | arxiv | Discurso | |
Vocode | O Vocode é uma biblioteca de código aberto para criar aplicativos LLM baseados em voz. | Discurso | ||
Caixa de voz | Geração de fala universal multilíngue guiada por texto em escala. | arxiv | Discurso | |
Voicecraft | Edição de fala zero-tiro e fala em fala na natureza. | Discurso | ||
Sussurrar | Whisper é um modelo de reconhecimento de fala geral. | Discurso | ||
Whisperspeech | Um sistema de texto para fala em código aberto criado invertendo o Whisper. | Discurso | ||
XE-fala | Estrutura de treinamento conjunto da conversão emocional de texto em voz e expressão e conversão de voz cruzada e de voz cruzada. | Discurso | ||
XTTS | XTTS é uma biblioteca para geração avançada de texto em fala. | Discurso | ||
Yourtts | Em direção a Zero Shot Multi-Speaker TTS e conversão de voz com tiro zero para todos. | arxiv | Discurso | |
Zmm-tts | Síntese de fala multilíngue e multispicando zero-tiro condicionada a representações discretas de fala auto-supervisionadas. | arxiv | Discurso |
^ Voltar ao conteúdo ^
Fonte | Descrição | Motor de jogo | Tipo |
---|---|---|---|
Ludo.ai | Assistente de pesquisa e design de jogos. | Análise |
^ Voltar ao conteúdo ^