ai game devtools Télécharger - ai game devtools Téléchargement du code source

Outils de développement de jeux AI (AI-GDT) ?

Jeu IA

Ici, nous garderons une trace des derniers outils de développement de jeux IA, notamment LLM, agent, code, écrivain, image, texture, shader, modèle 3D, animation, vidéo, audio, musique, voix chantée et analyses.

Table des matières

Outil (AI LLM)
Jeu (Agent)
Code
Écrivain
Image
Texture
Ombreur
Modèle 3D
Avatar
Animation
Visuel
Vidéo
Audio
Musique
Voix chantée
Discours
Analytique

Liste des projets

Outil (AI LLM)

Source	Description	Papier	Moteur de jeu	Taper
AgentGPT	? Assemblez, configurez et déployez des agents IA autonomes dans votre navigateur.			Outil
Commande AI	Intégration de ChatGPT avec Unity Editor.		Unité	Outil
AIOS	Système d'exploitation de l'agent LLM.			Outil
Scientifique en IA	Le scientifique de l'IA : vers une découverte scientifique ouverte et entièrement automatisée.	arXiv		Outil
Assistant CLI	Un outil CLI confortable pour utiliser le service ChatGPT			Outil
GPT automatique	Une tentative expérimentale open source pour rendre GPT-4 entièrement autonome.			Outil
BébéAGI	Ce script Python est un exemple de système de gestion de tâches basé sur l'IA.			Outil
?? Interface utilisateur BabyAGI	L'interface utilisateur de BabyAGI est conçue pour faciliter l'exécution et le développement avec babyagi dans une application Web, comme ChatGPT.			Outil
baichuan-7B	Un modèle linguistique de pré-formation 7B à grande échelle développé par Baichuan.			Outil
Baichuan-13B	Un grand modèle de langage 13B développé par Baichuan Intelligent Technology.			Outil
Baichuan 2	Une série de grands modèles de langage développés par Baichuan Intelligent Technology.			Outil
Bisheng	Bisheng est une plate-forme ouverte de développement LLM pour les applications d'IA de nouvelle génération.			Outil
Caractère-LLM	Un agent formable pour le jeu de rôle.	arXiv		Outil
ChatDev	Agents de communication pour le développement de logiciels.	arXiv		Outil
ChatGPT-API-unité	Lie l'API de complétion de chat ChatGPT au C# pur sur Unity.		Unité	Outil
ChatGPTForUnity	ChatGPT pour l'unité.		Unité	Outil
ChatRWKV	ChatRWKV est comme ChatGPT mais alimenté par le modèle de langage RWKV (100 % RNN) et open source.			Outil
ChatYuan	Grand modèle linguistique pour le dialogue en chinois et en anglais.			Outil
Chinois-LLaMA-Alpaga-3	(Chinese Llama-3 LLM) développés à partir de Meta Llama 3.			Outil
Chrome-GPT	Un agent AutoGPT qui contrôle Chrome sur votre bureau.			Outil
CogVLM	CogVLM, un puissant modèle de base de langage visuel open source.	arXiv		Outil
CoreNet	Une bibliothèque pour former des réseaux de neurones profonds.			Outil
Cosmos	Cosmos est une plate-forme de développement de modèles mondiaux qui comprend des modèles de base mondiaux, des tokeniseurs et un pipeline de traitement vidéo pour accélérer le développement de l'IA physique dans les laboratoires de robotique et d'audiovisuel.			LLM
DBRX	DBRX est un grand modèle de langage formé par Databricks.			Outil
DCLM	DataComp pour les modèles de langage.	arXiv		Outil
DeepSeek-V3	DeepSeek-V3 est un modèle de langage de mélange d'experts (MoE) puissant avec 671 B de paramètres au total, dont 37 B activés pour chaque jeton.	arXiv		LLM
DémoGPT	Générateur d'applications Auto Gen-AI avec la puissance de Llama 2			Outil
Conception2Code	Automatisation de l'ingénierie frontale			Outil
Devika	Devika est un ingénieur logiciel en IA agentique.			Outil
Dévonien	Un programmeur de paires open source.			Outil
Dora	Générer des sites Web puissants, une invite à la fois.			Outil
Flowise	Glissez-déposez l'interface utilisateur pour créer votre flux LLM personnalisé à l'aide de LangchainJS.			Outil
Gémeaux	Gemini est conçu dès le départ pour la multimodalité : raisonner de manière transparente sur le texte, les images, la vidéo, l'audio et le code.			Outil
Gemme	Gemma est une famille de modèles ouverts légers et de pointe, construits à partir de la recherche et de la technologie utilisées pour créer des modèles Google Gemini.			Outil
gemma.cpp	moteur d'inférence C++ léger et autonome pour les modèles Gemma de Google.			Outil
GLM-4	GLM-4-9B est la version open source de la dernière génération de modèles pré-entraînés de la série GLM-4 lancée par Zhipu AI.			Outil
GPT4Tous	Un chatbot formé sur une collection massive de données d'assistant propres, notamment du code, des histoires et des dialogues.			Outil
GPT-4o	GPT-4o (« o » pour « omni ») est une étape vers une interaction homme-machine beaucoup plus naturelle : il accepte en entrée n'importe quelle combinaison de texte, d'audio, d'image et de vidéo et génère n'importe quelle combinaison de texte, d'audio et d'image. sorties.			Outil
GPTScript	Développer des applications LLM en langage naturel.			Outil
Grok-1	Les poids et l'architecture de notre modèle de mélange d'experts de 314 milliards de paramètres, Grok-1.			Outil
CâlinsChat	Rendre les meilleurs modèles de chat IA de la communauté accessibles à tous.			Outil
Intégration Unity de l'API Hugging Face	Ce package Unity fournit une intégration facile à utiliser pour l'API Hugging Face Inference, permettant aux développeurs d'accéder et d'utiliser les modèles Hugging Face AI dans leurs projets Unity.		Unité	Outil
Liaison d'image	ImageBind One Embedding Space pour les lier tous.	arXiv		Outil
Indice-1.9B	Un LLM multilingue léger SOTA.			Outil
InteractML-Unity	InteractML, un framework de script visuel d'apprentissage automatique interactif pour Unity3D.		Unité	Outil
Moteur InteractML-Unreal	Apporter l’apprentissage automatique à Unreal Engine.		Moteur irréel	Outil
StagiaireLM	InternLM a mis en open source un modèle de base de 7 milliards de paramètres, un modèle de chat adapté aux scénarios pratiques et au système de formation.	arXiv		Outil
StagiaireLM-XComposer	InternLM-XComposer2 est un grand modèle de langage de vision (VLLM) révolutionnaire qui excelle dans la composition et la compréhension de texte-image de forme libre.	arXiv		Outil
Jan	Apportez l'IA sur votre bureau.			Outil
Lamini	Lamini permet à toute équipe d'ingénierie de surpasser les LLM à usage général grâce au RLHF et à l'ajustement précis de ses propres données.			Outil
LaMini-LM	LaMini-LM est une collection de modèles de langage efficaces de petite taille distillés à partir de ChatGPT et formés sur un ensemble de données à grande échelle de 2,58 millions d'instructions.			Outil
LangChaîne	LangChain est un framework pour développer des applications alimentées par des modèles de langage.			Outil
LangFlow	⛓️ LangFlow est une interface utilisateur pour LangChain, conçue avec React-Flow pour fournir un moyen sans effort d'expérimenter et de prototyper des flux.			Outil
LaVague	Automatisez l’automatisation avec le framework Large Action Model.			Outil
Maki	Modèles de fondation ouverts pour les agents linguistiques.			Outil
IA Lepton	Un framework Pythonic pour simplifier la création de services d'IA.			Outil
Lit-LLaMA	Implémentation du modèle de langage LLaMA basé sur nanoGPT. Prend en charge l'attention flash, la quantification Int8 et GPTQ 4 bits, le réglage fin de LoRA et LLaMA-Adapter, le pré-entraînement.			Outil
lama2-webui	Exécutez Llama 2 localement avec gradio UI sur GPU ou CPU depuis n'importe où (Linux/Windows/Mac).			Outil
Lama 3	Le site GitHub officiel de Meta Llama 3.			Outil
Lama 3.1	Llama est un grand modèle de langage (LLM) accessible et ouvert conçu pour permettre aux développeurs, aux chercheurs et aux entreprises de créer, d'expérimenter et de faire évoluer de manière responsable leurs idées d'IA générative.			Outil
LLaSM	Grand modèle de langage et de parole.			Outil
Moteur de réponse LLM	Créez un moteur de réponse inspiré de la perplexité à l'aide de Next.js, Groq, Mixtral, Langchain, OpenAI, Brave et Serper.			Outil
llm.c	Formation LLM en C/CUDA simple et brut.			Outil
LLMUnité	Créez des personnages dans Unity avec les LLM !		Unité	Outil
LLocalRecherche	LLocalSearch est un moteur de recherche exécuté entièrement localement utilisant des agents LLM.			Outil
LogicGamesSolver	Un outil Python pour résoudre des jeux de logique avec l'IA, le Deep Learning et la Computer Vision.			Outil
Écrivain long	LongWriter : libérer plus de 10 000 mots à partir de LLM à contexte long.	arXiv		Outil
Modèle du grand monde (LWM)	Le Large World Model (LWM) est un modèle autorégressif multimodal à grand contexte à usage général.	arXiv		Outil
Lumina-T2X	Lumina-T2X est un cadre unifié pour la génération de texte vers n'importe quelle modalité.	arXiv		Outil
MétaGPT	Le cadre multi-agents			Outil
MiniCPM-2B	Un LLM final surpasse Llama2-13B.			Outil
MiniGPT-4	Améliorer la compréhension du langage visuel avec des modèles de langage étendus avancés.	arXiv		Outil
MiniGPT-5	Génération de vision et de langage entrelacés via des Vokens génératifs.	arXiv		Outil
Mixtral 8x7B	Un mélange d’experts clairsemés de haute qualité.	arXiv		Outil
Mistral7B	Le meilleur modèle 7B à ce jour, Apache 2.0.			Outil
Mistral Grand	Mistral Large est un nouveau modèle de génération de texte de pointe. Il atteint des capacités de raisonnement de premier plan.			Outil
MLC LLM	Permettez à chacun de développer, d’optimiser et de déployer des modèles d’IA de manière native sur les appareils de chacun.			Outil
MobiLlama	Vers un GPT précis et léger entièrement transparent.	arXiv		Outil
MoE-LLaVA	Mélange d'Experts pour les Grands Modèles Vision-Langage.	arXiv		Outil
Moshi	Moshi est une IA conversationnelle expérimentale.			Outil
Moshi	Moshi : un modèle de base parole-texte pour le dialogue en temps réel.			Outil
MOUSSE	Un modèle de langage conversationnel augmenté par un outil open source de l'Université de Fudan.			Outil
mPLUG-Chouette ?	La modularisation permet aux grands modèles de langage d'être multimodaux.	arXiv		Outil
Némotron-4	Un grand modèle de langage multilingue de 15 milliards de paramètres formé sur 8 000 milliards de jetons de texte.	arXiv		Outil
NExT-GPT	Modèle de grand langage multimodal Any-to-Any.			Outil
OLMo	Modèle de langage ouvert	arXiv		Outil
OmniLMM	Grands modèles multimodaux pour des performances élevées et un déploiement efficace.			Outil
UnLLM	Un cadre pour aligner toutes les modalités sur le langage.	arXiv		Outil
Assistant ouvert	OpenAssistant est un assistant basé sur le chat qui comprend les tâches, peut interagir avec des systèmes tiers et récupérer des informations de manière dynamique pour ce faire.			Outil
OuvrirDevin	Un ingénieur logiciel IA autonome.			Outil
Orion-14B	Orion-14B est une famille de modèles comprenant un LLM de base 14B et une série de modèles.	arXiv		Outil
Panda	Grand modèle linguistique open source chinois d'outre-mer, basé sur Llama-7B, -13B, -33B, -65B pour une pré-formation continue dans le domaine chinois.			Outil
Perplexique	Un moteur de recherche alimenté par l'IA.			Outil
Pi	Chatbot IA conçu pour l'assistance personnelle et le soutien émotionnel.			Outil
Qwen1.5	Qwen1.5 est la version améliorée de Qwen.			Outil
Qwen2	Qwen2 est la grande série de modèles de langage développée par l'équipe Qwen, Alibaba Cloud.			Outil
Qwen-7B	Le dépôt officiel du chat Qwen-7B (通义千问-7B) et du grand modèle de langage pré-entraîné proposé par Alibaba Cloud.			Outil
Agent de dépôt	RepoAgent est un projet Open Source piloté par des Large Language Models (LLM) qui vise à fournir un moyen intelligent de documenter les projets.	arXiv		Outil
Moteur IA de santé mentale	Moteur Sanity AI pour l'outil de développement de jeux Unity.		Unité	Outil
RechercherGPT	? Connecter ChatGPT à Internet			Outil
PartagerGPT4V	Améliorer les grands modèles multimodaux avec de meilleures légendes.			Outil
Travail aérien	Les modèles de la série Skywork sont pré-entraînés sur 3,2 To de données multilingues (principalement chinois et anglais) et de code de haute qualité.			Outil
StableLM	Modèles de langage d’IA de stabilité.	arXiv		Outil
Alpaga de Stanford	Un modèle LLaMA suivant les instructions.			Outil
Interface utilisateur Web de génération de texte	Une interface utilisateur Web gradio pour exécuter des modèles de langage étendus tels que LLaMA, lama.cpp, GPT-J, OPT et GALACTICA.			Outil
Moteur de chat minuscule	Bibliothèque d'inférence LLM sur appareil.			Outil
Banc d'outils	Une plate-forme ouverte pour la formation, le service et l'évaluation d'un grand modèle de langage pour l'apprentissage des outils.			Outil
Unity ChatGPT	Expériences Unity ChatGPT.		Unité	Outil
Intégration Unity OpenAI-API	Intégrez le modèle de langage openai GPT-3 et l'API ChatGPT dans un projet Unity.		Unité	Outil
Unreal Engine 5 Lama LoRA	Un projet de validation de principe qui présente le potentiel d'utilisation de petits LLM pouvant être formés localement pour créer des outils de documentation de nouvelle génération.		Moteur irréel	Outil
UnrealGPT	Une collection de widgets Unreal Engine 5 Editor Utility optimisés par GPT3/4.		Moteur irréel	Outil
Vidéo-LLaVA	Apprentissage de la représentation visuelle unie par alignement avant projection.	arXiv		Outil
WebGPT	Exécutez le modèle GPT sur le navigateur avec WebGPU.			Outil
Web3-GPT	Déployer des contrats intelligents avec l'IA			Outil
MotGPT	? Apportez la puissance de ChatGPT à Microsoft Word			Outil
XAgent	Un agent LLM autonome pour la résolution de tâches complexes.			Outil
Yi	Une série de grands modèles de langage formés à partir de zéro par les développeurs.			Outil
01 Projet	L'ordinateur modèle de langage open source.			Outil

^ Retour au sommaire ^

Jeu (Agent)

Source	Description	Papier	Taper
Banc d'agent	Une référence complète pour évaluer les LLM en tant qu'agents.	arXiv	Agent
Discussion de groupe d'agents	Un simulacre de discussion de groupe interactif pour mieux susciter les comportements collectifs émergents.	arXiv	Agent
Agent K	Une AGI auto-agentique, auto-évolutive et modulaire.		Agent
AgentScope	Commencez à créer plus facilement des applications multi-agents basées sur LLM.	arXiv	Agent
AgentSims	Un bac à sable Open Source pour l'évaluation de modèles linguistiques à grande échelle.		Agent
Ville IA	AI Town est une ville virtuelle où les personnages IA vivent, discutent et socialisent.		Agent
anime.gf	Alternative locale et open source à CharacterAI.		Jeu
Astrocade	Créez des jeux avec l'IA		Jeu
Agents atomiques	Le framework Atomic Agents est conçu pour être modulaire, extensible et facile à utiliser.		Agent
Agents automatiques	Un cadre pour la génération automatique d'agents.		Agent
Génération automatique	Activez les applications de modèles de langage étendus de nouvelle génération.	arXiv	Agent
comportemental	Behaviac est un cadre de développement de l'IA de jeux.		Cadre
Biomes	Biomes est un MMORPG sandbox open source conçu pour le Web à l'aide de technologies Web telles que Next.js, Typescript, React et WebAssembly.		Jeu
Tampon de pensées	Raisonnement augmenté par la pensée avec de grands modèles de langage.	arXiv	Agent
Agent Byzer	Cadre d'agent simple, rapide et distribué pour tout le monde.		Agent
La ville des chats	Simulation alimentée par AC(h)atGPT avec des chats.		Agent
La ville des chats	Simulation alimentée par AC(h)atGPT avec des chats.		Agent
CaractèreGLM	Personnalisation des caractères conversationnels chinois de l'IA avec de grands modèles linguistiques.	arXiv	Agent
ChatDev	Agents de communication pour le développement de logiciels.	arXiv	Agent
CogAgent	CogAgent est un modèle de langage visuel open source amélioré basé sur CogVLM.	arXiv	Agent
Berceau	Vers un contrôle informatique général.		Agent
équipageIA	Cadre pour orchestrer des agents d’IA autonomes de jeu de rôle.		Agent
Difier	Dify est une plateforme de création d'applications LLM open source.		Agent
Projet de vie numérique	Personnages 3D autonomes avec intelligence sociale.	arXiv	Agent
tout-ai	Votre assistant chatbot local pleinement compétent, alimenté par l’IA ?		Agent
tissu	fabric est un framework open source permettant d'augmenter les humains à l'aide de l'IA.		Agent
GPT rapide	FastGPT est une plateforme basée sur les connaissances construite sur le LLM.		Agent
rapideRAG	Cadre efficace d’augmentation et de génération de récupération.		Agent
JeuAISDK	Cadre d'automatisation de l'IA de jeu basé sur l'image.		Cadre
GameNGen	Les modèles de diffusion sont des moteurs de jeu en temps réel.	arXiv	Jeu
GameGen-O	GameGen-O : Génération de jeux vidéo en monde ouvert.		Jeu
GenAgent	GenAgent : Créez des systèmes d'IA collaboratifs avec génération automatisée de flux de travail - Études de cas sur ComfyUI.	arXiv	Agent
Agents Génératifs	Simulacres interactifs du comportement humain.	arXiv	Agent
Genèse	Genesis : un moteur physique génératif et universel pour la robotique et au-delà.		Jeu
Génie	Environnements interactifs génératifs.		Jeu
gigax	Runtime, PNJ alimentés par LLM.		Jeu
HippoRAG	Mémoire à long terme d'inspiration neurobiologique pour les grands modèles de langage.	arXiv	Agent
PNJ interactifs alimentés par LLM	Interactive LLM Powered NPCs, est un projet open source qui transforme complètement votre interaction avec les personnages non-joueurs (PNJ) dans n'importe quel jeu !		Jeu
IoA	Un framework open source pour les agents d'IA collaboratifs, permettant à divers agents distribués de faire équipe et d'accomplir des tâches complexes via une connectivité de type Internet.		Agent
KwaiAgents	Un système d'agents de recherche d'informations généralisé avec de grands modèles linguistiques (LLM).	arXiv	Agent
LangChaîne	Faites passer votre application LLM du prototype à la production.		Agent
Flux de langage	Langflow est une interface utilisateur pour LangChain, conçue avec React-Flow pour fournir un moyen sans effort d'expérimenter et de prototyper des flux.		Agent
LangGraph Studio	LangGraph Studio offre une nouvelle façon de développer des applications LLM en fournissant un IDE d'agent spécialisé qui permet la visualisation, l'interaction et le débogage d'applications agentiques complexes.		Agent
GN	Jeu de rôle d'agent linguistique pour les jeux en monde ouvert.	arXiv	Agent
Système agent Llama	Composants agents des API Llama Stack.		Agent
LamaIndex	LlamaIndex est un framework de données pour votre application LLM.		Agent
Recherche mentale	? Un cadre multi-agent de moteur de recherche Web basé sur LLM (comme Perplexity.ai Pro et SearchGPT).		Agent
Mélange d'agents (MoA)	Le mélange d'agents améliore les capacités des grands modèles de langage.	arXiv	Agent
MMRôle	MMRole : un cadre complet pour le développement et l'évaluation d'agents de jeu de rôle multimodaux.	arXiv	Agent
Moonlander.ai	Commencez à créer des jeux 3D sans aucun codage grâce à l'IA générative.		Cadre
Diffusion de MuG	MuG Diffusion est une IA de cartographie pour les jeux de rythme basée sur Stable Diffusion (l'un des modèles AIGC les plus puissants) avec une modification importante pour incorporer des ondes audio.		Jeu
Oasis	Oasis est un modèle de monde interactif développé par Decart et Etched. Basé sur des transformateurs de diffusion, Oasis prend en compte les entrées du clavier de l'utilisateur et génère un gameplay de manière autorégressive.		Jeu
OmAgent	Un cadre d'agent multimodal pour résoudre des tâches complexes.		Agent
Agents ouverts	Une plateforme ouverte pour les agents linguistiques en liberté.		Agent
Opus	Une application d'IA qui transforme le texte en jeu vidéo.		Jeu
Pipecat	Framework Open Source pour l’IA conversationnelle vocale et multimodale.		Agent
Agent Qwen	Qwen-Agent est un framework pour développer des applications LLM basé sur le suivi des instructions, l'utilisation des outils, la planification et les capacités de mémoire de Qwen.		Agent
Ragas	Ragas est un framework qui vous aide à évaluer vos pipelines de récupération augmentée (RAG).		Agent
RPBench-Auto	Un pipeline automatisé pour évaluer les LLM pour le jeu de rôle.		Jeu
LMSI	Un agent IA généraliste pour les environnements virtuels 3D.		Agent
StoryGames.ai	L'IA pour les rêveurs crée des jeux.		Jeu
Agent SWE	Les interfaces ordinateur agent activent les modèles de langage de génie logiciel.	arXiv	Agent
TâcheGen	Un cadre agent basé sur les tâches s'appuyant sur les sorties StrictJSON des agents LLM.		Agent
Agent DIX	TEN Agent est le premier agent multimodal en temps réel au monde intégré à l'API OpenAI Realtime, RTC, et propose des fonctionnalités de vérification météo, de recherche sur le Web, de vision et de RAG.		Agent
Agent de traduction	Traduction agentique utilisant un workflow de réflexion.		Agent
Gazouillement	Twitter Personality est une application Web qui analyse votre identifiant Twitter pour créer un profil de personnalité personnalisé à l'aide de Wordware AI Agent.		Agent
Sans bornes	Unbounded : un jeu génératif infini de simulation de la vie des personnages.	arXiv	Jeu
Vidéo2Game	Environnement en temps réel, interactif, réaliste et compatible avec un navigateur à partir d'une seule vidéo.	arXiv	Jeu
V-IRL	Ancrer l'intelligence virtuelle dans la vie réelle.	arXiv	Agent
Agent de conception Web	Un agent utilisé pour la conception de sites Web.		Agent
XAgent	Un agent LLM autonome pour la résolution de tâches complexes.		Agent

^ Retour au sommaire ^

Code

Source	Description	Papier	Moteur de jeu	Taper
Traducteur de code IA	Utilisez l'IA pour traduire le code d'une langue à une autre.			Code
aiXcoder-7B	Modèle de langage étendu de code aiXcoder-7B.			Code
bloop	bloop est un moteur de recherche de code rapide écrit en Rust.			Code
Chapitre	Interpréteur de code ChatGPT dans les notebooks Jupyter.			Code
CodeGeeX	Un modèle de génération de code multilingue ouvert.	arXiv		Code
CodeGeeX2	Un modèle de génération de code multilingue plus puissant.			Code
CodeGeeX4	CodeGeeX4 : modèle ouvert de génération de code multilingue.			Code
CodeGen	CodeGen est un modèle open source pour la synthèse de programmes. Formé sur TPU-v4. Compétitif avec OpenAI Codex.	arXiv		Code
CodeGen2	Modèles CodeGen2 pour la synthèse de programmes.	arXiv		Code
Code Lama	Code Llama est un grand modèle de langage pour le code basé sur Llama 2.			Code
CodeTF	Bibliothèque de transformateurs unique pour un code LLM de pointe.			Code
CodeT5	LLM à code ouvert pour la compréhension et la génération de code.			Code
Curseur	Écrivez, modifiez et discutez de votre code avec GPT-4 dans un nouveau type d'éditeur.			Code
Codeur DeepSeek	DeepSeek Coder : laissez le code s'écrire tout seul.	arXiv		Code
Codex OpenAI	OpenAI Codex est un descendant de GPT-3.			Code
PandasAI	Pandas AI est une bibliothèque Python qui intègre des capacités d'intelligence artificielle générative dans Pandas, rendant les trames de données conversationnelles.			Code
RobloxScripterAI	RobloxScripterAI est un outil de génération de code basé sur l'IA pour Roblox.		Roblox	Code
Scikit-LLM	Intégrez de manière transparente des modèles de langage puissants tels que ChatGPT dans scikit-learn pour des tâches d'analyse de texte améliorées.			Code
SoTaNa	L'assistant de développement de logiciels open source.	arXiv		Code
Code stable 3B	Codage à la périphérie.			Code
Codeur étoile	? StarCoder est un modèle de langage (LM) formé sur le code source et le texte en langage naturel.	arXiv		Code
StarCoder 2	StarCoder2 est une famille de modèles de génération de code (3B, 7B et 15B), formés sur plus de 600 langages de programmation de The Stack v2 et certains textes en langage naturel tels que les problèmes Wikipedia, Arxiv et GitHub.	arXiv		Code
UnityGen IA	UnityGen AI est un plugin de génération de code alimenté par l'IA pour Unity.		Unité	Code
Vide	Void est une alternative open source au curseur. Écrivez du code avec les meilleurs outils d'IA, conservez le contrôle total de vos données et accédez à de puissantes fonctionnalités d'IA.			Code

^ Retour au sommaire ^

Écrivain

Source	Description	Taper
Écrivain IA	L'IA écrit des romans, génère des articles Web fantastiques et romantiques, etc. Modèle génératif chinois pré-entraîné.	Écrivain
Carnet.ai	Notebook.ai est un ensemble d'outils permettant aux écrivains, aux concepteurs de jeux et aux joueurs de rôle de créer des univers magnifiques – et tout ce qu'ils contiennent.	Écrivain
Roman	Éditeur WYSIWYG de style Notion avec saisie semi-automatique basée sur l'IA.	Écrivain
RomanAI	Grâce à l'IA, construisez sans douleur des histoires uniques, des contes palpitants, des romances séduisantes ou amusez-vous simplement.	Écrivain

^ Retour au sommaire ^

Image

Source	Description	Papier	Moteur de jeu	Taper
N'importe quelle porte	Personnalisation d’image au niveau de l’objet Zero-shot.	arXiv		Image
N'importe quel texte	Génération et édition de textes visuels multilingues.	arXiv		Image
AutoStudio	Création de sujets cohérents dans la génération d'images interactives multi-tours.	arXiv		Image
Blender-ControlNet	Utiliser ControlNet directement dans Blender.		Mixer	Image
BriVL	Relier la vision et le modèle linguistique.	arXiv		Image
CatVTON	CatVTON : la concaténation est tout ce dont vous avez besoin pour un essai virtuel avec des modèles de diffusion.	arXiv		Image
CLIPasso	Une méthode pour convertir l'image d'un objet en un croquis, permettant différents niveaux d'abstraction.	arXiv		Image
ClipDrop	Créez des visuels époustouflants en quelques secondes.			Image
Interface utilisateur confortable	Une interface graphique de diffusion stable puissante et modulaire avec une interface graphique/nœuds.			Image
Laboratoire de conception	Génération créative à l’aide de contraintes préalables de diffusion.	arXiv		Image
ContrôleNet	ControlNet est une structure de réseau neuronal permettant de contrôler les modèles de diffusion en ajoutant des conditions supplémentaires.	arXiv		Image
CSGO	CSGO : composition de style de contenu dans la génération de texte en image.	arXiv		Image
DALL·E 2	DALL·E 2 est un système d'IA capable de créer des images et des œuvres d'art réalistes à partir d'une description en langage naturel.			Image
Studio Dashtoon	Dashtoon Studio est une plateforme de création de bandes dessinées alimentée par l'IA.			Comique
IA profonde	DeepAI propose une suite d'outils qui utilisent l'IA pour améliorer votre créativité.			Image
DeepFloyd SI	IF par DeepFloyd Lab chez StabilityAI.			Image
Profondeur n'importe quoi V2	Profondeur n'importe quoi V2	arXiv		Image
Bibliothèque de cartes de profondeur et poseur	Bibliothèque de cartes de profondeur à utiliser avec l'extension Control Net pour Automatic1111/stable-diffusion-webui.			Image
Diffusez pour choisir	Enrichissement de l'inpainting conditionné par l'image dans les modèles de diffusion latente pour un essai virtuel.	arXiv		Image
Diffusion Disco	Un amalgame frankensteinien de cahiers, de modèles et de techniques pour la génération d'art et d'animations IA.			Image
Faites glisserGAN	Manipulation interactive basée sur des points sur le collecteur d'images génératives.	arXiv		Image
Dessiner des choses	Génération d'images assistée par l'IA dans votre poche.			Image
DWPose	Estimation efficace de la pose du corps entier avec distillation en deux étapes.	arXiv		Image
FacilePhoto	Votre générateur de photos intelligent AI.			Image
Flux	Ce référentiel contient un code d'inférence minimal pour exécuter du texte à l'image et de l'image à l'image avec nos transformateurs de flux rectifiés latents Flux.			Image
Suivez votre clic	Animation d'images régionales en domaine ouvert via des invites courtes.	arXiv		Image
Fooocus	Concentrez-vous sur l’incitation et la génération.			Image
GIFfusion	Créez des GIF et des vidéos à l'aide de la diffusion stable.			Image
Segment mis à la terre-n'importe quoi	Détectez, segmentez et générez automatiquement tout ce qui contient des entrées d'image, de texte et d'audio.	arXiv		Image
HivisionIDPhotos	HivisionIDPhotos : un outil de photos d'identification IA léger et efficace.			Image
Hua	Hua est un éditeur d'images IA avec diffusion stable (et plus).			Image
Hunyuan-DiT	Un puissant transformateur de diffusion multi-résolution avec une compréhension fine du chinois.	arXiv		Image
IC-Lumière	IC-Light est un projet pour manipuler l'éclairage des images.			Image
Idéogramme	Aider les gens à devenir plus créatifs.			Image
Image	Imagen est un système d'IA qui crée des images photoréalistes à partir du texte saisi.			Image
img2img-turbo	Image à image en une étape avec SD-Turbo.			Image
Img2Invite	Obtenez des invites à partir d’images générées par diffusion stable.			Image
Infini	Infinity : mise à l'échelle de la modélisation autorégressive au niveau du bit pour la synthèse d'images haute résolution.	arXiv		Image
ID instantané	Génération Zero-shot préservant l’identité en quelques secondes.	arXiv		Image
StagiaireLM-XComposer2	InternLM-XComposer2 est un grand modèle de langage de vision (VLLM) révolutionnaire qui excelle dans la composition et la compréhension de texte-image de forme libre.	arXiv		Image
KOALA	L'attention personnelle est importante dans la distillation des connaissances des modèles de diffusion latente pour une synthèse d'images rapide et efficace en mémoire.			Image
Couleurs	Kolors : formation efficace du modèle de diffusion pour la synthèse photoréaliste de texte en image.			Image
KRÉA	Générez des images et des vidéos avec un délicieux outil de conception alimenté par l'IA.			Image
Pont LaVi	Relier différents modèles de langage et modèles de vision générative pour la génération de texte en image.	arXiv		Image
CoucheDiffusion	Diffusion de couches d'images transparentes à l'aide de la transparence latente.	arXiv		Image
Lexique	Une diffusion stable invite le moteur de recherche.			Image
LamaGen	Le modèle autorégressif bat la diffusion : Llama pour la génération d'images évolutives.	arXiv		Image
Lumina-mGPT	Lumina-mGPT : illuminez la génération photoréaliste flexible de texte en image avec un pré-entraînement génératif multimodal.	arXiv		Image
Métashoot	MetaShoot est le jumeau numérique d'un studio photo, développé comme un plugin pour Unreal Engine qui donne à tout créateur la possibilité de produire des rendus très réalistes de la manière la plus simple et la plus rapide.		Moteur irréel	Image
À mi-parcours	Midjourney est un laboratoire de recherche indépendant qui explore de nouveaux moyens de pensée et développe les pouvoirs imaginatifs de l'espèce humaine.			Image
MIGC	MIGC : Contrôleur de génération multi-instance pour la synthèse texte-image.	arXiv		Image
ImiterBrosse	Édition d'images sans prise de vue avec imitation de référence.	arXiv		Image
OmniGen	OmniGen : génération d'images unifiée.	arXiv		Image
Omost	Omost est un projet visant à convertir la capacité de codage de LLM en capacité de génération d'images (ou plus précisément, de composition d'images).			Image
Éditeur Openpose	Éditeur Openpose pour le webui de diffusion stable d'AUTOMATIC1111.			Image
Équipez n'importe qui	Essayage virtuel de très haute qualité pour Tout Vêtements et Toute Personne.			Image
PeinturesAnnuler	PaintsUndo : un modèle de base des comportements de dessin dans les peintures numériques.			Image
Créateur de photos	Personnalisation de photos humaines réalistes via l’intégration d’ID empilés.	arXiv		Image
Salle photo	Générateur d'arrière-plan IA.			Image
Plask	Génération d'images IA dans le cloud.			Image
Invite.Art	Le hub des générateurs.			Image
PuLID	Personnalisation Pure et Lightning ID via un alignement contrasté.	arXiv		Image
Texte enrichi en image	Génération expressive de texte en image avec du texte enrichi.	arXiv		Image
RPG-DiffusionMaster	Maîtriser la diffusion texte-image : récapitulation, planification et génération avec des LLM multimodaux (PRG).			Image
Histoire SEED	SEED-Story : génération d'histoires longues multimodales avec un grand modèle de langage.	arXiv		Image
Segmenter n'importe quoi	Segment Anything Model (SAM) : un nouveau modèle d'IA de Meta AI qui peut "découper" n'importe quel objet, dans n'importe quelle image, en un seul clic.	arXiv		Image
Segmenter n'importe quoi modèle 2 (SAM 2)	SAM 2 : segmentez n'importe quoi dans les images et les vidéos.	arXiv		Image
sd-webui-controlnet	Extension WebUI pour ControlNet.			Image
SDXL-Lightning	Distillation progressive par diffusion antagoniste.	arXiv		Image
SDXS	Modèles de diffusion latente en une étape en temps réel avec conditions d'image.			Image
Stable.art	Plugin Photoshop pour Stable Diffusion avec Automatic1111 comme backend (localement ou avec Google Colab).			Image
Cascade stable	Stable Cascade se compose de trois modèles : Stage A, Stage B et Stage C, représentant une cascade de génération d'images, d'où le nom « Stable Cascade ».			Image
Diffusion stable	Un modèle de diffusion latent de texte en image.			Image
stable-diffusion.cpp	Diffusion stable en C/C++ pur.			Image
Interface utilisateur Web de diffusion stable	Une interface de navigateur basée sur la bibliothèque Gradio pour Stable Diffusion.			Image
Interface utilisateur Web de diffusion stable	Interface utilisateur Web pour une diffusion stable.			Image
WebUI à diffusion stable chinois	Version chinoise de stable-diffusion-webui.			Image
Diffusion stable XL	Générez des images à partir de texte.	arXiv		Image
Diffusion stable XL Turbo	Génération de texte en image en temps réel.			Image
Diffusion stable 3,5	La version ouverte Stable Diffusion 3.5 comprend plusieurs variantes de modèles, notamment Stable Diffusion 3.5 Large et Stable Diffusion 3.5 Large Turbo.			Image
Doodle stable	Stable Doodle est un outil de conversion d'esquisse en image qui convertit un simple dessin en une image dynamique.			Image
StableStudio	StableStudio par Stability AI			Image
Créateur d'histoires	StoryMaker : vers des personnages cohérents holistiques dans la génération texte-image.	arXiv		Image
FluxDiffusion	Une solution au niveau du pipeline pour la génération interactive en temps réel.			Image
StyleDrop	Génération de texte en image dans n'importe quel style.	arXiv		Image
SyncDreamer	Génération d'images cohérentes avec plusieurs vues à partir d'une image à vue unique.	arXiv		Image
Ultra	UltraEdit : édition d'images à grain fin basée sur des instructions et à grande échelle.	arXiv		Image
UltraPixel	UltraPixel : faire progresser la synthèse d'images à ultra haute résolution vers de nouveaux sommets.	arXiv		Image
Diffusion stable Unity ML	Diffusion stable de Core ML sur Unity.		Unité	Image
Visions Vispunk	Plateforme de génération de texte en image.			Image

^ Retour au sommaire ^

Texture

Source	Description	Papier	Moteur de jeu	Taper
GRC	Image unique en maillage texturé 3D avec modèle de reconstruction convolutive.	arXiv		Texture
Tapis de rêve	Génération de matériaux PBR de haute qualité avec des modèles de diffusion sensibles à la géométrie et à la lumière.	arXiv		Texture
Espace de rêve	Rêvez de l'espace de votre pièce avec la propagation de texture panoramique basée sur le texte.			Texture
Textures de rêve	Diffusion stable intégrée à Blender. Créez des textures, des illustrations conceptuelles, des éléments d'arrière-plan et bien plus encore à l'aide d'une simple invite de texte.		Mixer	Texture
Instruire les humains	Édition de textures humaines 3D animées avec instructions.	arXiv		Texture
InteX	Synthèse interactive de texte à texture via une peinture unifiée prenant en compte la profondeur.	arXiv		Texture
LLaMA-Maille	LLaMA-Mesh : unifier la génération de maillage 3D avec des modèles de langage.	arXiv		Engrener
MatérielSeg3D	MaterialSeg3D : segmentation de matériaux denses à partir d'a priori 2D pour les actifs 3D.	arXiv		Texture
MeshN'importe quoi	MaterialSeg3D : segmentation de matériaux denses à partir d'a priori 2D pour les actifs 3D.	arXiv		Engrener
Neuralangelo	Reconstruction de la surface neuronale haute fidélité.	arXiv		Texture
Peignez-le	Synthèse texte-texture via une optimisation de la carte de texture convolutive profonde et un rendu basé sur la physique.			Texture
Polycam	Créez vos propres textures 3D simplement en tapant.			Texture
TexFusion	Synthèse de textures 3D avec des modèles de diffusion d'images guidés par texte.	arXiv		Texture
Texte2Tex	Synthèse de textures basée sur le texte via des modèles de diffusion.	arXiv		Texture
Laboratoire de textures	Textures générées par l'IA. Vous pouvez générer le vôtre avec une invite de texte.			Texture
Avec Poly	Créez des textures avec Poly. Générez des matériaux 3D avec l'IA dans un éditeur en ligne gratuit ou effectuez une recherche dans notre bibliothèque communautaire en pleine expansion.			Texture
X-Maille	X-Mesh : vers une stylisation 3D rapide et précise basée sur le texte via un guidage textuel dynamique.	arXiv		Texture

^ Retour au sommaire ^

Ombreur

Source	Description	Papier	Moteur de jeu	Taper
Shader IA	Générateur de shader alimenté par ChatGPT pour Unity.		Unité	Ombreur

^ Retour au sommaire ^

Modèle 3D

Source	Description	Papier	Moteur de jeu	Taper
Animer3D	Animate3D : animation de n'importe quel modèle 3D avec diffusion vidéo multi-vues.	arXiv		3D
N'importe quoi-3D	Segment-Tout + 3D. Passons le tout à la 3D.	arXiv		Modèle
N'importe quel2Point	Any2Point : autoriser de grands modèles de toutes modalités pour une compréhension efficace de la 3D.	arXiv		3D
MélangeurGPT	Utilisez des commandes en anglais pour contrôler Blender avec le GPT-4 d'OpenAI.		Mixer	Modèle
Blender-GPT	Un assistant Blender tout-en-un alimenté par l'intégration GPT3/4 + Whisper.		Mixer	Modèle
Laboratoires de blocus	L'alchimie numérique est réelle avec Skybox Lab - la solution ultime basée sur l'IA pour générer d'incroyables expériences skybox à 360° à partir d'invites textuelles.			Modèle
CF-3DGS	Éclaboussures gaussiennes 3D sans COLMAP.	arXiv		3D
CaractèreGen	CharacterGen : génération efficace de personnages 3D à partir d'images uniques avec canonisation de pose multi-vues.	arXiv		3D
chatGPT-maya	Outil Maya simple qui utilise l'IA ouverte pour effectuer des tâches de base basées sur des instructions descriptives.		Maya	Modèle
VilleDreamer	Modèle génératif compositionnel de villes 3D illimitées.	arXiv		3D
CSM	Générez des mondes 3D à partir d'images et de vidéos.			3D
Tiret	Votre copilote pour la construction du monde dans Unreal Engine.		Moteur irréel	3D
Catalyseur de rêve	DreamCatalyst : édition 3D rapide et de haute qualité via le contrôle de la possibilité d'édition et la préservation de l'identité.	arXiv		3D
RêveGaussian4D	Éclaboussures gaussiennes 4D génératives.	arXiv		4D
POUSSIÈRE3R	Vision 3D géométrique simplifiée.	arXiv		3D
Édifier 3D	Edify 3D : génération d'actifs 3D évolutifs de haute qualité.	arXiv		3D
GALA3D	GALA3D : vers la génération de scènes complexes texte-3D via l'éclaboussement gaussien génératif guidé par la mise en page.	arXiv		3D
GaussCtrl	GaussCtrl : édition d'éclaboussures gaussiennes 3D cohérentes multi-vues.	arXiv		3D
Cube Gaussien	Une représentation de rayonnement structurée et explicite pour la modélisation générative 3D.	arXiv		3D
GaussienRêveur	Génération rapide du texte aux éclaboussures gaussiennes 3D avec les priorités des nuages de points.	arXiv		3D
GénieLabs	Renforcez votre jeu avec AI-UGC.			3D
HiFA	Text-to-3D haute fidélité avec guidage avancé de diffusion.			Modèle
HoloDreamer	HoloDreamer : génération d'un monde panoramique holistique en 3D à partir de descriptions textuelles.	arXiv		3D
Hunyuan3D-1.0	Hunyuan3D-1.0 : un cadre unifié pour la génération de texte en 3D et d'image en 3D.	arXiv		3D
Infinigen	Mondes photoréalistes infinis utilisant la génération procédurale.	arXiv		3D
Instruire-NeRF2NeRF	Édition de scènes 3D avec instructions.	arXiv		Modèle
3D interactive	Créez ce que vous voulez grâce à la génération 3D interactive.	arXiv		3D
Isotrope3D	Génération d'image en 3D basée sur une intégration de CLIP unique.			3D
LATTE3D	Synthèse Text-To-Enhanced3D amortie à grande échelle.	arXiv		3D
LION	Modèles de diffusion de points latents pour la génération de formes 3D.	arXiv		Modèle
Luma IA	Capturez en 3D réaliste. Photoréalisme, reflets et détails inégalés. L'avenir des effets visuels est maintenant, pour tout le monde !			Modèle
IA Lumine	Créativité basée sur l'IA.			3D
Créez-le-3D	Création 3D haute fidélité à partir d'une seule image avec diffusion préalable.	arXiv		Modèle
Maillé	Créez de superbes ressources de jeu 3D avec l'IA.			3D
Mouvement	Créateur d'animation IA 3D magique.			3D
MVrêve	Diffusion multi-vues pour la génération 3D.	arXiv		3D
NeRF instantané NVIDIA	Primitives graphiques neuronales instantanées : NeRF ultra-rapide et bien plus encore.			Modèle
Un-2-3-45	N'importe quelle image unique en maillage 3D en 45 secondes sans optimisation par forme.	arXiv		Modèle
Peinture3D	Peignez n'importe quoi en 3D avec des modèles de diffusion de texture sans éclairage.	arXiv		3D
PANIQUE-3D	Reconstruction 3D stylisée à vue unique à partir de portraits de personnages d'anime.	arXiv		Modèle
Point·E	Diffusion de nuages de points pour la synthèse de modèles 3D.			Modèle
Rêveur prolifique	Génération de texte en 3D haute fidélité et diversifiée avec distillation de partition variationnelle.	arXiv		Modèle
SF3D	SF3D : Reconstruction de maillage 3D rapide et stable avec démêlage UV et démêlage de l'éclairage.	arXiv		3D
Forme	Générez des objets 3D conditionnés à partir de texte ou d'images.	arXiv		Modèle
Sloyd	La modélisation 3D n'a jamais été aussi simple.			Modèle
IA spline	La puissance de l'IA arrive dans la 3ème dimension. Générez des objets, des animations et des textures à l'aide d'invites.			Modèle
Fusion de rêve stable	Une implémentation pytorch du modèle texte en 3D Dreamfusion, alimenté par le modèle texte en 2D Stable Diffusion.			Modèle
SV3D	Nouvelle synthèse multi-vues et génération 3D à partir d'une seule image à l'aide de la diffusion vidéo latente.	arXiv		3D
Tafi	Texte IA vers un moteur de personnages 3D.			Modèle
3D-GPT	Modélisation 3D procédurale avec de grands modèles de langage.	arXiv		3D
3D-LLM	Injecter le monde 3D dans de grands modèles linguistiques.	arXiv		3D
3Dpresso	Extrayez un modèle 3D d'un objet, capturé sur une vidéo.			Modèle
3DTopia	Génération de texte en 3D en 5 minutes.	arXiv		3D
3DTopia-XL	3DTopia-XL : mise à l'échelle de la génération d'actifs 3D de haute qualité via la diffusion primitive.	arXiv		3D
troisstudio	Un cadre unifié pour la génération de contenu 3D.			Modèle
TripoSR	Un modèle open source de pointe pour une reconstruction 3D rapide à partir d'une seule image.	arXiv		Modèle
Unique3D	Génération de maillage 3D de haute qualité et efficace à partir d'une seule image.	arxiv		3D
Unitygaussians Platting	Toy Gaussien Splatting Visualisation dans l'unité.		Unité	3D
Vif-1 à 3	Nouvelle synthèse de vue avec des modèles de diffusion vidéo.	arxiv		3D
Voxcraft	Création de modèles 3D prêts à l'emploi avec AI.			3D
Wonder3d	Image unique à 3D en utilisant la diffusion du domaine croisé.	arxiv		3D
Zéro-1 à 3	Zéro-shot une image à l'objet 3D.	arxiv		Modèle

^ Retour au sommaire ^

Avatar

Source	Description	Papier	Moteur de jeu	Taper
Aniportrait	Synthèse axée sur l'audio d'animations de portraits photoréalistes.	arxiv		Avatar
CALME	Modèles latentes adversaires conditionnels pour les caractères virtuels réalisables.	arxiv		Avatar
Chatavatar	Génération progressive de visages 3D animatisables sous le nom de texte.			Avatar
Chatdollkit	Chatdollkit vous permet de faire de votre modèle 3D un chatbot.		Unité	Avatar
Dreamtalk	Lorsque la génération expressive de tête parlante répond aux modèles probabilistes de diffusion.	arxiv		Avatar
Duix	Duix - SDK humain numérique basé en silicium?			Avatar
Échimique	Échomimique: animations de portraits audio réalistes à travers des conditions de repère modifiables.	arxiv		Avatar
Émoportraits	Avatars à tête multimodaux améliorés émotionnels.			Avatar
E3 Gen	Génération des avatars efficaces, expressives et modifiables.	arxiv		Avatar
Exavatar	Exavatar - Avatar gaussien 3D expressif du corps entier.	arxiv		Avatar
Geneavatar	Édition générique de tête volumétrique AVATAR à partir d'une seule image.	arxiv		Avatar
GENEFACE ++	Génération de visage parlante 3D généralisée et stable.			Avatar
Bonjour	Synthèse visuelle hiérarchique axée sur l'audio pour l'animation d'image de portrait.	arxiv		Avatar
Hallo2	Hallo2: Animation d'image de portrait audio de longue durée et haute résolution.	arxiv		Avatar
Idiot	Crafting Avatars 3D Head avec texte.	arxiv		Avatar
Intrinsicavatar	Intrinsicavatar: Rendu inverse physiquement basé sur les humains dynamiques à partir de vidéos monoculaires via le traçage explicite des rayons.	arxiv		Avatar
Talker	Système conversationnel Avatar numérique.			Avatar
Liveportrait	LivePortrait: animation de portrait efficace avec contrôle de couture et de reciblage.	arxiv		Avatar
Motiongpt	Le mouvement humain comme langue étrangère, un modèle de génération de langue de mouvement unifiée utilisant des LLM.	arxiv		Avatar
Coqueluche	MUSEPOSE: Un cadre d'image-vidéo axé sur la pose pour la génération humaine virtuelle.			Avatar
Musitalk	Synchorisation des lèvres de haute qualité en temps réel avec l'espace latent qui entre dans la dé wein.			Avatar
Musev	Génération de vidéo humaine virtuelle de longueur infinie et à haute fidélité avec débauche parallèle conditionnée visuelle.			Avatar
Portrait4d	Apprendre une synthèse d'avatar à tête 4D à un seul coup à l'aide de données synthétiques.	arxiv		Avatar
Prêt-moi prêt à me prêter	Intégrez des avatars personnalisables dans votre jeu ou votre application en jours.			Avatar
Rodinhd	Rodinhd: génération d'avatar 3D haute fidélité avec des modèles de diffusion.	arxiv		Avatar
Styleavatar3d	Tirant parti des modèles de diffusion de texte d'image pour la génération d'avatar 3D haute fidélité.	arxiv		Avatar
Text2Control3d	Génération d'avatar 3D contrôlable dans les champs de radiance neuronale en utilisant le modèle de diffusion de texte à l'image guidé par la géométrie.	arxiv		Avatar
Topo4d	Splatting gaussien préservant la topologie pour la capture de tête 4D haute fidélité.	arxiv		Avatar
Unityaiwithchatgpt	Sur la base de l'unité, l'affichage interactif de la voix de ChatGPT + UnityChan est réalisé.		Unité	Avatar
Vid2avatar	Reconstruction Avatar 3D de Videos in the Wild via la décomposition de la scène auto-supervisée.	arxiv		Avatar
Vlogger	Diffusion multimodale pour la synthèse de l'avatar incarnée.			Avatar
Wild2avatar	Rendant les humains derrière des occlusions.	arxiv		Avatar

^ Retour au sommaire ^

Animation

Source	Description	Papier	Taper
Animer quiconque	Synthèse d'image à video cohérente et contrôlable pour l'animation des personnages.	arxiv	Animation
Animateanything	Animation d'image de domaine ouvert à grain fin avec guidage de mouvement.	arxiv	Animation
Animée	Animez vos modèles de diffusion de texte à image personnalisés sans réglage spécifique.	arxiv	Animation
Animatelcm	Accélérons la génération de vidéos en 4 étapes!	arxiv	Animation
Animer-x	Animate-X: animation d'image de personnage universelle avec une représentation de mouvement améliorée.	arxiv	Animation
Animerzero	Les modèles de diffusion vidéo sont des animateurs d'image à tirs zéro.	arxiv	Animation
Animationgpt	Un outil AIGC pour générer des actifs de mouvement de combat de jeu.		Animation
Se débarrasser	Deforum exploite la diffusion stable pour générer des visuels AI évolutifs.		Animation
Drawingspinup	Dessingspinup: Animation 3D à partir de dessins à caractère unique.	arxiv	Animation
Rêvant	Un cadre de génération vidéo humaine basé sur des modèles de diffusion.	arxiv	Animation
Infusion	La prochaine génération fait face à Swapper et à l'amplificateur.		Animation
Librement	Écart d'initialisation de pontage dans les modèles de diffusion vidéo.	arxiv	Animation
Geneface	Synthèse du visage parlante audio généralisée et haute fidélité.	arxiv	Animation
Animateur id	Génération de vidéo humaine préservant l'identité zéro.	arxiv	Animation
Magicanime	Animation d'image humaine temporellement cohérente à l'aide du modèle de diffusion.	arxiv	Animation
Nuwa	Dragnuwa est un modèle de génération de vidéos basé sur la diffusion à domaine ouvert prend des contrôles de texte, d'image et de trajectoire comme entrées pour atteindre la génération vidéo contrôlable.	arxiv	Animation
Nuwa-infinity	Nuwa-Infinity est un modèle génératif multimodal conçu pour générer des images et des vidéos de haute qualité à partir d'une entrée de texte, d'image ou de vidéo donnée.		Animation
Nuwa-xl	Une nouvelle diffusion sur l'architecture de diffusion pour une génération vidéo extrêmement longue.		Animation
Animation omni	L'IA a généré des animations haute fidélité.		Animation
PIA	Votre animateur d'image personnalisé via des modules de plug-and-play dans les modèles de texte à image.	arxiv	Animation
Sadtalker	Apprendre des coefficients de mouvement 3D réalistes pour l'animation de visage parlante à l'image unique audio stylisée.	arxiv	Animation
Sadtalker-video-lip-sync	Ce projet est basé sur Sadtalkers WAV2lip pour la synthèse des lèvres vidéo.		Animation
Animation stable	Un puissant outil de texte à l'animation pour les développeurs.		Animation
Talecrafter	Un outil de visualisation interactif de l'histoire qui prend en charge plusieurs caractères.	arxiv	Animation
Tooncrafter	Tooncrafter: interpolation générative de dessin animé.	arxiv	Animation
Wav2lip	Vidéos avec précision des lèvres à l'état sauvage.	arxiv	Animation
Wonder Studio	Un outil d'IA qui anime, allume et compose automatiquement les personnages CG dans une scène en direct.		Animation

^ Retour au sommaire ^

Visuel

Source	Description	Papier	Taper
Cambrien-1	Cambrian-1: une exploration entièrement ouverte et centrée sur la vision des LLM multimodaux.	arxiv	LLMS multimodaux
Cogvlm2	Modèle multimodal open-source de niveau GPT4V basé sur LLAMA3-8B.		Visuel
Cotraceur	Il vaut mieux suivre ensemble.	arxiv	Visuel
Evf-sam	EVF-SAM: Fusion de langue de vision précoce pour le segment prévu pour le texte.	arxiv	Visuel
Face	Il vaut mieux suivre ensemble.		Visuel
Interlm-xcomposer2	Internlm-xcomposer2 est un grand modèle de vision (VLLM) révolutionnaire excellant dans la composition et la compréhension de l'image texte libre.	arxiv	Visuel
Kangourou	Kangaroo: un puissant modèle de langue vidéo prenant en charge l'entrée vidéo à long contexte.		Visuel
LGVI	Vers la détérioration vidéo axée sur la langue via des modèles multimodaux de grande langue.		Visuel
Llava ++	Étendre les capacités visuelles avec LLAMA-3 et PHI-3.		Visuel
Llava onevision	LLAVA-OneVision: Transfert de tâches visuelles faciles.	arxiv	Visuel
Longva	Transfert de contexte long du langage à la vision.	arxiv	Visuel
Masque	Pré-formation visuelle masquée pour la prédiction vidéo.	arxiv	Visuel
MINICPM-LALAMA3-V 2.5	Un MLLM de niveau GPT-4V sur votre téléphone.		Visuel
Moe-lava	Mélange d'experts pour les grands modèles de langue visuelle.	arxiv	Visuel
Motion	Comprendre les comportements humains des mouvements humains et des vidéos.	arxiv	Visuel
Pllava	Extension LLAVA sans paramètres des images aux vidéos pour le sous-titrage dense vidéo.	arxiv	Visuel
Qwen-vl	Un modèle polyvalent de la vision pour la compréhension, la localisation, la lecture de texte et au-delà.	arxiv	Visuel
Sapiens	SAPiens: Fondation pour les modèles de vision humaine.	arxiv	Visuel
Sharegpt4v	Amélioration de grands modèles multimodaux avec de meilleures légendes.	arxiv	Visuel
SOLO	Solo: un seul transformateur pour la modélisation évolutive en langue visuelle.	arxiv	Visuel
Vidéo-ccam	VIDEO-CCAM: Faire progresser la compréhension de la langue vidéo avec des masques transversales causales.		Visuel
Vidéo-lava	Apprendre une représentation visuelle unie par alignement avant projection.	arxiv	Visuel
Videollama 2	Faire progresser la modélisation spatiale-temporelle et la compréhension audio dans les lilms vidéo.	arxiv	Visuel
Vidéo-MME	La toute première référence d'évaluation complète des LLM multimodales dans l'analyse vidéo.	arxiv	Visuel
Vitre	Une vision unifiée au niveau de Pixel LLM pour la compréhension, la génération, la segmentation, l'édition.		Visuel
VILA	Vila: Sur la pré-formation pour les modèles de langage visuel.	arxiv	Visuel

^ Retour au sommaire ^

Vidéo

Source	Description	Papier	Taper
360DVD	Génération de vidéos Panorama contrôlable avec modèle de diffusion vidéo à 360 degrés.	arxiv	Vidéo
Animer-a-story	Génération de vidéos auprès de la récupération pour raconter une histoire.	arxiv	Vidéo
Tout dans n'importe quelle scène	Insertion de l'objet vidéo photoréaliste.		Vidéo
Art • V	Génération de texte à vidéo auto-régressive avec des modèles de diffusion.	arxiv	Vidéo
Assistant	Rencontrez la plate-forme vidéo générative qui donne vie à vos idées.		Vidéo
Atomovideo	Génération d'image à haute fidéalité à la vidéo.	arxiv	Vidéo
BackgroundRemover	Le dissolvant d'arrière-plan vous permet de supprimer l'arrière-plan des images et des vidéos en utilisant l'IA avec une interface de ligne de commande simple qui est gratuite et open source.		Vidéo
Boximator	Génération de mouvements riches et contrôlables pour la synthèse vidéo.	arxiv	Vidéo
Codef	Champs de déformation du contenu pour un traitement vidéo temporellement cohérent.	arxiv	Vidéo
Cogvideo	Générez des vidéos à partir de descriptions de texte.		Vidéo
Cogvideox	Cogvideox est une version open source du modèle de génération de vidéos, qui est homologue à 清影.		Vidéo
Cogvlm	COGVLM est un puissant modèle de langage visuel open source (VLM).		Visuel
Conr	Les vidéos de danse vivive génarate des feuilles de personnages d'anime dessinées à la main (ACS).	arxiv	Vidéo
Décohére	Créez ce qui ne peut pas être filmé.		Vidéo
Description	La description est la façon simple, puissante et amusante de modifier.		Vidéo
Diffutation	Ombrage toon modifiable à haute résolution via des modèles de diffusion.	arxiv	Vidéo
dauphin	Plateforme d'interaction vidéo générale basée sur LLMS.		Vidéo
Domoai	Amplifiez votre créativité avec Domoai.		Vidéo
Dreamcinema	Dreamcinema: transfert cinématographique avec caméra gratuite et caractère 3D.	arxiv	Vidéo
Dynamicrafter	Animation d'images du domaine ouvert avec des priors de diffusion vidéo.	arxiv	Vidéo
BORD	Nous introduisons Edge, une méthode puissante pour la génération de danse modifiable qui est capable de créer des danses réalistes et physiquement plausibles tout en restant fidèle à la musique d'entrée arbitraire.	arxiv	Vidéo
OMUM	Emote Portrait Alive - Génération de vidéos de portrait expressives avec modèle de diffusion Audio2video dans des conditions faibles.	arxiv	Vidéo
Vidéo EMU	Factoriser la génération de texte à vidéo par condition d'image explicite.		Vidéo
Etna	L'ETNA peut générer du contenu vidéo correspondant basé sur de courtes descriptions de texte.		Vidéo
Fée	Synthèse vidéo à la vidéo à guidage guidée par l'instruction rapide rapide.		Vidéo
Suivez vos cannettes	Suivez-vous-Canvas: Dépassement vidéo à haute résolution avec une génération de contenu étendue.	arXiv	Vidéo
Suivez votre pose	Génération de texte à vidéo guidée par la pose à l'aide de vidéos sans pose.	arxiv	Vidéo
Fulljourney	Votre suite complète d'outils de création d'IA à portée de main.		Vidéo
Gen-2	Un système d'IA multimodal qui peut générer de nouvelles vidéos avec du texte, des images ou des clips vidéo.		Vidéo
Dynamique générative	Dynamique générative de l'image.		Vidéo
Génie	Environnements interactifs génératifs.	arxiv	Vidéo
Genmo	Faire magiquement des vidéos avec l'IA.		Vidéo
Gentron	Transformers de diffusion pour la génération d'images et de vidéos.		Vidéo
Higen	Découplage spatio-temporel hiérarchique pour la génération de texte à vidéo.		Vidéo
Hotshot-xl	Hotshot-XL est un modèle de texte à GIF AI formé pour travailler aux côtés de diffusion stable XL.		Vidéo
Hunyuanvideo	Hunyuanvideo: un cadre systématique pour un grand modèle de génération de vidéos.	arxiv	Vidéo
Vidéo d'imagen	Compte tenu d'une invite de texte, Imagen Video génère des vidéos haute définition à l'aide d'un modèle de génération de vidéo de base et d'une séquence de modèles de super-résolution vidéo spatiale et temporelle interlinés.		Vidéo
Instructvideo	Instruire des modèles de diffusion vidéo avec une rétroaction humaine.	arxiv	Vidéo
I2vgen-xl	Synthèse d'image à vidéo de haute qualité via des modèles de diffusion en cascade.	arxiv	Vidéo
LaVie	Génération vidéo de haute qualité avec des modèles de diffusion latente en cascade.	arxiv	Vidéo
Studio LTX	LTX Studio est une plate-forme cinématographique holistique et dirigée par l'IA pour les créateurs, les spécialistes du marketing, les cinéastes et les studios.		Vidéo
LTX-video	LTX-video est le premier modèle de génération de vidéos basé sur DIT qui peut générer des vidéos de haute qualité en temps réel. Il peut générer des vidéos de 24 ips à une résolution 768x512, plus rapidement qu'il ne faut pour les regarder.		Vidéo
Lumière	Un modèle de diffusion spatio-temps pour la génération vidéo.	arXiv	Vidéo
LVDM	Modèles de diffusion vidéo latente pour la génération vidéo longue haute fidélité.	arxiv	Vidéo
Magicvideo	Génération vidéo efficace avec des modèles de diffusion latente.	arxiv	Vidéo
Magicvideo-v2	Génération vidéo à haute esthétique en plusieurs étapes.	arxiv	Vidéo
Heure magique	La vidéo AI pour les créateurs a été simplifiée.		Vidéo
Magvit-v2	Le tokenizer est la clé de la génération visuelle.		Vidéo
Magvit	Transformateur vidéo génératif masqué.		Vidéo
Make-a-video	Make-A-Video est un système AI de pointe qui génère des vidéos à partir de texte.	arxiv	Vidéo
Faire danser les pixels	Génération vidéo à haute dynamique.	arxiv	Vidéo
Faire votre vidéo	Génération vidéo personnalisée en utilisant des conseils textuels et structurels.	arxiv	Vidéo
Microcinema	Une approche de division et de conquis pour la génération de texte à vidéo.	arxiv	Vidéo
Mima	MIMO: synthèse vidéo de caractère contrôlable avec modélisation décomposée spatiale.	arxiv	Vidéo
Mini-gemini	Exploitation du potentiel des modèles de langage de vision multimodalités.		Vision
Mobilevidfactory	Génération de vidéo de médias sociaux basée sur la diffusion automatique pour les appareils mobiles à partir de texte.		Vidéo
Mochi 1	Mochi 1 est un modèle de génération vidéo de pointe ouverte avec un mouvement à haute fidélité et une forte adhésion rapide à l'évaluation préliminaire.		Vidéo
Mofa-video	Animation d'image contrôlable via des adaptations de champ de mouvement génératives dans le modèle de diffusion d'image à vidéo surgelé.	arXiv	Vidéo
MoneyPirterbo	Utilisez de grands modèles pour générer de courtes vidéos en un seul clic.		Vidéo
Moonvalley	MoonValley est un nouveau modèle d'interdiction de texte générateur de texte à vidéo.		Vidéo
Mora	Plus comme Sora pour la génération de vidéo généraliste.	arxiv	Vidéo
Morph Studio	Avec notre magie Text-to-Video AI, manifestez votre créativité à travers votre invite.		Vidéo
Mranch de mouvement	MotionClone: Clonage de mouvement sans formation pour la génération de vidéos contrôlables.	arxiv	Vidéo
Motionctrl	Un contrôleur de mouvement unifié et flexible pour la génération vidéo.	arxiv	Vidéo
Directeur de mouvement	Personnalisation du mouvement des modèles de diffusion de texte à vidéo.	arxiv	Vidéo
Motion	Une application de remplacement des personnages en vidéo par des avatars 3D.		Vidéo
Mov2mov	Plugin mov2mov pour automatique1111 / stable-diffusion-webui.		Vidéo
Moviefactory	Création automatique de films à partir de texte en utilisant de grands modèles génératifs pour le langage et les images.	arxiv	Vidéo
Cadres neuronaux	Découvrez le synthétiseur du monde visuel.		Vidéo
Nevertend	Créez votre monde.		Vidéo
Sora ouvert	Démocratiser la production vidéo efficace pour tous.		Vidéo
Sora ouvert	Plan ouvert.		Vidéo
Phénaki	Un modèle de génération de vidéos à partir de texte, avec des invites qui peuvent changer avec le temps, et des vidéos qui peuvent être aussi longues que plusieurs minutes.	arxiv	Vidéo
Pika Labs	Pika Labs révolutionne l'expérience vidéo avec l'IA.		Vidéo
Pixeling	Pixeling permet à nos clients de créer un contenu visuel très précis, ultra-réaliste et extrêmement contrôlable, y compris des images, des vidéos et des modèles 3D.		Vidéo
Pixverse	Créez des vidéos à couper le souffle avec l'IA.		Vidéo
Pollinisation	La création devient facile, rapide et amusante.		Vidéo
Réutiliser et diffuser	Denoison itératif pour la génération de texte à vidéo.	arXiv	Vidéo
Ruyi	Ruyi est un modèle d'image à video capable de générer des vidéos de qualité cinématographique à une résolution de 768, avec une fréquence d'images de 24 images par seconde, totalisant 5 secondes et 120 images.		Vidéo
Shortgpt	Un cadre expérimental d'IA pour la création automatisée de contenu court / vidéo.		Vidéo
Show-1	Épouser des pixels et des modèles de diffusion latente pour la génération de texte à vidéo.	arxiv	Vidéo
Cliché	Transformers spatio-temporels à l'échelle pour la synthèse du texte à vidéo.	arxiv	Vidéo
Sora	Création de vidéos à partir de texte.		Vidéo
Sorawebui	Sorawebui est un client Web Sora open-source, permettant aux utilisateurs de créer facilement des vidéos à partir de texte avec le modèle SORA d'Openai.		Vidéo
Stablevideo	Édition vidéo de diffusion de la cohérence axée sur le texte.		Vidéo
Diffusion vidéo stable	Image de diffusion vidéo stable (SVD) à video.		Vidéo
StoryDiffusion	Auto-agence d'auto-agence pour l'image à long terme et la génération de vidéos.	arxiv	Vidéo
Streamingt2v	Génération vidéo longue cohérente, dynamique et extensible à partir de texte.	arxiv	Vidéo
Stylecrafter	Nhancing Stylized Text-to-Video Generation with Style Adaptateur.	arxiv	Vidéo
Tatouage	Génération vidéo longue avec VQGAN agnostique dans le temps et transformateur sensible au temps.		Vidéo
Text2video-zéro	Les modèles de diffusion de texte à l'image sont des générateurs vidéo à tirs zéro.	arxiv	Vidéo
TF-T2V	Une recette pour augmenter la génération de texte à vidéo avec des vidéos sans texte.	arxiv	Vidéo
Tora	Tora: Transformateur de diffusion orienté vers la trajectoire pour la génération de vidéo.	arxiv	Vidéo
Piste	La piste est un outil flexible et interactif pour le suivi et la segmentation des objets vidéo, basé sur le segment n'importe quoi et XMEM.	arxiv	Vidéo
Tune-A-Video	Digne à un coup des modèles de diffusion d'image pour la génération de texte à vidéo.	arxiv	Vidéo
Douze	IA multimodale qui comprend des vidéos comme les humains.		Vidéo
Univg	Vers la génération vidéo unifiée modale.		Vidéo
Vchitect-2.0	VCITECT-2.0: Transformateur parallèle pour la mise à l'échelle des modèles de diffusion vidéo.		Vidéo
Vgen	Un écosystème de génération de vidéos holistique pour la génération de vidéos construisant sur des modèles de diffusion.	arxiv	Vidéo
ViewCrafter	ViewCrafter: Modèles de diffusion vidéo apprivoisés pour la synthèse de la nouvelle fidélité.	arxiv	Vidéo
Vidéo-chatte	Video-chatgpt est un modèle de conversation vidéo capable de générer une conversation significative sur les vidéos.	arxiv	Vidéo
Videocomposeur	Synthèse vidéo compositionnelle avec contrôlabilité de mouvement.	arxiv	Vidéo
Vidéocrafter1	Modèles de diffusion ouverts pour la génération de vidéos de haute qualité.	arxiv	Vidéo
Videocrafter2	Surmonter les limites de données pour les modèles de diffusion vidéo de haute qualité.	arxiv	Vidéo
VideoDrafter	Génération de vidéos multiples consiste à contenu avec LLM.	arxiv	Vidéo
Vidéoelevator	Élévation de la qualité de la génération de vidéos avec des modèles de diffusion de texte à image polyvalente.	arxiv	Vidéo
Vidéo vidéo	Échangez l'attention dans les diffusions spatio-temporelles pour la génération de texte à vidéo.		Vidéo
Vidote	Une approche de diffusion latente guidée par référence pour la génération de texte à vide à haute définition.	arxiv	Vidéo
Videolcm	Modèle de cohérence latente vidéo.	arxiv	Vidéo
Video LDMS	Alignez vos latents: synthèse vidéo haute résolution avec des modèles de diffusion latente.	arxiv	Vidéo
Vidéo-lava	Apprendre une représentation visuelle unie par alignement avant projection.	arxiv	Vidéo
Videomamba	Modèle d'espace d'état pour une compréhension vidéo efficace.	arxiv	Vidéo
Vidéo de pensée	Vidéo-pensée: raisonnement vidéo étape par étape de la perception à la cognition.		Vidéo
Videopoet	Un modèle grand langage pour la génération de vidéos à tirs zéro.	arxiv	Vidéo
Mouvement vispunk	Créez des vidéos réalistes en utilisant juste du texte.		Vidéo
Visualrwkv	VisualRwkv est la version visuelle améliorée du modèle de langue RWKV, permettant à RWKV de gérer diverses tâches visuelles.		Visuel
V-JEPA	Video Joint Imageding Architecture prédictive.	arxiv	Vidéo
Walt	Génération vidéo photoréaliste avec des modèles de diffusion.	arxiv	Vidéo
Zéroscope	Zeroscope Text-to-video.		Vidéo

^ Retour au sommaire ^

Audio

Source	Description	Papier	Taper
Academicodec	Un modèle de codec audio open source pour la recherche académique.		Audio
Amphion	Une boîte à outils audio, de musique et de génération de discours open source.	arxiv	Audio
Archisound	Génération audio utilisant des modèles de diffusion, dans Pytorch.		Audio
Audio	Génération audio unifiée avec invites en langage naturel.		Audio
Audio-édignation	Édition audio non supervisée et basée sur le texte à l'aide de l'inversion DDPM.	arxiv	Audio
Codec audiogène	Un codec audio neural à faible compression de 48 kHz pour l'audio général, optimisant pour la fidélité audio ?.		Audio
Audiogpt	Comprendre et générer la parole, la musique, le son et la tête parlante.	arxiv	Audio
Audiolcm	Génération de texte à audio avec des modèles de cohérence latente.	arXiv	Audio
Audioldm	Génération de texte à audio avec des modèles de diffusion latente.	arxiv	Audio
Audioldm 2	Apprentissage de la génération d'audio holistique avec pré-formation auto-supervisée.	arxiv	Audio
Auffusion	Tirant l'extraction de la puissance de la diffusion et des modèles de langue importants pour la génération de texte à audio.	arxiv	Audio
Ctag	Génération créative de texte à audio via la programmation du synthétiseur.		Audio
Foleycrafter	FOLEYCRAFTER: Donnez vie aux vidéos silencieuses avec des sons réalisants et synchronisés.	arxiv	Audio
Aimant	Génération audio masquée à l'aide d'un seul transformateur non autorégressif.		Audio
Make-an-audio	Génération de texte à audio avec des modèles de diffusion améliorés.	arxiv	Audio
Make-an-Audio 3	Transformer le texte en audio via de grands transformateurs de diffusion basés sur le débit.	arxiv	Audio
Neuralsound	Synthèse sonore modale basée sur l'apprentissage avec transfert acoustique.	arxiv	Audio
Optimizerai	Sons pour les créateurs, les fabricants de jeux, les artistes, les fabricants de vidéos.		Audio
Qwen2-audio	CHAT QWEN2-AUDIO et modèle de langage audio prétrainé proposé par Alibaba Cloud.	arxiv	Audio
See-2-Sound	SON SONNET SPATIAL SPATIAL-SHOT SON-SPATIAL.	arxiv	Audio
Tempête de son	Génération audio parallèle efficace.	arxiv	Audio
Audio stable	Diffusion audio latente conditionnée par un timing rapide.		Audio
Audio stable ouvert	STABLE Audio Open 1.0 génère l'audio stéréo de longueur variable (jusqu'à 47S) à 44,1 kHz à partir d'invites de texte.		Audio
Syncusion	Syncfusion: synthèse de la vidéo de la vidéo-audio synchronisée par le début multimodal.	arxiv	Audio
TANGO	GÉNÉRATION TEXT-TO-AUDIO Utilisation de l'instruction TONED LLM et du modèle de diffusion latente.		Audio
VTA-LDM	Génération vidéo à audio avec alignement caché.	arxiv	Audio
Wavjourney	Création audio de composition avec de grands modèles de langue.	arxiv	Audio

^ Retour au sommaire ^

Musique

Source	Description	Papier	Taper
Aiva	L'intelligence artificielle composant la musique de bande originale émotionnelle.		Musique
Musique d'ampère	Technologie de génération de musique personnalisée propulsée par Amper.		Musique
Flétri	Créez de la musique générative. Partagez-le avec le monde.		Musique
Chatmusicien	Favoriser les capacités musicales intrinsèques dans LLM.		Musique
Chord2Melody	Génération de musique automatique AI.		Musique
Diff-bgm	Un modèle de diffusion pour la génération de musique de fond vidéo.	arxiv	Musique
Fluxmusique	FLUXMUSIQUE: GÉNÉRATION DE TEXT-TO AUTUSIQUE AVEC LE TRANSFORMATEUR DE FLOW REDITIFE.	arxiv	Musique
Gptilleton	Da rédiger un script pour le traitement de la réponse GPT et l'envoi des notes MIDI dans les clips Ableton avec AbleTonosc et Python-OSC.		Musique
Heymusic.ai	Générateur de musique AI		Musique
Image à la musique	L'image AI en générateur de musique est un outil qui utilise l'intelligence artificielle pour convertir les images en musique.		Musique
Jen-1	Génération de musique universelle guidée par texte avec des modèles de diffusion omnidirectionnels.		Musique
Juke-box	Un modèle génératif pour la musique.	arxiv	Musique
Magenta	Magenta est un projet de recherche explorant le rôle de l'apprentissage automatique dans le processus de création de l'art et de la musique.		Musique
Mélodie	Génération de musique neuronale efficace		Musique
Mubert	AI Musique générative.		Musique
Bouffée	Un réseau neuronal profond qui peut générer des compositions musicales de 4 minutes avec 10 instruments différents, et peut combiner des styles du pays à Mozart aux Beatles.		Musique
Musicgen	Génération de musique simple et contrôlable.	arxiv	Musique
Musicldm	Amélioration de la nouveauté de la génération de texte à la musique à l'aide de stratégies de mélange synchrones battues.	arxiv	Musique
MusiqueLM	Générer de la musique à partir de texte.	arxiv	Musique
Application de riffusion	La riffusion est une application pour la génération de musique en temps réel avec une diffusion stable.		Musique
Sonauto	Sonauto est un éditeur de musique AI qui transforme les invites, les paroles ou les mélodies en chansons complètes dans n'importe quel style.		Musique
Soupçon	Générateur de musique AI pour les créateurs.		Musique
Soundry Ai	Outils d'IA génératifs, y compris des packs d'échantillons de texte à son et infini.		Musique

^ Retour au sommaire ^

Voix chanteuse

Source	Description	Papier	Taper
Diffsinger	Synthèse vocale chantante via un mécanisme de diffusion superficiel.	arxiv	Voix chanteuse
CONSURANT DE LA VOICE SANTÉ	Un cadre SVC facile à utiliser basé sur les VITS.		Voix chanteuse
So-vits-svc	SoftVC vites chantant la conversion vocale.		Voix chanteuse
Vi-svs	Utilisez des VITS et OpenCPOP pour développer la synthèse vocale chanteuse; Différent de Visinger.		Voix chanteuse

^ Retour au sommaire ^

Discours

Source	Description	Papier	Moteur de jeu	Taper
Applio	Outil de clonage vocal ultime, méticuleusement optimisé pour une puissance, une modularité et une expérience conviviales inégalées.			Discours
Audyo	Texte en. Audio out.			Discours
Aboyer	Modèle audio génératif proposé par texte.			Discours
Bert-vits2	VITS2 DURCHEUR avec bert multilingue.			Discours
Cordons	Chattts est un modèle de discours génératif pour le dialogue quotidien.			Discours
Clapspeech	Apprendre la prosodie à partir du contexte du texte avec un libellé contrastif-Audio pré-formation.	arxiv		Discours
Cosyvoice	Modèle de génération de grandes voix multilingues, offrant une inférence, une formation et un déploiement à la capacité complète.			Discours
DEX-TTS	Expressive de texte vocale expressive basée sur la diffusion avec modélisation de style sur la variabilité du temps.	arxiv		Discours
Émotive	Un moteur TTS à voix multiples et à commande rapide.			Discours
Fliki	Transformez le texte en vidéos avec des voix d'IA.			Discours
GLM-4-VOICE	GLM-4-VOICE est un modèle vocal de bout en bout lancé par Zhipu AI. GLM-4-Voice peut comprendre et générer directement la parole chinoise et l'anglais, s'engager dans des conversations vocales en temps réel et changer d'attributs tels que l'émotion, l'intonation, le taux de parole et le dialecte basé sur les instructions de l'utilisateur.			Discours
Brillant	Un flux génératif pour le texte à la disposition via la recherche d'alignement monotonique.	arxiv		Discours
GPT-SOVITS	Une puissante conversion vocale à quelques coups et un webui de texte vocal.			Discours
Lovo	Lovo est le générateur vocal AI et la plate-forme Text to Speech pour des milliers de créateurs.			Discours
Mahatts	Un modèle de génération de discours de grande source open source.			Discours
Matcha-tts	Une architecture TTS rapide avec correspondance de débit conditionnelle.	arxiv		Discours
Mélottes	Bibliothèque de texte vocale multilingue de haute qualité par myshell.ai. Prise en charge de l'anglais, de l'espagnol, du français, du chinois, du japonais et du coréen.			Discours
Metavoice-1b	IA pour l'intelligence de la parole au niveau de l'homme.			Discours
Narakeet	Créez facilement des voix off en utilisant du texte réaliste vers la parole.			Discours
Mini-omni	MINI-OMNI: Les modèles de langue peuvent entendre, parler tout en pensant en streaming. Le mini-OMNI est un modèle de grande langue à source ouverte qui peut entendre, parler tout en pensant. Doté de l'entrée de bout en bout en temps réel et des capacités de conversation de sortie audio de streaming en temps réel.	arxiv		Discours
Cloner un seul coup	One Shot Voice Cloning Base sur Unet-TTS.			Discours
Openvoice	Clonage de voix instantanée par Myshell.			Discours
Débordement	Mettre les flux sur les transducteurs neuronaux pour un meilleur TTS.			Discours
RealTimemetts	RealTimetts est une bibliothèque de texte à dispection à la pointe de la technologie (TTS) conçue pour des applications en temps réel.			Discours
Sens vain	SenseVoice est un modèle de base de la parole avec de multiples capacités de compréhension de la parole, notamment la reconnaissance automatique de la parole (ASR), l'identification du langage parlé (LID), la reconnaissance des émotions de la parole (SER) et la détection des événements audio (AED).			Discours
Discours	Autonomiser les grands modèles de langage avec des capacités de conversation intermodales intrinsèques.	arxiv		Discours
discours à text-gpt3-unité	Ceci est le repo que j'utilise API Whisper et Chatgpt d'Openai dans Unity.		Unité	Discours
Discours stable	Modèle de texte vocal de stabilité AI.			Discours
Stabletts	Modèle TTS de nouvelle génération utilisant la correspondance de flux et DIT, inspiré par la diffusion stable 3.			Discours
Styletts 2	Vers le tex-voca-vocation au niveau de l'homme à travers la diffusion du style et la formation contradictoire avec de grands modèles de langage de la parole.	arxiv		Discours
tortue.cpp	Tortoise.cpp: mise en œuvre GGML de Tortoise-TTS.			Discours
Tortue-tts	Un système TTS multi-voix s'est formé en mettant l'accent sur la qualité.			Discours
Webui de génération de tts	TTS Generation Webui (Bark, Musicgen, Tortoise, RVC, vocos, DeMUCS).			Discours
Vall-e	Les modèles de langage de codec neural sont du texte à tirs zéro pour les synthétiseurs de la parole.	arxiv		Discours
Vall-e x	Parlez des langues étrangères avec votre propre voix: modélisation de la langue des codecs neuronaux inter-greatoires	arxiv		Discours
Vocode	Vocode est une bibliothèque open source pour construire des applications LLM basées sur la voix.			Discours
Boîte à voix	Génération de parole universelle multilingue guidée par texte à grande échelle.	arxiv		Discours
Vocation	Édition de parole zéro-shot et text-to-dispection dans la nature.			Discours
Chuchoter	Whisper est un modèle de reconnaissance vocale à usage général.			Discours
Chuchotement	Un système de texte vocal open source construit par un chuchotement inversé.			Discours
Xe-dispection	Cadre de formation conjointe de la conversion émotionnelle inter-vocale émotionnelle et conversion de la voix émotionnelle non autorégressive.			Discours
Xtts	XTTS est une bibliothèque pour la génération avancée de texte-parole.			Discours
Yourtts	Vers des TT multi-partenaires zéro et une conversion vocale zéro-shot pour tout le monde.	arxiv		Discours
Zmm-tts	Synthèse de la parole multilingue et multilingue zéro conditionnée sur des représentations discretes discretes auto-supervisées.	arxiv		Discours