ai game devtools
1.0.0
Ici, nous garderons une trace des derniers outils de développement de jeux IA, notamment LLM, agent, code, écrivain, image, texture, shader, modèle 3D, animation, vidéo, audio, musique, voix chantée et analyses.
Source | Description | Papier | Moteur de jeu | Taper |
---|---|---|---|---|
AgentGPT | ? Assemblez, configurez et déployez des agents IA autonomes dans votre navigateur. | Outil | ||
Commande AI | Intégration de ChatGPT avec Unity Editor. | Unité | Outil | |
AIOS | Système d'exploitation de l'agent LLM. | Outil | ||
Scientifique en IA | Le scientifique de l'IA : vers une découverte scientifique ouverte et entièrement automatisée. | arXiv | Outil | |
Assistant CLI | Un outil CLI confortable pour utiliser le service ChatGPT | Outil | ||
GPT automatique | Une tentative expérimentale open source pour rendre GPT-4 entièrement autonome. | Outil | ||
BébéAGI | Ce script Python est un exemple de système de gestion de tâches basé sur l'IA. | Outil | ||
?? Interface utilisateur BabyAGI | L'interface utilisateur de BabyAGI est conçue pour faciliter l'exécution et le développement avec babyagi dans une application Web, comme ChatGPT. | Outil | ||
baichuan-7B | Un modèle linguistique de pré-formation 7B à grande échelle développé par Baichuan. | Outil | ||
Baichuan-13B | Un grand modèle de langage 13B développé par Baichuan Intelligent Technology. | Outil | ||
Baichuan 2 | Une série de grands modèles de langage développés par Baichuan Intelligent Technology. | Outil | ||
Bisheng | Bisheng est une plate-forme ouverte de développement LLM pour les applications d'IA de nouvelle génération. | Outil | ||
Caractère-LLM | Un agent formable pour le jeu de rôle. | arXiv | Outil | |
ChatDev | Agents de communication pour le développement de logiciels. | arXiv | Outil | |
ChatGPT-API-unité | Lie l'API de complétion de chat ChatGPT au C# pur sur Unity. | Unité | Outil | |
ChatGPTForUnity | ChatGPT pour l'unité. | Unité | Outil | |
ChatRWKV | ChatRWKV est comme ChatGPT mais alimenté par le modèle de langage RWKV (100 % RNN) et open source. | Outil | ||
ChatYuan | Grand modèle linguistique pour le dialogue en chinois et en anglais. | Outil | ||
Chinois-LLaMA-Alpaga-3 | (Chinese Llama-3 LLM) développés à partir de Meta Llama 3. | Outil | ||
Chrome-GPT | Un agent AutoGPT qui contrôle Chrome sur votre bureau. | Outil | ||
CogVLM | CogVLM, un puissant modèle de base de langage visuel open source. | arXiv | Outil | |
CoreNet | Une bibliothèque pour former des réseaux de neurones profonds. | Outil | ||
Cosmos | Cosmos est une plate-forme de développement de modèles mondiaux qui comprend des modèles de base mondiaux, des tokeniseurs et un pipeline de traitement vidéo pour accélérer le développement de l'IA physique dans les laboratoires de robotique et d'audiovisuel. | LLM | ||
DBRX | DBRX est un grand modèle de langage formé par Databricks. | Outil | ||
DCLM | DataComp pour les modèles de langage. | arXiv | Outil | |
DeepSeek-V3 | DeepSeek-V3 est un modèle de langage de mélange d'experts (MoE) puissant avec 671 B de paramètres au total, dont 37 B activés pour chaque jeton. | arXiv | LLM | |
DémoGPT | Générateur d'applications Auto Gen-AI avec la puissance de Llama 2 | Outil | ||
Conception2Code | Automatisation de l'ingénierie frontale | Outil | ||
Devika | Devika est un ingénieur logiciel en IA agentique. | Outil | ||
Dévonien | Un programmeur de paires open source. | Outil | ||
Dora | Générer des sites Web puissants, une invite à la fois. | Outil | ||
Flowise | Glissez-déposez l'interface utilisateur pour créer votre flux LLM personnalisé à l'aide de LangchainJS. | Outil | ||
Gémeaux | Gemini est conçu dès le départ pour la multimodalité : raisonner de manière transparente sur le texte, les images, la vidéo, l'audio et le code. | Outil | ||
Gemme | Gemma est une famille de modèles ouverts légers et de pointe, construits à partir de la recherche et de la technologie utilisées pour créer des modèles Google Gemini. | Outil | ||
gemma.cpp | moteur d'inférence C++ léger et autonome pour les modèles Gemma de Google. | Outil | ||
GLM-4 | GLM-4-9B est la version open source de la dernière génération de modèles pré-entraînés de la série GLM-4 lancée par Zhipu AI. | Outil | ||
GPT4Tous | Un chatbot formé sur une collection massive de données d'assistant propres, notamment du code, des histoires et des dialogues. | Outil | ||
GPT-4o | GPT-4o (« o » pour « omni ») est une étape vers une interaction homme-machine beaucoup plus naturelle : il accepte en entrée n'importe quelle combinaison de texte, d'audio, d'image et de vidéo et génère n'importe quelle combinaison de texte, d'audio et d'image. sorties. | Outil | ||
GPTScript | Développer des applications LLM en langage naturel. | Outil | ||
Grok-1 | Les poids et l'architecture de notre modèle de mélange d'experts de 314 milliards de paramètres, Grok-1. | Outil | ||
CâlinsChat | Rendre les meilleurs modèles de chat IA de la communauté accessibles à tous. | Outil | ||
Intégration Unity de l'API Hugging Face | Ce package Unity fournit une intégration facile à utiliser pour l'API Hugging Face Inference, permettant aux développeurs d'accéder et d'utiliser les modèles Hugging Face AI dans leurs projets Unity. | Unité | Outil | |
Liaison d'image | ImageBind One Embedding Space pour les lier tous. | arXiv | Outil | |
Indice-1.9B | Un LLM multilingue léger SOTA. | Outil | ||
InteractML-Unity | InteractML, un framework de script visuel d'apprentissage automatique interactif pour Unity3D. | Unité | Outil | |
Moteur InteractML-Unreal | Apporter l’apprentissage automatique à Unreal Engine. | Moteur irréel | Outil | |
StagiaireLM | InternLM a mis en open source un modèle de base de 7 milliards de paramètres, un modèle de chat adapté aux scénarios pratiques et au système de formation. | arXiv | Outil | |
StagiaireLM-XComposer | InternLM-XComposer2 est un grand modèle de langage de vision (VLLM) révolutionnaire qui excelle dans la composition et la compréhension de texte-image de forme libre. | arXiv | Outil | |
Jan | Apportez l'IA sur votre bureau. | Outil | ||
Lamini | Lamini permet à toute équipe d'ingénierie de surpasser les LLM à usage général grâce au RLHF et à l'ajustement précis de ses propres données. | Outil | ||
LaMini-LM | LaMini-LM est une collection de modèles de langage efficaces de petite taille distillés à partir de ChatGPT et formés sur un ensemble de données à grande échelle de 2,58 millions d'instructions. | Outil | ||
LangChaîne | LangChain est un framework pour développer des applications alimentées par des modèles de langage. | Outil | ||
LangFlow | ⛓️ LangFlow est une interface utilisateur pour LangChain, conçue avec React-Flow pour fournir un moyen sans effort d'expérimenter et de prototyper des flux. | Outil | ||
LaVague | Automatisez l’automatisation avec le framework Large Action Model. | Outil | ||
Maki | Modèles de fondation ouverts pour les agents linguistiques. | Outil | ||
IA Lepton | Un framework Pythonic pour simplifier la création de services d'IA. | Outil | ||
Lit-LLaMA | Implémentation du modèle de langage LLaMA basé sur nanoGPT. Prend en charge l'attention flash, la quantification Int8 et GPTQ 4 bits, le réglage fin de LoRA et LLaMA-Adapter, le pré-entraînement. | Outil | ||
lama2-webui | Exécutez Llama 2 localement avec gradio UI sur GPU ou CPU depuis n'importe où (Linux/Windows/Mac). | Outil | ||
Lama 3 | Le site GitHub officiel de Meta Llama 3. | Outil | ||
Lama 3.1 | Llama est un grand modèle de langage (LLM) accessible et ouvert conçu pour permettre aux développeurs, aux chercheurs et aux entreprises de créer, d'expérimenter et de faire évoluer de manière responsable leurs idées d'IA générative. | Outil | ||
LLaSM | Grand modèle de langage et de parole. | Outil | ||
Moteur de réponse LLM | Créez un moteur de réponse inspiré de la perplexité à l'aide de Next.js, Groq, Mixtral, Langchain, OpenAI, Brave et Serper. | Outil | ||
llm.c | Formation LLM en C/CUDA simple et brut. | Outil | ||
LLMUnité | Créez des personnages dans Unity avec les LLM ! | Unité | Outil | |
LLocalRecherche | LLocalSearch est un moteur de recherche exécuté entièrement localement utilisant des agents LLM. | Outil | ||
LogicGamesSolver | Un outil Python pour résoudre des jeux de logique avec l'IA, le Deep Learning et la Computer Vision. | Outil | ||
Écrivain long | LongWriter : libérer plus de 10 000 mots à partir de LLM à contexte long. | arXiv | Outil | |
Modèle du grand monde (LWM) | Le Large World Model (LWM) est un modèle autorégressif multimodal à grand contexte à usage général. | arXiv | Outil | |
Lumina-T2X | Lumina-T2X est un cadre unifié pour la génération de texte vers n'importe quelle modalité. | arXiv | Outil | |
MétaGPT | Le cadre multi-agents | Outil | ||
MiniCPM-2B | Un LLM final surpasse Llama2-13B. | Outil | ||
MiniGPT-4 | Améliorer la compréhension du langage visuel avec des modèles de langage étendus avancés. | arXiv | Outil | |
MiniGPT-5 | Génération de vision et de langage entrelacés via des Vokens génératifs. | arXiv | Outil | |
Mixtral 8x7B | Un mélange d’experts clairsemés de haute qualité. | arXiv | Outil | |
Mistral7B | Le meilleur modèle 7B à ce jour, Apache 2.0. | Outil | ||
Mistral Grand | Mistral Large est un nouveau modèle de génération de texte de pointe. Il atteint des capacités de raisonnement de premier plan. | Outil | ||
MLC LLM | Permettez à chacun de développer, d’optimiser et de déployer des modèles d’IA de manière native sur les appareils de chacun. | Outil | ||
MobiLlama | Vers un GPT précis et léger entièrement transparent. | arXiv | Outil | |
MoE-LLaVA | Mélange d'Experts pour les Grands Modèles Vision-Langage. | arXiv | Outil | |
Moshi | Moshi est une IA conversationnelle expérimentale. | Outil | ||
Moshi | Moshi : un modèle de base parole-texte pour le dialogue en temps réel. | Outil | ||
MOUSSE | Un modèle de langage conversationnel augmenté par un outil open source de l'Université de Fudan. | Outil | ||
mPLUG-Chouette ? | La modularisation permet aux grands modèles de langage d'être multimodaux. | arXiv | Outil | |
Némotron-4 | Un grand modèle de langage multilingue de 15 milliards de paramètres formé sur 8 000 milliards de jetons de texte. | arXiv | Outil | |
NExT-GPT | Modèle de grand langage multimodal Any-to-Any. | Outil | ||
OLMo | Modèle de langage ouvert | arXiv | Outil | |
OmniLMM | Grands modèles multimodaux pour des performances élevées et un déploiement efficace. | Outil | ||
UnLLM | Un cadre pour aligner toutes les modalités sur le langage. | arXiv | Outil | |
Assistant ouvert | OpenAssistant est un assistant basé sur le chat qui comprend les tâches, peut interagir avec des systèmes tiers et récupérer des informations de manière dynamique pour ce faire. | Outil | ||
OuvrirDevin | Un ingénieur logiciel IA autonome. | Outil | ||
Orion-14B | Orion-14B est une famille de modèles comprenant un LLM de base 14B et une série de modèles. | arXiv | Outil | |
Panda | Grand modèle linguistique open source chinois d'outre-mer, basé sur Llama-7B, -13B, -33B, -65B pour une pré-formation continue dans le domaine chinois. | Outil | ||
Perplexique | Un moteur de recherche alimenté par l'IA. | Outil | ||
Pi | Chatbot IA conçu pour l'assistance personnelle et le soutien émotionnel. | Outil | ||
Qwen1.5 | Qwen1.5 est la version améliorée de Qwen. | Outil | ||
Qwen2 | Qwen2 est la grande série de modèles de langage développée par l'équipe Qwen, Alibaba Cloud. | Outil | ||
Qwen-7B | Le dépôt officiel du chat Qwen-7B (通义千问-7B) et du grand modèle de langage pré-entraîné proposé par Alibaba Cloud. | Outil | ||
Agent de dépôt | RepoAgent est un projet Open Source piloté par des Large Language Models (LLM) qui vise à fournir un moyen intelligent de documenter les projets. | arXiv | Outil | |
Moteur IA de santé mentale | Moteur Sanity AI pour l'outil de développement de jeux Unity. | Unité | Outil | |
RechercherGPT | ? Connecter ChatGPT à Internet | Outil | ||
PartagerGPT4V | Améliorer les grands modèles multimodaux avec de meilleures légendes. | Outil | ||
Travail aérien | Les modèles de la série Skywork sont pré-entraînés sur 3,2 To de données multilingues (principalement chinois et anglais) et de code de haute qualité. | Outil | ||
StableLM | Modèles de langage d’IA de stabilité. | arXiv | Outil | |
Alpaga de Stanford | Un modèle LLaMA suivant les instructions. | Outil | ||
Interface utilisateur Web de génération de texte | Une interface utilisateur Web gradio pour exécuter des modèles de langage étendus tels que LLaMA, lama.cpp, GPT-J, OPT et GALACTICA. | Outil | ||
Moteur de chat minuscule | Bibliothèque d'inférence LLM sur appareil. | Outil | ||
Banc d'outils | Une plate-forme ouverte pour la formation, le service et l'évaluation d'un grand modèle de langage pour l'apprentissage des outils. | Outil | ||
Unity ChatGPT | Expériences Unity ChatGPT. | Unité | Outil | |
Intégration Unity OpenAI-API | Intégrez le modèle de langage openai GPT-3 et l'API ChatGPT dans un projet Unity. | Unité | Outil | |
Unreal Engine 5 Lama LoRA | Un projet de validation de principe qui présente le potentiel d'utilisation de petits LLM pouvant être formés localement pour créer des outils de documentation de nouvelle génération. | Moteur irréel | Outil | |
UnrealGPT | Une collection de widgets Unreal Engine 5 Editor Utility optimisés par GPT3/4. | Moteur irréel | Outil | |
Vidéo-LLaVA | Apprentissage de la représentation visuelle unie par alignement avant projection. | arXiv | Outil | |
WebGPT | Exécutez le modèle GPT sur le navigateur avec WebGPU. | Outil | ||
Web3-GPT | Déployer des contrats intelligents avec l'IA | Outil | ||
MotGPT | ? Apportez la puissance de ChatGPT à Microsoft Word | Outil | ||
XAgent | Un agent LLM autonome pour la résolution de tâches complexes. | Outil | ||
Yi | Une série de grands modèles de langage formés à partir de zéro par les développeurs. | Outil | ||
01 Projet | L'ordinateur modèle de langage open source. | Outil |
^ Retour au sommaire ^
Source | Description | Papier | Moteur de jeu | Taper |
---|---|---|---|---|
Banc d'agent | Une référence complète pour évaluer les LLM en tant qu'agents. | arXiv | Agent | |
Discussion de groupe d'agents | Un simulacre de discussion de groupe interactif pour mieux susciter les comportements collectifs émergents. | arXiv | Agent | |
Agent K | Une AGI auto-agentique, auto-évolutive et modulaire. | Agent | ||
AgentScope | Commencez à créer plus facilement des applications multi-agents basées sur LLM. | arXiv | Agent | |
AgentSims | Un bac à sable Open Source pour l'évaluation de modèles linguistiques à grande échelle. | Agent | ||
Ville IA | AI Town est une ville virtuelle où les personnages IA vivent, discutent et socialisent. | Agent | ||
anime.gf | Alternative locale et open source à CharacterAI. | Jeu | ||
Astrocade | Créez des jeux avec l'IA | Jeu | ||
Agents atomiques | Le framework Atomic Agents est conçu pour être modulaire, extensible et facile à utiliser. | Agent | ||
Agents automatiques | Un cadre pour la génération automatique d'agents. | Agent | ||
Génération automatique | Activez les applications de modèles de langage étendus de nouvelle génération. | arXiv | Agent | |
comportemental | Behaviac est un cadre de développement de l'IA de jeux. | Cadre | ||
Biomes | Biomes est un MMORPG sandbox open source conçu pour le Web à l'aide de technologies Web telles que Next.js, Typescript, React et WebAssembly. | Jeu | ||
Tampon de pensées | Raisonnement augmenté par la pensée avec de grands modèles de langage. | arXiv | Agent | |
Agent Byzer | Cadre d'agent simple, rapide et distribué pour tout le monde. | Agent | ||
La ville des chats | Simulation alimentée par AC(h)atGPT avec des chats. | Agent | ||
La ville des chats | Simulation alimentée par AC(h)atGPT avec des chats. | Agent | ||
CaractèreGLM | Personnalisation des caractères conversationnels chinois de l'IA avec de grands modèles linguistiques. | arXiv | Agent | |
ChatDev | Agents de communication pour le développement de logiciels. | arXiv | Agent | |
CogAgent | CogAgent est un modèle de langage visuel open source amélioré basé sur CogVLM. | arXiv | Agent | |
Berceau | Vers un contrôle informatique général. | Agent | ||
équipageIA | Cadre pour orchestrer des agents d’IA autonomes de jeu de rôle. | Agent | ||
Difier | Dify est une plateforme de création d'applications LLM open source. | Agent | ||
Projet de vie numérique | Personnages 3D autonomes avec intelligence sociale. | arXiv | Agent | |
tout-ai | Votre assistant chatbot local pleinement compétent, alimenté par l’IA ? | Agent | ||
tissu | fabric est un framework open source permettant d'augmenter les humains à l'aide de l'IA. | Agent | ||
GPT rapide | FastGPT est une plateforme basée sur les connaissances construite sur le LLM. | Agent | ||
rapideRAG | Cadre efficace d’augmentation et de génération de récupération. | Agent | ||
JeuAISDK | Cadre d'automatisation de l'IA de jeu basé sur l'image. | Cadre | ||
GameNGen | Les modèles de diffusion sont des moteurs de jeu en temps réel. | arXiv | Jeu | |
GameGen-O | GameGen-O : Génération de jeux vidéo en monde ouvert. | Jeu | ||
GenAgent | GenAgent : Créez des systèmes d'IA collaboratifs avec génération automatisée de flux de travail - Études de cas sur ComfyUI. | arXiv | Agent | |
Agents Génératifs | Simulacres interactifs du comportement humain. | arXiv | Agent | |
Genèse | Genesis : un moteur physique génératif et universel pour la robotique et au-delà. | Jeu | ||
Génie | Environnements interactifs génératifs. | Jeu | ||
gigax | Runtime, PNJ alimentés par LLM. | Jeu | ||
HippoRAG | Mémoire à long terme d'inspiration neurobiologique pour les grands modèles de langage. | arXiv | Agent | |
PNJ interactifs alimentés par LLM | Interactive LLM Powered NPCs, est un projet open source qui transforme complètement votre interaction avec les personnages non-joueurs (PNJ) dans n'importe quel jeu ! | Jeu | ||
IoA | Un framework open source pour les agents d'IA collaboratifs, permettant à divers agents distribués de faire équipe et d'accomplir des tâches complexes via une connectivité de type Internet. | Agent | ||
KwaiAgents | Un système d'agents de recherche d'informations généralisé avec de grands modèles linguistiques (LLM). | arXiv | Agent | |
LangChaîne | Faites passer votre application LLM du prototype à la production. | Agent | ||
Flux de langage | Langflow est une interface utilisateur pour LangChain, conçue avec React-Flow pour fournir un moyen sans effort d'expérimenter et de prototyper des flux. | Agent | ||
LangGraph Studio | LangGraph Studio offre une nouvelle façon de développer des applications LLM en fournissant un IDE d'agent spécialisé qui permet la visualisation, l'interaction et le débogage d'applications agentiques complexes. | Agent | ||
GN | Jeu de rôle d'agent linguistique pour les jeux en monde ouvert. | arXiv | Agent | |
Système agent Llama | Composants agents des API Llama Stack. | Agent | ||
LamaIndex | LlamaIndex est un framework de données pour votre application LLM. | Agent | ||
Recherche mentale | ? Un cadre multi-agent de moteur de recherche Web basé sur LLM (comme Perplexity.ai Pro et SearchGPT). | Agent | ||
Mélange d'agents (MoA) | Le mélange d'agents améliore les capacités des grands modèles de langage. | arXiv | Agent | |
MMRôle | MMRole : un cadre complet pour le développement et l'évaluation d'agents de jeu de rôle multimodaux. | arXiv | Agent | |
Moonlander.ai | Commencez à créer des jeux 3D sans aucun codage grâce à l'IA générative. | Cadre | ||
Diffusion de MuG | MuG Diffusion est une IA de cartographie pour les jeux de rythme basée sur Stable Diffusion (l'un des modèles AIGC les plus puissants) avec une modification importante pour incorporer des ondes audio. | Jeu | ||
Oasis | Oasis est un modèle de monde interactif développé par Decart et Etched. Basé sur des transformateurs de diffusion, Oasis prend en compte les entrées du clavier de l'utilisateur et génère un gameplay de manière autorégressive. | Jeu | ||
OmAgent | Un cadre d'agent multimodal pour résoudre des tâches complexes. | Agent | ||
Agents ouverts | Une plateforme ouverte pour les agents linguistiques en liberté. | Agent | ||
Opus | Une application d'IA qui transforme le texte en jeu vidéo. | Jeu | ||
Pipecat | Framework Open Source pour l’IA conversationnelle vocale et multimodale. | Agent | ||
Agent Qwen | Qwen-Agent est un framework pour développer des applications LLM basé sur le suivi des instructions, l'utilisation des outils, la planification et les capacités de mémoire de Qwen. | Agent | ||
Ragas | Ragas est un framework qui vous aide à évaluer vos pipelines de récupération augmentée (RAG). | Agent | ||
RPBench-Auto | Un pipeline automatisé pour évaluer les LLM pour le jeu de rôle. | Jeu | ||
LMSI | Un agent IA généraliste pour les environnements virtuels 3D. | Agent | ||
StoryGames.ai | L'IA pour les rêveurs crée des jeux. | Jeu | ||
Agent SWE | Les interfaces ordinateur agent activent les modèles de langage de génie logiciel. | arXiv | Agent | |
TâcheGen | Un cadre agent basé sur les tâches s'appuyant sur les sorties StrictJSON des agents LLM. | Agent | ||
Agent DIX | TEN Agent est le premier agent multimodal en temps réel au monde intégré à l'API OpenAI Realtime, RTC, et propose des fonctionnalités de vérification météo, de recherche sur le Web, de vision et de RAG. | Agent | ||
Agent de traduction | Traduction agentique utilisant un workflow de réflexion. | Agent | ||
Gazouillement | Twitter Personality est une application Web qui analyse votre identifiant Twitter pour créer un profil de personnalité personnalisé à l'aide de Wordware AI Agent. | Agent | ||
Sans bornes | Unbounded : un jeu génératif infini de simulation de la vie des personnages. | arXiv | Jeu | |
Vidéo2Game | Environnement en temps réel, interactif, réaliste et compatible avec un navigateur à partir d'une seule vidéo. | arXiv | Jeu | |
V-IRL | Ancrer l'intelligence virtuelle dans la vie réelle. | arXiv | Agent | |
Agent de conception Web | Un agent utilisé pour la conception de sites Web. | Agent | ||
XAgent | Un agent LLM autonome pour la résolution de tâches complexes. | Agent |
^ Retour au sommaire ^
Source | Description | Papier | Moteur de jeu | Taper |
---|---|---|---|---|
Traducteur de code IA | Utilisez l'IA pour traduire le code d'une langue à une autre. | Code | ||
aiXcoder-7B | Modèle de langage étendu de code aiXcoder-7B. | Code | ||
bloop | bloop est un moteur de recherche de code rapide écrit en Rust. | Code | ||
Chapitre | Interpréteur de code ChatGPT dans les notebooks Jupyter. | Code | ||
CodeGeeX | Un modèle de génération de code multilingue ouvert. | arXiv | Code | |
CodeGeeX2 | Un modèle de génération de code multilingue plus puissant. | Code | ||
CodeGeeX4 | CodeGeeX4 : modèle ouvert de génération de code multilingue. | Code | ||
CodeGen | CodeGen est un modèle open source pour la synthèse de programmes. Formé sur TPU-v4. Compétitif avec OpenAI Codex. | arXiv | Code | |
CodeGen2 | Modèles CodeGen2 pour la synthèse de programmes. | arXiv | Code | |
Code Lama | Code Llama est un grand modèle de langage pour le code basé sur Llama 2. | Code | ||
CodeTF | Bibliothèque de transformateurs unique pour un code LLM de pointe. | Code | ||
CodeT5 | LLM à code ouvert pour la compréhension et la génération de code. | Code | ||
Curseur | Écrivez, modifiez et discutez de votre code avec GPT-4 dans un nouveau type d'éditeur. | Code | ||
Codeur DeepSeek | DeepSeek Coder : laissez le code s'écrire tout seul. | arXiv | Code | |
Codex OpenAI | OpenAI Codex est un descendant de GPT-3. | Code | ||
PandasAI | Pandas AI est une bibliothèque Python qui intègre des capacités d'intelligence artificielle générative dans Pandas, rendant les trames de données conversationnelles. | Code | ||
RobloxScripterAI | RobloxScripterAI est un outil de génération de code basé sur l'IA pour Roblox. | Roblox | Code | |
Scikit-LLM | Intégrez de manière transparente des modèles de langage puissants tels que ChatGPT dans scikit-learn pour des tâches d'analyse de texte améliorées. | Code | ||
SoTaNa | L'assistant de développement de logiciels open source. | arXiv | Code | |
Code stable 3B | Codage à la périphérie. | Code | ||
Codeur étoile | ? StarCoder est un modèle de langage (LM) formé sur le code source et le texte en langage naturel. | arXiv | Code | |
StarCoder 2 | StarCoder2 est une famille de modèles de génération de code (3B, 7B et 15B), formés sur plus de 600 langages de programmation de The Stack v2 et certains textes en langage naturel tels que les problèmes Wikipedia, Arxiv et GitHub. | arXiv | Code | |
UnityGen IA | UnityGen AI est un plugin de génération de code alimenté par l'IA pour Unity. | Unité | Code | |
Vide | Void est une alternative open source au curseur. Écrivez du code avec les meilleurs outils d'IA, conservez le contrôle total de vos données et accédez à de puissantes fonctionnalités d'IA. | Code |
^ Retour au sommaire ^
Source | Description | Papier | Moteur de jeu | Taper |
---|---|---|---|---|
Écrivain IA | L'IA écrit des romans, génère des articles Web fantastiques et romantiques, etc. Modèle génératif chinois pré-entraîné. | Écrivain | ||
Carnet.ai | Notebook.ai est un ensemble d'outils permettant aux écrivains, aux concepteurs de jeux et aux joueurs de rôle de créer des univers magnifiques – et tout ce qu'ils contiennent. | Écrivain | ||
Roman | Éditeur WYSIWYG de style Notion avec saisie semi-automatique basée sur l'IA. | Écrivain | ||
RomanAI | Grâce à l'IA, construisez sans douleur des histoires uniques, des contes palpitants, des romances séduisantes ou amusez-vous simplement. | Écrivain |
^ Retour au sommaire ^
Source | Description | Papier | Moteur de jeu | Taper |
---|---|---|---|---|
N'importe quelle porte | Personnalisation d’image au niveau de l’objet Zero-shot. | arXiv | Image | |
N'importe quel texte | Génération et édition de textes visuels multilingues. | arXiv | Image | |
AutoStudio | Création de sujets cohérents dans la génération d'images interactives multi-tours. | arXiv | Image | |
Blender-ControlNet | Utiliser ControlNet directement dans Blender. | Mixer | Image | |
BriVL | Relier la vision et le modèle linguistique. | arXiv | Image | |
CatVTON | CatVTON : la concaténation est tout ce dont vous avez besoin pour un essai virtuel avec des modèles de diffusion. | arXiv | Image | |
CLIPasso | Une méthode pour convertir l'image d'un objet en un croquis, permettant différents niveaux d'abstraction. | arXiv | Image | |
ClipDrop | Créez des visuels époustouflants en quelques secondes. | Image | ||
Interface utilisateur confortable | Une interface graphique de diffusion stable puissante et modulaire avec une interface graphique/nœuds. | Image | ||
Laboratoire de conception | Génération créative à l’aide de contraintes préalables de diffusion. | arXiv | Image | |
ContrôleNet | ControlNet est une structure de réseau neuronal permettant de contrôler les modèles de diffusion en ajoutant des conditions supplémentaires. | arXiv | Image | |
CSGO | CSGO : composition de style de contenu dans la génération de texte en image. | arXiv | Image | |
DALL·E 2 | DALL·E 2 est un système d'IA capable de créer des images et des œuvres d'art réalistes à partir d'une description en langage naturel. | Image | ||
Studio Dashtoon | Dashtoon Studio est une plateforme de création de bandes dessinées alimentée par l'IA. | Comique | ||
IA profonde | DeepAI propose une suite d'outils qui utilisent l'IA pour améliorer votre créativité. | Image | ||
DeepFloyd SI | IF par DeepFloyd Lab chez StabilityAI. | Image | ||
Profondeur n'importe quoi V2 | Profondeur n'importe quoi V2 | arXiv | Image | |
Bibliothèque de cartes de profondeur et poseur | Bibliothèque de cartes de profondeur à utiliser avec l'extension Control Net pour Automatic1111/stable-diffusion-webui. | Image | ||
Diffusez pour choisir | Enrichissement de l'inpainting conditionné par l'image dans les modèles de diffusion latente pour un essai virtuel. | arXiv | Image | |
Diffusion Disco | Un amalgame frankensteinien de cahiers, de modèles et de techniques pour la génération d'art et d'animations IA. | Image | ||
Faites glisserGAN | Manipulation interactive basée sur des points sur le collecteur d'images génératives. | arXiv | Image | |
Dessiner des choses | Génération d'images assistée par l'IA dans votre poche. | Image | ||
DWPose | Estimation efficace de la pose du corps entier avec distillation en deux étapes. | arXiv | Image | |
FacilePhoto | Votre générateur de photos intelligent AI. | Image | ||
Flux | Ce référentiel contient un code d'inférence minimal pour exécuter du texte à l'image et de l'image à l'image avec nos transformateurs de flux rectifiés latents Flux. | Image | ||
Suivez votre clic | Animation d'images régionales en domaine ouvert via des invites courtes. | arXiv | Image | |
Fooocus | Concentrez-vous sur l’incitation et la génération. | Image | ||
GIFfusion | Créez des GIF et des vidéos à l'aide de la diffusion stable. | Image | ||
Segment mis à la terre-n'importe quoi | Détectez, segmentez et générez automatiquement tout ce qui contient des entrées d'image, de texte et d'audio. | arXiv | Image | |
HivisionIDPhotos | HivisionIDPhotos : un outil de photos d'identification IA léger et efficace. | Image | ||
Hua | Hua est un éditeur d'images IA avec diffusion stable (et plus). | Image | ||
Hunyuan-DiT | Un puissant transformateur de diffusion multi-résolution avec une compréhension fine du chinois. | arXiv | Image | |
IC-Lumière | IC-Light est un projet pour manipuler l'éclairage des images. | Image | ||
Idéogramme | Aider les gens à devenir plus créatifs. | Image | ||
Image | Imagen est un système d'IA qui crée des images photoréalistes à partir du texte saisi. | Image | ||
img2img-turbo | Image à image en une étape avec SD-Turbo. | Image | ||
Img2Invite | Obtenez des invites à partir d’images générées par diffusion stable. | Image | ||
Infini | Infinity : mise à l'échelle de la modélisation autorégressive au niveau du bit pour la synthèse d'images haute résolution. | arXiv | Image | |
ID instantané | Génération Zero-shot préservant l’identité en quelques secondes. | arXiv | Image | |
StagiaireLM-XComposer2 | InternLM-XComposer2 est un grand modèle de langage de vision (VLLM) révolutionnaire qui excelle dans la composition et la compréhension de texte-image de forme libre. | arXiv | Image | |
KOALA | L'attention personnelle est importante dans la distillation des connaissances des modèles de diffusion latente pour une synthèse d'images rapide et efficace en mémoire. | Image | ||
Couleurs | Kolors : formation efficace du modèle de diffusion pour la synthèse photoréaliste de texte en image. | Image | ||
KRÉA | Générez des images et des vidéos avec un délicieux outil de conception alimenté par l'IA. | Image | ||
Pont LaVi | Relier différents modèles de langage et modèles de vision générative pour la génération de texte en image. | arXiv | Image | |
CoucheDiffusion | Diffusion de couches d'images transparentes à l'aide de la transparence latente. | arXiv | Image | |
Lexique | Une diffusion stable invite le moteur de recherche. | Image | ||
LamaGen | Le modèle autorégressif bat la diffusion : Llama pour la génération d'images évolutives. | arXiv | Image | |
Lumina-mGPT | Lumina-mGPT : illuminez la génération photoréaliste flexible de texte en image avec un pré-entraînement génératif multimodal. | arXiv | Image | |
Métashoot | MetaShoot est le jumeau numérique d'un studio photo, développé comme un plugin pour Unreal Engine qui donne à tout créateur la possibilité de produire des rendus très réalistes de la manière la plus simple et la plus rapide. | Moteur irréel | Image | |
À mi-parcours | Midjourney est un laboratoire de recherche indépendant qui explore de nouveaux moyens de pensée et développe les pouvoirs imaginatifs de l'espèce humaine. | Image | ||
MIGC | MIGC : Contrôleur de génération multi-instance pour la synthèse texte-image. | arXiv | Image | |
ImiterBrosse | Édition d'images sans prise de vue avec imitation de référence. | arXiv | Image | |
OmniGen | OmniGen : génération d'images unifiée. | arXiv | Image | |
Omost | Omost est un projet visant à convertir la capacité de codage de LLM en capacité de génération d'images (ou plus précisément, de composition d'images). | Image | ||
Éditeur Openpose | Éditeur Openpose pour le webui de diffusion stable d'AUTOMATIC1111. | Image | ||
Équipez n'importe qui | Essayage virtuel de très haute qualité pour Tout Vêtements et Toute Personne. | Image | ||
PeinturesAnnuler | PaintsUndo : un modèle de base des comportements de dessin dans les peintures numériques. | Image | ||
Créateur de photos | Personnalisation de photos humaines réalistes via l’intégration d’ID empilés. | arXiv | Image | |
Salle photo | Générateur d'arrière-plan IA. | Image | ||
Plask | Génération d'images IA dans le cloud. | Image | ||
Invite.Art | Le hub des générateurs. | Image | ||
PuLID | Personnalisation Pure et Lightning ID via un alignement contrasté. | arXiv | Image | |
Texte enrichi en image | Génération expressive de texte en image avec du texte enrichi. | arXiv | Image | |
RPG-DiffusionMaster | Maîtriser la diffusion texte-image : récapitulation, planification et génération avec des LLM multimodaux (PRG). | Image | ||
Histoire SEED | SEED-Story : génération d'histoires longues multimodales avec un grand modèle de langage. | arXiv | Image | |
Segmenter n'importe quoi | Segment Anything Model (SAM) : un nouveau modèle d'IA de Meta AI qui peut "découper" n'importe quel objet, dans n'importe quelle image, en un seul clic. | arXiv | Image | |
Segmenter n'importe quoi modèle 2 (SAM 2) | SAM 2 : segmentez n'importe quoi dans les images et les vidéos. | arXiv | Image | |
sd-webui-controlnet | Extension WebUI pour ControlNet. | Image | ||
SDXL-Lightning | Distillation progressive par diffusion antagoniste. | arXiv | Image | |
SDXS | Modèles de diffusion latente en une étape en temps réel avec conditions d'image. | Image | ||
Stable.art | Plugin Photoshop pour Stable Diffusion avec Automatic1111 comme backend (localement ou avec Google Colab). | Image | ||
Cascade stable | Stable Cascade se compose de trois modèles : Stage A, Stage B et Stage C, représentant une cascade de génération d'images, d'où le nom « Stable Cascade ». | Image | ||
Diffusion stable | Un modèle de diffusion latent de texte en image. | Image | ||
stable-diffusion.cpp | Diffusion stable en C/C++ pur. | Image | ||
Interface utilisateur Web de diffusion stable | Une interface de navigateur basée sur la bibliothèque Gradio pour Stable Diffusion. | Image | ||
Interface utilisateur Web de diffusion stable | Interface utilisateur Web pour une diffusion stable. | Image | ||
WebUI à diffusion stable chinois | Version chinoise de stable-diffusion-webui. | Image | ||
Diffusion stable XL | Générez des images à partir de texte. | arXiv | Image | |
Diffusion stable XL Turbo | Génération de texte en image en temps réel. | Image | ||
Diffusion stable 3,5 | La version ouverte Stable Diffusion 3.5 comprend plusieurs variantes de modèles, notamment Stable Diffusion 3.5 Large et Stable Diffusion 3.5 Large Turbo. | Image | ||
Doodle stable | Stable Doodle est un outil de conversion d'esquisse en image qui convertit un simple dessin en une image dynamique. | Image | ||
StableStudio | StableStudio par Stability AI | Image | ||
Créateur d'histoires | StoryMaker : vers des personnages cohérents holistiques dans la génération texte-image. | arXiv | Image | |
FluxDiffusion | Une solution au niveau du pipeline pour la génération interactive en temps réel. | Image | ||
StyleDrop | Génération de texte en image dans n'importe quel style. | arXiv | Image | |
SyncDreamer | Génération d'images cohérentes avec plusieurs vues à partir d'une image à vue unique. | arXiv | Image | |
Ultra | UltraEdit : édition d'images à grain fin basée sur des instructions et à grande échelle. | arXiv | Image | |
UltraPixel | UltraPixel : faire progresser la synthèse d'images à ultra haute résolution vers de nouveaux sommets. | arXiv | Image | |
Diffusion stable Unity ML | Diffusion stable de Core ML sur Unity. | Unité | Image | |
Visions Vispunk | Plateforme de génération de texte en image. | Image |
^ Retour au sommaire ^
Source | Description | Papier | Moteur de jeu | Taper |
---|---|---|---|---|
GRC | Image unique en maillage texturé 3D avec modèle de reconstruction convolutive. | arXiv | Texture | |
Tapis de rêve | Génération de matériaux PBR de haute qualité avec des modèles de diffusion sensibles à la géométrie et à la lumière. | arXiv | Texture | |
Espace de rêve | Rêvez de l'espace de votre pièce avec la propagation de texture panoramique basée sur le texte. | Texture | ||
Textures de rêve | Diffusion stable intégrée à Blender. Créez des textures, des illustrations conceptuelles, des éléments d'arrière-plan et bien plus encore à l'aide d'une simple invite de texte. | Mixer | Texture | |
Instruire les humains | Édition de textures humaines 3D animées avec instructions. | arXiv | Texture | |
InteX | Synthèse interactive de texte à texture via une peinture unifiée prenant en compte la profondeur. | arXiv | Texture | |
LLaMA-Maille | LLaMA-Mesh : unifier la génération de maillage 3D avec des modèles de langage. | arXiv | Engrener | |
MatérielSeg3D | MaterialSeg3D : segmentation de matériaux denses à partir d'a priori 2D pour les actifs 3D. | arXiv | Texture | |
MeshN'importe quoi | MaterialSeg3D : segmentation de matériaux denses à partir d'a priori 2D pour les actifs 3D. | arXiv | Engrener | |
Neuralangelo | Reconstruction de la surface neuronale haute fidélité. | arXiv | Texture | |
Peignez-le | Synthèse texte-texture via une optimisation de la carte de texture convolutive profonde et un rendu basé sur la physique. | Texture | ||
Polycam | Créez vos propres textures 3D simplement en tapant. | Texture | ||
TexFusion | Synthèse de textures 3D avec des modèles de diffusion d'images guidés par texte. | arXiv | Texture | |
Texte2Tex | Synthèse de textures basée sur le texte via des modèles de diffusion. | arXiv | Texture | |
Laboratoire de textures | Textures générées par l'IA. Vous pouvez générer le vôtre avec une invite de texte. | Texture | ||
Avec Poly | Créez des textures avec Poly. Générez des matériaux 3D avec l'IA dans un éditeur en ligne gratuit ou effectuez une recherche dans notre bibliothèque communautaire en pleine expansion. | Texture | ||
X-Maille | X-Mesh : vers une stylisation 3D rapide et précise basée sur le texte via un guidage textuel dynamique. | arXiv | Texture |
^ Retour au sommaire ^
Source | Description | Papier | Moteur de jeu | Taper |
---|---|---|---|---|
Shader IA | Générateur de shader alimenté par ChatGPT pour Unity. | Unité | Ombreur |
^ Retour au sommaire ^
Source | Description | Papier | Moteur de jeu | Taper |
---|---|---|---|---|
Animer3D | Animate3D : animation de n'importe quel modèle 3D avec diffusion vidéo multi-vues. | arXiv | 3D | |
N'importe quoi-3D | Segment-Tout + 3D. Passons le tout à la 3D. | arXiv | Modèle | |
N'importe quel2Point | Any2Point : autoriser de grands modèles de toutes modalités pour une compréhension efficace de la 3D. | arXiv | 3D | |
MélangeurGPT | Utilisez des commandes en anglais pour contrôler Blender avec le GPT-4 d'OpenAI. | Mixer | Modèle | |
Blender-GPT | Un assistant Blender tout-en-un alimenté par l'intégration GPT3/4 + Whisper. | Mixer | Modèle | |
Laboratoires de blocus | L'alchimie numérique est réelle avec Skybox Lab - la solution ultime basée sur l'IA pour générer d'incroyables expériences skybox à 360° à partir d'invites textuelles. | Modèle | ||
CF-3DGS | Éclaboussures gaussiennes 3D sans COLMAP. | arXiv | 3D | |
CaractèreGen | CharacterGen : génération efficace de personnages 3D à partir d'images uniques avec canonisation de pose multi-vues. | arXiv | 3D | |
chatGPT-maya | Outil Maya simple qui utilise l'IA ouverte pour effectuer des tâches de base basées sur des instructions descriptives. | Maya | Modèle | |
VilleDreamer | Modèle génératif compositionnel de villes 3D illimitées. | arXiv | 3D | |
CSM | Générez des mondes 3D à partir d'images et de vidéos. | 3D | ||
Tiret | Votre copilote pour la construction du monde dans Unreal Engine. | Moteur irréel | 3D | |
Catalyseur de rêve | DreamCatalyst : édition 3D rapide et de haute qualité via le contrôle de la possibilité d'édition et la préservation de l'identité. | arXiv | 3D | |
RêveGaussian4D | Éclaboussures gaussiennes 4D génératives. | arXiv | 4D | |
POUSSIÈRE3R | Vision 3D géométrique simplifiée. | arXiv | 3D | |
Édifier 3D | Edify 3D : génération d'actifs 3D évolutifs de haute qualité. | arXiv | 3D | |
GALA3D | GALA3D : vers la génération de scènes complexes texte-3D via l'éclaboussement gaussien génératif guidé par la mise en page. | arXiv | 3D | |
GaussCtrl | GaussCtrl : édition d'éclaboussures gaussiennes 3D cohérentes multi-vues. | arXiv | 3D | |
Cube Gaussien | Une représentation de rayonnement structurée et explicite pour la modélisation générative 3D. | arXiv | 3D | |
GaussienRêveur | Génération rapide du texte aux éclaboussures gaussiennes 3D avec les priorités des nuages de points. | arXiv | 3D | |
GénieLabs | Renforcez votre jeu avec AI-UGC. | 3D | ||
HiFA | Text-to-3D haute fidélité avec guidage avancé de diffusion. | Modèle | ||
HoloDreamer | HoloDreamer : génération d'un monde panoramique holistique en 3D à partir de descriptions textuelles. | arXiv | 3D | |
Hunyuan3D-1.0 | Hunyuan3D-1.0 : un cadre unifié pour la génération de texte en 3D et d'image en 3D. | arXiv | 3D | |
Infinigen | Mondes photoréalistes infinis utilisant la génération procédurale. | arXiv | 3D | |
Instruire-NeRF2NeRF | Édition de scènes 3D avec instructions. | arXiv | Modèle | |
3D interactive | Créez ce que vous voulez grâce à la génération 3D interactive. | arXiv | 3D | |
Isotrope3D | Génération d'image en 3D basée sur une intégration de CLIP unique. | 3D | ||
LATTE3D | Synthèse Text-To-Enhanced3D amortie à grande échelle. | arXiv | 3D | |
LION | Modèles de diffusion de points latents pour la génération de formes 3D. | arXiv | Modèle | |
Luma IA | Capturez en 3D réaliste. Photoréalisme, reflets et détails inégalés. L'avenir des effets visuels est maintenant, pour tout le monde ! | Modèle | ||
IA Lumine | Créativité basée sur l'IA. | 3D | ||
Créez-le-3D | Création 3D haute fidélité à partir d'une seule image avec diffusion préalable. | arXiv | Modèle | |
Maillé | Créez de superbes ressources de jeu 3D avec l'IA. | 3D | ||
Mouvement | Créateur d'animation IA 3D magique. | 3D | ||
MVrêve | Diffusion multi-vues pour la génération 3D. | arXiv | 3D | |
NeRF instantané NVIDIA | Primitives graphiques neuronales instantanées : NeRF ultra-rapide et bien plus encore. | Modèle | ||
Un-2-3-45 | N'importe quelle image unique en maillage 3D en 45 secondes sans optimisation par forme. | arXiv | Modèle | |
Peinture3D | Peignez n'importe quoi en 3D avec des modèles de diffusion de texture sans éclairage. | arXiv | 3D | |
PANIQUE-3D | Reconstruction 3D stylisée à vue unique à partir de portraits de personnages d'anime. | arXiv | Modèle | |
Point·E | Diffusion de nuages de points pour la synthèse de modèles 3D. | Modèle | ||
Rêveur prolifique | Génération de texte en 3D haute fidélité et diversifiée avec distillation de partition variationnelle. | arXiv | Modèle | |
SF3D | SF3D : Reconstruction de maillage 3D rapide et stable avec démêlage UV et démêlage de l'éclairage. | arXiv | 3D | |
Forme | Générez des objets 3D conditionnés à partir de texte ou d'images. | arXiv | Modèle | |
Sloyd | La modélisation 3D n'a jamais été aussi simple. | Modèle | ||
IA spline | La puissance de l'IA arrive dans la 3ème dimension. Générez des objets, des animations et des textures à l'aide d'invites. | Modèle | ||
Fusion de rêve stable | Une implémentation pytorch du modèle texte en 3D Dreamfusion, alimenté par le modèle texte en 2D Stable Diffusion. | Modèle | ||
SV3D | Nouvelle synthèse multi-vues et génération 3D à partir d'une seule image à l'aide de la diffusion vidéo latente. | arXiv | 3D | |
Tafi | Texte IA vers un moteur de personnages 3D. | Modèle | ||
3D-GPT | Modélisation 3D procédurale avec de grands modèles de langage. | arXiv | 3D | |
3D-LLM | Injecter le monde 3D dans de grands modèles linguistiques. | arXiv | 3D | |
3Dpresso | Extrayez un modèle 3D d'un objet, capturé sur une vidéo. | Modèle | ||
3DTopia | Génération de texte en 3D en 5 minutes. | arXiv | 3D | |
3DTopia-XL | 3DTopia-XL : mise à l'échelle de la génération d'actifs 3D de haute qualité via la diffusion primitive. | arXiv | 3D | |
troisstudio | Un cadre unifié pour la génération de contenu 3D. | Modèle | ||
TripoSR | Un modèle open source de pointe pour une reconstruction 3D rapide à partir d'une seule image. | arXiv | Modèle | |
Unique3D | Génération de maillage 3D de haute qualité et efficace à partir d'une seule image. | arxiv | 3D | |
Unitygaussians Platting | Toy Gaussien Splatting Visualisation dans l'unité. | Unité | 3D | |
Vif-1 à 3 | Nouvelle synthèse de vue avec des modèles de diffusion vidéo. | arxiv | 3D | |
Voxcraft | Création de modèles 3D prêts à l'emploi avec AI. | 3D | ||
Wonder3d | Image unique à 3D en utilisant la diffusion du domaine croisé. | arxiv | 3D | |
Zéro-1 à 3 | Zéro-shot une image à l'objet 3D. | arxiv | Modèle |
^ Retour au sommaire ^
Source | Description | Papier | Moteur de jeu | Taper |
---|---|---|---|---|
Aniportrait | Synthèse axée sur l'audio d'animations de portraits photoréalistes. | arxiv | Avatar | |
CALME | Modèles latentes adversaires conditionnels pour les caractères virtuels réalisables. | arxiv | Avatar | |
Chatavatar | Génération progressive de visages 3D animatisables sous le nom de texte. | Avatar | ||
Chatdollkit | Chatdollkit vous permet de faire de votre modèle 3D un chatbot. | Unité | Avatar | |
Dreamtalk | Lorsque la génération expressive de tête parlante répond aux modèles probabilistes de diffusion. | arxiv | Avatar | |
Duix | Duix - SDK humain numérique basé en silicium? | Avatar | ||
Échimique | Échomimique: animations de portraits audio réalistes à travers des conditions de repère modifiables. | arxiv | Avatar | |
Émoportraits | Avatars à tête multimodaux améliorés émotionnels. | Avatar | ||
E3 Gen | Génération des avatars efficaces, expressives et modifiables. | arxiv | Avatar | |
Exavatar | Exavatar - Avatar gaussien 3D expressif du corps entier. | arxiv | Avatar | |
Geneavatar | Édition générique de tête volumétrique AVATAR à partir d'une seule image. | arxiv | Avatar | |
GENEFACE ++ | Génération de visage parlante 3D généralisée et stable. | Avatar | ||
Bonjour | Synthèse visuelle hiérarchique axée sur l'audio pour l'animation d'image de portrait. | arxiv | Avatar | |
Hallo2 | Hallo2: Animation d'image de portrait audio de longue durée et haute résolution. | arxiv | Avatar | |
Idiot | Crafting Avatars 3D Head avec texte. | arxiv | Avatar | |
Intrinsicavatar | Intrinsicavatar: Rendu inverse physiquement basé sur les humains dynamiques à partir de vidéos monoculaires via le traçage explicite des rayons. | arxiv | Avatar | |
Talker | Système conversationnel Avatar numérique. | Avatar | ||
Liveportrait | LivePortrait: animation de portrait efficace avec contrôle de couture et de reciblage. | arxiv | Avatar | |
Motiongpt | Le mouvement humain comme langue étrangère, un modèle de génération de langue de mouvement unifiée utilisant des LLM. | arxiv | Avatar | |
Coqueluche | MUSEPOSE: Un cadre d'image-vidéo axé sur la pose pour la génération humaine virtuelle. | Avatar | ||
Musitalk | Synchorisation des lèvres de haute qualité en temps réel avec l'espace latent qui entre dans la dé wein. | Avatar | ||
Musev | Génération de vidéo humaine virtuelle de longueur infinie et à haute fidélité avec débauche parallèle conditionnée visuelle. | Avatar | ||
Portrait4d | Apprendre une synthèse d'avatar à tête 4D à un seul coup à l'aide de données synthétiques. | arxiv | Avatar | |
Prêt-moi prêt à me prêter | Intégrez des avatars personnalisables dans votre jeu ou votre application en jours. | Avatar | ||
Rodinhd | Rodinhd: génération d'avatar 3D haute fidélité avec des modèles de diffusion. | arxiv | Avatar | |
Styleavatar3d | Tirant parti des modèles de diffusion de texte d'image pour la génération d'avatar 3D haute fidélité. | arxiv | Avatar | |
Text2Control3d | Génération d'avatar 3D contrôlable dans les champs de radiance neuronale en utilisant le modèle de diffusion de texte à l'image guidé par la géométrie. | arxiv | Avatar | |
Topo4d | Splatting gaussien préservant la topologie pour la capture de tête 4D haute fidélité. | arxiv | Avatar | |
Unityaiwithchatgpt | Sur la base de l'unité, l'affichage interactif de la voix de ChatGPT + UnityChan est réalisé. | Unité | Avatar | |
Vid2avatar | Reconstruction Avatar 3D de Videos in the Wild via la décomposition de la scène auto-supervisée. | arxiv | Avatar | |
Vlogger | Diffusion multimodale pour la synthèse de l'avatar incarnée. | Avatar | ||
Wild2avatar | Rendant les humains derrière des occlusions. | arxiv | Avatar |
^ Retour au sommaire ^
Source | Description | Papier | Moteur de jeu | Taper |
---|---|---|---|---|
Animer quiconque | Synthèse d'image à video cohérente et contrôlable pour l'animation des personnages. | arxiv | Animation | |
Animateanything | Animation d'image de domaine ouvert à grain fin avec guidage de mouvement. | arxiv | Animation | |
Animée | Animez vos modèles de diffusion de texte à image personnalisés sans réglage spécifique. | arxiv | Animation | |
Animatelcm | Accélérons la génération de vidéos en 4 étapes! | arxiv | Animation | |
Animer-x | Animate-X: animation d'image de personnage universelle avec une représentation de mouvement améliorée. | arxiv | Animation | |
Animerzero | Les modèles de diffusion vidéo sont des animateurs d'image à tirs zéro. | arxiv | Animation | |
Animationgpt | Un outil AIGC pour générer des actifs de mouvement de combat de jeu. | Animation | ||
Se débarrasser | Deforum exploite la diffusion stable pour générer des visuels AI évolutifs. | Animation | ||
Drawingspinup | Dessingspinup: Animation 3D à partir de dessins à caractère unique. | arxiv | Animation | |
Rêvant | Un cadre de génération vidéo humaine basé sur des modèles de diffusion. | arxiv | Animation | |
Infusion | La prochaine génération fait face à Swapper et à l'amplificateur. | Animation | ||
Librement | Écart d'initialisation de pontage dans les modèles de diffusion vidéo. | arxiv | Animation | |
Geneface | Synthèse du visage parlante audio généralisée et haute fidélité. | arxiv | Animation | |
Animateur id | Génération de vidéo humaine préservant l'identité zéro. | arxiv | Animation | |
Magicanime | Animation d'image humaine temporellement cohérente à l'aide du modèle de diffusion. | arxiv | Animation | |
Nuwa | Dragnuwa est un modèle de génération de vidéos basé sur la diffusion à domaine ouvert prend des contrôles de texte, d'image et de trajectoire comme entrées pour atteindre la génération vidéo contrôlable. | arxiv | Animation | |
Nuwa-infinity | Nuwa-Infinity est un modèle génératif multimodal conçu pour générer des images et des vidéos de haute qualité à partir d'une entrée de texte, d'image ou de vidéo donnée. | Animation | ||
Nuwa-xl | Une nouvelle diffusion sur l'architecture de diffusion pour une génération vidéo extrêmement longue. | Animation | ||
Animation omni | L'IA a généré des animations haute fidélité. | Animation | ||
PIA | Votre animateur d'image personnalisé via des modules de plug-and-play dans les modèles de texte à image. | arxiv | Animation | |
Sadtalker | Apprendre des coefficients de mouvement 3D réalistes pour l'animation de visage parlante à l'image unique audio stylisée. | arxiv | Animation | |
Sadtalker-video-lip-sync | Ce projet est basé sur Sadtalkers WAV2lip pour la synthèse des lèvres vidéo. | Animation | ||
Animation stable | Un puissant outil de texte à l'animation pour les développeurs. | Animation | ||
Talecrafter | Un outil de visualisation interactif de l'histoire qui prend en charge plusieurs caractères. | arxiv | Animation | |
Tooncrafter | Tooncrafter: interpolation générative de dessin animé. | arxiv | Animation | |
Wav2lip | Vidéos avec précision des lèvres à l'état sauvage. | arxiv | Animation | |
Wonder Studio | Un outil d'IA qui anime, allume et compose automatiquement les personnages CG dans une scène en direct. | Animation |
^ Retour au sommaire ^
Source | Description | Papier | Moteur de jeu | Taper |
---|---|---|---|---|
Cambrien-1 | Cambrian-1: une exploration entièrement ouverte et centrée sur la vision des LLM multimodaux. | arxiv | LLMS multimodaux | |
Cogvlm2 | Modèle multimodal open-source de niveau GPT4V basé sur LLAMA3-8B. | Visuel | ||
Cotraceur | Il vaut mieux suivre ensemble. | arxiv | Visuel | |
Evf-sam | EVF-SAM: Fusion de langue de vision précoce pour le segment prévu pour le texte. | arxiv | Visuel | |
Face | Il vaut mieux suivre ensemble. | Visuel | ||
Interlm-xcomposer2 | Internlm-xcomposer2 est un grand modèle de vision (VLLM) révolutionnaire excellant dans la composition et la compréhension de l'image texte libre. | arxiv | Visuel | |
Kangourou | Kangaroo: un puissant modèle de langue vidéo prenant en charge l'entrée vidéo à long contexte. | Visuel | ||
LGVI | Vers la détérioration vidéo axée sur la langue via des modèles multimodaux de grande langue. | Visuel | ||
Llava ++ | Étendre les capacités visuelles avec LLAMA-3 et PHI-3. | Visuel | ||
Llava onevision | LLAVA-OneVision: Transfert de tâches visuelles faciles. | arxiv | Visuel | |
Longva | Transfert de contexte long du langage à la vision. | arxiv | Visuel | |
Masque | Pré-formation visuelle masquée pour la prédiction vidéo. | arxiv | Visuel | |
MINICPM-LALAMA3-V 2.5 | Un MLLM de niveau GPT-4V sur votre téléphone. | Visuel | ||
Moe-lava | Mélange d'experts pour les grands modèles de langue visuelle. | arxiv | Visuel | |
Motion | Comprendre les comportements humains des mouvements humains et des vidéos. | arxiv | Visuel | |
Pllava | Extension LLAVA sans paramètres des images aux vidéos pour le sous-titrage dense vidéo. | arxiv | Visuel | |
Qwen-vl | Un modèle polyvalent de la vision pour la compréhension, la localisation, la lecture de texte et au-delà. | arxiv | Visuel | |
Sapiens | SAPiens: Fondation pour les modèles de vision humaine. | arxiv | Visuel | |
Sharegpt4v | Amélioration de grands modèles multimodaux avec de meilleures légendes. | arxiv | Visuel | |
SOLO | Solo: un seul transformateur pour la modélisation évolutive en langue visuelle. | arxiv | Visuel | |
Vidéo-ccam | VIDEO-CCAM: Faire progresser la compréhension de la langue vidéo avec des masques transversales causales. | Visuel | ||
Vidéo-lava | Apprendre une représentation visuelle unie par alignement avant projection. | arxiv | Visuel | |
Videollama 2 | Faire progresser la modélisation spatiale-temporelle et la compréhension audio dans les lilms vidéo. | arxiv | Visuel | |
Vidéo-MME | La toute première référence d'évaluation complète des LLM multimodales dans l'analyse vidéo. | arxiv | Visuel | |
Vitre | Une vision unifiée au niveau de Pixel LLM pour la compréhension, la génération, la segmentation, l'édition. | Visuel | ||
VILA | Vila: Sur la pré-formation pour les modèles de langage visuel. | arxiv | Visuel |
^ Retour au sommaire ^
Source | Description | Papier | Moteur de jeu | Taper |
---|---|---|---|---|
360DVD | Génération de vidéos Panorama contrôlable avec modèle de diffusion vidéo à 360 degrés. | arxiv | Vidéo | |
Animer-a-story | Génération de vidéos auprès de la récupération pour raconter une histoire. | arxiv | Vidéo | |
Tout dans n'importe quelle scène | Insertion de l'objet vidéo photoréaliste. | Vidéo | ||
Art • V | Génération de texte à vidéo auto-régressive avec des modèles de diffusion. | arxiv | Vidéo | |
Assistant | Rencontrez la plate-forme vidéo générative qui donne vie à vos idées. | Vidéo | ||
Atomovideo | Génération d'image à haute fidéalité à la vidéo. | arxiv | Vidéo | |
BackgroundRemover | Le dissolvant d'arrière-plan vous permet de supprimer l'arrière-plan des images et des vidéos en utilisant l'IA avec une interface de ligne de commande simple qui est gratuite et open source. | Vidéo | ||
Boximator | Génération de mouvements riches et contrôlables pour la synthèse vidéo. | arxiv | Vidéo | |
Codef | Champs de déformation du contenu pour un traitement vidéo temporellement cohérent. | arxiv | Vidéo | |
Cogvideo | Générez des vidéos à partir de descriptions de texte. | Vidéo | ||
Cogvideox | Cogvideox est une version open source du modèle de génération de vidéos, qui est homologue à 清影. | Vidéo | ||
Cogvlm | COGVLM est un puissant modèle de langage visuel open source (VLM). | Visuel | ||
Conr | Les vidéos de danse vivive génarate des feuilles de personnages d'anime dessinées à la main (ACS). | arxiv | Vidéo | |
Décohére | Créez ce qui ne peut pas être filmé. | Vidéo | ||
Description | La description est la façon simple, puissante et amusante de modifier. | Vidéo | ||
Diffutation | Ombrage toon modifiable à haute résolution via des modèles de diffusion. | arxiv | Vidéo | |
dauphin | Plateforme d'interaction vidéo générale basée sur LLMS. | Vidéo | ||
Domoai | Amplifiez votre créativité avec Domoai. | Vidéo | ||
Dreamcinema | Dreamcinema: transfert cinématographique avec caméra gratuite et caractère 3D. | arxiv | Vidéo | |
Dynamicrafter | Animation d'images du domaine ouvert avec des priors de diffusion vidéo. | arxiv | Vidéo | |
BORD | Nous introduisons Edge, une méthode puissante pour la génération de danse modifiable qui est capable de créer des danses réalistes et physiquement plausibles tout en restant fidèle à la musique d'entrée arbitraire. | arxiv | Vidéo | |
OMUM | Emote Portrait Alive - Génération de vidéos de portrait expressives avec modèle de diffusion Audio2video dans des conditions faibles. | arxiv | Vidéo | |
Vidéo EMU | Factoriser la génération de texte à vidéo par condition d'image explicite. | Vidéo | ||
Etna | L'ETNA peut générer du contenu vidéo correspondant basé sur de courtes descriptions de texte. | Vidéo | ||
Fée | Synthèse vidéo à la vidéo à guidage guidée par l'instruction rapide rapide. | Vidéo | ||
Suivez vos cannettes | Suivez-vous-Canvas: Dépassement vidéo à haute résolution avec une génération de contenu étendue. | arXiv | Vidéo | |
Suivez votre pose | Génération de texte à vidéo guidée par la pose à l'aide de vidéos sans pose. | arxiv | Vidéo | |
Fulljourney | Votre suite complète d'outils de création d'IA à portée de main. | Vidéo | ||
Gen-2 | Un système d'IA multimodal qui peut générer de nouvelles vidéos avec du texte, des images ou des clips vidéo. | Vidéo | ||
Dynamique générative | Dynamique générative de l'image. | Vidéo | ||
Génie | Environnements interactifs génératifs. | arxiv | Vidéo | |
Genmo | Faire magiquement des vidéos avec l'IA. | Vidéo | ||
Gentron | Transformers de diffusion pour la génération d'images et de vidéos. | Vidéo | ||
Higen | Découplage spatio-temporel hiérarchique pour la génération de texte à vidéo. | Vidéo | ||
Hotshot-xl | Hotshot-XL est un modèle de texte à GIF AI formé pour travailler aux côtés de diffusion stable XL. | Vidéo | ||
Hunyuanvideo | Hunyuanvideo: un cadre systématique pour un grand modèle de génération de vidéos. | arxiv | Vidéo | |
Vidéo d'imagen | Compte tenu d'une invite de texte, Imagen Video génère des vidéos haute définition à l'aide d'un modèle de génération de vidéo de base et d'une séquence de modèles de super-résolution vidéo spatiale et temporelle interlinés. | Vidéo | ||
Instructvideo | Instruire des modèles de diffusion vidéo avec une rétroaction humaine. | arxiv | Vidéo | |
I2vgen-xl | Synthèse d'image à vidéo de haute qualité via des modèles de diffusion en cascade. | arxiv | Vidéo | |
LaVie | Génération vidéo de haute qualité avec des modèles de diffusion latente en cascade. | arxiv | Vidéo | |
Studio LTX | LTX Studio est une plate-forme cinématographique holistique et dirigée par l'IA pour les créateurs, les spécialistes du marketing, les cinéastes et les studios. | Vidéo | ||
LTX-video | LTX-video est le premier modèle de génération de vidéos basé sur DIT qui peut générer des vidéos de haute qualité en temps réel. Il peut générer des vidéos de 24 ips à une résolution 768x512, plus rapidement qu'il ne faut pour les regarder. | Vidéo | ||
Lumière | Un modèle de diffusion spatio-temps pour la génération vidéo. | arXiv | Vidéo | |
LVDM | Modèles de diffusion vidéo latente pour la génération vidéo longue haute fidélité. | arxiv | Vidéo | |
Magicvideo | Génération vidéo efficace avec des modèles de diffusion latente. | arxiv | Vidéo | |
Magicvideo-v2 | Génération vidéo à haute esthétique en plusieurs étapes. | arxiv | Vidéo | |
Heure magique | La vidéo AI pour les créateurs a été simplifiée. | Vidéo | ||
Magvit-v2 | Le tokenizer est la clé de la génération visuelle. | Vidéo | ||
Magvit | Transformateur vidéo génératif masqué. | Vidéo | ||
Make-a-video | Make-A-Video est un système AI de pointe qui génère des vidéos à partir de texte. | arxiv | Vidéo | |
Faire danser les pixels | Génération vidéo à haute dynamique. | arxiv | Vidéo | |
Faire votre vidéo | Génération vidéo personnalisée en utilisant des conseils textuels et structurels. | arxiv | Vidéo | |
Microcinema | Une approche de division et de conquis pour la génération de texte à vidéo. | arxiv | Vidéo | |
Mima | MIMO: synthèse vidéo de caractère contrôlable avec modélisation décomposée spatiale. | arxiv | Vidéo | |
Mini-gemini | Exploitation du potentiel des modèles de langage de vision multimodalités. | Vision | ||
Mobilevidfactory | Génération de vidéo de médias sociaux basée sur la diffusion automatique pour les appareils mobiles à partir de texte. | Vidéo | ||
Mochi 1 | Mochi 1 est un modèle de génération vidéo de pointe ouverte avec un mouvement à haute fidélité et une forte adhésion rapide à l'évaluation préliminaire. | Vidéo | ||
Mofa-video | Animation d'image contrôlable via des adaptations de champ de mouvement génératives dans le modèle de diffusion d'image à vidéo surgelé. | arXiv | Vidéo | |
MoneyPirterbo | Utilisez de grands modèles pour générer de courtes vidéos en un seul clic. | Vidéo | ||
Moonvalley | MoonValley est un nouveau modèle d'interdiction de texte générateur de texte à vidéo. | Vidéo | ||
Mora | Plus comme Sora pour la génération de vidéo généraliste. | arxiv | Vidéo | |
Morph Studio | Avec notre magie Text-to-Video AI, manifestez votre créativité à travers votre invite. | Vidéo | ||
Mranch de mouvement | MotionClone: Clonage de mouvement sans formation pour la génération de vidéos contrôlables. | arxiv | Vidéo | |
Motionctrl | Un contrôleur de mouvement unifié et flexible pour la génération vidéo. | arxiv | Vidéo | |
Directeur de mouvement | Personnalisation du mouvement des modèles de diffusion de texte à vidéo. | arxiv | Vidéo | |
Motion | Une application de remplacement des personnages en vidéo par des avatars 3D. | Vidéo | ||
Mov2mov | Plugin mov2mov pour automatique1111 / stable-diffusion-webui. | Vidéo | ||
Moviefactory | Création automatique de films à partir de texte en utilisant de grands modèles génératifs pour le langage et les images. | arxiv | Vidéo | |
Cadres neuronaux | Découvrez le synthétiseur du monde visuel. | Vidéo | ||
Nevertend | Créez votre monde. | Vidéo | ||
Sora ouvert | Démocratiser la production vidéo efficace pour tous. | Vidéo | ||
Sora ouvert | Plan ouvert. | Vidéo | ||
Phénaki | Un modèle de génération de vidéos à partir de texte, avec des invites qui peuvent changer avec le temps, et des vidéos qui peuvent être aussi longues que plusieurs minutes. | arxiv | Vidéo | |
Pika Labs | Pika Labs révolutionne l'expérience vidéo avec l'IA. | Vidéo | ||
Pixeling | Pixeling permet à nos clients de créer un contenu visuel très précis, ultra-réaliste et extrêmement contrôlable, y compris des images, des vidéos et des modèles 3D. | Vidéo | ||
Pixverse | Créez des vidéos à couper le souffle avec l'IA. | Vidéo | ||
Pollinisation | La création devient facile, rapide et amusante. | Vidéo | ||
Réutiliser et diffuser | Denoison itératif pour la génération de texte à vidéo. | arXiv | Vidéo | |
Ruyi | Ruyi est un modèle d'image à video capable de générer des vidéos de qualité cinématographique à une résolution de 768, avec une fréquence d'images de 24 images par seconde, totalisant 5 secondes et 120 images. | Vidéo | ||
Shortgpt | Un cadre expérimental d'IA pour la création automatisée de contenu court / vidéo. | Vidéo | ||
Show-1 | Épouser des pixels et des modèles de diffusion latente pour la génération de texte à vidéo. | arxiv | Vidéo | |
Cliché | Transformers spatio-temporels à l'échelle pour la synthèse du texte à vidéo. | arxiv | Vidéo | |
Sora | Création de vidéos à partir de texte. | Vidéo | ||
Sorawebui | Sorawebui est un client Web Sora open-source, permettant aux utilisateurs de créer facilement des vidéos à partir de texte avec le modèle SORA d'Openai. | Vidéo | ||
Stablevideo | Édition vidéo de diffusion de la cohérence axée sur le texte. | Vidéo | ||
Diffusion vidéo stable | Image de diffusion vidéo stable (SVD) à video. | Vidéo | ||
StoryDiffusion | Auto-agence d'auto-agence pour l'image à long terme et la génération de vidéos. | arxiv | Vidéo | |
Streamingt2v | Génération vidéo longue cohérente, dynamique et extensible à partir de texte. | arxiv | Vidéo | |
Stylecrafter | Nhancing Stylized Text-to-Video Generation with Style Adaptateur. | arxiv | Vidéo | |
Tatouage | Génération vidéo longue avec VQGAN agnostique dans le temps et transformateur sensible au temps. | Vidéo | ||
Text2video-zéro | Les modèles de diffusion de texte à l'image sont des générateurs vidéo à tirs zéro. | arxiv | Vidéo | |
TF-T2V | Une recette pour augmenter la génération de texte à vidéo avec des vidéos sans texte. | arxiv | Vidéo | |
Tora | Tora: Transformateur de diffusion orienté vers la trajectoire pour la génération de vidéo. | arxiv | Vidéo | |
Piste | La piste est un outil flexible et interactif pour le suivi et la segmentation des objets vidéo, basé sur le segment n'importe quoi et XMEM. | arxiv | Vidéo | |
Tune-A-Video | Digne à un coup des modèles de diffusion d'image pour la génération de texte à vidéo. | arxiv | Vidéo | |
Douze | IA multimodale qui comprend des vidéos comme les humains. | Vidéo | ||
Univg | Vers la génération vidéo unifiée modale. | Vidéo | ||
Vchitect-2.0 | VCITECT-2.0: Transformateur parallèle pour la mise à l'échelle des modèles de diffusion vidéo. | Vidéo | ||
Vgen | Un écosystème de génération de vidéos holistique pour la génération de vidéos construisant sur des modèles de diffusion. | arxiv | Vidéo | |
ViewCrafter | ViewCrafter: Modèles de diffusion vidéo apprivoisés pour la synthèse de la nouvelle fidélité. | arxiv | Vidéo | |
Vidéo-chatte | Video-chatgpt est un modèle de conversation vidéo capable de générer une conversation significative sur les vidéos. | arxiv | Vidéo | |
Videocomposeur | Synthèse vidéo compositionnelle avec contrôlabilité de mouvement. | arxiv | Vidéo | |
Vidéocrafter1 | Modèles de diffusion ouverts pour la génération de vidéos de haute qualité. | arxiv | Vidéo | |
Videocrafter2 | Surmonter les limites de données pour les modèles de diffusion vidéo de haute qualité. | arxiv | Vidéo | |
VideoDrafter | Génération de vidéos multiples consiste à contenu avec LLM. | arxiv | Vidéo | |
Vidéoelevator | Élévation de la qualité de la génération de vidéos avec des modèles de diffusion de texte à image polyvalente. | arxiv | Vidéo | |
Vidéo vidéo | Échangez l'attention dans les diffusions spatio-temporelles pour la génération de texte à vidéo. | Vidéo | ||
Vidote | Une approche de diffusion latente guidée par référence pour la génération de texte à vide à haute définition. | arxiv | Vidéo | |
Videolcm | Modèle de cohérence latente vidéo. | arxiv | Vidéo | |
Video LDMS | Alignez vos latents: synthèse vidéo haute résolution avec des modèles de diffusion latente. | arxiv | Vidéo | |
Vidéo-lava | Apprendre une représentation visuelle unie par alignement avant projection. | arxiv | Vidéo | |
Videomamba | Modèle d'espace d'état pour une compréhension vidéo efficace. | arxiv | Vidéo | |
Vidéo de pensée | Vidéo-pensée: raisonnement vidéo étape par étape de la perception à la cognition. | Vidéo | ||
Videopoet | Un modèle grand langage pour la génération de vidéos à tirs zéro. | arxiv | Vidéo | |
Mouvement vispunk | Créez des vidéos réalistes en utilisant juste du texte. | Vidéo | ||
Visualrwkv | VisualRwkv est la version visuelle améliorée du modèle de langue RWKV, permettant à RWKV de gérer diverses tâches visuelles. | Visuel | ||
V-JEPA | Video Joint Imageding Architecture prédictive. | arxiv | Vidéo | |
Walt | Génération vidéo photoréaliste avec des modèles de diffusion. | arxiv | Vidéo | |
Zéroscope | Zeroscope Text-to-video. | Vidéo |
^ Retour au sommaire ^
Source | Description | Papier | Moteur de jeu | Taper |
---|---|---|---|---|
Academicodec | Un modèle de codec audio open source pour la recherche académique. | Audio | ||
Amphion | Une boîte à outils audio, de musique et de génération de discours open source. | arxiv | Audio | |
Archisound | Génération audio utilisant des modèles de diffusion, dans Pytorch. | Audio | ||
Audio | Génération audio unifiée avec invites en langage naturel. | Audio | ||
Audio-édignation | Édition audio non supervisée et basée sur le texte à l'aide de l'inversion DDPM. | arxiv | Audio | |
Codec audiogène | Un codec audio neural à faible compression de 48 kHz pour l'audio général, optimisant pour la fidélité audio ?. | Audio | ||
Audiogpt | Comprendre et générer la parole, la musique, le son et la tête parlante. | arxiv | Audio | |
Audiolcm | Génération de texte à audio avec des modèles de cohérence latente. | arXiv | Audio | |
Audioldm | Génération de texte à audio avec des modèles de diffusion latente. | arxiv | Audio | |
Audioldm 2 | Apprentissage de la génération d'audio holistique avec pré-formation auto-supervisée. | arxiv | Audio | |
Auffusion | Tirant l'extraction de la puissance de la diffusion et des modèles de langue importants pour la génération de texte à audio. | arxiv | Audio | |
Ctag | Génération créative de texte à audio via la programmation du synthétiseur. | Audio | ||
Foleycrafter | FOLEYCRAFTER: Donnez vie aux vidéos silencieuses avec des sons réalisants et synchronisés. | arxiv | Audio | |
Aimant | Génération audio masquée à l'aide d'un seul transformateur non autorégressif. | Audio | ||
Make-an-audio | Génération de texte à audio avec des modèles de diffusion améliorés. | arxiv | Audio | |
Make-an-Audio 3 | Transformer le texte en audio via de grands transformateurs de diffusion basés sur le débit. | arxiv | Audio | |
Neuralsound | Synthèse sonore modale basée sur l'apprentissage avec transfert acoustique. | arxiv | Audio | |
Optimizerai | Sons pour les créateurs, les fabricants de jeux, les artistes, les fabricants de vidéos. | Audio | ||
Qwen2-audio | CHAT QWEN2-AUDIO et modèle de langage audio prétrainé proposé par Alibaba Cloud. | arxiv | Audio | |
See-2-Sound | SON SONNET SPATIAL SPATIAL-SHOT SON-SPATIAL. | arxiv | Audio | |
Tempête de son | Génération audio parallèle efficace. | arxiv | Audio | |
Audio stable | Diffusion audio latente conditionnée par un timing rapide. | Audio | ||
Audio stable ouvert | STABLE Audio Open 1.0 génère l'audio stéréo de longueur variable (jusqu'à 47S) à 44,1 kHz à partir d'invites de texte. | Audio | ||
Syncusion | Syncfusion: synthèse de la vidéo de la vidéo-audio synchronisée par le début multimodal. | arxiv | Audio | |
TANGO | GÉNÉRATION TEXT-TO-AUDIO Utilisation de l'instruction TONED LLM et du modèle de diffusion latente. | Audio | ||
VTA-LDM | Génération vidéo à audio avec alignement caché. | arxiv | Audio | |
Wavjourney | Création audio de composition avec de grands modèles de langue. | arxiv | Audio |
^ Retour au sommaire ^
Source | Description | Papier | Moteur de jeu | Taper |
---|---|---|---|---|
Aiva | L'intelligence artificielle composant la musique de bande originale émotionnelle. | Musique | ||
Musique d'ampère | Technologie de génération de musique personnalisée propulsée par Amper. | Musique | ||
Flétri | Créez de la musique générative. Partagez-le avec le monde. | Musique | ||
Chatmusicien | Favoriser les capacités musicales intrinsèques dans LLM. | Musique | ||
Chord2Melody | Génération de musique automatique AI. | Musique | ||
Diff-bgm | Un modèle de diffusion pour la génération de musique de fond vidéo. | arxiv | Musique | |
Fluxmusique | FLUXMUSIQUE: GÉNÉRATION DE TEXT-TO AUTUSIQUE AVEC LE TRANSFORMATEUR DE FLOW REDITIFE. | arxiv | Musique | |
Gptilleton | Da rédiger un script pour le traitement de la réponse GPT et l'envoi des notes MIDI dans les clips Ableton avec AbleTonosc et Python-OSC. | Musique | ||
Heymusic.ai | Générateur de musique AI | Musique | ||
Image à la musique | L'image AI en générateur de musique est un outil qui utilise l'intelligence artificielle pour convertir les images en musique. | Musique | ||
Jen-1 | Génération de musique universelle guidée par texte avec des modèles de diffusion omnidirectionnels. | Musique | ||
Juke-box | Un modèle génératif pour la musique. | arxiv | Musique | |
Magenta | Magenta est un projet de recherche explorant le rôle de l'apprentissage automatique dans le processus de création de l'art et de la musique. | Musique | ||
Mélodie | Génération de musique neuronale efficace | Musique | ||
Mubert | AI Musique générative. | Musique | ||
Bouffée | Un réseau neuronal profond qui peut générer des compositions musicales de 4 minutes avec 10 instruments différents, et peut combiner des styles du pays à Mozart aux Beatles. | Musique | ||
Musicgen | Génération de musique simple et contrôlable. | arxiv | Musique | |
Musicldm | Amélioration de la nouveauté de la génération de texte à la musique à l'aide de stratégies de mélange synchrones battues. | arxiv | Musique | |
MusiqueLM | Générer de la musique à partir de texte. | arxiv | Musique | |
Application de riffusion | La riffusion est une application pour la génération de musique en temps réel avec une diffusion stable. | Musique | ||
Sonauto | Sonauto est un éditeur de musique AI qui transforme les invites, les paroles ou les mélodies en chansons complètes dans n'importe quel style. | Musique | ||
Soupçon | Générateur de musique AI pour les créateurs. | Musique | ||
Soundry Ai | Outils d'IA génératifs, y compris des packs d'échantillons de texte à son et infini. | Musique |
^ Retour au sommaire ^
Source | Description | Papier | Moteur de jeu | Taper |
---|---|---|---|---|
Diffsinger | Synthèse vocale chantante via un mécanisme de diffusion superficiel. | arxiv | Voix chanteuse | |
CONSURANT DE LA VOICE SANTÉ | Un cadre SVC facile à utiliser basé sur les VITS. | Voix chanteuse | ||
So-vits-svc | SoftVC vites chantant la conversion vocale. | Voix chanteuse | ||
Vi-svs | Utilisez des VITS et OpenCPOP pour développer la synthèse vocale chanteuse; Différent de Visinger. | Voix chanteuse |
^ Retour au sommaire ^
Source | Description | Papier | Moteur de jeu | Taper |
---|---|---|---|---|
Applio | Outil de clonage vocal ultime, méticuleusement optimisé pour une puissance, une modularité et une expérience conviviales inégalées. | Discours | ||
Audyo | Texte en. Audio out. | Discours | ||
Aboyer | Modèle audio génératif proposé par texte. | Discours | ||
Bert-vits2 | VITS2 DURCHEUR avec bert multilingue. | Discours | ||
Cordons | Chattts est un modèle de discours génératif pour le dialogue quotidien. | Discours | ||
Clapspeech | Apprendre la prosodie à partir du contexte du texte avec un libellé contrastif-Audio pré-formation. | arxiv | Discours | |
Cosyvoice | Modèle de génération de grandes voix multilingues, offrant une inférence, une formation et un déploiement à la capacité complète. | Discours | ||
DEX-TTS | Expressive de texte vocale expressive basée sur la diffusion avec modélisation de style sur la variabilité du temps. | arxiv | Discours | |
Émotive | Un moteur TTS à voix multiples et à commande rapide. | Discours | ||
Fliki | Transformez le texte en vidéos avec des voix d'IA. | Discours | ||
GLM-4-VOICE | GLM-4-VOICE est un modèle vocal de bout en bout lancé par Zhipu AI. GLM-4-Voice peut comprendre et générer directement la parole chinoise et l'anglais, s'engager dans des conversations vocales en temps réel et changer d'attributs tels que l'émotion, l'intonation, le taux de parole et le dialecte basé sur les instructions de l'utilisateur. | Discours | ||
Brillant | Un flux génératif pour le texte à la disposition via la recherche d'alignement monotonique. | arxiv | Discours | |
GPT-SOVITS | Une puissante conversion vocale à quelques coups et un webui de texte vocal. | Discours | ||
Lovo | Lovo est le générateur vocal AI et la plate-forme Text to Speech pour des milliers de créateurs. | Discours | ||
Mahatts | Un modèle de génération de discours de grande source open source. | Discours | ||
Matcha-tts | Une architecture TTS rapide avec correspondance de débit conditionnelle. | arxiv | Discours | |
Mélottes | Bibliothèque de texte vocale multilingue de haute qualité par myshell.ai. Prise en charge de l'anglais, de l'espagnol, du français, du chinois, du japonais et du coréen. | Discours | ||
Metavoice-1b | IA pour l'intelligence de la parole au niveau de l'homme. | Discours | ||
Narakeet | Créez facilement des voix off en utilisant du texte réaliste vers la parole. | Discours | ||
Mini-omni | MINI-OMNI: Les modèles de langue peuvent entendre, parler tout en pensant en streaming. Le mini-OMNI est un modèle de grande langue à source ouverte qui peut entendre, parler tout en pensant. Doté de l'entrée de bout en bout en temps réel et des capacités de conversation de sortie audio de streaming en temps réel. | arxiv | Discours | |
Cloner un seul coup | One Shot Voice Cloning Base sur Unet-TTS. | Discours | ||
Openvoice | Clonage de voix instantanée par Myshell. | Discours | ||
Débordement | Mettre les flux sur les transducteurs neuronaux pour un meilleur TTS. | Discours | ||
RealTimemetts | RealTimetts est une bibliothèque de texte à dispection à la pointe de la technologie (TTS) conçue pour des applications en temps réel. | Discours | ||
Sens vain | SenseVoice est un modèle de base de la parole avec de multiples capacités de compréhension de la parole, notamment la reconnaissance automatique de la parole (ASR), l'identification du langage parlé (LID), la reconnaissance des émotions de la parole (SER) et la détection des événements audio (AED). | Discours | ||
Discours | Autonomiser les grands modèles de langage avec des capacités de conversation intermodales intrinsèques. | arxiv | Discours | |
discours à text-gpt3-unité | Ceci est le repo que j'utilise API Whisper et Chatgpt d'Openai dans Unity. | Unité | Discours | |
Discours stable | Modèle de texte vocal de stabilité AI. | Discours | ||
Stabletts | Modèle TTS de nouvelle génération utilisant la correspondance de flux et DIT, inspiré par la diffusion stable 3. | Discours | ||
Styletts 2 | Vers le tex-voca-vocation au niveau de l'homme à travers la diffusion du style et la formation contradictoire avec de grands modèles de langage de la parole. | arxiv | Discours | |
tortue.cpp | Tortoise.cpp: mise en œuvre GGML de Tortoise-TTS. | Discours | ||
Tortue-tts | Un système TTS multi-voix s'est formé en mettant l'accent sur la qualité. | Discours | ||
Webui de génération de tts | TTS Generation Webui (Bark, Musicgen, Tortoise, RVC, vocos, DeMUCS). | Discours | ||
Vall-e | Les modèles de langage de codec neural sont du texte à tirs zéro pour les synthétiseurs de la parole. | arxiv | Discours | |
Vall-e x | Parlez des langues étrangères avec votre propre voix: modélisation de la langue des codecs neuronaux inter-greatoires | arxiv | Discours | |
Vocode | Vocode est une bibliothèque open source pour construire des applications LLM basées sur la voix. | Discours | ||
Boîte à voix | Génération de parole universelle multilingue guidée par texte à grande échelle. | arxiv | Discours | |
Vocation | Édition de parole zéro-shot et text-to-dispection dans la nature. | Discours | ||
Chuchoter | Whisper est un modèle de reconnaissance vocale à usage général. | Discours | ||
Chuchotement | Un système de texte vocal open source construit par un chuchotement inversé. | Discours | ||
Xe-dispection | Cadre de formation conjointe de la conversion émotionnelle inter-vocale émotionnelle et conversion de la voix émotionnelle non autorégressive. | Discours | ||
Xtts | XTTS est une bibliothèque pour la génération avancée de texte-parole. | Discours | ||
Yourtts | Vers des TT multi-partenaires zéro et une conversion vocale zéro-shot pour tout le monde. | arxiv | Discours | |
Zmm-tts | Synthèse de la parole multilingue et multilingue zéro conditionnée sur des représentations discretes discretes auto-supervisées. | arxiv | Discours |
^ Retour au sommaire ^
Source | Description | Moteur de jeu | Taper |
---|---|---|---|
Ludo.ai | Assistant pour la recherche et la conception de jeux. | Analytique |
^ Retour au sommaire ^