awesome colab notebooks Télécharger - awesome colab notebooks Téléchargement du code source

La page pourrait ne pas être rendue correctement. Veuillez ouvrir directement le fichier README.md

Superbe collection de cahiers Colab pour les expériences ML

Tendance

référentiels	papiers
facebookresearch/co-tracker itératif/chaîne de données callummcdougall/ARENA_3.0 Au début/PuLID ZhengPeng7/BiRefNet ultralytiques/ultralytiques unslothai/unsloth recherche facebook/segment-n'importe quoi-2 lllyasviel/IC-Light gemelo-ai/vocos confortableanonyme/ComfyUI TransformerLensOrg/TransformerLens HongwenZhang/PyMAF-X flux robot/supervision KwaiVGI/LivePortrait piddnad/DDColor TencentARC/InstantMesh LAION-AI/prédicteur esthétique Doubiiu/DynamiCrafter facebookresearch/home-robot KillianLucas/interprète ouvert jxnl/instructeur	LIDA Éclaboussures gaussiennes Régler une vidéo Suivez votre pose Text2Video-Zéro GLIP UniFormerV2 TristeTarker OWL-ViT VidéoReTalking MLD Champs de rêve Détic GraphCast Faites glisserGAN VRT Modèle de mouvement spline à plaque mince PyMAF-X DestinZéro py-irt VQ-Diffusion ÉCONOMIQUE

référentiels

papiers

facebookresearch/co-tracker
itératif/chaîne de données
callummcdougall/ARENA_3.0
Au début/PuLID
ZhengPeng7/BiRefNet
ultralytiques/ultralytiques
unslothai/unsloth
recherche facebook/segment-n'importe quoi-2
lllyasviel/IC-Light
gemelo-ai/vocos
confortableanonyme/ComfyUI
TransformerLensOrg/TransformerLens
HongwenZhang/PyMAF-X
flux robot/supervision
KwaiVGI/LivePortrait
piddnad/DDColor
TencentARC/InstantMesh
LAION-AI/prédicteur esthétique
Doubiiu/DynamiCrafter
facebookresearch/home-robot
KillianLucas/interprète ouvert
jxnl/instructeur

LIDA
Éclaboussures gaussiennes
Régler une vidéo
Suivez votre pose
Text2Video-Zéro
GLIP
UniFormerV2
TristeTarker
OWL-ViT
VidéoReTalking
MLD
Champs de rêve
Détic
GraphCast
Faites glisserGAN
VRT
Modèle de mouvement spline à plaque mince
PyMAF-X
DestinZéro
py-irt
VQ-Diffusion
ÉCONOMIQUE

Recherche

nom	description	auteurs	links	mise à jour
CoTracker	Architecture qui suit conjointement plusieurs points tout au long d'une vidéo entière	Nikita Karaev Ignacio Rocco Benjamin Graham Natalia Neverova autres Andrea Vedaldi Christian Rupprecht	, projet	16.10.2024
PIFu	Fonction implicite alignée sur les pixels pour la numérisation humaine habillée haute résolution	Ryota Natsume Shunsuke Saito Zeng Huang Angjoo Kanazawa Hao Li		08.10.2024
DifFace	Méthode capable de gérer plus gracieusement des dégradations invisibles et complexes, sans conception de perte compliquée	Zongsheng Yue Chen Changer Loy	, , ,	05.10.2024
Segmenter n'importe quoi 2	Modèle de base pour résoudre la segmentation visuelle rapide dans les images et les vidéos	Nikhila Ravi Valentin Gabeur Yuan-Ting Hu Ronghang Hu autres Chaitanya Ryali Tengyu Ma Haitham Khedr Romain Rädle Chloé Rolland Laura Gustavson Eric Mintun Casserole de jonction [Kalyan Vasudev](lwala](https://scholar.google.co.in/citations?user=m34oaWEAAAAJ) Nicolas Carion [Chao-Yuan](u](https://chaoyuan.org/) Ross Girshick Piotr Dollarar Christophe Feichtenhofer	démo , , projet , , ,	01.10.2024
Ouvrir-Démixer	Une implémentation de référence de réseau neuronal profond pour la séparation des sources musicales, applicable aux chercheurs, ingénieurs du son et artistes	Fabian-Robert Stöter Antoine Liutkus	données projet	25.09.2024
Harmonisation picturale profonde	L'algorithme produit des résultats nettement meilleurs que les techniques de composition photo ou de stylisation globale et permet des modifications picturales créatives qui seraient autrement difficiles à réaliser.	Fujun Luan Sylvain Paris Eli Shechtman Kavita Bala	, , ,	23.09.2024
audio2photoréal	Cadre permettant de générer des avatars photoréalistes corsés qui gèrent selon la dynamique conversationnelle d'une interaction dyadique	Evonne Ng Javier Romero Timur Bagautdinov Shaojie Bai autres Trevor Darrell Angjoo Kanazawa Alexandre Richard	projet	13.09.2024
Segment rapide n'importe quoi	CNN Segment Anything Model formé en utilisant seulement 2 % de l'ensemble de données SA-1B publié par les auteurs de SAM	Xu Zhao Wenchao Ding Yongqi An Yinglong Du autres Tao Yu Min Li Ming Tang Jin Qiao Wang	, , ,	10.09.2024
Neuralangelo	Cadre pour la reconstruction de surfaces 3D haute fidélité à partir de captures vidéo RVB	Zhaoshuo Li Thomas Muller Alex Evans Russell Taylor autres Mathias Unberath Ming Yu Liu Chen-Hsuan Lin	article de blog projet , ,	02.09.2024
BiRefNet	Cadre de référence bilatéral pour la segmentation d'images dichotomiques haute résolution	Peng Zheng Dehong Gao Fan de Deng-Ping Li Liu autres Jorma Laaksonen Wanli Ouyang Nicu Sebé	, , , , projet , ,	23.08.2024
ROTATION	Apprendre à reconstruire la pose et la forme humaine en 3D via l'ajustement du modèle dans la boucle	Nikos Kolotouros Georgios Pavlakos Michel Noir Kostas Daniilidis	, projet	21.08.2024
YOLOv10	Viser à faire progresser davantage la limite performance-efficacité des YOLO à la fois du post-traitement et de l'architecture du modèle	Ao Wang Hui Chen Kai Chen Zijia Lin autres Jungong Han Guiguang Ding	article de blog démo , , , , , , , , , , , , ,	20.08.2024
SpecVQGAN	Apprivoiser la génération sonore guidée visuellement en réduisant un ensemble de données d'entraînement à un ensemble de vecteurs représentatifs	Vladimir Iachine Esa Rahtu	, , , , , , , , projet , ,	12.07.2024
Portrait en direct	Cadre d'animation de portraits vidéo axé sur une meilleure généralisation, contrôlabilité et efficacité pour une utilisation pratique	Jianzhu Guo Ding Yun Zhang Xiaoqiang Liu Zhizhou Zhong autres Yuan Zhang Pengfei Wan Di Zhang	, , , , projet , , , , ,	10.07.2024
TAPIR	Suivi de n'importe quel point avec initialisation par image et raffinement temporel	Carl Dörsch Yi-Yang Mel Vecerik Dilara Gokay autres Ankush Gupta Yusuf Aytar João Carreira Andrew Zisserman	, article de blog, article de blog ,	05.07.2024
Wav2Lip	Un expert en synchronisation labiale est tout ce dont vous avez besoin pour la génération parole-lèvre dans la nature	Prajwal Renukanand Rudrabha Mukhopadhyay Vinay Namboodiri CV Jawahar	données démo projet	27.06.2024
DeepLabCut	Méthode efficace d'estimation de pose sans marqueur basée sur l'apprentissage par transfert avec des réseaux neuronaux profonds qui permet d'obtenir d'excellents résultats avec un minimum de données d'entraînement	Alexandre Mathis Pranav Mamidanna Kévin Cury Taïga Abe autres Venkatesh Murthy Mackenzie Mathis Matthias Bethge	, , , , , forum , site web , ,	05.06.2024
PiscineAncienne	MetaFormer est en fait ce dont vous avez besoin pour la vision	Weihao Yu Mi Luo Pan Zhou Chenyang Si autres Yichen Zhou Xinchao Wang Jiashi Feng Shuicheng Yan	, ,	01.06.2024
HistoireDiffusion	Méthode de calcul de l'auto-attention, appelée Consistent Self-Attention, qui améliore considérablement la cohérence entre les images générées et augmente les modèles texte-image pré-entraînés pré-entraînés basés sur la diffusion de manière zéro-shot	Yupeng Zhou Daquan Zhou Ming Ming Cheng Jiashi Feng Qibin Hou	projet ,	04.05.2024
PuLID	Personnalisation Pure et Lightning ID, une méthode de personnalisation d'ID sans réglage pour la génération de texte en image	Zinan Guo Yanze Wu Zhuo Wei Chen Lang Chen Qian Il	, ,	03.05.2024
FILM	Un algorithme d'interpolation d'images qui synthétise plusieurs images intermédiaires à partir de deux images d'entrée avec un grand mouvement intermédiaire	Fitsum Reda Janne Kontkanen Éric Tabellion Soleil de Qing autres Caroline Pantofaru Brian Curlless	données, données, données projet , ,	03.05.2024
VoixCraft	Modèle de langage de codec neuronal à remplissage de jetons, qui atteint des performances de pointe en matière d'édition vocale et de synthèse vocale sans prise de vue sur les livres audio, les vidéos Internet et les podcasts.	Pu Yuan Peng Po Yao Huang Shang Wen Li Abdelrahman Mohamed David Harwath	projet , ,	21.04.2024
Zeste	Procédé de transfert de matériau sans prise de vue vers un objet dans l'image d'entrée à partir d'une image exemplaire de matériau	Ta-Ying Cheng Prafull Sharma Andrew Markham Niki Trigoni Varun Jampani	, projet	16.04.2024
Maille instantanée	Cadre de rétroaction pour la génération instantanée de maillage 3D à partir d'une seule image, offrant une qualité de génération de pointe et une évolutivité significative de la formation	Jiale Xu Wei Hao Cheng Yiming Gao Xintao Wang autres Shenghua Gao Ying Shan	, ,	16.04.2024
AlphaFold	Prédiction très précise de la structure des protéines	John Jumper Richard Evans Alexandre Pritzel Tim Green autres Michael Figurnov Olaf Ronneberger Kathryn Tunyasuvunakool Russ Bates Augustin Zidek Anna Potapenko Alex Bridgland Clément Meyer Simon Kohl André Ballard Bernardino Romera Paredes Stanislav Nikolov Rishub Jain	article de blog, article de blog , papier ,	15.04.2024
Würstchen	Architecture de synthèse texte-image qui combine des performances compétitives avec une rentabilité sans précédent pour les modèles de diffusion texte-image à grande échelle	Pablo Pernias Dominique Rampas Mats Richter Christophe Pal Marc Aubreville		06.04.2024
LQA	Compression extrême de grands modèles de langage via la quantification additive	Vage Egiazarian Andreï Panférov Denis Kouznedelev Elias Frantar autres Artem Babenko Dan Alistarh	, , ,	08.03.2024
YOLOv9	Apprendre ce que vous voulez apprendre à l'aide des informations de dégradé programmables	Chien Yao Wang I-Hau Ouais Hong-Yuan Mark Liao	, article de blog , , , , ,	05.03.2024
Composition multi-LoRA	LoRA Switch et LoRA Composite, des approches qui visent à surpasser les techniques traditionnelles en termes de précision et de qualité d'image, notamment dans les compositions complexes	Ming Zhong Yelong Shen Shuohang Wang Yadong Lu autres Yizhu Jiao Siru Ouyang Donghan Yu Jiawei Han Weizhu Chen	site web	03.03.2024
AMARETTO	Inférence multiéchelle et multimodale de réseaux de régulation pour identifier les circuits cellulaires et leurs moteurs partagés et distincts au sein et entre les systèmes biologiques des maladies humaines	Nathalie Pochet Olivier Gévaert Mohsen Nabian Jayendra Shinde autres Céline Everaert Thorin Thabor	bioconducteur projet	28.02.2024
LIDA	Outil pour générer des visualisations et des infographies indépendantes de la grammaire	Victor Dibia	, projet , ,	06.02.2024
ViT	Architectures de transformateur de vision et de mélangeur MLP	Alexeï Dosovitski Lucas Beyer Alexandre Kolesnikov Dirk Weissenborn autres XiaohuaZhai Thomas Unterthiner Mostafa Dehghani Matthias Minderer Georg Heigold Sylvain Gelly Jakob Uszkoreit Neil Houlsby	, , , , , , article de blog , , , , ,	06.02.2024
Ken Burns modèle 3D	Une implémentation de référence de l'effet 3D Ken Burns à partir d'une seule image à l'aide de PyTorch : étant donné une seule image d'entrée, elle anime cette image fixe avec un balayage et un zoom de caméra virtuelle soumis à la parallaxe de mouvement.	Manuel Romero		24.01.2024
VALL-E X	Modèle de langage de codec neuronal multilingue pour la synthèse vocale multilingue	Ziqiang Zhang Long Zhou Cheng Yi Wang San Yuan Chen autres Yu Wu Shujie Liu Zhuo Chen Yan Qing Liu Huaming Wang Jin Yu Li Lei Il Sheng Zhao Furu Wei	, , démo projet	19.01.2024
Créateur de photos	Méthode de génération de texte en image personnalisée et efficace, qui code principalement un nombre arbitraire d'images d'identification d'entrée dans une intégration d'ID de pile pour préserver les informations d'identification	Zhen Li Mingdeng Cao Xintao Wang Zhongang Qi autres Ming Ming Cheng Ying Shan	, , , , , projet ,	18.01.2024
DDCouleur	Méthode de bout en bout avec deux décodeurs pour la colorisation des images	Xiaoyang Kang Tao-Yang Wenqi Ouyang Peiran Ren autres Lingzhi Li Xie Xuansong	,	15.01.2024
PASD	Réseau de diffusion stable prenant en compte les pixels pour obtenir un Real-ISR robuste ainsi qu'une stylisation personnalisée	Tao-Yang Peiran Ren Xie Xuansong Lei Zhang	,	12.01.2024
Raffineur à main	Affiner les mains mal formées dans les images générées par l'inpainting conditionnel basé sur la diffusion	Wenquan Lu Yufei Xu Jing Zhang Chaoyue Wang Dacheng Tao	, ,	08.01.2024
GraphCast	Apprendre des prévisions météorologiques mondiales à moyen terme	Rémi Lam Alvaro Sánchez-Gonzalez Matthieu Willson Peter Wirnsberger autres Meire Fortunato Ferran Alet Suman Ravuri Timo Ewalds Zach Eaton Rosen WeihuaHu Alexandre Mérose Stéphane Hoyer Georges Hollande Vinyals Oriol Jacklynn Stott Alexandre Pritzel Chakir Mohamed Pierre Battaglia	données , , , , , , , ,	04.01.2024
MES	Modélisation à l'échelle évolutive : modèles de langage pré-entraînés pour les protéines	Zeming Lin Roshan Rao Brian Hie Zhongkai Zhu autres Allán dos Santos Costa Maryam Fazel-Zarandi Tom Sercu Salvatore Candido Alexandre Rives Josué Meier Robert Verkuil Jason Liu Chloé Hsu Adam Lerer	Atlas MES PDSF CIML données papier, papier, papier, papier publié ,	28.12.2023
LLaVA	Large Language and Vision Assistant, un grand modèle multimodal formé de bout en bout qui connecte un encodeur de vision et un LLM pour une compréhension visuelle et linguistique générale	Haotian Liu Chunyuan Li Qingyang Wu Yong Jae Lee Yuheng Li	, , , , démo , , , , , , projet , , , , ,	22.12.2023
Tapis de fond V2	Technique de remplacement d'arrière-plan en temps réel et haute résolution qui fonctionne à 30 ips en résolution 4K et à 60 ips en HD sur un GPU moderne	Shanchuan Lin Andreï Ryabtsev Soumyadip Sengupta Brian Curlless autres Steve Seitz Ira Kemelmacher-Shlizerman	, projet ,	22.12.2023
Éclaboussures gaussiennes	Qualité visuelle de pointe tout en maintenant des temps d'entraînement compétitifs et, surtout, en permettant une synthèse de nouvelle vue de haute qualité en temps réel (≥ 100 ips) à une résolution de 1080p	Bernhard Kerbl Georgios Kopanas Thomas Leimkühler Georges Drettakis	projet , , , , , ,	19.12.2023
SMPLer-X	Faire évoluer l'EHPS vers le premier modèle de base généraliste, avec jusqu'à ViT-Huge comme épine dorsale et une formation avec jusqu'à 4,5 millions d'instances provenant de diverses sources de données	Zhongang Cai Wan Qi Yin Zeng malade Chen Wei autres Soleil Qingping Yan Jun Wang Hui En Pang Haiyi Mei Ming Yuan Zhang Lei Zhang Chen Changer Loy Lei Yang Ziwei Liu	, , projet ,	18.12.2023
Cache profond	Paradigme sans formation qui accélère les modèles de diffusion du point de vue de l'architecture des modèles	Xinyin Ma Croc Gongfan Xinchao Wang	projet	18.12.2023
MagieAnimer	Cadre basé sur la diffusion qui vise à améliorer la cohérence temporelle, à préserver fidèlement l'image de référence et à améliorer la fidélité de l'animation	Zhongcong Xu Jianfeng Zhang Jun Hao Liew Hanshu Yan autres Jia Wei Liu Chen Xu Zhang Jiashi Feng Mike Shou	, , projet site web , ,	18.12.2023
DiffBIR	Vers la restauration d’images aveugles avec diffusion générative préalable	Lin Xinqi Jingwen Il Ziyan Chen Zhaoyang Lyu autres Ben Fei Bo Daï Wanli Ouyang Yu Qiao Chao Dong	projet ,	18.12.2023
AudioLDM	Système texte-audio construit sur un espace latent pour apprendre les représentations audio continues à partir de latents de pré-entraînement contrastés langue-audio	Haohe Liu Zehua Chen Yi Yuan Xinhao Mei autres Xubo Liu Danilo Mandic Wen Wu Wang Marc Plumbley	, , projet	02.12.2023
OngletPFN	Réseau neuronal qui a appris à faire des prédictions de données tabulaires	Noah Hollmann Samuel Muller Katharina Eggensperger Frank Hutter	, , , , , article de blog	29.11.2023
Curseurs de concepts	Adaptateurs plug-and-play de bas rang appliqués au-dessus des modèles pré-entraînés	Rohit Gandikota Joanna Materzyńska Tingrui Zhou Antonio Torralba David Bau	, projet	26.11.2023
Qwen-VL	Ensemble de modèles de langage visuel à grande échelle conçus pour percevoir et comprendre à la fois le texte et les images	Jinze Bai Shuai Bai Shusheng Yang Shijie Wang autres Sinan Tan Peng Wang Junyang Lin Chang Zhou Jingren Zhou	, , démo , , , , ,	24.11.2023
AnimeGANv3	Réseau contradictoire génératif à double queue pour une animation photo rapide	Gang Liu Xin Chen	projet , , , , ,	23.11.2023
Ithaque	Premier réseau de neurones profonds pour la restauration textuelle, l'attribution géographique et chronologique des inscriptions grecques anciennes	Yannis Assaël Théa Sommershield Brendan Shillingford Mahyar Bordbar autres Jean Pavlopoulos Marita Chatzipanagiotou Ion Androutsopoulos Jonathan Prag Nando de Freitas	, projet	21.11.2023
PixArt-Σ	Formation faible à forte du transformateur de diffusion pour la génération de texte en image 4K	Jun Song Chen Chongjian Ge Enzé Xie Yue Wu autres Lewei Yao Xiaozhe Ren Zhongdao Wang Ping Luo Huchuan Lu Zhenguo Li	, , , projet	07.11.2023
Zéro123++	Modèle de diffusion conditionné par l'image pour générer des images multi-vues cohérentes en 3D à partir d'une seule vue d'entrée	Ruoxi Shi Hansheng Chen Zhuoyang Zhang Minghua Liu autres Chao Xu Xinyue Wei Linghao Chen Chong Zeng Hao Su	, ,	26.10.2023
UniFormerV2	Transformateur unifié pour un apprentissage efficace de la représentation spatio-temporelle	Kunchang Li Yali Wang Yinan Il Yi Zhuo Li autres Yi Wang Limin Wang Yu Qiao	, , , , , , ,	20.10.2023
Afficher-1	Modèle hybride, baptisé Show-1, qui associe des VDM basés sur les pixels et latents pour la génération de texte en vidéo	David Junhao Zhang Jay Zhangjie Wu Jia Wei Liu Rui Zhao autres Lingmin a couru Yuchao Gu Difei Gao Mike Zheng Shou	, , , , , projet	15.10.2023
AudioSep	Modèle de base pour la séparation des sources audio en domaine ouvert avec des requêtes en langage naturel	Xubo Liu Qiuqiang Kong Yan Zhao Haohe Liu autres Yi Yuan Yu Zhuo Liu Rui Xia Yu Xuan Wang Marc Plumbley Wen Wu Wang	projet	12.10.2023
DA-CLIP	Modèle de langage de vision sensible à la dégradation pour mieux transférer les modèles de langage de vision pré-entraînés vers des tâches de vision de bas niveau en tant que cadre universel pour la restauration d'images	Ziwei Luo Fredrik Gustafsson Zheng Zhao Jens Sjölund Thomas Schön	projet	11.10.2023
TristeTarker	Génère des coefficients de mouvement 3D du 3DMM à partir de l'audio et module implicitement un nouveau rendu de visage compatible 3D pour la génération de têtes parlantes.	Wen Xuan Zhang Xiaodong Cun Xuan Wang Yong Zhang autres Xi Shen Yu Guo Ying Shan Fei Wang	, , , , , , , projet , , ,	10.10.2023
Musique	Système de génération de musique pouvant être entraîné sur des centaines d'heures de musique à l'aide d'un seul GPU grand public, et permettant une génération beaucoup plus rapide que la génération en temps réel de musique de longueur arbitraire sur un processeur grand public	Marco Pasini Jan Schlüter	, données , projet ,	09.10.2023
YOLOv6	Cadre de détection d'objets en une seule étape dédié aux applications industrielles	Kaiheng Weng Meng Cheng Yiduo Li Xiangxiang Chu Xiaolin Wei	, article de blog données , , , , , ,	08.10.2023
RêveGaussien	Algorithme pour convertir les Gaussiennes 3D en maillages texturés et appliquer une étape de réglage fin pour affiner les détails	Jiaxiang Tang Jia Wei Ren Hang Zhou Ziwei Liu Gang Zeng	, , projet	04.10.2023
ICÔNE	À partir d'un ensemble d'images, la méthode estime une surface 3D détaillée à partir de chaque image, puis les combine en un avatar animable.	Yuliang Xiu Jinlong Yang Dimitrios Tzionas Michel Noir	, , , , , , , projet	31.08.2023
DINov2	Produisez des fonctionnalités visuelles hautes performances qui peuvent être directement utilisées avec des classificateurs aussi simples que des couches linéaires sur une variété de tâches de vision par ordinateur ; ces fonctionnalités visuelles sont robustes et fonctionnent bien dans tous les domaines sans aucune nécessité de réglage fin	Maxime Oquab Timothée Darcet Théo Moutakanni Huy Vo autres Marc Szafraniec Vasil Khalidov Pierre Fernández Daniel Haziza Francisco Massa Alaaeldin El-Nouby Mahmoud Assran Nicolas Ballas Wojciech Galuba Russell Howes Po Yao Huang Shang Wen Li Ishan Misra Michel Rabbat Vasu Sharma Gabriel Synnaève Hu Xu Hervé Jégou Julien Mairal Patrick Labatut Armand Joulin Piotr Bojanowski	article de blog démo , , ,	31.08.2023
OWL-ViT	Détection d'objets simple à vocabulaire ouvert avec des transformateurs de vision	Matthias Minderer Alexeï Gritsenko Pierre Austin Maxime Neumann autres Dirk Weissenborn Alexeï Dosovitski Aravindh Mahendran Anurag Arnab Mostafa Dehghani Zhuoran Shen Xiao Wang XiaohuaZhai Thomas Kipf Neil Houlsby		21.08.2023
StyleGAN3	Réseaux contradictoires génératifs sans alias	Tero Karras Miika Aittala Samuli Lainé Erik Harkönen autres Janne Hellsten Jaakko Lehtinen Timo Aïla	, , , , , , , , , projet	13.08.2023
DestinZéro	Méthode d'édition de texte sans prise de vue sur des vidéos du monde réel sans formation préalable ni masque spécifique à l'utilisation	Chenyang Qi Xiaodong Cun Yong Zhang Chenyang Lei autres Xintao Wang Ying Shan Qifeng Chen	, , projet vidéo	13.08.2023
Gros GAN	Formation GAN à grande échelle pour la synthèse d'images naturelles haute fidélité	Andrew Brock Jeff Donahue Karen Simonian		03.08.2023
Lama	Inpainting de grands masques à résolution robuste avec convolutions de Fourier	Romain Souvorov Elizaveta Logacheva Anton Mashikhine Anastasia Remizova autres Arsénii Achoukha Alexeï Sylvestrov Naejin Kong Harshith Goka Parc Kiwoong Victor Lempitski	, , , projet	02.08.2023
Faites-en parler	Une méthode qui génère des vidéos expressives de têtes parlantes à partir d'une seule image faciale avec l'audio comme seule entrée	Yang Zhou Xintong Han Eli Shechtman José Echevarria autres Evangelos Kalogerakis Dingzeyu Li	données projet	27.07.2023
HiDT	Un modèle génératif d'image à image et un nouveau schéma de suréchantillonnage qui permet d'appliquer une traduction d'image à haute résolution	Denis Korjekov Gleb Sterkine Sergueï Nikolenko Victor Lempitski	projet ,	24.07.2023
Coutelier	Approche simple pour former des modèles de détection et de segmentation d'objets non supervisés	Wang Xudong Rohit Girdhar Stella Yu Ishan Misra	, projet	24.07.2023
Reconnaître n'importe quoi et Tag2Text	Cadre de pré-formation en langage visuel, qui introduit le marquage d'images dans les modèles de langage visuel pour guider l'apprentissage des caractéristiques visuo-linguistiques	Xin Yu Huang Youcai Zhang Jin Yu Ma Zhaoyang Li autres Yanchun Xie Yu Zhuo Qin Tong Luo Yaqian Li Yandong Guo Yandong Guo Lei Zhang	, , projet, projet	09.07.2023
Modèle de mouvement spline à plaque mince	Cadre de transfert de mouvement non supervisé de bout en bout	Jian Zhao Hui Zhang	, , , sup	07.07.2023
Faites glisserGAN	Faites glisser votre GAN : manipulation interactive basée sur des points sur le collecteur d'images génératives	Poêle Xingang Ayush Tewari Thomas Leimkühler Lingjie Liu autres Abhimitra Meka Christian Théobalt	projet	03.07.2023
MobileSAM	Vers un SAM léger pour les applications mobiles	Chaoning Zhang Dongshen Han Yu Qiao Jung Uk Kim autres Sung Ho Bae Seungkyu Lee Choong Seon Hong	, , , , , , ,	30.06.2023
Mise à la terre de DINO	Marier DINO avec une pré-formation ancrée pour la détection d'objets en espace ouvert	Shilong Liu Zhaoyang Zeng Tianhe Ren Feng Li autres Hao Zhang Jie Yang Chunyuan Li Jian Wei Yang Hang Su Jun Zhu Lei Zhang	, , , , , , , , , , , ,	28.06.2023
T5X	Cadre modulaire, composable et convivial pour la recherche pour une formation, une évaluation et une inférence hautes performances, configurables et en libre-service de modèles de séquence à de nombreuses échelles	Adam Roberts Hyung Won Chung Anselme Levskaïa Gaurav Mishra autres James Bradbury Daniel Andor Sharan Narang Brian Lester Colin Gaffney Afroz Mohiuddin Curtis Hawthorne Aitor Lewkowycz Alex Salcianu Marc van Zee Jacob Austin Sébastien Goodman Livio Baldini Soares Haitang Hu Sacha Tsvyachchenko Chaudrée Aakanksha Jasmin Bastings Jannis Bulian Xavier García Jianmo Ni Kathleen Kenealy Jonathan Clark Dan Garrette James Lee Thorp Colin Raffel Noam Shazeer Marvin Ritter Martin Bosma Alexandre Passos Jeremy Maitin Shepard Noé Fiedel Brennan Saeta Ryan Sepassi Alexandre Spiridonov Joshua Newlan Andrea Gesmundo	, , , ,	27.06.2023
CodeTalker	Caster une animation faciale pilotée par la parole en tant que tâche de requête de code dans un espace proxy fini du livre de codes appris, ce qui favorise efficacement la vivacité des mouvements générés en réduisant l'incertitude de cartographie intermodale	[Jinbo Xing](Jinbo Xing) Menghan Xia Yue Chen Zhang Xiaodong Cun autres Jue Wang Tien Tsin Wong	, , , , , , , , , , , , , , , projet	16.06.2023
Modèle de mouvement du premier ordre pour l’animation d’images	Transférer les mouvements du visage de la vidéo à l'image	Aliaksandr Siarohin	projet	04.06.2023
WaveGAN parallèle	Modèles non autorégressifs de pointe pour créer votre propre vocodeur	Tomoki Hayashi	, , démo ,	01.06.2023
ÉCONOMIQUE	conçu pour la "numérisation humaine à partir d'une image couleur", qui combine les meilleures propriétés des représentations implicites et explicites, pour déduire des humains habillés en 3D haute fidélité à partir d'images sauvages, même avec des vêtements amples ou dans des poses difficiles	Yuliang Xiu Jinlong Yang Xu Cao Dimitrios Tzionas Michel Noir	, , , , , , , , ,	31.05.2023
MMS	Le projet Massively Multilingual Speech étend la technologie vocale d'environ 100 langues à plus de 1 000 en créant un modèle unique de reconnaissance vocale multilingue prenant en charge plus de 1 100 langues, des modèles d'identification de langue capables d'identifier plus de 4 000 langues, des modèles pré-entraînés prenant en charge plus de 1 400 langues et des outils de conversion texte-to-langue. modèles vocaux pour plus de 1 100 langues	Vineel Pratap Andros Tjandra Bowen Shi Paden Tomasello autres Arun Babu Sayani Kundu Ali Elkahky Zhaoheng Ni Apoorv Vyas Maryam Fazel-Zarandi Alexeï Baevski Yossi Adi Xiaohui Zhang Wei Ning Hsu Alexis Conneau Michael Auli	, , ,	26.05.2023
FAB	Flow AIS Bootstrap utilise l'AIS pour générer des échantillons dans les régions où le flux est une mauvaise approximation de la cible, facilitant ainsi la découverte de nouveaux modes.	Laurence Midgley Vincent Stimper Gregor NC Simm Bernhard Schölkopf José Miguel Hernández-Lobato	,	29.04.2023
CodeFormer	Réseau de prédiction basé sur un transformateur pour modéliser la composition globale et le contexte des faces de faible qualité pour la prédiction de code, permettant la découverte de faces naturelles qui se rapprochent étroitement des faces cibles même lorsque les entrées sont gravement dégradées	Shangchen Zhou Kelvin Chan Chongyi Li Chen Changer Loy	, , projet , , ,	21.04.2023
Text2Video-Zéro	Les modèles de diffusion texte-image sont des générateurs vidéo Zero-Shot	Lévon Khachatryan Andranik Movsissian Vahram Tadevossian Roberto Henschel autres Zhang Yang Wang Shant Navasardyan Humphrey Shi	, , , , , projet vidéo ,	11.04.2023
Segmenter n'importe quoi	Le modèle Segment Anything produit des masques d'objets de haute qualité à partir d'invites de saisie telles que des points ou des cases, et il peut être utilisé pour générer des masques pour tous les objets d'une image.	Alexandre Kirillov Eric Mintun Nikhila Ravi Hanzi Mao autres Chloé Rolland Laura Gustavson Tête Xiao Spencer Whitehead Alex Berg Wan-Yen Lo Piotr Dollarar Ross Girshick	données , site web , ,	10.04.2023
Suivez votre pose	Schéma de formation en deux étapes qui peut utiliser des paires de poses d'images et des ensembles de données vidéo sans pose ainsi que le modèle texte-image pré-entraîné pour obtenir les vidéos de personnages contrôlables par la pose	Yue Ma Yingqing Il Xiaodong Cun Xintao Wang autres Siran Chen Ying Shan Xiu Li Qifeng Chen	, , , projet vidéo	07.04.2023
EVA3D	Modèle génératif humain 3D inconditionnel de haute qualité qui ne nécessite que des collections d'images 2D pour la formation	Fangzhou Hong Zhaoxi Chen Yushi Lan Pan Liang Ziwei Liu	projet ,	06.04.2023
Fusion de rêve stable	Utilisation d'un modèle de diffusion texte-image 2D pré-entraîné pour effectuer une synthèse texte-3D	Jiaxiang Tang Ben Poole Ajay Jain Jon Barron Ben Mildenhall	, projet , , ,	04.04.2023
PIFuHD	Fonction implicite d'alignement de pixels à plusieurs niveaux pour la numérisation humaine 3D haute résolution	Shunsuke Saito Thomas Simon Jason Saragih Hanbyul Joo	,	26.03.2023
VidéoReTalking	Système permettant d'éditer les visages d'une vidéo de tête parlante du monde réel en fonction de l'audio d'entrée, produisant une vidéo de sortie de haute qualité et synchronisée sur les lèvres, même avec une émotion différente	Kun Cheng Xiaodong Cun Yong Zhang Menghan Xia autres Fei Yin Mingrui Zhu Xuan Wang Jue Wang Nannan Wang	, , , , projet , ,	19.03.2023
Chat visuelGPT	Connecte ChatGPT et une série de modèles Visual Foundation pour permettre l'envoi et la réception d'images pendant le chat	Chenfei Wu Shengming Yin Weizhen Qi Xiaodong Wang autres Tang Zecheng Nan Duan	, , , ,	15.03.2023
Régler une vidéo	Réglage en une seule fois des modèles de diffusion d'images pour la génération de texte en vidéo	Jay Zhangjie Wu Yixiao Ge Xintao Wang Stan Weixian Lei autres Yuchao Gu Yufei Shi Wynne Hsu Ying Shan Xiaohu Qie Mike Zheng Shou	, , , projet ,	23.02.2023
GPEN	Réseau intégré GAN Prior pour la restauration des visages aveugles dans la nature	Tao-Yang Peiran Ren Xie Xuansong Lei Zhang	démo ,	15.02.2023
PyMAF-X	Approche basée sur la régression pour récupérer des modèles paramétriques du corps entier à partir d'images monoculaires	Hongwen Zhang Yating Tian Yuxiang Zhang Meng Cheng Li autres Liang An Soleil de Zhenan Yebin Liu	, , , , projet	14.02.2023
Diffusion Disco	Un amalgame frankensteinien de cahiers, de modèles et de techniques pour la génération d'art et d'animations IA	Max Ingham Adam Letts Daniel Russel Chigozie Nri	, ,	11.02.2023
GrooVAE	Quelques applications de l'apprentissage automatique pour générer et manipuler des rythmes et des performances de batterie	Jon Gillick Adam Roberts Jesse Engel	article de blog données application Web	02.02.2023
Musique multipisteVAE	Les modèles de ce cahier sont capables d'encoder et de décoder des mesures uniques allant jusqu'à 8 pistes, éventuellement conditionnées sur un accord sous-jacent.	Ian Simon Adam Roberts Colin Raffel Jesse Engel autres Curtis Hawthorne Douglas Eck	article de blog	02.02.2023
MusiqueVAE	Un modèle vectoriel latent hiérarchique pour l'apprentissage de la structure à long terme de la musique	Adam Roberts Jesse Engel Colin Raffel Curtis Hawthorne Douglas Eck	article de blog projet	02.02.2023
Apprendre à peindre	Apprendre à peindre avec l'apprentissage par renforcement profond basé sur des modèles	Manuel Romero		01.02.2023
NGP instantané	Primitives graphiques neuronales instantanées avec un codage de hachage multirésolution	Thomas Muller Alex Evans Christophe Schied Alexandre Keller	article de blog , , , , projet tutoriel , , ,	18.01.2023
Réseaux de fonctionnalités de Fourier	Les fonctionnalités de Fourier permettent aux réseaux d'apprendre des fonctions haute fréquence dans des domaines de faible dimension	Matthieu Tancik Pratul Srinivasan Ben Mildenhall Sara Fridovitch-Keil autres Nithin Raghavan Utkarsh Singhal Ravi Ramamoorthi Jon Barron Ren Ng	, projet	17.01.2023
AlphaPose	Estimation et suivi des poses multi-personnes régionales du corps entier en temps réel	Hao-Shu Fang Jiefeng Li Hongyang Tang Chao Xu autres Hao Yi Zhu Yuliang Xiu Yong-Lu Li Cewu Lu	, projet , , ,	07.01.2023
HybrIK	Solution hybride de cinématique inverse analytique et neuronale pour l'estimation de la pose et de la forme humaine en 3D	Jiefeng Li Chao Xu Zhicun Chen Siyuan Bian autres Lixin Yang Cewu Lu	projet sup	01.01.2023
Score du chaînage jacobien	Appliquez la règle de chaîne sur les gradients appris et rétro-propagez le score d'un modèle de diffusion à travers le jacobien d'un moteur de rendu différentiable, que nous instancions pour être un champ de radiance voxel.	Hao Chen Wang Xiaodan Du Jiahao Li Raymond Ouais Greg Shakhnarovitch	, projet ,	05.12.2022
Démocrates	Spectrogramme hybride et séparation de source de forme d'onde	Alexandre Défossez	, , , , , ,	21.11.2022
StyleCLIP	Manipulation pilotée par texte de StyleGAN Imager	Ou Patashnik Zongze Wu Eli Shechtman Daniel Cohen-Or Dani Lischinski	, , , ,	30.10.2022
MouvementDiffuse	Le premier cadre de génération de mouvement basé sur un modèle de diffusion et piloté par du texte, qui démontre plusieurs propriétés souhaitées par rapport aux méthodes existantes	Ming Yuan Zhang Zhongang Cai Pan Liang Fangzhou Hong autres Xin Ying Guo Lei Yang Ziwei Liu	projet	13.10.2022
VToonifier	Exploite les couches moyenne et haute résolution de StyleGAN pour restituer des portraits artistiques de haute qualité basés sur les fonctionnalités de contenu multi-échelle extraites par un encodeur afin de mieux préserver les détails du cadre	Shuai Yang Chaulage Jiang Ziwei Liu Chen Change Loy	, , , , projet	07.10.2022
PyMAF	Alignement du maillage pyramidal Boucle de rétroaction dans le réseau de régression pour une récupération du maillage corporel bien aligné et extension pour la récupération de modèles expressifs du corps entier	Hongwen Zhang Yating Tian Yuxiang Zhang Meng Cheng Li autres Liang An Soleil de Zhenan Yebin Liu	, , , , projet ,	06.10.2022
AlphaTenseur	Découvrir des algorithmes de multiplication matricielle plus rapides avec l'apprentissage par renforcement	Alhussein Fawzi Matej Balog Aja Huang Thomas Hubert autres Bernardino Romera Paredes Mohammadamin Barekatain Alexandre Novikov Francisco Ruiz Julien Schrittwieser Grzegorz Swirszcz David Argent Demis Hassabis Rencontrez Kohli	, , ,	04.10.2022
Swin2SR	Nouveau Swin Transformer V2, pour améliorer SwinIR pour la super-résolution d'image, et en particulier le scénario d'entrée compressé	Marcos Condé Ui-Jin Choi Maxime Burchi Radu Timofté	, , , , , , ,	03.10.2022
Fonction	Des données à la fonction : votre point de données est une fonction et vous pouvez le traiter comme telle.	Émilien Dupont Hyunjik Kim Ali Eslami Danilo Rezende Dan Rosenbaum	,	24.09.2022
Chuchoter	Système de reconnaissance vocale automatique formé sur 680 000 heures de données supervisées multilingues et multitâches collectées sur le Web	Alec Radford Jong Wook Kim Tao Xu Greg Brockman autres Christine McLeavey Ilya Sutskever	article de blog , ,	21.09.2022
DeOldify (vidéo)	Colorisez vos propres vidéos !	Jason Antic	, modèle , site web ,	19.09.2022
DeOldify (photo)	Colorisez vos propres photos !	Jason Antic Matt Robinson Maria Benavente	, modèle site web	19.09.2022
Réel-ESRGAN	Étendez le puissant ESRGAN à une application de restauration pratique, formée avec des données synthétiques pures.	Xintao Wang Liangbin Xie Chao Dong Ying Shan	, , , ,	18.09.2022
IDE-3D	Édition interactive démêlée pour une synthèse de portrait haute résolution compatible 3D	Soleil Jingxiang Xuan Wang Yichun Shi Lizhen Wang autres Jue Wang Yebin Liu	, , ,	08.09.2022
Transformateurs de décision	Une architecture qui présente le problème de RL comme modèle de séquence conditionnelle Développer Informations supplémentaires Version 1.0.0 Type Autre code source Date de mise à jour 2024-12-27 taille 804.02KB Provenant de Github Applications connexes awesome citygml 2024-11-13 awesome generative ai guide 2024-11-05 GitHub sgrebnov/cordova plugin background download 2024-11-05 awesome swift 2024-11-03 Super jeu du diable 2023-04-16 La superbe publicité 2022-08-08 Recommandé pour vous chat.petals.dev Autre code source 1.0.0 GPT Prompt Templates Autre code source 1.0.0 GPTyped Autre code source GPTyped 1.0.5 waymo open dataset Autre code source December 2023 Update SmartTube Autre code source 24.71 Stable Sunamu Autre code source Release 2.2.0 waymo open dataset Autre code source December 2023 Update termwind Autres catégories v2.3.0 wp functions Autres catégories 1.0.0 Actualités connexes Tout Comment réparer le bégaiement dans Stalker 2: Heart of Chornobyl 2024-11-23 Où est Juice WRLD dans Fortnite ? 2024-11-23 Comment démarrer l'extension Wild Card dans Star Wars Outlaws 2024-11-23 Pékin ajoute une nouvelle institution de R&D pour améliorer la sécurité et la gouvernance de l'intelligence artificielle 2024-11-22 Le séminaire s'est ouvert à Shanghai, Guterres y a participé et la proposition de la Chine de coopérer pour renforcer les capacités en matière d'intelligence artificielle a été adoptée par l'Assemblée générale des Nations Unies. 2024-11-22 Construire un cadre d'intelligence artificielle pour trouver le lysozyme le plus efficace 2024-11-22 Les grands modèles d’IA entrent dans leur première année d’application. Les institutions financières intensifient leurs efforts pour construire un nouvel écosystème de puissance de calcul intelligente. 2024-11-22 MiniMax Yan Junjie : La rapidité est bonne pour les grands modèles, mais parfois la lenteur consiste simplement à être plus rapide. 2024-11-22 L’intelligence artificielle entre sur le campus pour éclairer les rêves scientifiques des étudiants 2024-11-22 L'intelligence artificielle active la fabrication grand public et les équipements de fitness de Yongkang se vendent bien sur les marchés nationaux et étrangers 2024-11-22 Nvidia investit dans le financement de série B de Sakana AI pour aider à développer l'intelligence artificielle générative 2024-11-22 L’IA ouvre la voie à une nouvelle révolution cognitive ! Lecture universelle du cours général des nouvelles sciences et technologies, calendrier de développement de l'intelligence artificielle : réaliser une vidéo en 2028, écrire un best-seller en 204 2024-11-22 Products & Services Install APK APK signature verification APK Download Service Company Developer Console Submit APK Monetization of traffic through downcodes Legal About us Contact Us Cooperation [email protected]