Download awesome colab notebooks - download de código-fonte awesome colab notebooks

A página pode não ser renderizada corretamente. Abra o arquivo README.md diretamente

Coleção incrível de notebooks colaborativos para experimentos de ML

Tendências

repositórios	papéis
pesquisa no Facebook/co-rastreador iterativo/cadeia de dados callummcdougall/ARENA_3.0 ToTheBeginning/PuLID ZhengPeng7/BiRefNet ultralíticos/ultralíticos unslothai/despreguiça pesquisa no Facebook/segment-anything-2 llyasviel/IC-Light gemelo-ai/vocos confortável/ComfyUI TransformerLensOrg/TransformerLens HongwenZhang/PyMAF-X roboflow/supervisão KwaiVGI/LivePortrait piddnad/DDColor TencentARC/InstantMesh LAION-AI/preditor estético Doubiiu/DynamiCrafter pesquisa no Facebook/home-robô KillianLucas/intérprete aberto jxnl/instrutor	LIDA Respingos Gaussianos Sintonize um vídeo Siga sua pose Text2Video-Zero GLIP UniFormerV2 SadTalker OWL-ViT VídeoReTalking LDM Campos de sonho Dético GráficoCast ArrastarGAN VRV Modelo de movimento spline de placa fina PyMAF-X DestinoZero py-irt Difusão VQ ECONOMIA

repositórios

papéis

pesquisa no Facebook/co-rastreador
iterativo/cadeia de dados
callummcdougall/ARENA_3.0
ToTheBeginning/PuLID
ZhengPeng7/BiRefNet
ultralíticos/ultralíticos
unslothai/despreguiça
pesquisa no Facebook/segment-anything-2
llyasviel/IC-Light
gemelo-ai/vocos
confortável/ComfyUI
TransformerLensOrg/TransformerLens
HongwenZhang/PyMAF-X
roboflow/supervisão
KwaiVGI/LivePortrait
piddnad/DDColor
TencentARC/InstantMesh
LAION-AI/preditor estético
Doubiiu/DynamiCrafter
pesquisa no Facebook/home-robô
KillianLucas/intérprete aberto
jxnl/instrutor

LIDA
Respingos Gaussianos
Sintonize um vídeo
Siga sua pose
Text2Video-Zero
GLIP
UniFormerV2
SadTalker
OWL-ViT
VídeoReTalking
LDM
Campos de sonho
Dético
GráficoCast
ArrastarGAN
VRV
Modelo de movimento spline de placa fina
PyMAF-X
DestinoZero
py-irt
Difusão VQ
ECONOMIA

Pesquisar

nome	descrição	autores	links	atualizar
CoTracker	Arquitetura que rastreia em conjunto vários pontos ao longo de um vídeo inteiro	Nikita Karaeva Ignácio Rocco Benjamim Graham Natália Neverova outros Andrea Vedaldi Christian Rupprecht	, projeto	16.10.2024
PI Fu	Função implícita alinhada a pixels para digitalização humana vestida de alta resolução	Ryota Natsume Shunsuke Saito Zeng Huang Angjoo Kanazawa Hao Li		08.10.2024
DifFace	Método que é capaz de lidar com degradações invisíveis e complexas de maneira mais elegante, sem projetos complicados de perda	Zong Sheng Yue Chen Mudança Loy	, , ,	05.10.2024
Segmentar qualquer coisa 2	Modelo básico para resolver segmentação visual imediata em imagens e vídeos	Nikhila Ravi Valentin Gabeur Yuan-Ting Hu Ronghang Hu outros Chaitanya Ryali Tengyu Ma Haitham Khedr Roman Radle Chloé Rolland Laura Gustafson Eric Mintun Panela de Junção [Kalyan Vasudev](lwala](https://scholar.google.co.in/citations?user=m34oaWEAAAAJ) Nicolas Carion [Chao-Yuan](você](https://chaoyuan.org/) Ross Girshick Piotr Dollár Christoph Feichtenhofer	demonstração , , projeto , , ,	01.10.2024
Abrir-Desmixar	Uma implementação de referência de rede neural profunda para separação de fontes musicais, aplicável para pesquisadores, engenheiros de áudio e artistas	Fabian-Robert Stöter Antoine Liutkus	dados projeto	25.09.2024
Harmonização pictórica profunda	O algoritmo produz resultados significativamente melhores do que a composição de fotos ou técnicas de estilização global e permite edições pictóricas criativas que de outra forma seriam difíceis de alcançar	Fujun Luan Silvana Paris Eli Shechtman Kavita Bala	, , ,	23.09.2024
áudio2fotoreal	Estrutura para geração de avatares fotorrealistas encorpados que gesticulam de acordo com a dinâmica conversacional de uma interação diádica	Evonne Ng Javier Romero Timur Bagautdinov Shaojie Bai outros Trevor Darrell Angjoo Kanazawa Alexandre Ricardo	projeto	13.09.2024
Segmente rapidamente qualquer coisa	Modelo CNN Segment Anything treinado usando apenas 2% do conjunto de dados SA-1B publicado pelos autores do SAM	Xu Zhao Wenchao Ding Yongqi An Ying Long Du outros Tao Yu Min Li Ming Tang Jin Qiao Wang	, , ,	10.09.2024
Neuralângelo	Estrutura para reconstrução de superfície 3D de alta fidelidade a partir de capturas de vídeo RGB	Zhao Shuo Li Thomas Müller Alex Evans Russel Taylor outros Mathias Unberath Ming Yu Liu Chen-Hsuan Lin	postagem no blog projeto , ,	02.09.2024
BiRefNet	Quadro de referência bilateral para segmentação dicotômica de imagens de alta resolução	Peng Zheng Dehong Gao Ventilador Deng-Ping Li Liu outros Jorma Laaksonen Wanli Ouyang Nicu Sebe	, , , , projeto , ,	23.08.2024
RODAR	Aprendendo a reconstruir a postura e a forma humana em 3D por meio do ajuste do modelo no loop	Nikos Kolotouros Georgios Pavlakos Michael Preto Kostas Daniilidis	, projeto	21.08.2024
YOLOv10	Objetivo de avançar ainda mais o limite de eficiência de desempenho dos YOLOs tanto do pós-processamento quanto da arquitetura do modelo	Ao Wang Hui Chen Kai Chen Zijia Lin outros Jungong Han Guiguang Ding	postagem no blog demonstração , , , , , , , , , , , , ,	20.08.2024
EspecificaçãoVQGAN	Dominar a geração de som guiada visualmente, reduzindo um conjunto de dados de treinamento a um conjunto de vetores representativos	Vladimir Iashin Esa Rahtu	, , , , , , , , projeto , ,	12.07.2024
Retrato ao vivo	Estrutura de animação de retratos baseada em vídeo com foco em melhor generalização, controlabilidade e eficiência para uso prático	Jianzhu Guo DingyunZhang Xiaoqiang Liu Zhizhou Zhong outros Yuan Zhang Pengfei Wan Di Zhang	, , , , projeto , , , , ,	10.07.2024
ANTA	Rastreando qualquer ponto com inicialização por quadro e refinamento temporal	Carl Doersch Yi Yang Mel Vecerik Dilara Gokay outros Ankush Gupta Yusuf Aytar João Carreira Andrew Zisserman	, postagem de blog, postagem de blog ,	05.07.2024
Wav2Lip	Um especialista em sincronização labial é tudo que você precisa para gerar fala em lábios na natureza	Prajwal Renukanand Rudrabha Mukhopadhyay Vinay Namboodiri CV Jawahar	dados demonstração projeto	27.06.2024
DeepLab Cut	Método eficiente para estimativa de pose sem marcadores baseado em aprendizagem por transferência com redes neurais profundas que alcança excelentes resultados com dados de treinamento mínimos	Alexandre Mathis Pranav Mamidanna Kevin Cury Taiga Abe outros Venkatesh Murthy Mackenzie Mathis Matias Bethge	, , , , , fórum , site , ,	05.06.2024
PoolFormer	MetaFormer é realmente o que você precisa para ter visão	Wei Hao Yu Mi Luo Pan Zhou Chenyang Si outros Yi Chen Zhou Xinchao Wang Jiashi Feng Shuicheng Yan	, ,	01.06.2024
Difusão de história	Forma de cálculo de autoatenção, denominada Autoatenção Consistente, que aumenta significativamente a consistência entre as imagens geradas e aumenta os modelos de texto para imagem baseados em difusão pré-treinados predominantes de maneira zero-shot	Yupeng Zhou DaquanZhou Ming-Ming Cheng Jiashi Feng Qibinhou	projeto ,	04.05.2024
PuLID	Personalização Pure e Lightning ID, um método de personalização de ID sem ajuste para geração de texto para imagem	Zinan Guo Yanze Wu Zhuowei Chen Lang Chen Qian Ele	, ,	03.05.2024
FILME	Um algoritmo de interpolação de quadros que sintetiza vários quadros intermediários a partir de duas imagens de entrada com grande movimento intermediário	Fitsum Reda Janne Kontkanen Eric Tabelião Sol Deqing outros Caroline Pantofaru Brian Curless	dados, dados, dados projeto , ,	03.05.2024
VoiceCraft	modelo de linguagem de codec neural com preenchimento de token, que alcança desempenho de última geração tanto na edição de fala quanto na conversão de texto em fala de disparo zero em audiolivros, vídeos da Internet e podcasts	Puyuan Peng Po-Yao Huang Shang Wen Li Abdelrahman Mohamed David Harwath	projeto , ,	21.04.2024
ZeST	Método para transferência de material de disparo zero para um objeto na imagem de entrada, dada uma imagem exemplar de material	Ta-Ying Cheng Prafull Sharma Andrew Markham Niki Trigoni Varun Jampani	, projeto	16.04.2024
Malha Instantânea	Estrutura feedforward para geração instantânea de malha 3D a partir de uma única imagem, apresentando qualidade de geração de última geração e escalabilidade de treinamento significativa	Jiale Xu Wei Hao Cheng Yiming Gao Xintao Wang outros Shenghua Gao Ying Shan	, ,	16.04.2024
AlfaFold	Previsão altamente precisa da estrutura proteica	John Jumper Ricardo Evans Alexandre Pritzel Tim Verde outros Michael Figurnov Olaf Ronneberger Kathryn Tunyasuvunakool Russ Bates Augustin Zídek Anna Potapenko Alex Bridgeland Clemens Meyer Simon Kohl André Ballard Bernardino Romera-Paredes Stanislav Nikolov Rishub Jain	postagem de blog, postagem de blog , papel ,	15.04.2024
Würstchen	Arquitetura para síntese de texto para imagem que combina desempenho competitivo com custo-benefício sem precedentes para modelos de difusão de texto para imagem em larga escala	Pablo Pernias Dominic Rampas Mats Richter Cristóvão Pal Marc Aubreville		06.04.2024
AQLM	Compressão Extrema de Grandes Modelos de Linguagem via Quantização Aditiva	Vage Egiazarian Andrey Panferov Denis Kuznedelev Elias França outros Artem Babenko Dan Alistarh	, , ,	08.03.2024
YOLOv9	Aprendendo o que você deseja aprender usando informações de gradiente programável	Chien-Yao Wang Eu-Hau Yeh Hong-Yuan Mark Liao	, postagem no blog , , , , ,	05.03.2024
Composição Multi-LoRA	LoRA Switch e LoRA Composite, abordagens que visam superar as técnicas tradicionais em termos de precisão e qualidade de imagem, especialmente em composições complexas	Ming Zhong Ye Long Shen Shuo Hang Wang Yadong Lu outros Yizhu Jiao Siru Ouyang Donghan Yu Jia Wei Han Weizhu Chen	site	03.03.2024
AMARETTO	Inferência multiescala e multimodal de redes reguladoras para identificar circuitos celulares e seus impulsionadores compartilhados e distintos dentro e entre sistemas biológicos de doenças humanas	Nathalie Pochet Olivier Gevaert Mohsen Nabian Jayendra Shinde outros Celine Everaert Thorin Tabor	biocondutor projeto	28.02.2024
LIDA	Ferramenta para gerar visualizações e infográficos independentes de gramática	Victor Dibia	, projeto , ,	06.02.2024
ViT	Arquiteturas Vision Transformer e MLP-Mixer	Alexei Dosovitskiy Lucas Beyer Alexandre Kolesnikov Dirk Weissenborn outros XiaohuaZhai Thomas Unterthiner Mostafa Dehghani Matias Minderer Georg Heigold Sylvain Gelly Jakob Uszkoreit Neil Houlsby	, , , , , , postagem no blog , , , , ,	06.02.2024
Ken Burns Modelo 3D	Uma implementação de referência do efeito 3D Ken Burns a partir de uma única imagem usando PyTorch - dada uma única imagem de entrada, ele anima esta imagem estática com uma varredura de câmera virtual e zoom sujeito a paralaxe de movimento	Manuel Romero		24.01.2024
VALL-E X	Modelo de linguagem de codec neural multilíngue para síntese de fala multilíngue	ZiqiangZhang Longo Zhou Cheng Yi Wang San Yuan Chen outros Yu Wu Shujie Liu Zhuo Chen Yan Qing Liu Huaming Wang Jin Yu Li Lei Ele Sheng Zhao Furu Wei	, , demonstração projeto	19.01.2024
FotoMaker	Método eficiente de geração de texto para imagem personalizado, que codifica principalmente um número arbitrário de imagens de ID de entrada em uma incorporação de ID de pilha para preservar informações de ID	Zhen Li Mingdeng Cao Xintao Wang Zhongang Qi outros Ming-Ming Cheng Ying Shan	, , , , , projeto ,	18.01.2024
DDCor	Método ponta a ponta com decodificadores duplos para colorização de imagens	Xiao Yang Kang Tao Yang Wenqi Ouyang Peiran Ren outros Lingzhi Li Xuansong Xie	,	15.01.2024
PASD	Rede de difusão estável com reconhecimento de pixel para obter Real-ISR robusto, bem como estilização personalizada	Tao Yang Peiran Ren Xuansong Xie Lei Zhang	,	12.01.2024
HandRefiner	Refinando mãos malformadas em imagens geradas por pintura condicional baseada em difusão	Wenquan Lu Yu Fei Xu Jing Zhang Chaoyue Wang Dacheng Tao	, ,	08.01.2024
GráficoCast	Aprendendo previsões meteorológicas globais de médio alcance hábeis	Rémi Lam Álvaro Sanchez-Gonzalez Matheus Willson Peter Wirnsberger outros Meire Fortunato Ferran Alet Suman Ravuri Timo Ewalds Zach Eaton-Rosen Weihuahu Alexandre Merose Stephan Hoyer George Holanda Oriol Vinyals Jacklynn Stott Alexandre Pritzel Shakir Mohamed Pedro Battaglia	dados , , , , , , , ,	04.01.2024
MEE	Modelagem em escala evolutiva: modelos de linguagem pré-treinados para proteínas	Zeming Lin Roshan Rao Brian Hie Zhongkai Zhu outros Alan dos Santos Costa Maryam Fazel-Zarandi Tom Sercu Salvatore Cândido Alexandre Rives Josué Meier Robert Verkuil Jason Liu Chloe Hsu Adam Lerer	Atlas do ESM FSDP ICML dados papel, papel, papel, papel publicado ,	28.12.2023
LLaVA	Large Language and Vision Assistant, um grande modelo multimodal treinado de ponta a ponta que conecta um codificador de visão e LLM para compreensão visual e de linguagem de uso geral	Haotian Liu Chunyuan Li Qingyang Wu Yong Jae Lee Yuheng Li	, , , , demonstração , , , , , , projeto , , , , ,	22.12.2023
Tapete de fundo V2	Técnica de substituição de fundo de alta resolução em tempo real que opera a 30 fps em resolução 4K e 60 fps para HD em uma GPU moderna	Shanchuan Lin Andrei Ryabtsev Soumyadip Sengupta Brian Curless outros Steve Seitz Ira Kemelmacher-Shlizerman	, projeto ,	22.12.2023
Respingos Gaussianos	Qualidade visual de última geração, mantendo tempos de treinamento competitivos e, o que é mais importante, permite uma síntese de visualização inovadora de alta qualidade em tempo real (≥ 100 fps) com resolução de 1080p	Bernard Kerbl Georgios Kopanas Thomas Leimkuhler George Drettakis	projeto , , , , , ,	19.12.2023
SMPLer-X	Ampliando o EHPS para o primeiro modelo de base generalista, com até ViT-Huge como backbone e treinamento com até 4,5 milhões de instâncias de diversas fontes de dados	Zhongang Cai Wan Qi Yin Zeng doente Chen Wei outros Sol Qingping Yanjun Wang Hui En Pang Hai Yi Mei Mingyuan Zhang Lei Zhang Chen Mudança Loy Lei Yang Ziwei Liu	, , projeto ,	18.12.2023
DeepCache	Paradigma livre de treinamento que acelera modelos de difusão na perspectiva da arquitetura de modelos	Xinyin Ma Gongfan Fang Xinchao Wang	projeto	18.12.2023
MagicAnimate	Estrutura baseada em difusão que visa melhorar a consistência temporal, preservar fielmente a imagem de referência e melhorar a fidelidade da animação	Zhongcong Xu JianfengZhang Jun Hao Liew Hanshu Yan outros Jia Wei Liu Chenxu Zhang Jiashi Feng Mike Shou	, , projeto site , ,	18.12.2023
DifBIR	Rumo à restauração cega de imagens com difusão generativa prévia	Xinqi Lin Jingwen Ele Zi Yan Chen Zhaoyang Liu outros Ben Fei Bo Dai Wanli Ouyang Yu Qiao Chao Dong	projeto ,	18.12.2023
ÁudioLDM	Sistema de texto para áudio construído em um espaço latente para aprender as representações contínuas de áudio a partir de latentes contrastantes de pré-treinamento de áudio-linguagem	Haohe Liu Zehua Chen Yi Yuan Xinhao Mei outros Xubo Liu Danilo Mandic Wen Wu Wang Mark Plumbley	, , projeto	12.02.2023
TabPFN	Rede neural que aprendeu a fazer previsão de dados tabulares	Noah Hollmann Samuel Muller Katharina Eggensperger Frank Hutter	, , , , , postagem no blog	29.11.2023
Controles deslizantes de conceito	Adaptadores plug-and-play de baixa classificação aplicados em modelos pré-treinados	Rohit Gandikota Joanna Materzyńska Tingrui Zhou Antonio Torralba David Bau	, projeto	26.11.2023
Qwen-VL	Conjunto de modelos de linguagem visual em grande escala projetados para perceber e compreender textos e imagens	Jinze Bai Shuai Bai Shusheng Yang Shijie Wang outros Sinan Tan Peng Wang Junyang Lin Changzhou Jingren Zhou	, , demonstração , , , , ,	24.11.2023
AnimeGANv3	Rede adversária generativa de cauda dupla para animação fotográfica rápida	Gangue Liu Xin Chen	projeto , , , , ,	23.11.2023
Ítaca	Primeira Rede Neural Profunda para restauração textual, atribuição geográfica e cronológica de inscrições gregas antigas	Yannis Assael Thea Sommerschield Brendan Shillingford Mahyar Bordbar outros João Pavlopoulos Marita Chatzipanagiotou Ion Androutsopoulos Jonathan Praga Nando de Freitas	, projeto	21.11.2023
PixArt-Σ	Treinamento fraco a forte de transformador de difusão para geração de texto para imagem em 4K	Junsong Chen Chongjian Ge Enze Xie Yue Wu outros Lewei Yao Xiao Zhe Ren Zhongdao Wang Ping Luo Huchuan Lu Zhenguo Li	, , , projeto	07.11.2023
Zero123++	Modelo de difusão condicionada por imagem para gerar imagens multivisualização consistentes em 3D a partir de uma única visualização de entrada	Ruoxi Shi Hansheng Chen ZhuoyangZhang Ming Hua Liu outros Chao Xu Xinyue Wei Linghao Chen Chong Zeng Hao Su	, ,	26.10.2023
UniFormerV2	Transformador Unificado para Aprendizagem Eficiente de Representação Espaçotemporal	Kunchang Li Yali Wang Yinan Ele Yizhuo Li outros Yi Wang Limin Wang Yu Qiao	, , , , , , ,	20.10.2023
Mostrar-1	Modelo híbrido, apelidado de Show-1, que combina VDMs baseados em pixels e baseados em latentes para geração de texto para vídeo	David Junhao Zhang Jay Zhangjie Wu Jia Wei Liu Rui Zhao outros Lingmin Ran Yu Chao Gu Difei Gao Mike Zheng Shou	, , , , , projeto	15.10.2023
ÁudioSep	Modelo básico para separação de fontes de áudio de domínio aberto com consultas em linguagem natural	Xubo Liu Qiuqiang-Kong Yan Zhao Haohe Liu outros Yi Yuan Yu Zhuo Liu Rui Xia Yuxuan Wang Mark Plumbley Wen Wu Wang	projeto	12.10.2023
DA-CLIP	Modelo de linguagem de visão com reconhecimento de degradação para melhor transferir modelos de linguagem de visão pré-treinados para tarefas de visão de baixo nível como uma estrutura universal para restauração de imagens	Ziwei Luo Fredrik Gustafsson Zheng Zhao Jens Sjölund Thomas Schön	projeto	11.10.2023
SadTalker	Gera coeficientes de movimento 3D do 3DMM a partir de áudio e modula implicitamente uma nova renderização facial compatível com 3D para geração de falantes	WenxuanZhang Xiaodong Cun Xuan Wang Yong Zhang outros Xi Shen Yu Guo Ying Shan Fei Wang	, , , , , , , projeto , , ,	10.10.2023
Música	Sistema de geração de música que pode ser treinado em centenas de horas de música usando uma única GPU de consumidor e que permite uma geração de música de duração arbitrária muito mais rápida do que em tempo real em uma CPU de consumidor	Marco Pasini Jan Schlüter	, dados , projeto ,	09.10.2023
YOLOv6	Estrutura de detecção de objetos de estágio único dedicada a aplicações industriais	Kaiheng Weng Meng Cheng Yiduo Li Xiangxiangchu Xiao Lin Wei	, postagem no blog dados , , , , , ,	08.10.2023
DreamGaussian	Algoritmo para converter gaussianas 3D em malhas texturizadas e aplicar um estágio de ajuste fino para refinar os detalhes	Jia Xiang Tang Jia Wei Ren Pendure Zhou Ziwei Liu Gangue Zeng	, , projeto	04.10.2023
ÍCONE	Dado um conjunto de imagens, o método estima uma superfície 3D detalhada de cada imagem e depois as combina em um avatar animável	Yuliang Xiu Jin Long Yang Dimitrios Tzionas Michael Negro	, , , , , , , projeto	31.08.2023
DINov2	Produza recursos visuais de alto desempenho que podem ser empregados diretamente com classificadores tão simples quanto camadas lineares em uma variedade de tarefas de visão computacional; esses recursos visuais são robustos e funcionam bem em todos os domínios, sem qualquer necessidade de ajuste fino	Maxime Oquab Timothée Darcet Théo Moutakanni Huy Vo outros Marc Szafraniec Vasil Khalidov Pierre Fernández Daniel Haziza Francisco Massa Alaeldin El-Nouby Mahmoud Assran Nicolas Ballas Wojciech Galuba Russell Howes Po-Yao Huang Shang Wen Li Ishan Misra Michael Rabbat Vasu Sharma Gabriel Sinnaeve Hu Xu Hervé Jegou Julien Mairal Patrick Labatut Armand Joulin Piotr Bojanowski	postagem no blog demonstração , , ,	31.08.2023
OWL-ViT	Detecção simples de objetos de vocabulário aberto com transformadores de visão	Matias Minderer Alexei Gritsenko Pedra de Austin Máximo Neumann outros Dirk Weissenborn Alexei Dosovitskiy Aravindh Mahendran Anurag Arnab Mostafa Dehghani Zhuoran Shen Xiao Wang XiaohuaZhai Thomas Kipf Neil Houlsby		21.08.2023
EstiloGAN3	Redes Adversariais Gerativas Livres de Alias	Tero Karras Miika Aittala Samuli Laine Erik Härkönen outros Jane Hellsten Jaakko Lehtinen Timo Aila	, , , , , , , , , projeto	13.08.2023
DestinoZero	Método de edição zero-shot baseado em texto em vídeos do mundo real, sem treinamento por solicitação ou máscara específica de uso	Chen Yang Qi Xiaodong Cun Yong Zhang Chen Yang Lei outros Xintão Wang Ying Shan Qi Feng Chen	, , projeto vídeo	13.08.2023
Grande GAN	Treinamento GAN em grande escala para síntese de imagens naturais de alta fidelidade	André Brock Jeff Donahue Karen Simonyan		03.08.2023
Lama	Pintura de máscara grande com resolução robusta e convoluções de Fourier	Romano Suvorov Elizaveta Logacheva Anton Mashikhin Anastasia Remizova outros Arsenii Ashukha Aleksei Silvestrov Naejin Kong Harshith Goka Parque Kiwoong Victor Lempitski	, , , projeto	02.08.2023
MakeItTalk	Um método que gera vídeos expressivos de falantes a partir de uma única imagem facial com áudio como única entrada	Yang Zhou Xintong Han Eli Shechtman José Echevarria outros Evangelos Kalogerakis Dingzeyu Li	dados projeto	27.07.2023
HiDT	Um modelo generativo de imagem para imagem e um novo esquema de upsampling que permite aplicar tradução de imagens em alta resolução	Denis Korzhenkov Gleb Sterkin Sergei Nikolenko Victor Lempitski	projeto ,	24.07.2023
CutLER	Abordagem simples para treinar modelos não supervisionados de detecção e segmentação de objetos	Xu Dong Wang Rohit Girdhar Stella Yu Ishan Misra	, projeto	24.07.2023
Reconhecer qualquer coisa e Tag2Text	Estrutura de pré-treinamento de linguagem de visão, que introduz marcação de imagens em modelos de linguagem de visão para orientar o aprendizado de recursos de linguagem visual	Xinyu Huang Youcai Zhang Jinyu Ma Zhao Yang Li outros Yanchun Xie Yu Zhuo Qin Tong Luo Yaqian Li Yandong Guo Yandong Guo Lei Zhang	, , projeto, projeto	09.07.2023
Modelo de movimento spline de placa fina	Estrutura de transferência de movimento não supervisionada de ponta a ponta	Jian Zhao Hui Zhang	, , , suporte	07.07.2023
ArrastarGAN	Arraste seu GAN: manipulação interativa baseada em pontos no coletor de imagens generativas	Panela Xingang Ayush Tewari Thomas Leimkuhler Lingjie Liu outros Abhimitra Meka Cristão Teobalto	projeto	03.07.2023
MóvelSAM	Rumo ao SAM leve para aplicações móveis	ChaoningZhang Dongshen Han Yu Qiao Jung Uk Kim outros Sung-Ho Bae Seungkyu Lee Choong Seon Hong	, , , , , , ,	30.06.2023
Aterramento DINO	Casando DINO com pré-treinamento fundamentado para detecção de objetos em conjunto aberto	Shilong Liu Zhao Yang Zeng Tianhe Ren Feng Li outros Hao Zhang Jie Yang Chunyuan Li Jian Wei Yang Pendure Su Jun Zhu Lei Zhang	, , , , , , , , , , , ,	28.06.2023
T5X	Estrutura modular, combinável e fácil de pesquisar para treinamento, avaliação e inferência de alto desempenho, configurável e de autoatendimento de modelos de sequência em muitas escalas	Adam Roberts Hyung Won Chung Anselmo Levskaya Gaurav Mishra outros James Bradbury Daniel Andor Sharan Narang Brian Lester Colin Gaffney Afroz Mohiuddin Curtis Hawthorne Aitor Lewkowycz Alex Salcianu Marc van Zee Jacó Austin Sebastian Goodman Lívio Baldini Soares Haitang Hu Sasha Tsvyashchenko Aakanksha Chowdhery Jasmijn Bastings Jannis Bulian Xavier Garcia Jianmo Ni Kathleen Kenealy Jonathan Clark Dan Garrette James Lee Thorp Colin Raffel Noam Shazeer Marvin Ritter Maarten Bosma Alexandre Passos Jeremy Maitin-Shepard Noah Fiedel Brennan Saeta Ryan Sepassi Alexandre Spiridonov Josué Newlan Andrea Gesmundo	, , , ,	27.06.2023
Code Talker	Transmitir animação facial orientada por fala como uma tarefa de consulta de código em um espaço proxy finito do livro de códigos aprendido, o que promove efetivamente a vivacidade dos movimentos gerados, reduzindo a incerteza do mapeamento intermodal	[Jinbo Xing] (Jinbo Xing) Menghan Xia YuechenZhang Xiaodong Cun outros Jue Wang Tien-Tsin Wong	, , , , , , , , , , , , , , , projeto	16.06.2023
Modelo de movimento de primeira ordem para animação de imagens	Transferindo movimentos faciais de vídeo para imagem	Aliaksander Siarohin	projeto	04.06.2023
Onda ParalelaGAN	Modelos não autorregressivos de última geração para construir seu próprio excelente vocoder	Tomoki Hayashi	, , demonstração ,	01.06.2023
ECONOMIA	projetado para "Digitalização humana a partir de uma imagem colorida", que combina as melhores propriedades de representações implícitas e explícitas, para inferir humanos vestidos em 3D de alta fidelidade a partir de imagens selvagens, mesmo com roupas largas ou em poses desafiadoras	Yuliang Xiu Jin Long Yang Xu Cao Dimitrios Tzionas Michael Preto	, , , , , , , , ,	31.05.2023
MMS	O projeto Massively Multilingual Speech expande a tecnologia de fala de cerca de 100 idiomas para mais de 1.000, construindo um único modelo de reconhecimento de fala multilíngue que suporta mais de 1.100 idiomas, modelos de identificação de idioma capazes de identificar mais de 4.000 idiomas, modelos pré-treinados que suportam mais de 1.400 idiomas e conversão de texto em modelos de fala para mais de 1100 idiomas	Vinho Pratap Andros Tjandra Bowen Shi Paden Tomasello outros Arun Babu Sayani Kundu Ali Elkahky Zhaoheng Ni Apoorv Vyas Maryam Fazel-Zarandi Alexei Baevski Yossi Adi Xiao Hui Zhang Wei Ning Hsu Alexis Conneau Michael Auli	, , ,	26.05.2023
FABULOSO	Flow AIS Bootstrap usa AIS para gerar amostras em regiões onde o fluxo é uma aproximação pobre do alvo, facilitando a descoberta de novos modos	Laurence Midgley Vicente Stimper Gregor NC Simm Bernhard Schölkopf José Miguel Hernández-Lobato	,	29.04.2023
CodeFormer	Rede de predição baseada em transformador para modelar a composição global e o contexto das faces de baixa qualidade para predição de código, permitindo a descoberta de faces naturais que se aproximam das faces alvo mesmo quando as entradas estão severamente degradadas	Shang Chen Zhou Kelvin Chan Chongyi Li Chen Mudança Loy	, , projeto , , ,	21.04.2023
Text2Video-Zero	Modelos de difusão de texto para imagem são geradores de vídeo Zero-Shot	Levon Khachatryan Andranik Movsisyan Vahram Tadevosyan Roberto Henschel outros Zhang Yang Wang Shant Navasardyan Humphrey Shi	, , , , , projeto vídeo ,	11.04.2023
Segmente qualquer coisa	O modelo Segment Anything produz máscaras de objetos de alta qualidade a partir de prompts de entrada, como pontos ou caixas, e pode ser usado para gerar máscaras para todos os objetos em uma imagem	Alexandre Kirillov Eric Mintun Nikhila Ravi Hanzi Mao outros Chloé Rolland Laura Gustafson Tete Xiao Spencer Whitehead Alex Berg Wan-Yen Lo Piotr Dollár Ross Girshick	dados , site , ,	10.04.2023
Siga sua pose	Esquema de treinamento de dois estágios que pode utilizar pares de pose de imagem e conjuntos de dados de vídeo sem pose e o modelo de texto para imagem pré-treinado para obter vídeos de personagens controláveis por pose	Yue Ma Yingqing Ele Xiaodong Cun Xintão Wang outros Siran Chen Ying Shan Xiu Li Qi Feng Chen	, , , projeto vídeo	07.04.2023
EVA3D	Modelo generativo humano 3D incondicional de alta qualidade que requer apenas coleções de imagens 2D para treinamento	Fangzhou Hong Zhaoxi Chen Yushi Lan Liang Pan Ziwei Liu	projeto ,	06.04.2023
Dreamfusion estável	Usando um modelo de difusão de texto para imagem 2D pré-treinado para realizar a síntese de texto para 3D	Jia Xiang Tang Ben Poole Ajay Jain Jon Barron Ben Mildenhall	, projeto , , ,	04.04.2023
PIFUHD	Função implícita alinhada a pixels multinível para digitalização humana 3D de alta resolução	Shunsuke Saito Tomás Simão Jason Saragih Hanbyul Joo	,	26.03.2023
VídeoReTalking	Sistema para editar os rostos de um vídeo falante do mundo real de acordo com o áudio de entrada, produzindo um vídeo de saída de alta qualidade e sincronização labial, mesmo com uma emoção diferente	Kun Cheng Xiaodong Cun Yong Zhang Menghan Xia outros Fei Yin Mingrui Zhu Xuan Wang Jue Wang Nanan Wang	, , , , projeto , ,	19.03.2023
Bate-papo visualGPT	Conecta ChatGPT e uma série de Visual Foundation Models para permitir o envio e recebimento de imagens durante o bate-papo	Chenfei Wu Sheng Ming Yin Weizhen-Qi Xiao Dong Wang outros Zecheng Tang Nan Duan	, , , ,	15.03.2023
Sintonize um vídeo	Ajuste único de modelos de difusão de imagem para geração de texto para vídeo	Jay Zhangjie Wu Yixiao Ge Xintao Wang Stan Weixian Lei outros Yu Chao Gu Yufei Shi Wynne Hsu Ying Shan Xiao Hu Qie Mike Zheng Shou	, , , projeto ,	23.02.2023
GPEN	Rede incorporada anterior GAN para restauração de rostos cegos na natureza	Tao Yang Peiran Ren Xuansong Xie Lei Zhang	demonstração ,	15.02.2023
PyMAF-X	Abordagem baseada em regressão para recuperação de modelos paramétricos de corpo inteiro a partir de imagens monoculares	Hongwen Zhang Yating Tian Yu Xiang Zhang Mengcheng Li outros Liang An Sol Zhenan Yebin Liu	, , , , projeto	14.02.2023
Difusão Discoteca	Um amálgama frankensteiniano de cadernos, modelos e técnicas para a geração de arte e animações de IA	Max Ingham Adam Letts Daniel Russel Chigozie Nri	, ,	11.02.2023
GrooVAE	Algumas aplicações de aprendizado de máquina para geração e manipulação de batidas e performances de bateria	Jon Gillick Adam Roberts Jessé Engel	postagem no blog dados aplicativo da web	02.02.2023
Música multifaixa VAE	Os modelos deste notebook são capazes de codificar e decodificar compassos únicos de até 8 trilhas, opcionalmente condicionados a um acorde subjacente	Ian Simon Adam Roberts Colin Raffel Jessé Engel outros Curtis Hawthorne Douglas Eck	postagem no blog	02.02.2023
MúsicaVAE	Um modelo hierárquico de vetor latente para aprendizagem de estrutura de longo prazo em música	Adam Roberts Jessé Engel Colin Raffel Curtis Hawthorne Douglas Eck	postagem no blog projeto	02.02.2023
Aprendendo a pintar	Aprendendo a pintar com aprendizado por reforço profundo baseado em modelo	Manuel Romero		01.02.2023
NGP instantâneo	Primitivos gráficos neurais instantâneos com codificação hash multiresolução	Thomas Müller Alex Evans Christoph Schied Alexandre Keller	postagem no blog , , , , projeto tutorial , , ,	18.01.2023
Redes de recursos de Fourier	Os recursos de Fourier permitem que as redes aprendam funções de alta frequência em domínios de baixa dimensão	Mateus Tancik Pratul Srinivasan Ben Mildenhall Sara Fridovich Keil outros Nithin Raghavan Utkarsh Singhal Ravi Ramamoorthi Jon Barron Ren Ng	, projeto	17.01.2023
AlfaPose	Estimativa e rastreamento regional de pose multipessoal de corpo inteiro em tempo real	Hao-Shu Fang Jiefeng Li Hong Yang Tang Chao Xu outros Haoyi Zhu Yuliang Xiu Yong-Lu Li Cewu Lu	, projeto , , ,	07.01.2023
HybrIK	Solução híbrida de cinemática inversa analítica-neural para estimativa de pose e forma humana em 3D	Jiefeng Li Chao Xu Zhicun Chen Siyuan Bian outros Lixin Yang Cewu Lu	projeto suporte	01.01.2023
Pontuação do encadeamento jacobiano	Aplicar a regra da cadeia nos gradientes aprendidos e propagar retroativamente a pontuação de um modelo de difusão através do Jacobiano de um renderizador diferenciável, que instanciamos como um campo de radiância de voxel	Hao Chen Wang Xiaodan Du Jiahao Li Raimundo Sim Greg Shakhnarovich	, projeto ,	12/05/2022
Democs	Espectrograma Híbrido e Separação de Fonte de Forma de Onda	Alexandre Défossez	, , , , , ,	21.11.2022
EstiloCLIP	Manipulação baseada em texto do StyleGAN Imager	Ou patashnik Zongze Wu Eli Shechtman Daniel Cohen-Or Dani Lischinsky	, , , ,	30.10.2022
Movimento Difuso	A primeira estrutura de geração de movimento orientada por texto baseada em modelo de difusão, que demonstra várias propriedades desejadas em relação aos métodos existentes	Mingyuan Zhang Zhongang Cai Liang Pan Fangzhou Hong outros Xinying Guo Lei Yang Ziwei Liu	projeto	13.10.2022
VToonify	Aproveita as camadas de média e alta resolução do StyleGAN para renderizar retratos artísticos de alta qualidade com base nos recursos de conteúdo em várias escalas extraídos por um codificador para preservar melhor os detalhes do quadro	Shuai Yang Liming Jiang Ziwei Liu Chen Mudança Loy	, , , , projeto	07.10.2022
PyMAF	Loop de feedback de alinhamento de malha piramidal em rede de regressão para recuperação de malha corporal bem alinhada e estendê-lo para a recuperação de modelos expressivos de corpo inteiro	Hongwen Zhang Yating Tian Yu Xiang Zhang Mengcheng Li outros Liang An Sol Zhenan Yebin Liu	, , , , projeto ,	06.10.2022
Alfa Tensor	Descobrindo algoritmos de multiplicação de matrizes mais rápidos com aprendizagem por reforço	Alhussein Fawzi Matej Balog Aja Huang Thomas Hubert outros Bernardino Romera-Paredes Mohammadamin Barekatain Alexandre Novikov Francisco Ruiz Julian Schrittwieser Grzegorz Swirszcz David Prata Demis Hassabis Pushmeet Kohli	, , ,	04.10.2022
Swin2SR	Novel Swin Transformer V2, para melhorar o SwinIR para super-resolução de imagem e, em particular, o cenário de entrada compactada	Marcos Conde Ui-Jin Choi Maxime Burchi Radu Timofte	, , , , , , ,	03.10.2022
Função	Dos dados à função: seu ponto de dados é uma função e você pode tratá-lo como tal	Emilien Dupont Hyunjik Kim Ali Eslami Daniel Rezende Dan Rosenbaum	,	24.09.2022
Sussurrar	Sistema automático de reconhecimento de fala treinado em 680.000 horas de dados supervisionados multilíngues e multitarefa coletados da web	Alec Radford Jong-wook Kim Tao Xu Greg Brockman outros Christine McLeavey Ilya Sutskever	postagem no blog , ,	21.09.2022
DeOldify (vídeo)	Colorir seus próprios vídeos!	Jason Antic	, modelo , site ,	19.09.2022
DeOldify (foto)	Colorir suas próprias fotos!	Jason Antic Matt Robinson Maria Benavente	, modelo site	19.09.2022
Real-ESRGAN	Estenda o poderoso ESRGAN para uma aplicação prática de restauração, que é treinada com dados sintéticos puros	Xintão Wang Liang Bin Xie Chao Dong Ying Shan	, , , ,	18.09.2022
IDE-3D	Edição interativa desembaraçada para síntese de retratos com reconhecimento de 3D de alta resolução	Sol Jingxiang Xuan Wang Yichun Shi Lizhen Wang outros Jue Wang Yebin Liu	, , ,	08.09.2022
Transformadores de decisão	Uma arquitetura que lança o problema de RL como modelo de sequência condicional Expandir Informações adicionais Versão 1.0.0 Tipo Outro código-fonte Data da Última Atualização 2024-12-27 tamanho 804.02KB Vindo de Github Aplicativos Relacionados awesome citygml 2024-11-13 awesome generative ai guide 2024-11-05 GitHub sgrebnov/cordova plugin background download 2024-11-05 awesome swift 2024-11-03 Jogo incrível do diabo 2023-04-16 O anúncio incrível 2022-08-08 Recomendado para você chat.petals.dev Outro código-fonte 1.0.0 GPT Prompt Templates Outro código-fonte 1.0.0 GPTyped Outro código-fonte GPTyped 1.0.5 waymo open dataset Outro código-fonte December 2023 Update SmartTube Outro código-fonte 24.71 Stable Sunamu Outro código-fonte Release 2.2.0 waymo open dataset Outro código-fonte December 2023 Update termwind Outras categorias v2.3.0 wp functions Outras categorias 1.0.0 Informações Relacionadas Todos Como consertar a gagueira em Stalker 2: Heart of Chornobyl 2024-11-23 Onde está o Juice WRLD em Fortnite? 2024-11-23 Como iniciar a expansão do Wild Card em Star Wars Outlaws 2024-11-23 Pequim adiciona uma nova instituição de P&D para melhorar a segurança da inteligência artificial e o layout de governança 2024-11-22 Seminário aberto em Xangai, Guterres participou, e a proposta da China de cooperar para fortalecer a capacitação em inteligência artificial foi adotada pela Assembleia Geral das Nações Unidas 2024-11-22 Construa uma estrutura de inteligência artificial para encontrar a lisozima mais eficaz 2024-11-22 Grandes modelos de IA entram no primeiro ano de aplicação As instituições financeiras estão a aumentar os seus esforços para construir um novo ecossistema de poder de computação inteligente. 2024-11-22 MiniMax Yan Junjie: Rápido é bom para modelos grandes, mas às vezes lento é apenas para ser mais rápido. 2024-11-22 A inteligência artificial entra no campus para iluminar os sonhos científicos dos alunos 2024-11-22 A inteligência artificial ativa a fabricação para o consumidor e os equipamentos de ginástica Yongkang vendem bem nos mercados interno e externo 2024-11-22 Nvidia investe no financiamento Série B da Sakana AI para ajudar a desenvolver inteligência artificial generativa 2024-11-22 A IA está desbloqueando uma nova revolução cognitiva! Leitura universal do novo curso geral de ciência e tecnologia, cronograma de desenvolvimento de inteligência artificial: fazer um vídeo em 2028, escrever um livro best-seller em 2049... 2024-11-22 Products & Services Install APK APK signature verification APK Download Service Company Developer Console Submit APK Monetization of traffic through downcodes Legal About us Contact Us Cooperation [email protected]