Descarga de awesome colab notebooks - awesome colab notebooks Descarga del código fuente

Es posible que la página no se muestre correctamente. Abra el archivo README.md directamente

Impresionante colección de cuadernos de colaboración para experimentos de aprendizaje automático

Tendencia

repositorios	papeles
facebookresearch/co-rastreador iterativo/cadena de datos callummcdougall/ARENA_3.0 Al Principio/PuLID ZhengPeng7/BiRefNet ultralíticos/ultralíticos unslothai/unsloth facebookresearch/segmento-cualquier cosa-2 lllyasviel/IC-Light gemelo-ai/vocos cómodoanónimo/ComfyUI TransformerLensOrg/TransformerLens HongwenZhang/PyMAF-X roboflow/supervisión KwaiVGI/LivePortrait piddnad/DDColor TencentARC/InstantMesh LAION-AI/predictor-estético Doubiiu/DynamiCrafter facebookresearch/robot-doméstico KillianLucas/intérprete abierto jxnl/instructor	LIDA Salpicadura gaussiana Sintonizar un video Sigue tu pose Text2Video-Cero GLIP UniFormerV2 tristehablador BÚHO-ViT VideoRehablando LDM Campos de ensueño detic GraphCast ArrastrarGAN VRT Modelo de movimiento spline de placa delgada PyMAF-X destinocero py-irt Difusión VQ economía

repositorios

papeles

facebookresearch/co-rastreador
iterativo/cadena de datos
callummcdougall/ARENA_3.0
Al Principio/PuLID
ZhengPeng7/BiRefNet
ultralíticos/ultralíticos
unslothai/unsloth
facebookresearch/segmento-cualquier cosa-2
lllyasviel/IC-Light
gemelo-ai/vocos
cómodoanónimo/ComfyUI
TransformerLensOrg/TransformerLens
HongwenZhang/PyMAF-X
roboflow/supervisión
KwaiVGI/LivePortrait
piddnad/DDColor
TencentARC/InstantMesh
LAION-AI/predictor-estético
Doubiiu/DynamiCrafter
facebookresearch/robot-doméstico
KillianLucas/intérprete abierto
jxnl/instructor

LIDA
Salpicadura gaussiana
Sintonizar un video
Sigue tu pose
Text2Video-Cero
GLIP
UniFormerV2
tristehablador
BÚHO-ViT
VideoRehablando
LDM
Campos de ensueño
detic
GraphCast
ArrastrarGAN
VRT
Modelo de movimiento spline de placa delgada
PyMAF-X
destinocero
py-irt
Difusión VQ
economía

Investigación

nombre	descripción	autores	campo de golf	actualizar
CoTracker	Arquitectura que rastrea conjuntamente múltiples puntos a lo largo de un video completo.	Nikita Karaev Ignacio Rocco Benjamín Graham Natalia Neverova otros Andrea Vedaldi Christian Rupprecht	, proyecto	16.10.2024
PIFu	Función implícita alineada con píxeles para la digitalización humana vestida de alta resolución	ryota natsume Saito Shunsuke Zeng Huang Angjoo Kanazawa hao li		08.10.2024
cara difusa	Método que es capaz de hacer frente a degradaciones complejas e invisibles con mayor elegancia sin diseños de pérdidas complicados.	Zongsheng Yue Chen Cambio Loy	, , ,	05.10.2024
Segmentar cualquier cosa 2	Modelo básico para resolver la segmentación visual rápida en imágenes y vídeos.	Nikhila Ravi Valentin Gabeur Yuan Ting Hu Ronghang Hu otros Chaitanya Ryali Tengyu Ma Haitham Khedr Rädle romano Chloé Rolland Laura Gustafson Eric Mintún Bandeja de juntas [Kalyan Vasudev](lwala](https://scholar.google.co.in/citations?user=m34oaWEAAAAJ) Nicolás Carión [Chao-Yuan](u](https://chaoyuan.org/) Ross Girshick Piotr Dollár Christoph Feichtenhofer	manifestación , , proyecto , , ,	01.10.2024
Abrir-desmezclar	Una implementación de referencia de red neuronal profunda para la separación de fuentes musicales, aplicable para investigadores, ingenieros de audio y artistas.	Fabián-Robert Stöter Antonio Liutkus	datos proyecto	25.09.2024
Armonización pictórica profunda	El algoritmo produce resultados significativamente mejores que la composición de fotografías o las técnicas de estilización global y permite realizar ediciones pictóricas creativas que de otro modo serían difíciles de lograr.	Fujian Luan Sylvain París Eli Shechtman Kavita Bala	, , ,	23.09.2024
audio2fotorreal	Marco para generar avatares fotorrealistas con cuerpo que gesticulan de acuerdo con la dinámica conversacional de una interacción diádica.	Evonne Ng Javier Romero Timur Bagautdinov shaojie bai otros Trevor Darrell Angjoo Kanazawa Alejandro Ricardo	proyecto	13.09.2024
Segmente rápidamente cualquier cosa	CNN Segment Anything Model entrenado utilizando solo el 2% del conjunto de datos SA-1B publicado por los autores de SAM	Xu Zhao Wenchao Ding Yongqian Yinglong Du otros tao yu Min Li Ming Tang Jinqiao Wang	, , ,	10.09.2024
Neuralangelo	Marco para la reconstrucción de superficies 3D de alta fidelidad a partir de capturas de vídeo RGB	Zhao Shuo Li Thomas Müller Alex Evans Russell Taylor otros Mathias Unberath Ming Yu Liu Chen-Hsuan Lin	publicación de blog proyecto , ,	02.09.2024
BiRefNet	Marco de referencia bilateral para la segmentación de imágenes dicotómicas de alta resolución.	Peng Zheng De Hong Gao Fanático de Deng Ping Li Liu otros Jorma Laaksonen Wanli Ouyang Nicu Sebe	, , , , proyecto , ,	23.08.2024
GIRAR	Aprender a reconstruir la pose y la forma humana en 3D mediante el ajuste de modelos en el bucle	Nikos Kolotouros Georgios Pavlakos miguel negro Kostas Daniilidis	, proyecto	21.08.2024
YOLOv10	Apuntar a avanzar aún más en el límite rendimiento-eficiencia de los YOLO tanto desde la arquitectura de postprocesamiento como de modelo.	Ao Wang Hui-chen Kai-chen Zijia Lin otros Jungong Han Guiguang Ding	publicación de blog manifestación , , , , , , , , , , , , ,	20.08.2024
especificaciónVQGAN	Domar la generación de sonido guiada visualmente reduciendo un conjunto de datos de entrenamiento a un conjunto de vectores representativos	Vladimir Yashin Esa Rahtu	, , , , , , , , proyecto , ,	12.07.2024
Retrato en vivo	Marco de animación de retratos basado en vídeo centrado en una mejor generalización, controlabilidad y eficiencia para uso práctico.	Jianzhu Guo Dingyun Zhang Xiaoqiang Liu Zhizhou Zhong otros Yuan Zhang Peng Fei Wan Di Zhang	, , , , proyecto , , , , ,	10.07.2024
TAPIR	Seguimiento de cualquier punto con inicialización por cuadro y refinamiento temporal	Carl Dörsch Yi Yang Mel Vecerik Dilara Gokay otros Ankush Gupta Yusuf Aytar Joao Carreira Andres Zisserman	, entrada de blog, entrada de blog ,	05.07.2024
Wav2Labio	Un experto en sincronización de labios es todo lo que necesita para la generación de voz a labios en la naturaleza	Prajwal Renukanand Rudrabha Mukhopadhyay Vinay Namboodiri CV Jawahar	datos manifestación proyecto	27.06.2024
Corte Profundo	Método eficiente para la estimación de pose sin marcadores basado en el aprendizaje por transferencia con redes neuronales profundas que logra excelentes resultados con mínimos datos de entrenamiento.	Alejandro Mathis Pranav Mamidanna Kevin Cury Taiga Abe otros Venkatesh Murthy Mackenzie Mathis Matthias Bethge	, , , , , foro , sitio web , ,	05.06.2024
piscinaEx	MetaFormer es realmente lo que necesita para tener visión	Weihao Yu Mi Luo Pan Zhou Chenyang Si otros Yichen Zhou Xinchao Wang Jiashi Feng Shuicheng Yan	, ,	01.06.2024
HistoriaDifusión	Una forma de cálculo de la autoatención, denominada autoatención consistente, que aumenta significativamente la coherencia entre las imágenes generadas y aumenta los modelos de texto a imagen preentrenados prevalentes basados en difusión de una manera de disparo cero.	Yupeng Zhou Daquan Zhou Ming Ming Cheng Jiashi Feng Qibin Hou	proyecto ,	04.05.2024
PULID	Personalización de ID pura y Lightning, un método de personalización de ID sin ajustes para la generación de texto a imagen	Zinan Guo Yanze Wu Zhuowei Chen Lang Chen Qian He	, ,	03.05.2024
PELÍCULA	Un algoritmo de interpolación de fotogramas que sintetiza múltiples fotogramas intermedios a partir de dos imágenes de entrada con un gran movimiento intermedio.	Fitsum Reda Janne Kontkanen Eric Tabellion sol de deqing otros Carolina Pantofaru Brian Curless	datos, datos, datos proyecto , ,	03.05.2024
VozCraft	Modelo de lenguaje de códec neuronal con relleno de tokens, que logra un rendimiento de vanguardia tanto en la edición de voz como en la conversión de texto a voz en audiolibros, vídeos de Internet y podcasts.	Puyuanpeng Po-Yao Huang Shang-Wen Li Abdelrahman Mohamed David Harwath	proyecto , ,	21.04.2024
Ánimo	Método para la transferencia de material de disparo cero a un objeto en la imagen de entrada dada una imagen ejemplar de material	Ta-Ying Cheng Prafull Sharma Andres Markham Niki Trigoni Varun Jampani	, proyecto	16.04.2024
malla instantánea	Marco de avance para la generación instantánea de mallas 3D a partir de una sola imagen, con calidad de generación de última generación y una escalabilidad de entrenamiento significativa.	Jiale Xu Weihao Cheng Yiming Gao Xintao Wang otros Shenghua Gao Ying Shan	, ,	16.04.2024
AlfaFold	Predicción de la estructura de proteínas de alta precisión	Juan saltador Richard Evans Alejandro Pritzel Tim Green otros miguel figurnov Olaf Ronneberger Kathryn Tunyasuvunakool Russ Bates Agustín Žídek Anna Potapenko Alex Bridgland Clemente Meyer Simón Kohl Andrés Ballard Bernardino Romera Paredes Stanislav Nikólov rishub jainista	entrada de blog, entrada de blog , papel ,	15.04.2024
Würstchen	Arquitectura para síntesis de texto a imagen que combina un rendimiento competitivo con una rentabilidad sin precedentes para modelos de difusión de texto a imagen a gran escala.	Pablo Pernías Dominic Rampas Mats Richter Cristóbal Pal Marc Aubreville		04.06.2024
AQLM	Compresión extrema de modelos de lenguaje grandes mediante cuantificación aditiva	Vage Egiazarian Andréi Panferov Denis Kuznedelev Elias Frantar otros Artem Babenko Dan Alistarh	, , ,	08.03.2024
YOLOv9	Aprenda lo que quiere aprender utilizando información de gradiente programable	Chien-Yao Wang I-Hau Yeh Hong-Yuan Mark Liao	, publicación de blog , , , , ,	05.03.2024
Composición multi-LoRA	LoRA Switch y LoRA Composite, enfoques que pretenden superar las técnicas tradicionales en términos de precisión y calidad de imagen, especialmente en composiciones complejas	Ming Zhong Yelong Shen Shuohang Wang Yadong Lu otros Yizhu Jiao Siru Ouyang Dong Han Yu Jia Wei Han Weizhu Chen	sitio web	03.03.2024
AMARETTO	Inferencia multiescala y multimodal de redes regulatorias para identificar circuitos celulares y sus impulsores compartidos y distintos dentro y entre sistemas biológicos de enfermedades humanas.	Nathalie Pochet Olivier Gevaert Mohsen Nabian Jayendra Shinde otros Celine Everaert Thorin Tabor	bioconductor proyecto	28.02.2024
LIDA	Herramienta para generar visualizaciones e infografías independientes de la gramática	Víctor Dibia	, proyecto , ,	06.02.2024
ViT	Arquitecturas Vision Transformer y MLP-Mixer	Alexey Dosovitskiy Lucas Beyer Alexánder Kolésnikov Dirk Weissenborn otros Xiaohua Zhai Thomas Unterthiner Mostafa Dehghani Matthias Minderer Georg Heigold Sylvain Gelly Jakob Uszkoreit Neil Houlsby	, , , , , , publicación de blog , , , , ,	06.02.2024
Ken quema 3D	Una implementación de referencia del efecto 3D Ken Burns a partir de una sola imagen usando PyTorch: dada una única imagen de entrada, anima esta imagen fija con un escaneo de cámara virtual y un zoom sujeto al paralaje de movimiento.	manuel romero		24.01.2024
VALLE-E X	Modelo de lenguaje de códec neuronal multilingüe para síntesis de voz multilingüe	Ziqiang Zhang Zhou largo Cheng Yi Wang San Yuan Chen otros Yu Wu Shujie Liu Zhuo Chen Yanqing Liu Hua Ming Wang Jinyu Li Lei He Sheng Zhao Wei Wei	, , manifestación proyecto	19.01.2024
creador de fotos	Método eficiente y personalizado de generación de texto a imagen, que codifica principalmente un número arbitrario de imágenes de identificación de entrada en una pila de identificación de identificación para preservar la información de identificación.	zhen li Mingdeng Cao Xintao Wang Zhongang Qi otros Ming Ming Cheng Ying Shan	, , , , , proyecto ,	18.01.2024
DDColor	Método de extremo a extremo con decodificadores duales para colorear imágenes	Xiao Yang Kang Tao Yang Wenqi Ouyang Peiran Ren otros Lingzhi Li Xie Xie	,	15.01.2024
PASADO	Red de difusión estable con reconocimiento de píxeles para lograr un Real-ISR sólido y una estilización personalizada	Tao Yang Peiran Ren Xie Xie Lei Zhang	,	12.01.2024
Refinador manual	Refinamiento de manos malformadas en imágenes generadas mediante pintura interna condicional basada en difusión	Wenquan Lu Yufei Xu Jing Zhang Chao Yue Wang Dacheng Tao	, ,	08.01.2024
GraphCast	Aprender pronósticos meteorológicos globales hábiles a medio plazo	Rémi Lam Álvaro Sánchez-González Mateo Wilson Peter Wirnsberger otros Meire Fortunato Ferran Alet Suman Ravuri Timo Ewalds Zach Eaton-Rosen Wei Hua Hu Alejandro Meros Esteban Hoyer jorge holanda Oriol Vinyals Jacklynn Stott Alejandro Pritzel shakir mohamed Peter Battaglia	datos , , , , , , , ,	04.01.2024
MEDE	Modelado a escala evolutiva: modelos de lenguaje previamente entrenados para proteínas	Zeming Lin Roshan Rao Brian Hie Zhongkai Zhu otros Allan dos Santos Costa Maryam Fazel-Zarandi Tom Sercu Salvatore Cándido Alejandro Rives Josué Meier Robert Verkuil Jason Liu Chloe Hsu Adam Lerer	Atlas del MEDE FSDP ICML datos papel, papel, papel, papel publicado ,	28.12.2023
LLaVA	Large Language and Vision Assistant, un gran modelo multimodal entrenado de extremo a extremo que conecta un codificador de visión y un LLM para la comprensión visual y del lenguaje de uso general	Haotian Liu Chunyuan Li Qingyang Wu Yong Jae Lee Yuheng Li	, , , , manifestación , , , , , , proyecto , , , , ,	22.12.2023
Estera de fondo V2	Técnica de reemplazo de fondo de alta resolución en tiempo real que funciona a 30 fps en resolución 4K y 60 fps en HD en una GPU moderna.	Shan Chuan Lin Andrei Riabtsev Soumyadip Sengupta Brian Curless otros Steve Seitz Ira Kemelmacher-Shlizerman	, proyecto ,	22.12.2023
Salpicadura gaussiana	Calidad visual de última generación manteniendo tiempos de entrenamiento competitivos y, lo que es más importante, permite una síntesis de vistas novedosas de alta calidad en tiempo real (≥ 100 fps) con una resolución de 1080p.	Bernhard Kerbl Georgios Kopanas Thomas Leimkühler George Drettakis	proyecto , , , , , ,	19.12.2023
SMPLer-X	Ampliar EHPS hacia el primer modelo básico generalista, con hasta ViT-Huge como columna vertebral y capacitación con hasta 4,5 millones de instancias de diversas fuentes de datos.	Zhongang Cai Wanqi Yin Zeng enfermo Chen Wei otros Sol Qingping Yan Jun Wang Hui En Pang Haiyi Mei Mingyuan Zhang Lei Zhang Chen Cambio Loy Lei Yang Ziwei Liu	, , proyecto ,	18.12.2023
caché profundo	Paradigma sin entrenamiento que acelera los modelos de difusión desde la perspectiva de la arquitectura de modelos.	Xin Yin Ma Colmillo Gongfan Xinchao Wang	proyecto	18.12.2023
MagiaAnimar	Marco basado en difusión que tiene como objetivo mejorar la coherencia temporal, preservar fielmente la imagen de referencia y mejorar la fidelidad de la animación.	Zhongcong Xu Jian Feng Zhang Jun Hao Liew Han Shu Yan otros Jia Wei Liu Chenxu Zhang Jiashi Feng mike shou	, , proyecto sitio web , ,	18.12.2023
DiffBIR	Hacia la restauración de imágenes a ciegas con difusión generativa previa	Xinqi Lin Jingwen He Ziyan Chen Zhaoyang Lyu otros ben fei bo dai Wanli Ouyang Yu Qiao chao dong	proyecto ,	18.12.2023
AudioLDM	Sistema de texto a audio que se basa en un espacio latente para aprender las representaciones de audio continuas a partir de latentes de preentrenamiento de audio y lenguaje contrastivo.	Haohe Liu Zehua Chen yi yuan Xinhao Mei otros Xubo Liu Danilo Mandic Wen Wu Wang Marcos Plumbley	, , proyecto	02.12.2023
PestañaPFN	Red neuronal que aprendió a hacer predicciones de datos tabulares	Noah Hollmann Samuel Muller Katharina Eggensperger franco hutter	, , , , , publicación de blog	29.11.2023
Controles deslizantes conceptuales	Adaptadores plug-and-play de bajo rango aplicados sobre modelos previamente entrenados	Rohit Gandikota Joanna Materzyńska Tingrui Zhou Antonio Torralba David Bau	, proyecto	26.11.2023
Qwen-VL	Conjunto de modelos visión-lenguaje a gran escala diseñados para percibir y comprender tanto texto como imágenes.	Jinze Bai Shuaibai Shusheng Yang Shijie Wang otros Sinan Tan Peng Wang Jun Yang Lin Chang Zhou Jingren Zhou	, , manifestación , , , , ,	24.11.2023
AnimeGANv3	Red adversarial generativa de doble cola para una rápida animación fotográfica	Gang Liu Xin Chen	proyecto , , , , ,	23.11.2023
Ítaca	Primera Red Neural Profunda para la restauración textual, atribución geográfica y cronológica de inscripciones griegas antiguas	Yannis Assael Teresa Sommerschield Brendan Shillingford Mahyar Bordbar otros Juan Pavlopoulos Marita Chatzipanagiotou Ion Androutsopoulos Jonathan Praga Nando de Freitas	, proyecto	21.11.2023
PixArt-Σ	Entrenamiento de débil a fuerte del transformador de difusión para la generación de texto a imagen 4K	Junsong Chen Chongjian Ge Enze Xie Yue Wu otros Le Wei Yao Xiaozhe Ren Zhongdao Wang Ping-luo Hu Chuan Lu Zhenguo Li	, , , proyecto	07.11.2023
Cero123++	Modelo de difusión condicionada por imágenes para generar imágenes multivista consistentes en 3D desde una única vista de entrada	Ruoxi Shi Hansheng Chen Zhuoyang Zhang Minghua Liu otros Chao Xu Xin Yue Wei Linghao Chen Chong Zeng hao su	, ,	26.10.2023
UniFormerV2	Transformador unificado para un aprendizaje eficiente de la representación espaciotemporal	Kunchang Li Yali Wang yinan él Yizhuo Li otros yi wang Limin Wang Yu Qiao	, , , , , , ,	20.10.2023
Mostrar-1	Modelo híbrido, denominado Show-1, que combina VDM basados en píxeles y basados en latentes para la generación de texto a vídeo.	David Junhao Zhang Jay Zhang Jie Wu Jia Wei Liu Rui Zhao otros Ling Min Ran Yuchao Gu Difei Gao Mike Zheng Shou	, , , , , proyecto	15.10.2023
Audioseptiembre	Modelo básico para la separación de fuentes de audio de dominio abierto con consultas en lenguaje natural	Xubo Liu Qiuqiang Kong Yan Zhao Haohe Liu otros yi yuan Yuzhuo Liu Rui Xia Yuxuan Wang Marcos Plumbley Wen Wu Wang	proyecto	12.10.2023
DA-CLIP	Modelo de visión-lenguaje consciente de la degradación para transferir mejor modelos de visión-lenguaje previamente entrenados a tareas de visión de bajo nivel como marco universal para la restauración de imágenes	Ziwei Luo Fredrik Gustafsson Zheng Zhao Jens Sjölund Thomas Schön	proyecto	11.10.2023
tristehablador	Genera coeficientes de movimiento 3D del 3DMM a partir de audio y modula implícitamente un novedoso renderizado de rostros con reconocimiento 3D para la generación de cabezas parlantes.	Wenxuan Zhang Xiao Dong Cun Wang Xuan Yong Zhang otros Xi Shen Yu Guo Ying Shan Wang Fei	, , , , , , , proyecto , , ,	10.10.2023
música	Sistema de generación de música que se puede entrenar con cientos de horas de música utilizando una única GPU de consumo, y que permite una generación mucho más rápida que en tiempo real de música de duración arbitraria en una CPU de consumo.	Marco Pasini Jan Schlüter	, datos , proyecto ,	09.10.2023
YOLOv6	Marco de detección de objetos de una sola etapa dedicado a aplicaciones industriales	Kaiheng Weng Meng Cheng Yiduo Li Xiangxiang Chu Xiaolin Wei	, publicación de blog datos , , , , , ,	08.10.2023
SueñoGaussiano	Algoritmo para convertir gaussianos 3D en mallas texturizadas y aplicar una etapa de ajuste para refinar los detalles	Jiaxiang Tang Jia Wei Ren colgar zhou Ziwei Liu Pandilla Zeng	, , proyecto	04.10.2023
ICONO	Dado un conjunto de imágenes, el método estima una superficie 3D detallada de cada imagen y luego las combina en un avatar animable.	Yuliang Xiu Jinlong Yang Dimitrios Tzionas miguel negro	, , , , , , , proyecto	31.08.2023
DINOV2	Produzca características visuales de alto rendimiento que puedan emplearse directamente con clasificadores tan simples como capas lineales en una variedad de tareas de visión por computadora; Estas características visuales son sólidas y funcionan bien en todos los dominios sin ningún requisito de ajuste.	Maxime Oquab Timothée Darcet Théo Moutakani Huy-Vo otros Marc Szafraniec Vasil Khalidov Pedro Fernández Daniel Haziza francisco masa Alaaeldin El-Nouby Mahmoud Assran Nicolás Ballas Wojciech Galuba Russell Howes Po-Yao Huang Shang-Wen Li Ishan Misra michael rabbat Vasu Sharma Gabriel Synnaeve Hu Xu Hervé Jegou Julien Mairal Patricio Labatut Armand Joulin Piotr Bojanowski	publicación de blog manifestación , , ,	31.08.2023
BÚHO-ViT	Detección simple de objetos de vocabulario abierto con transformadores de visión	Matthias Minderer Alexey Gritsenko piedra austin Máximo Neumann otros Dirk Weissenborn Alexey Dosovitskiy Aravindh Mahendran Anurag Arnab Mostafa Dehghani Zhuoran Shen Xiao Wang Xiaohua Zhai Thomas Kipf Neil Houlsby		21.08.2023
EstiloGAN3	Redes adversarias generativas sin alias	Tero Karras Miika Aitala Samuli Laine Erik Härkönen otros Janne Hellsten Jaakko Lehtinen Timo Aila	, , , , , , , , , proyecto	13.08.2023
destinocero	Método de edición de texto de toma cero en videos del mundo real sin capacitación por indicación ni máscara de uso específico	Chen Yang Qi Xiao Dong Cun Yong Zhang Chen Yang Lei otros Xintao Wang Ying Shan Qi Feng Chen	, , proyecto video	13.08.2023
Gran GAN	Entrenamiento GAN a gran escala para síntesis de imágenes naturales de alta fidelidad	andres brock Jeff Donahue Karen Simonyan		03.08.2023
Lama	Pintura de máscara grande de resolución robusta con convoluciones de Fourier	Roman Suvorov Elizaveta Logacheva Antón Mashikhin Anastasia Remizova otros Arsenio Ashuja Alexéi Silvestrov Naejin Kong Harshith Goka Parque Kiwoong Víctor Lempitsky	, , , proyecto	02.08.2023
Hazlo hablar	Un método que genera vídeos expresivos de cabezas parlantes a partir de una única imagen facial con audio como única entrada.	Yang Zhou Xintong Han Eli Shechtman José Echevarría otros Evangelos Kalogerakis Dingzeyu Li	datos proyecto	27.07.2023
HiDT	Un modelo generativo de imagen a imagen y un nuevo esquema de muestreo que permite aplicar la traducción de imágenes en alta resolución.	Denis Korzhenkov Gleb Sterkin Serguéi Nikolenko Víctor Lempitsky	proyecto ,	24.07.2023
Cuchillero	Enfoque simple para entrenar modelos de segmentación y detección de objetos no supervisados	Xu Dong Wang Rohit Girdhar Estela Yu Ishan Misra	, proyecto	24.07.2023
Reconocer cualquier cosa y Tag2Text	Marco de preentrenamiento del lenguaje visual, que introduce el etiquetado de imágenes en modelos de lenguaje visual para guiar el aprendizaje de características visual-lingüísticas.	Xin Yu Huang Yucai Zhang Jinyu Ma Zhaoyang Li otros Yan Chun Xie Yu Zhuo Qin Tongluo Yaqian Li Yandong Guo Yandong Guo Lei Zhang	, , proyecto, proyecto	09.07.2023
Modelo de movimiento spline de placa delgada	Marco de transferencia de movimiento no supervisado de un extremo a otro	Jian Zhao Hui Zhang	, , , apoyo	07.07.2023
ArrastrarGAN	Arrastre su GAN: manipulación interactiva basada en puntos en el colector de imágenes generativas	Pan Xingang Ayush Tewari Thomas Leimkühler Lingjie Liu otros Abhimitra Meka cristiano teobaldo	proyecto	03.07.2023
MóvilSAM	Hacia SAM ligero para aplicaciones móviles	Zhang Chao Dongshen Han Yu Qiao Jung Uk Kim otros Sung Ho Bae Seungkyu Lee Choong Seon Hong	, , , , , , ,	30.06.2023
Puesta a tierra DINO	Casarse con DINO con entrenamiento previo conectado a tierra para la detección de objetos en conjunto abierto	Shilong Liu Zhaoyang Zeng Tian He Ren Feng Li otros Hao Zhang Jie Yang Chunyuan Li Jian Wei Yang colgar su Jun Zhu Lei Zhang	, , , , , , , , , , , ,	28.06.2023
T5X	Marco modular, componible y apto para la investigación para capacitación, evaluación e inferencia de autoservicio, configurable y de alto rendimiento de modelos de secuencia en muchas escalas.	Adam Roberts Hyung Won Chung Anselmo Levskaya Gaurav Mishra otros James Bradbury Daniel Andor Sharan Narang Brian Lester Colin Gaffney Afroz Mohiuddin Curtis Hawthorne Aitor Lewkowycz Alex Salciano Marc van Zee Jacob Austin Sebastián Goodman Livio Baldini Soares Haitang Hu Sasha Tsviashchenko Aakanksha Chowdhery Jasmijn Bastings Jannis Bulian Xavier García Jian Mo Ni Kathleen Kenealy jonathan clark Dan Garrette James Lee Thorp Colin Raffel Noam Shazeer Marvin Ritter Martín Bosma Alejandro Passos Jeremy Maitin Shepard Noé Fiedel Brennan Saeta Ryan Sepassi Alejandro Spiridonov Josué Newlan Andrea Gesmundo	, , , ,	27.06.2023
Códigohablante	Transmita una animación facial basada en la voz como una tarea de consulta de código en un espacio proxy finito del libro de códigos aprendido, lo que promueve efectivamente la viveza de los movimientos generados al reducir la incertidumbre del mapeo intermodal.	[Jinbo Xing](Jinbo Xing) Menghan Xia Yuchen Zhang Xiao Dong Cun otros Jue Wang Tien Tsin Wong	, , , , , , , , , , , , , , , proyecto	16.06.2023
Modelo de movimiento de primer orden para animación de imágenes	Transferir movimientos faciales de vídeo a imagen.	Aliaksandr Siarohin	proyecto	04.06.2023
Onda paralelaGAN	Modelos no autorregresivos de última generación para construir tu propio gran vocoder	Tomoki Hayashi	, , manifestación ,	01.06.2023
economía	diseñado para "Digitalización humana a partir de una imagen en color", que combina las mejores propiedades de las representaciones implícitas y explícitas, para inferir humanos vestidos en 3D de alta fidelidad a partir de imágenes en la naturaleza, incluso con ropa holgada o en poses desafiantes.	Yuliang Xiu Jinlong Yang Xu Cao Dimitrios Tzionas miguel negro	, , , , , , , , ,	31.05.2023
MMS	El proyecto Massively Multilingual Speech amplía la tecnología del habla de aproximadamente 100 idiomas a más de 1000 mediante la creación de un único modelo de reconocimiento de voz multilingüe que admite más de 1100 idiomas, modelos de identificación de idiomas capaces de identificar más de 4000 idiomas, modelos previamente entrenados que admiten más de 1400 idiomas y conversión de texto a modelos de habla para más de 1100 idiomas	Vineel Pratap Andros Tjandra Bowen Shi Paden Tomasello otros Arun Babú Sayani Kundu Ali Elkahky Zhao Heng Ni Apoorv Vyas Maryam Fazel-Zarandi Alexei Baevski Yossi Adi Xiaohui Zhang Wei Ning Hsu Alexis Conneau Michael Auli	, , ,	26.05.2023
fabuloso	Flow AIS Bootstrap utiliza AIS para generar muestras en regiones donde el flujo es una mala aproximación del objetivo, facilitando el descubrimiento de nuevos modos.	Laurence Midgley Vicente Stimper Gregor NC Simm Bernhard Schölkopf José Miguel Hernández Lobato.	,	29.04.2023
Código anterior	Red de predicción basada en transformadores para modelar la composición global y el contexto de las caras de baja calidad para la predicción de código, lo que permite el descubrimiento de caras naturales que se aproximan mucho a las caras objetivo incluso cuando las entradas están gravemente degradadas.	Shangchen Zhou Kelvin Chan Chongyi Li Chen Cambio Loy	, , proyecto , , ,	21.04.2023
Text2Video-Cero	Los modelos de difusión de texto a imagen son generadores de vídeo de disparo cero	Levon Khachatryan Andranik Movsisyan Vahram Tadevosyan Roberto Henschel otros Zhangyang Wang Shant Navasardyan Humphrey Shi	, , , , , proyecto video ,	11.04.2023
Segmentar cualquier cosa	El modelo Segment Anything produce máscaras de objetos de alta calidad a partir de mensajes de entrada, como puntos o cuadros, y se puede utilizar para generar máscaras para todos los objetos de una imagen.	Alejandro Kirillov Eric Mintún Nikhila Ravi Han Zi Mao otros Chloé Rolland Laura Gustafson Tete Xiao Spencer Whitehead Alex Berg Wan-Yen Lo Piotr Dollár Ross Girshick	datos , sitio web , ,	10.04.2023
Sigue tu pose	Esquema de entrenamiento de dos etapas que puede utilizar pares de poses de imágenes y conjuntos de datos de video sin pose y el modelo de texto a imagen previamente entrenado para obtener videos de personajes con pose controlable.	Yuema Yingqing él Xiao Dong Cun Xintao Wang otros Siran Chen Ying Shan xiu li Qi Feng Chen	, , , proyecto video	07.04.2023
EVA3D	Modelo generativo humano 3D incondicional de alta calidad que solo requiere colecciones de imágenes 2D para entrenamiento	Fangzhou Hong Zhaoxi Chen Yushi Lan Liang Pan Ziwei Liu	proyecto ,	04.06.2023
Fusión de sueños estable	Uso de un modelo de difusión de texto a imagen 2D previamente entrenado para realizar síntesis de texto a 3D	Jiaxiang Tang Ben Poole Ajay Jain Jon Barrón Ben Mildenhall	, proyecto , , ,	04.04.2023
PIFUHD	Función implícita de alineación de píxeles de varios niveles para la digitalización humana en 3D de alta resolución	Saito Shunsuke Tomás Simón Jason Saragih Hanbyul Joo	,	26.03.2023
VideoRehablando	Sistema para editar las caras de un video de cabeza parlante del mundo real de acuerdo con el audio de entrada, produciendo un video de salida de alta calidad y sincronización de labios incluso con una emoción diferente.	Kun Cheng Xiao Dong Cun Yong Zhang Menghan Xia otros fei yin Mingrui Zhu Wang Xuan Jue Wang Nannan Wang	, , , , proyecto , ,	19.03.2023
Chat visualGPT	Conecta ChatGPT y una serie de modelos de Visual Foundation para permitir enviar y recibir imágenes durante el chat.	Chenfei Wu Yin Yin Weizhen Qi Xiao Dong Wang otros Tang Zecheng Nan Duan	, , , ,	15.03.2023
Sintonizar un video	Ajuste de una sola vez de modelos de difusión de imágenes para la generación de texto a vídeo	Jay Zhang Jie Wu Yixiao Ge Xintao Wang Stan Weixian Lei otros Yuchao Gu Yufei Shi Wynne Hsu Ying Shan Xiaohu Qie Mike Zheng Shou	, , , proyecto ,	23.02.2023
GPEN	Red integrada anterior de GAN para la restauración de rostros ciegos en la naturaleza	Tao Yang Peiran Ren Xie Xie Lei Zhang	manifestación ,	15.02.2023
PyMAF-X	Enfoque basado en regresión para recuperar modelos paramétricos de cuerpo completo a partir de imágenes monoculares	Hong Wen Zhang Yating Tian Yuxiang Zhang Mengcheng Li otros Liang An sol de zhenan Yebin Liu	, , , , proyecto	14.02.2023
Difusión Discoteca	Una amalgama frankensteiniana de cuadernos, modelos y técnicas para la generación de Arte y Animaciones con IA.	Max Ingham Adam Letts Daniel Russell Chigozie Nri	, ,	11.02.2023
GrooVAE	Algunas aplicaciones del aprendizaje automático para generar y manipular ritmos e interpretaciones de batería.	Jon Gillick Adam Roberts Jessie Engel	publicación de blog datos aplicación web	02.02.2023
Música multipistaVAE	Los modelos de este portátil son capaces de codificar y decodificar compases individuales de hasta 8 pistas, opcionalmente condicionados a un acorde subyacente.	Ian Simón Adam Roberts Colin Raffel Jessie Engel otros Curtis Hawthorne Douglas Eck	publicación de blog	02.02.2023
MúsicaVAE	Un modelo jerárquico de vectores latentes para aprender la estructura a largo plazo en la música	Adam Roberts Jessie Engel Colin Raffel Curtis Hawthorne Douglas Eck	publicación de blog proyecto	02.02.2023
aprendiendo a pintar	Aprender a pintar con aprendizaje por refuerzo profundo basado en modelos	manuel romero		01.02.2023
NGP instantáneo	Primitivas de gráficos neuronales instantáneos con codificación hash multiresolución	Thomas Müller Alex Evans Christoph Schied Alejandro Keller	publicación de blog , , , , proyecto tutorial , , ,	18.01.2023
Redes de funciones de Fourier	Las funciones de Fourier permiten a las redes aprender funciones de alta frecuencia en dominios de baja dimensión	Mateo Tancik Pratul Srinivasan Ben Mildenhall Sara Fridovich-Keil otros Nithin Raghavan Utkarsh Singhal Ravi Ramamoorthi Jon Barrón Ren Ng	, proyecto	17.01.2023
alfapose	Estimación y seguimiento de posturas regionales de varias personas para todo el cuerpo en tiempo real	Hao Shu Fang Jie Feng Li Tang Hongyang Chao Xu otros Hao Yi Zhu Yuliang Xiu Yong Lu Li Cewu Lu	, proyecto , , ,	07.01.2023
híbrido	Solución híbrida de cinemática inversa analítico-neural para la estimación de la forma y la postura humana en 3D	Jie Feng Li Chao Xu Zhicun Chen Siyuan Bian otros Lixin Yang Cewu Lu	proyecto apoyo	01.01.2023
Puntuación Encadenamiento jacobiano	Aplique la regla de la cadena en los gradientes aprendidos y propague hacia atrás la puntuación de un modelo de difusión a través del jacobiano de un renderizador diferenciable, que instanciamos como un campo de radiancia de vóxel.	Haochen Wang Xiaodan Du Jiahao Li Raymond Yeh Greg Shakhnarovich	, proyecto ,	05.12.2022
Demucs	Espectrograma híbrido y separación de fuentes de formas de onda	Alexandre Défossez	, , , , , ,	21.11.2022
EstiloCLIP	Manipulación basada en texto de StyleGAN Imager	o patashnik Zongze Wu Eli Shechtman Daniel Cohen-Or Dani Lischinski	, , , ,	30.10.2022
Movimiento Difuso	El primer marco de generación de movimiento basado en texto basado en un modelo de difusión, que demuestra varias propiedades deseadas sobre los métodos existentes.	Mingyuan Zhang Zhongang Cai Liang Pan Fangzhou Hong otros Xinying Guo Lei Yang Ziwei Liu	proyecto	13.10.2022
VToonificar	Aprovecha las capas de resolución media y alta de StyleGAN para representar retratos artísticos de alta calidad basados en las características de contenido multiescala extraídas por un codificador para preservar mejor los detalles del marco.	Shuai Yang Liming Jiang Ziwei Liu Chen Cambio Loy	, , , , proyecto	07.10.2022
PyMAF	Alineación de malla piramidal Bucle de retroalimentación en la red de regresión para una recuperación de la malla corporal bien alineada y extenderlo para la recuperación de modelos expresivos de cuerpo completo	Hong Wen Zhang Yating Tian Yuxiang Zhang Mengcheng Li otros Liang An sol de zhenan Yebin Liu	, , , , proyecto ,	06.10.2022
AlfaTensor	Descubriendo algoritmos de multiplicación de matrices más rápidos con aprendizaje por refuerzo	Alhussein Fawzi Matej Balog Aja Huang Thomas Huberto otros Bernardino Romera Paredes Mohammadamin Barekatain Alejandro Nóvikov francisco ruiz Julian Schrittwieser Grzegorz Swirszcz David Plata Demis Hassabis Pushmeet Kohli	, , ,	04.10.2022
Swin2SR	Novel Swin Transformer V2, para mejorar SwinIR para superresolución de imágenes y, en particular, el escenario de entrada comprimida	Marcos Condé Ui-Jin Choi Maxime Burchi Radu Timofte	, , , , , , ,	03.10.2022
Functa	De los datos a la función: su punto de datos es una función y puede tratarlo como tal	Emilio Dupont Hyunjik Kim Ali Eslami Danilo Rezende Daniel Rosenbaum	,	24.09.2022
Susurro	Sistema de reconocimiento automático de voz entrenado en 680.000 horas de datos supervisados multilingües y multitarea recopilados de la web	Alec Radford Jong Wook Kim Tao Xu Greg Brockman otros Christine McLeavey Ilya Sutskever	publicación de blog , ,	21.09.2022
DeOldify (vídeo)	¡Colorea tus propios vídeos!	Jason Antic	, modelo , sitio web ,	19.09.2022
DeOldify (foto)	¡Colorea tus propias fotos!	Jason Antic Matt Robinson María Benavente	, modelo sitio web	19.09.2022
Real-ESRGAN	Amplíe el potente ESRGAN a una aplicación de restauración práctica, entrenada con datos sintéticos puros.	Xintao Wang Liangbin Xie chao dong Ying Shan	, , , ,	18.09.2022
IDE-3D	Edición interactiva desenredada para síntesis de retratos 3D de alta resolución	Sol Jingxiang Wang Xuan Yichun Shi Lizhen Wang otros Jue Wang Yebin Liu	, , ,	08.09.2022
Transformadores de decisión	Una arquitectura que plantea el problema de RL como modelo de secuencia condicional. Expandir Información adicional Versión 1.0.0 Tipo Otro código fuente Fecha de actualización 2024-12-27 tamaño 804.02KB Proviene de Github Aplicaciones relacionadas awesome citygml 2024-11-13 awesome generative ai guide 2024-11-05 GitHub sgrebnov/cordova plugin background download 2024-11-05 awesome swift 2024-11-03 Impresionante juego del diablo 2023-04-16 El anuncio impresionante 2022-08-08 Recomendado para ti chat.petals.dev Otro código fuente 1.0.0 GPT Prompt Templates Otro código fuente 1.0.0 GPTyped Otro código fuente GPTyped 1.0.5 waymo open dataset Otro código fuente December 2023 Update SmartTube Otro código fuente 24.71 Stable Sunamu Otro código fuente Release 2.2.0 waymo open dataset Otro código fuente December 2023 Update termwind Otras categorias v2.3.0 wp functions Otras categorias 1.0.0 Información relacionada Todo Cómo solucionar el tartamudeo en Stalker 2: Heart of Chernobyl 2024-11-23 ¿Dónde está Juice WRLD en Fortnite? 2024-11-23 Cómo iniciar la expansión Wild Card en Star Wars Outlaws 2024-11-23 Beijing agrega una nueva institución de I+D para mejorar la seguridad de la inteligencia artificial y el diseño de la gobernanza 2024-11-22 Se inauguró un seminario en Shanghai, asistió Guterres y la Asamblea General de las Naciones Unidas adoptó la propuesta de China de cooperar para fortalecer el desarrollo de capacidades en inteligencia artificial. 2024-11-22 Construya un marco de inteligencia artificial para encontrar la lisozima más eficaz 2024-11-22 Los grandes modelos de IA entran en el primer año de aplicación. Las instituciones financieras están aumentando sus esfuerzos para construir un nuevo ecosistema de potencia informática inteligente. 2024-11-22 MiniMax Yan Junjie: Lo rápido es bueno para modelos grandes, pero a veces lo lento es solo para ser más rápido. 2024-11-22 La inteligencia artificial ingresa al campus para iluminar los sueños científicos de los estudiantes 2024-11-22 La inteligencia artificial activa la fabricación de consumo y los equipos de fitness Yongkang se venden bien en los mercados nacionales y extranjeros. 2024-11-22 Nvidia invierte en la financiación Serie B de Sakana AI para ayudar a desarrollar la inteligencia artificial generativa 2024-11-22 ¡La IA está desbloqueando una nueva revolución cognitiva! Lectura universal del curso general de nueva ciencia y tecnología, calendario de desarrollo de la inteligencia artificial: hacer un vídeo en 2028, escribir un libro más vendido en 2049... 2024-11-22 Products & Services Install APK APK signature verification APK Download Service Company Developer Console Submit APK Monetization of traffic through downcodes Legal About us Contact Us Cooperation [email protected]