awesome colab notebooks下载 - awesome colab notebooks源代码下载

该页面可能无法正确呈现。请直接打开README.md文件

用于 ML 实验的很棒的 Colab 笔记本集合

流行趋势

存储库	文件
facebookresearch/共同追踪迭代/数据链卡鲁姆杜格尔/ARENA_3.0 起点/PuLID 郑鹏7/BiRefNet 超解剂/超解剂安斯洛泰 facebookresearch/segment-anything-2 llyasviel/IC-Light 杰梅洛-艾/vocos comfyanonymous/ComfyUI TransformerLensOrg/TransformerLens 张宏文/PyMAF-X 机器人流程/监督快手VGI/LivePortrait pidnad/DDColor 腾讯ARC/InstantMesh LAION-AI/审美预测器豆瓣/动创 facebookresearch/家庭机器人 KillianLucas/开放解释器 jxnl/导师	利达高斯泼溅调整视频跟随你的姿势文本2视频-零 GLIP UniFormerV2 悲伤语者猫头鹰ViT 视频重讲 LDM 梦想田野德蒂克图播拖动GAN 虚拟现实测试薄板样条运动模型 PyMAF-X 命运零 py-irt VQ-扩散经济

存储库

文件

facebookresearch/共同追踪
迭代/数据链
卡鲁姆杜格尔/ARENA_3.0
起点/PuLID
郑鹏7/BiRefNet
超解剂/超解剂
安斯洛泰
facebookresearch/segment-anything-2
llyasviel/IC-Light
杰梅洛-艾/vocos
comfyanonymous/ComfyUI
TransformerLensOrg/TransformerLens
张宏文/PyMAF-X
机器人流程/监督
快手VGI/LivePortrait
pidnad/DDColor
腾讯ARC/InstantMesh
LAION-AI/审美预测器
豆瓣/动创
facebookresearch/家庭机器人
KillianLucas/开放解释器
jxnl/导师

利达
高斯泼溅
调整视频
跟随你的姿势
文本2视频-零
GLIP
UniFormerV2
悲伤语者
猫头鹰ViT
视频重讲
LDM
梦想田野
德蒂克
图播
拖动GAN
虚拟现实测试
薄板样条运动模型
PyMAF-X
命运零
py-irt
VQ-扩散
经济

研究

姓名	描述	作者	链接	更新
协同追踪器	在整个视频中联合跟踪多个点的架构	尼基塔·卡拉耶夫伊格纳西奥·罗科本杰明·格雷厄姆娜塔莉亚·内沃瓦其他的安德里亚·维达尔迪克里斯蒂安·鲁普雷希特	, 项目	2024年10月16日
PIFu	用于高分辨率穿着人体数字化的像素对齐隐式函数	夏目良太斋藤俊介曾晃金泽安乔郝丽		2024年10月8日
差异面	能够更优雅地应对看不见的复杂退化的方法，无需复杂的损耗设计	岳宗盛陈变来	, , ,	2024年10月5日
分段任何内容 2	解决图像和视频中即时视觉分割问题的基础模型	尼基拉·拉维瓦伦丁·加博尔胡元廷胡荣航其他的柴坦尼亚·里亚利马腾宇海瑟姆·赫德尔罗曼·拉德尔克洛伊·罗兰劳拉·古斯塔夫森埃里克·明顿潘俊廷 [Kalyan Vasudev](lwala](https://scholar.google.co.in/itations?user=m34oaWEAAAAJ) 尼古拉斯·卡里恩 [朝源](u)(https://chaoyuan.org/) 罗斯·吉尔希克皮奥特尔·多拉尔克里斯托夫·费希滕霍费尔	演示 , , 项目 , , ,	2024年10月1日
打开-取消混合	用于音乐源分离的深度神经网络参考实现，适用于研究人员、音频工程师和艺术家	法比安-罗伯特·斯托特安托万·柳特库斯	数据项目	2024年9月25日
深刻的绘画和谐	与照片合成或全局风格化技术相比，算法产生的结果明显更好，并且它可以实现原本难以实现的创造性绘画编辑	栾福军西尔万·帕里斯伊莱·谢赫特曼卡维塔·巴拉	, , ,	2024年9月23日
音频2照片真实	用于生成全身逼真化身的框架，该化身根据二元交互的对话动态进行手势	吴伊芳哈维尔·罗梅罗铁木尔·巴高迪诺夫白少杰其他的特雷弗·达雷尔金泽安乔亚历山大·理查德	项目	2024年9月13日
快速分割任何东西	仅使用 SAM 作者发布的 SA-1B 数据集的 2% 来训练 CNN Segment Anything 模型	赵旭丁文超安永琪杜迎龙其他的陶宇李敏明堂王金桥	, , ,	2024年9月10日
纽拉兰杰洛	从 RGB 视频捕获进行高保真 3D 表面重建的框架	李兆硕托马斯·穆勒亚历克斯·埃文斯拉塞尔·泰勒其他的马蒂亚斯·安贝拉特刘明玉林震轩	博客文章项目 , ,	2024年9月2日
双参考网	高分辨率二分图像分割的双边参考框架	彭正高德宏范登平刘莉其他的乔玛·拉克索宁欧阳万里尼库·塞贝	, , , , 项目 , ,	2024年8月23日
旋转	学习通过循环中的模型拟合重建 3D 人体姿势和形状	尼科斯·科洛图罗斯乔治斯·帕夫拉科斯迈克尔·布莱克科斯塔斯·丹尼利迪斯	, 项目	2024年8月21日
YOLOv10	旨在从后处理和模型架构上进一步推进YOLO的性能效率边界	王敖陈慧陈凯林子佳其他的韩军工丁桂光	博客文章演示 ,,,,,,,,,, , , , , , ,	2024年8月20日
规格VQGAN	通过将训练数据集缩小为一组代表性向量来驯服视觉引导声音的生成	弗拉基米尔·亚辛埃萨·拉赫图	,,,,,,, , , , 项目 , ,	2024年7月12日
现场肖像	视频驱动的人像动画框架，注重更好的通用性、可控性和实际使用的效率	郭建柱张定云刘小强钟志洲其他的张元万鹏飞张迪	, , , , 项目 ,,,,,,,	2024年7月10日
貘	通过每帧初始化和时间细化跟踪任意点	卡尔·多尔施易阳梅尔·维切里克迪拉拉·戈凯其他的安库什·古普塔优素福·阿伊塔尔若昂·卡雷拉安德鲁·齐瑟曼	, 博客文章，博客文章 ,	2024年7月5日
声音2唇	口型同步专家是您在野外进行语音到唇型生成所需的一切	普拉吉瓦尔·雷努卡南德鲁德拉巴·穆霍帕迪亚维奈·南布迪里 CV贾瓦哈尔	数据演示项目	2024年6月27日
深实验室切割	基于深度神经网络迁移学习的无标记姿态估计的有效方法，用最少的训练数据取得优异的结果	亚历山大·马西斯普拉纳夫·马米丹纳凯文·库里阿部大河其他的文卡特什·穆尔蒂麦肯齐·马西斯马蒂亚斯·贝思格	,,,,,,, 论坛 , 网站 , ,	2024年6月5日
泳池前	MetaFormer 实际上是您实现视觉所需的工具	于伟豪米罗潘舟晨阳寺其他的周亦辰王新超冯家士严水成	, ,	2024年6月1日
故事扩散	自注意力计算方式，称为一致性自注意力，可显着提高生成图像之间的一致性，并以零样本方式增强流行的基于预训练扩散的文本到图像模型	周玉鹏周大全郑明明冯家士侯其斌	项目 ,	2024年5月4日
普利德	Pure and Lightning ID 定制，一种无需调优的文本转图像 ID 定制方法	郭子南吴彦泽陈卓伟陈朗何谦	, ,	2024年5月3日
电影	一种帧插值算法，可从两个具有较大中间运动的输入图像合成多个中间帧	菲特姆·雷达詹妮·康特卡宁埃里克·塔贝利恩孙德清其他的卡罗琳·潘托法鲁布赖恩·库莱斯	数据，数据，数据项目 , ,	2024年5月3日
声艺	令牌填充神经编解码器语言模型，在有声读物、互联网视频和播客的语音编辑和零样本文本转语音方面实现了最先进的性能	彭濮元黄宝耀李尚文阿卜杜勒拉赫曼·穆罕默德大卫·哈沃斯	项目 , ,	2024年4月21日
泽斯特	给定材料样本图像的情况下，零样本材料转移到输入图像中的对象的方法	郑大英普拉富尔·夏尔马安德鲁·马卡姆尼基·特里戈尼瓦伦·詹帕尼	, 项目	2024年4月16日
即时网格	用于从单个图像即时生成 3D 网格的前馈框架，具有最先进的生成质量和显着的训练可扩展性	徐家乐程伟豪高一鸣王新涛其他的高胜华英山	, ,	2024年4月16日
阿尔法折叠	高精度蛋白质结构预测	约翰·詹珀理查德·埃文斯亚历山大·普里策尔蒂姆·格林其他的迈克尔·菲格诺夫奥拉夫·罗内伯格凯瑟琳·图尼亚苏乌纳库尔拉斯·贝茨奥古斯丁·齐德克安娜·波塔彭科亚历克斯·布里奇兰克莱门斯·迈耶西蒙·科尔安德鲁巴拉德贝尔纳迪诺·罗梅拉·帕雷德斯斯坦尼斯拉夫·尼科洛夫里舒卜·贾因	博客文章，博客文章 , 纸 ,	2024年4月15日
维尔斯辰	用于文本到图像合成的架构，将大规模文本到图像扩散模型的竞争性能与前所未有的成本效益相结合	巴勃罗·佩尼亚斯多米尼克·兰帕斯马茨·里克特克里斯托弗·帕尔马克·奥伯维尔		2024年4月6日
质量管理体系	通过加性量化对大型语言模型进行极限压缩	瓦吉·埃吉扎里安安德烈·潘费罗夫丹尼斯·库兹内捷列夫埃利亚斯·弗兰塔尔其他的阿尔乔姆·巴本科丹·阿里斯塔	, , ,	2024年3月8日
YOLOv9	使用可编程梯度信息学习您想学习的内容	王建耀叶一厚廖宏元	, 博客文章 , , , , ,	2024年3月5日
多LoRA组合	LoRA Switch 和 LoRA Composite 是旨在在准确性和图像质量方面超越传统技术的方法，尤其是在复杂的构图中	明忠沉叶龙王硕航亚东路亚东路其他的焦亦竹欧阳思如于东寒韩家伟陈伟柱	网站	2024年3月3日
苦杏酒	调节网络的多尺度和多模式推理，以识别人类疾病生物系统内和跨生物系统共享和不同的细胞回路及其驱动因素	娜塔莉·波切特奥利维尔·吉瓦特莫森·纳比安杰延德拉·辛德其他的席琳·埃弗拉特索林·塔博尔	生物导体项目	2024年2月28日
利达	用于生成与语法无关的可视化和信息图表的工具	维克多·迪比亚	, 项目 , ,	2024年2月6日
维特	视觉转换器和 MLP 混合器架构	阿列克谢·多索维茨基卢卡斯拜尔亚历山大·科列斯尼科夫德克·维森博恩其他的翟晓华托马斯·翁特蒂纳穆斯塔法·德哈尼马蒂亚斯·明德勒格奥尔格·海戈尔德西尔万·杰利雅各布·乌什科雷特尼尔·霍尔斯比	,,,,,,,, 博客文章 , , , , ,	2024年2月6日
3D肯·伯恩斯	使用 PyTorch 从单个图像实现 3D Ken Burns 效果的参考实现 - 给定单个输入图像，它通过虚拟相机扫描和缩放受运动视差影响的静态图像进行动画处理	曼努埃尔·罗梅罗		2024年1月24日
瓦莱X	用于跨语言语音合成的跨语言神经编解码器语言模型	张自强龙舟王成义陈三元其他的于武刘树杰陈卓刘延庆王华明李金玉何雷赵胜福如伟	, , 演示项目	2024年1月19日
照片制作者	高效的个性化文本到图像生成方法，主要是将任意数量的输入ID图像编码成堆栈ID嵌入，以保存ID信息	李珍曹明灯王新涛齐忠刚其他的郑明明英山	,,,,,,, 项目 ,	2024年1月18日
DD色彩	具有双解码器的端到端图像着色方法	康晓阳陶阳欧阳文琪任沛然其他的李灵芝谢轩松	,	2024年1月15日
帕斯卡	像素感知稳定扩散网络，以实现强大的 Real-ISR 以及个性化风格化	陶阳任沛然谢轩松张雷	,	2024年1月12日
手工精炼机	通过基于扩散的条件修复来细化生成图像中畸形的手	温泉路温泉路徐宇飞张静王超跃陶大成	, ,	2024年1月8日
图播	学习熟练的中期全球天气预报	林雷米阿尔瓦罗·桑切斯·冈萨雷斯马修威尔森彼得·温斯伯格其他的梅雷·福图纳托费兰·阿莱特苏曼·拉乌里蒂莫·埃瓦尔兹扎克·伊顿·罗森胡卫华亚历山大·梅罗斯史蒂芬·霍耶乔治·霍兰德奥里奥尔黑胶唱片杰克琳·斯托特亚历山大·普里策尔沙基尔·穆罕默德彼得·巴塔利亚	数据 , , , , , , , ,	2024年1月4日
环境管理署	进化规模建模：蛋白质的预训练语言模型	林泽明饶罗山布赖恩·希伊朱仲凯其他的艾伦·多斯·桑托斯·科斯塔玛丽亚姆·法泽尔·扎兰迪汤姆·塞尔库萨尔瓦多·坎迪多亚历山大·里夫斯约书亚·迈尔罗伯特·韦尔库尔刘杰森徐可儿亚当·勒勒	ESM图集 FSDP ICML 数据纸，纸，纸，纸出版医学 ,	2023年12月28日
拉瓦	大型语言和视觉助手，一种端到端训练的大型多模态模型，连接视觉编码器和 LLM 以实现通用视觉和语言理解	刘浩天李春元吴庆阳李龙在李玉恒	, , , , 演示 ,,,,,,, , 项目 ,,,,,,,	2023年12月22日
背景抠图 V2	实时高分辨率背景替换技术，在现代 GPU 上以 4K 分辨率为 30 fps 运行，高清为 60 fps	林山川安德烈·里亚布采夫苏米亚迪普·森古塔布赖恩·库莱斯其他的史蒂夫·塞茨艾拉·凯梅尔马赫-施利泽曼	, 项目 ,	2023年12月22日
高斯泼溅	最先进的视觉质量，同时保持有竞争力的训练时间，重要的是允许在 1080p 分辨率下进行高质量实时 (≥ 100 fps) 新颖的视图合成	伯恩哈德·克尔布尔乔治斯·科帕纳斯托马斯·莱姆库勒乔治·德雷塔基斯	项目 ,,,,,,,,	2023年12月19日
SMPLer-X	将 EHPS 扩展到第一个通用基础模型，以 ViT-Huge 作为骨干，并使用来自不同数据源的多达 450 万个实例进行训练	蔡忠刚尹万琪曾爱玲陈伟其他的孙庆平王彦军彭惠恩梅海怡张明远张雷陈变来雷阳刘紫薇	, , 项目 ,	2023年12月18日
深度缓存	从模型架构角度加速扩散模型的免训练范式	马欣银方功凡王新超	项目	2023年12月18日
魔法动画	基于扩散的框架，旨在增强时间一致性、忠实地保留参考图像并提高动画保真度	徐忠聪张剑峰刘俊豪严寒舒其他的刘家伟张晨旭冯家士寿迈克	, , 项目网站 , ,	2023年12月18日
差分BIR	利用生成扩散先验实现盲图像恢复	林新奇何静文陈紫妍吕朝阳其他的本飞戴波欧阳万里于乔董超	项目 ,	2023年12月18日
音频LDM	建立在潜在空间上的文本到音频系统，用于从对比语言音频预训练潜在中学习连续音频表示	刘浩和陈泽华怡园梅新浩其他的刘旭波达尼洛·曼迪奇王文武马克·普拉布利	, , 项目	2023年12月2日
标签PFN	学习进行表格数据预测的神经网络	诺亚·霍尔曼塞缪尔·穆勒凯瑟琳娜·埃根斯佩格弗兰克·哈特	,,,,,,, 博客文章	2023年11月29日
概念滑块	应用在预训练模型之上的即插即用低等级适配器	罗希特·甘迪科塔乔安娜·马特辛斯卡周廷瑞安东尼奥·托拉尔巴大卫·鲍	, 项目	2023年11月26日
Qwen-VL	一组旨在感知和理解文本和图像的大规模视觉语言模型	白金泽白帅杨树生王世杰其他的陈思南王鹏林俊阳常州周敬仁	, , 演示 , , , , ,	2023年11月24日
动漫GANv3	用于快速照片动画的双尾生成对抗网络	刘刚陈鑫	项目 ,,,,,,,	2023年11月23日
伊萨卡岛	第一个深度神经网络，用于古希腊铭文的文本恢复、地理和时间归属	雅尼斯·阿萨尔西娅·萨默希尔德布伦丹·西林福德马赫亚尔·博德巴尔其他的约翰·帕夫洛普洛斯玛丽塔·查齐帕纳吉奥图扬·安德鲁索普洛斯乔纳森·普拉格南多·德·弗雷塔斯	, 项目	2023年11月21日
原相-Σ	用于 4K 文本到图像生成的扩散变压器的弱到强训练	陈俊松葛崇健谢恩泽吴越其他的姚乐伟任小哲王忠道罗平湖川路李振国	, , , 项目	2023年11月7日
零123++	用于从单个输入视图生成 3D 一致的多视图图像的图像条件扩散模型	石若曦陈汉生张卓阳刘明华其他的徐超魏新月陈凌浩曾崇浩苏	, ,	2023年10月26日
UniFormerV2	用于高效时空表示学习的统一变压器	李坤昌王雅丽何一男李一卓其他的王毅王利民于乔	, , , , , , ,	2023年10月20日
显示-1	混合模型，称为 Show-1，结合了基于像素和基于潜在的 VDM，用于文本到视频的生成	张俊豪吴张杰刘家伟赵锐其他的冉令敏顾玉超高涤飞迈克·郑守	,,,,,,, 项目	2023年10月15日
音频九月	使用自然语言查询进行开放域音频源分离的基础模型	刘旭波孔秋强赵艳刘浩和其他的怡园刘玉琢夏瑞王宇轩马克·普拉布利王文武	项目	2023年10月12日
DA-CLIP	退化感知视觉语言模型可以更好地将预训练的视觉语言模型转移到低级视觉任务中，作为图像恢复的通用框架	罗紫薇弗雷德里克·古斯塔夫森郑钊延斯·舍伦德托马斯·舍恩	项目	2023年10月11日
悲伤语者	从音频生成 3DMM 的 3D 运动系数，并隐式调制新颖的 3D 感知面部渲染以生成头部说话	张文轩小东村王旋张勇其他的席申于果英山王飞	,,,,,,,,,, 项目 , , ,	2023年10月10日
穆西卡	音乐生成系统可以使用单个消费类 GPU 进行数百小时的音乐训练，并且比在消费类 CPU 上实时生成任意长度的音乐要快得多	马可·帕西尼扬·施吕特	, 数据 , 项目 ,	2023年10月9日
YOLOv6	专用于工业应用的单级物体检测框架	翁凯恒孟成李一朵褚香香魏晓琳	, 博客文章数据 , , , , , ,	2023年10月8日
梦幻高斯	将 3D 高斯转换为纹理网格并应用微调阶段来细化细节的算法	唐家祥任嘉伟杭州刘紫薇曾刚	, , 项目	2023年10月4日
图标	给定一组图像，该方法会根据每个图像估计详细的 3D 表面，然后将它们组合成可动画化的头像	修玉良杨金龙迪米特里奥斯·齐奥纳斯迈克尔·布莱克	,,,,,,,,,, 项目	2023年8月31日
恐龙v2	产生高性能的视觉特征，可以直接与分类器一起使用，就像各种计算机视觉任务中的线性层一样简单；这些视觉功能非常强大，并且跨领域表现良好，无需任何微调	马克西姆·奥卡布蒂莫西·达尔塞西奥·穆塔卡尼胡伊沃其他的马克·萨弗拉涅克瓦西里·哈利多夫皮埃尔·费尔南德斯丹尼尔·哈齐扎弗朗西斯科·马萨阿拉丁·努比马哈茂德·阿斯兰尼古拉斯·巴拉斯沃伊切赫·加鲁巴拉塞尔·豪斯黄宝耀李尚文伊尚·米斯拉迈克尔·拉巴特瓦苏·夏尔马加布里埃尔·西尼夫胡旭埃尔维·杰古朱利安·迈拉尔帕特里克·拉巴特阿尔芒·茹兰皮奥特·博雅诺夫斯基	博客文章演示 , , ,	2023年8月31日
猫头鹰ViT	使用视觉转换器进行简单的开放词汇目标检测	马蒂亚斯·明德勒阿列克谢·格里森科奥斯汀·斯通马克西姆·诺依曼其他的德克·维森博恩阿列克谢·多索维茨基阿拉文德·马亨德兰阿努拉格·阿纳布穆斯塔法·德哈尼沉卓然小王翟晓华托马斯·基普夫尼尔·霍尔斯比		2023年8月21日
样式GAN3	无别名生成对抗网络	特罗·卡拉斯米卡·艾塔拉萨穆里·莱恩埃里克·哈科宁其他的珍妮·赫尔斯坦雅科·莱赫蒂宁蒂莫·艾拉	,,,,,,, , , , , 项目	2023年8月13日
命运零	针对真实视频的零镜头基于文本的编辑方法，无需按提示进行训练或使用特定的掩模	齐晨阳小东村张勇雷晨阳其他的王新涛英山陈其峰	, , 项目视频	2023年8月13日
大甘	用于高保真自然图像合成的大规模 GAN 训练	安德鲁·布洛克杰夫·多纳休凯伦·西蒙尼扬		2023年8月3日
喇嘛	使用傅立叶卷积进行分辨率鲁棒的大型掩模修复	罗曼·苏沃洛夫伊丽莎白·洛加切娃安东·马希欣阿纳斯塔西娅·雷米佐娃其他的阿森尼·阿舒卡阿列克谢·西尔维斯特洛夫孔乃真哈西斯·戈卡朴基雄维克托·伦皮茨基	, , , 项目	2023年8月2日
让它说话	一种以音频作为唯一输入，从单个面部图像生成富有表现力的头部说话视频的方法	扬州韩欣桐伊莱·谢赫特曼何塞·埃切瓦里亚其他的埃万杰洛斯·卡洛杰拉基斯李丁泽宇	数据项目	2023年7月27日
HIDT	生成图像到图像模型和新的上采样方案，允许以高分辨率应用图像转换	丹尼斯·科尔任科夫格莱布·斯特金谢尔盖·尼科连科维克托·伦皮茨基	项目 ,	2023年7月24日
卡特勒	训练无监督对象检测和分割模型的简单方法	王旭东罗希特·格达尔于斯特拉伊尚·米斯拉	, 项目	2023年7月24日
识别任何内容和 Tag2Text	视觉语言预训练框架，将图像标签引入视觉语言模型中，指导视觉语言特征的学习	黄新宇张友才马金玉李朝阳其他的谢艳春秦玉琢铜锣李亚倩郭彦东郭彦东张雷	, , 项目，项目	2023年7月9日
薄板样条运动模型	端到端无监督运动传输框架	赵健张慧	, , , 供应	2023年7月7日
拖动GAN	拖动您的 GAN：生成图像流形上基于点的交互式操作	潘新港阿尤什·特瓦里托马斯·莱姆库勒刘令杰其他的阿比米特拉·梅卡克里斯蒂安·西奥博尔特	项目	2023年7月3日
移动SAM	迈向移动应用的轻量级 SAM	张超宁韩东深于乔金正旭其他的裴成浩李升奎钟善洪	,,,,,,,,,,	2023年6月30日
恐龙接地	将 DINO 与开放集目标检测的接地预训练结合起来	刘世龙曾朝阳天河人李峰其他的张浩杨杰李春元杨建伟苏航朱骏张雷	,,,,,,,, , , , , , ,	2023年6月28日
T5X	模块化、可组合、研究友好的框架，用于多种规模的序列模型的高性能、可配置、自助训练、评估和推理	亚当·罗伯茨郑亨元安塞姆·列夫斯卡娅高拉夫·米什拉其他的詹姆斯·布拉德伯里丹尼尔·安多尔夏兰·纳朗布赖恩·莱斯特科林·加夫尼阿夫罗兹·莫希丁柯蒂斯·霍桑艾托尔·卢科维奇亚历克斯·萨尔恰努马克·范泽雅各布·奥斯汀塞巴斯蒂安·古德曼利维奥·巴尔迪尼·苏亚雷斯胡海棠萨沙·茨维亚先科阿坎克沙乔杜里贾斯敏·巴斯廷斯詹尼斯·布利安泽维尔·加西亚倪建模凯瑟琳·肯尼利乔纳森·克拉克丹·加勒特詹姆斯·李·索普科林·拉斐尔诺姆·沙泽尔马文·里特马丁·博斯马亚历山大·帕索斯杰里米·迈廷-谢泼德诺亚·菲德尔布伦南·萨埃塔瑞安·塞帕西亚历山大·斯皮里多诺夫约书亚·纽兰安德里亚·杰斯蒙多	, , , ,	2023年6月27日
码语者	将语音驱动的面部动画作为学习代码本的有限代理空间中的代码查询任务，通过减少跨模态映射的不确定性，有效提升生成动作的生动性	[星金波](星金波) 夏梦涵张跃辰小东村其他的王珏黄天真	,,,,,,,,,,,,, , ,,,,,,, 项目	2023年6月16日
图像动画的一阶运动模型	将面部动作从视频传输到图像	阿利亚克桑德尔·西亚罗欣	项目	2023年6月4日
并行WaveGAN	最先进的非自回归模型来构建您自己的出色声码器	林智树	, , 演示 ,	2023年6月1日
经济	专为“彩色图像的人体数字化”而设计，它结合了隐式和显式表示的最佳特性，从野外图像中推断出高保真 3D 穿着人类，即使穿着宽松的衣服或处于具有挑战性的姿势	修玉良杨金龙徐操迪米特里奥斯·齐奥纳斯迈克尔·布莱克	,,,,,,,, , , ,	2023年5月31日
彩信	大规模多语言语音项目通过构建支持 1100 多种语言的单一多语言语音识别模型、能够识别 4000 多种语言的语言识别模型、支持 1400 多种语言的预训练模型以及文本到文本的转换，将语音技术从大约 100 种语言扩展到 1000 多种语言。超过 1100 种语言的语音模型	维内尔·普拉塔普安德罗斯詹德拉施博文帕登·托马塞洛其他的阿伦巴布萨亚尼昆杜阿里·埃尔卡基倪兆恒阿普尔夫·维亚斯玛丽亚姆·法泽尔·扎兰迪阿列克谢·巴耶夫斯基约西·阿迪张晓慧许伟宁亚历克西斯·康诺迈克尔·奥利	, , ,	2023年5月26日
FAB	Flow AIS Bootstrap 使用 AIS 在流量不太接近目标的区域生成样本，从而促进新模式的发现	劳伦斯·米奇利文森特·斯廷珀格雷戈尔·NC·西姆伯恩哈德·舍尔科普夫何塞·米格尔·埃尔南德斯·洛巴托	,	2023年4月29日
代码形成者	基于 Transformer 的预测网络可对低质量人脸的全局组成和上下文进行建模以进行代码预测，即使输入严重退化，也能发现与目标人脸非常接近的自然人脸	周尚臣陈凯文李崇义陈变来	, , 项目 , , ,	2023年4月21日
文本2视频-零	文本到图像扩散模型是零样本视频生成器	莱文·哈恰图良安德拉尼克·莫夫西相瓦赫拉姆·塔德沃相罗伯托·亨舍尔其他的王张扬尚特·纳瓦萨迪安史汉弗莱	, , , , , 项目视频 ,	2023年4月11日
分割任何东西	分段任何模型可根据点或框等输入提示生成高质量的对象蒙版，并且可用于为图像中的所有对象生成蒙版	亚历山大·基里洛夫埃里克·明顿尼基拉·拉维汉字毛其他的克洛伊·罗兰劳拉·古斯塔夫森肖特特斯宾塞·怀特海德亚历克斯·伯格罗万彦皮奥特尔·多拉尔罗斯·吉尔希克	数据 , 网站 , ,	2023年4月10日
跟随你的姿势	两阶段训练方案，可以利用图像姿势对和无姿势视频数据集以及预训练的文本到图像模型来获得姿势可控的角色视频	马跃何迎清小东村王新涛其他的陈思然英山秀丽陈其峰	, , , 项目视频	2023年4月7日
EVA3D	高质量无条件 3D 人体生成模型，仅需要 2D 图像集合进行训练	方舟洪陈兆熙玉石兰潘亮刘紫薇	项目 ,	2023年4月6日
稳定的梦境融合	使用预训练的 2D 文本到图像扩散模型执行文本到 3D 合成	唐家祥本普尔阿贾伊·贾恩乔恩·巴伦本·米尔登霍尔	, 项目 , , ,	2023年4月4日
PIFuHD	用于高分辨率 3D 人体数字化的多级像素对齐隐式函数	斋藤俊介托马斯·西蒙贾森·萨拉吉朱韩星	,	2023年3月26日
视频重讲	系统根据输入音频编辑现实世界中头部说话视频的面孔，即使情绪不同，也能生成高质量且口型同步的输出视频	程坤小东村张勇夏梦涵其他的飞音朱明瑞王旋王珏王楠楠	, , , , 项目 , ,	2023年3月19日
可视化聊天GPT	连接 ChatGPT 和一系列 Visual Foundation 模型，以实现在聊天期间发送和接收图像	吴晨飞尹胜明齐维珍王晓东其他的唐泽成南段	, , , ,	2023年3月15日
调整视频	用于文本到视频生成的图像扩散模型的一次性调整	吴张杰葛一笑王新涛雷斯坦伟贤其他的顾玉超史玉飞徐怀恩英山切小虎迈克·郑守	, , , 项目 ,	2023年2月23日
GPEN	GAN Prior 嵌入式网络用于野外盲人面部恢复	陶阳任沛然谢轩松张雷	演示 ,	2023年2月15日
PyMAF-X	基于回归的方法从单目图像中恢复参数化全身模型	张宏文田雅婷张玉祥李梦成其他的梁安孙哲南刘业斌	, , , , 项目	2023年2月14日
迪斯科扩散	用于生成人工智能艺术和动画的笔记本、模型和技术的弗兰肯斯坦式融合	马克斯·英厄姆亚当·莱茨丹尼尔·拉塞尔奇戈齐·尼里	, ,	2023年2月11日
格鲁VAE	机器学习在生成和操纵节拍和鼓演奏方面的一些应用	乔恩·吉利克亚当·罗伯茨杰西·恩格尔	博客文章数据网络应用程序	2023年2月2日
多轨音乐VAE	该笔记本中的模型能够编码和解码最多 8 个轨道的单个小节，可以选择以基础和弦为条件	伊恩·西蒙亚当·罗伯茨科林·拉斐尔杰西·恩格尔其他的柯蒂斯·霍桑道格拉斯·艾克	博客文章	2023年2月2日
音乐VAE	用于学习音乐长期结构的分层潜在向量模型	亚当·罗伯茨杰西·恩格尔科林·拉斐尔柯蒂斯·霍桑道格拉斯·艾克	博客文章项目	2023年2月2日
学习绘画	使用基于模型的深度强化学习学习绘画	曼努埃尔·罗梅罗		2023年2月1日
即时NGP	具有多分辨率哈希编码的即时神经图形基元	托马斯·穆勒亚历克斯·埃文斯克里斯托夫·席德亚历山大·凯勒	博客文章 , , , , 项目教程 , , ,	2023年1月18日
傅里叶特征网络	傅里叶特征让网络学习低维域中的高频函数	马修·坦西克普拉图·斯里尼瓦桑本·米尔登霍尔萨拉·弗里多维奇-凯尔其他的尼辛·拉格万乌特卡什·辛格哈尔拉维·拉马莫蒂乔恩·巴伦吴仁	, 项目	2023年1月17日
阿尔法姿势	全身局部多人姿势实时估计和跟踪	方浩淑李杰峰唐红阳徐超其他的朱浩仪修玉良李永禄侧屋路	, 项目 , , ,	2023年1月7日
混合 IK	用于 3D 人体姿势和形状估计的混合分析神经逆运动学解决方案	李杰峰徐超陈志存卞思源其他的杨立新侧屋路	项目供应	2023年1月1日
雅可比链分数	对学习到的梯度应用链式法则，并通过可微渲染器的雅可比行列式反向传播扩散模型的分数，我们将其实例化为体素辐射场	王浩辰杜晓丹李家豪叶雷文格雷格·沙赫纳罗维奇	, 项目 ,	2022年12月5日
德穆克斯	混合频谱图和波形源分离	亚历山大·德福塞	, , , , , ,	2022年11月21日
风格剪辑	StyleGAN 成像器的文本驱动操作	或帕塔什尼克吴宗泽伊莱·谢赫特曼丹尼尔·科恩-奥尔丹尼·利辛斯基	, , , ,	2022年10月30日
运动漫反射	第一个基于扩散模型的文本驱动运动生成框架，它展示了现有方法的几个所需属性	张明远蔡忠刚潘亮方舟洪其他的郭欣颖雷阳刘紫薇	项目	2022年10月13日
VToonify	利用StyleGAN的中高分辨率层，根据编码器提取的多尺度内容特征，渲染高质量的艺术肖像，更好地保留帧细节	杨帅蒋黎明刘紫薇陈变来	, , , , 项目	2022年10月7日
皮玛夫	金字塔网格对齐回归网络中的反馈循环，用于对齐良好的身体网格恢复，并将其扩展以恢复富有表现力的全身模型	张宏文田雅婷张玉祥李梦成其他的梁安孙哲南刘业斌	, , , , 项目 ,	2022年10月6日
阿尔法张量	通过强化学习发现更快的矩阵乘法算法	阿尔侯赛因·法齐马泰·巴洛格黄阿佳托马斯·休伯特其他的贝尔纳迪诺·罗梅拉·帕雷德斯穆罕默德·巴雷卡坦亚历山大·诺维科夫弗朗西斯科·鲁伊斯朱利安·施里特威瑟格热戈日·斯维尔什茨大卫·西尔弗黛米斯·哈萨比斯普什梅特·科利	, , ,	2022年10月4日
斯温2SR	新颖的 Swin Transformer V2，用于改进 SwinIR 的图像超分辨率，特别是压缩输入场景	马科斯·孔德崔义珍马克西姆·布尔奇拉杜·蒂莫夫特	, , , , , , ,	2022年10月3日
功能	从数据到函数：您的数据点是一个函数，您可以将其视为一个函数	艾米连·杜邦金贤直阿里·伊斯拉米达尼洛·雷森德丹·罗森鲍姆	,	2022年9月24日
耳语	自动语音识别系统使用从网络收集的 680,000 小时多语言和多任务监督数据进行训练	亚历克·雷德福金钟旭徐涛格雷格·布罗克曼其他的克里斯汀·麦克莱维伊利亚·苏茨克韦尔	博客文章 , ,	2022年9月21日
去旧化（视频）	为您自己的视频上色！	贾森·安提克	, 模型 , 网站 ,	2022年9月19日
去旧化（照片）	为您自己的照片上色！	贾森·安提克马特·罗宾逊玛丽亚·贝纳文特	, 模型网站	2022年9月19日
真实ESRGAN	将强大的 ESRGAN 扩展到实际的恢复应用，该应用使用纯合成数据进行训练	王新涛谢良斌董超英山	, , , ,	2022年9月18日
IDE-3D	用于高分辨率 3D 感知肖像合成的交互式解缠结编辑	孙景祥王旋施宜春王丽珍其他的王珏刘业斌	, , ,	2022年9月8日
决策变压器	将 RL 问题转化为条件序列模型的架构展开附加信息版本 1.0.0 类型其他源码更新时间 2024-12-27 大小 804.02KB 来自于 Github 相关应用 awesome citygml 2024-11-13 awesome generative ai guide 2024-11-05 GitHub sgrebnov/cordova plugin background download 2024-11-05 awesome swift 2024-11-03 Awesome Devil游戏 2023-04-16 很棒的广告 2022-08-08 为您推荐 chat.petals.dev 其他源码 1.0.0 GPT Prompt Templates 其他源码 1.0.0 GPTyped 其他源码 GPTyped 1.0.5 waymo open dataset 其他源码 December 2023 Update SmartTube 其他源码 24.71 Stable Sunamu 其他源码 Release 2.2.0 waymo open dataset 其他源码 December 2023 Update termwind 其他类别 v2.3.0 wp functions 其他类别 1.0.0 相关资讯全部如何解决《潜行者 2：切尔诺贝利之心》中的卡顿问题 2024-11-23 《堡垒之夜》中的 Juice WRLD 在哪里？ 2024-11-23 如何开始《星球大战：亡命徒》中的外卡扩展 2024-11-23 北京市再添一家新型研发机构完善人工智能安全与治理布局 2024-11-22 研讨班在沪开班古特雷斯出席合作加强人工智能能力建设中国提议在联合国大会通过 2024-11-22 构建人工智能框架找到最有效溶菌酶 2024-11-22 AI大模型迈入应用元年金融机构加码构建智能算力新生态 2024-11-22 MiniMax闫俊杰：大模型快就是好可有时候慢是为了更快 2024-11-22 人工智能进校园点亮学生科学梦 2024-11-22 人工智能激活消费制造永康健身器械热销国内外市场 2024-11-22 英伟达投资Sakana AI B轮融资，助力生成式人工智能发展 2024-11-22 AI正解锁新的认知革命！普适读本新科技通识课，人工智能发展时间表：2028 年制作影片，2049年撰写畅销书籍…… 2024-11-22 Products & Services Install APK APK signature verification APK Download Service Company Developer Console Submit APK Monetization of traffic through downcodes Legal About us Contact Us Cooperation [email protected]