awesome colab notebooks 다운로드 - awesome colab notebooks 소스 코드 다운로드

페이지가 제대로 렌더링되지 않을 수 있습니다. README.md 파일을 직접 열어주세요

ML 실험을 위한 멋진 Colab 노트북 컬렉션

저장소	서류
페이스북 조사/공동 추적자 반복/데이터체인 callummcdougall/ARENA_3.0 ToTheBeginning/PuLID ZhengPeng7/BiRefNet 한외분해성/한외분해성 언슬로타이/언슬로타이 facebookresearch/segment-anything-2 lllyasviel/IC-라이트 gemelo-ai/vocos comfyanonymous/ComfyUI TransformerLens조직/TransformerLens 홍원장/PyMAF-X 로보플로우/감시 KwaiVGI/LivePortrait piddnad/DDColor 텐센트ARC/인스턴트메시 LAION-AI/미적 예측기 Doubiiu/DynamiCrafter 페이스북리서치/홈로봇 KillianLucas/개방형 통역사 jxnl/강사	리다 가우스 스플래팅 Tune-A-Video 당신의 포즈를 따르세요 Text2Video-제로 글립 UniFormerV2 SadTalker 올빼미-ViT 비디오리토킹 LDM 꿈의 들판 데틱 그래프캐스트 드래그GAN VRT 박판 스플라인 모션 모델 PyMAF-X 페이트제로 py-irt VQ-확산 이콘

연구

이름	설명	작가	모래밭	업데이트
공동 추적기	전체 비디오에서 여러 지점을 공동으로 추적하는 아키텍처	니키타 카라예프 이그나시오 로코 벤저민 그레이엄 나탈리아 네버로바 다른 사람 안드레아 베달디 크리스티안 루프레히트	, 프로젝트	2024년 10월 16일
PIFU	고해상도 옷을 입은 인간 디지털화를 위한 픽셀 정렬 암시적 함수	나츠메 료타 사이토 슌스케 젱 황 가나자와 앙주 리 하오리		2024년 8월 10일
차이얼굴	복잡한 손실 설계 없이 눈에 보이지 않는 복잡한 열화에 보다 우아하게 대처할 수 있는 방법	유에 종셩 첸 체인지 로이	, , ,	2024년 5월 10일
세그먼트 무엇이든 2	이미지와 비디오의 신속한 시각적 분할을 해결하기 위한 기초 모델	니힐라 라비 발렌틴 가뵈르 후 위안팅 후 롱항 다른 사람 차이타냐 리알리 마 텡규 하이탐 케드르 로만 래들 클로이 롤랜드 로라 구스타프손 에릭 민턴 정팅팬 [칼얀 바수데프](lwala](https://scholar.google.co.in/citations?user=m34oaWEAAAAJ) 니콜라스 카리온 [차오위안](u](https://chaoyuan.org/) 로스 거식 피오트르 달러르 크리스토프 파이히텐호퍼	데모 , , 프로젝트 , , ,	2024년 10월 1일
오픈-언믹스	연구원, 오디오 엔지니어 및 아티스트에게 적용 가능한 음악 소스 분리를 위한 심층 신경망 참조 구현	파비안-로베르트 스토터 앙투안 리우트쿠스	데이터 프로젝트	2024년 9월 25일
깊은 회화적 조화	알고리즘은 사진 합성이나 글로벌 스타일화 기술보다 훨씬 더 나은 결과를 생성하며 다른 방법으로는 달성하기 어려운 창의적인 회화적 편집을 가능하게 합니다.	푸준 루안 실뱅 파리 엘리 셰흐트만 카비타 발라	, , ,	2024년 9월 23일
오디오2포토리얼	두 쌍의 상호 작용의 대화 역학에 따라 몸짓을 하는 사실적인 전신 아바타를 생성하기 위한 프레임워크	에본 응 하비에르 로메로 티무르 바가우트디노프 바이 샤오지에 다른 사람 트레버 대럴 가나자와 앙주 알렉산더 리차드	프로젝트	2024년 9월 13일
무엇이든 빠르게 세그먼트화	SAM 작성자가 게시한 SA-1B 데이터 세트의 2%만을 사용하여 훈련된 CNN Segment Anything 모델	쉬 자오 딩 원차오 안용기 두 잉롱 다른 사람 타오 유 민 리 명나라 당나라 왕 진차오	, , ,	2024년 10월 9일
신경안젤로	RGB 비디오 캡처에서 충실도가 높은 3D 표면 재구성을 위한 프레임워크	리 자오슈오 토마스 뮐러 알렉스 에반스 러셀 테일러 다른 사람 마티아스 운베라스 리우 밍유 린 첸수안	블로그 게시물 프로젝트 , ,	2024년 2월 9일
BiRefNet	고해상도 이분법적 이미지 분할을 위한 양측 참조 프레임워크	펭 정 가오 데홍 덩핑 팬 리 리우 다른 사람 요르마 락소넨 완리 어우양 니쿠 세베	, , , , 프로젝트 , ,	2024년 8월 23일
회전	루프의 모델 피팅을 통해 3D 인간 자세 및 모양을 재구성하는 방법 학습	니코스 콜로투로스 게오르기오스 파블라코스 마이클 블랙 코스타스 다닐리디스	, 프로젝트	2024년 8월 21일
YOLOv10	후처리 및 모델 아키텍처 모두에서 YOLO의 성능 효율성 경계를 더욱 발전시키는 것을 목표로 합니다.	왕 아오 첸 후이 카이 첸 지지아 린 다른 사람 한중공 구이광 딩	블로그 게시물 데모 , , , , , , , , , , , , ,	2024.08.20
사양VQGAN	훈련 데이터 세트를 일련의 대표 벡터로 축소하여 시각적으로 안내되는 사운드 생성을 길들이기	블라디미르 이아신 에사 라투	, , , , , , , , 프로젝트 , ,	2024년 7월 12일
라이브 초상화	실제 사용을 위한 더 나은 일반화, 제어 가능성 및 효율성에 초점을 맞춘 비디오 기반 초상화 애니메이션 프레임워크	궈 지안주 장딩윤 리우 샤오창 지저우 종 다른 사람 장 위안 완 펑페이 디 장	, , , , 프로젝트 , , , , ,	2024년 10월 7일
맥	프레임별 초기화 및 시간적 개선을 통해 모든 지점 추적	칼 도어쉬 이양 멜 베세릭 딜라라 고케이 다른 사람 안쿠시 굽타 유수프 아이타르 주앙 카레이라 앤드류 지서만	, 블로그 포스트, 블로그 포스트 ,	2024년 5월 7일
Wav2Lip	립싱크 전문가는 야생에서 음성을 생성하는 데 필요한 모든 것입니다	프라즈왈 레누카난드 루드라바 무코파디아이 비나이 남부디리 이력서 자와하르	데이터 데모 프로젝트	2024년 6월 27일
DeepLabCut	최소한의 훈련 데이터로 우수한 결과를 달성하는 심층 신경망을 이용한 전이 학습 기반의 효율적인 마커 없는 자세 추정 방법	알렉산더 마티스 프라나브 마미다나 케빈 큐리 아베 타이가 다른 사람 벤카테시 머티 매켄지 마티스 마티아스 베스게	, , , , , 법정 , 웹사이트 , ,	2024년 5월 6일
풀이전	MetaFormer는 실제로 비전에 필요한 것입니다	유 웨이하오 미루오 판저우 첸양시 다른 사람 저우 이첸 왕 신차오 지아시 펭 얀 슈이쳉	, ,	2024년 6월 1일
스토리확산	생성된 이미지 간의 일관성을 크게 높이고 널리 사용되는 사전 학습된 확산 기반 텍스트-이미지 모델을 제로샷 방식으로 강화하는 일관된 Self-Attention이라고 하는 self-attention 계산 방법	저우 유펑 저우 다취안 밍밍 쳉 지아시 펭 허우 키빈	프로젝트 ,	2024년 5월 4일
PuLID	텍스트-이미지 생성을 위한 튜닝이 필요 없는 ID 사용자 정의 방법인 Pure 및 Lightning ID 사용자 정의	지난 구오 우 얀쩌 첸 주오웨이 랑첸 허 치안	, ,	2024년 5월 3일
영화	중간 움직임이 큰 두 개의 입력 이미지에서 여러 중간 프레임을 합성하는 프레임 보간 알고리즘	핏썸 레다 얀 콘트카넨 에릭 타벨리온 더칭 선 다른 사람 캐롤라인 판토파루 브라이언 컬리스	데이터, 데이터, 데이터 프로젝트 , ,	2024년 5월 3일
보이스크래프트	오디오북, 인터넷 비디오 및 팟캐스트의 음성 편집 및 제로샷 텍스트 음성 변환 모두에서 최첨단 성능을 달성하는 토큰 채우기 신경 코덱 언어 모델	푸위안 펭 황 포야오 리 상웬 압델라흐만 모하메드 데이비드 하워스	프로젝트 , ,	2024년 4월 21일
풍미	재료 예시 이미지가 주어지면 입력 이미지의 물체로 제로샷 재료를 전송하는 방법	쳉 타잉 프라풀 샤르마 앤드루 마크햄 니키 트리고니 바룬 잠파니	, 프로젝트	2024년 4월 16일
인스턴트메시	단일 이미지에서 즉각적인 3D 메시 생성을 위한 피드포워드 프레임워크로, 최첨단 생성 품질과 상당한 훈련 확장성을 갖추고 있습니다.	지알레 쑤 웨이하오 쳉 가오 이미밍 왕 신타오 다른 사람 가오 성화 잉샨	, ,	2024년 4월 16일
알파폴드	매우 정확한 단백질 구조 예측	존 점퍼 리차드 에반스 알렉산더 프리첼 팀 그린 다른 사람 마이클 피구르노프 올라프 로네베르거 캐서린 투냐수부나쿨 러스 베이츠 아우구스틴 지덱 안나 포타펜코 알렉스 브리지랜드 클레멘스 메이어 사이먼 콜 앤드류 발라드 베르나르디노 로메라-파레데스 스타니슬라프 니콜로프 리슈브 자인	블로그 포스트, 블로그 포스트 , 종이 ,	2024년 4월 15일
뷔르스트헨	대규모 텍스트-이미지 확산 모델을 위해 경쟁력 있는 성능과 전례 없는 비용 효율성을 결합한 텍스트-이미지 합성을 위한 아키텍처	파블로 페르니아스 도미닉 람파스 마츠 리히터 크리스토퍼 팔 마크 오브레빌		2024년 4월 6일
AQLM	추가 양자화를 통한 대규모 언어 모델의 극단적인 압축	Vage Egiazarian 안드레이 판페로프 데니스 쿠즈네델레프 엘리아스 프란타르 다른 사람 아르템 바벤코 단 알리스타	, , ,	2024년 8월 3일
YOLOv9	프로그래밍 가능한 기울기 정보를 사용하여 배우고 싶은 내용 학습	왕 치엔야오 아이하우 예 홍위안 마크 랴오	, 블로그 게시물 , , , , ,	2024년 5월 3일
다중 LoRA 구성	LoRA Switch 및 LoRA Composite는 특히 복잡한 구도에서 정확성과 이미지 품질 측면에서 기존 기술을 능가하는 것을 목표로 하는 접근 방식입니다.	종 밍 쉔 예롱 왕슈오항 야동 루 다른 사람 자오 이주 오우양 시루 유동한 한 지아웨이 웨이주 첸	웹사이트	2024년 3월 3일
아마레토	인간 질병의 생물학적 시스템 내에서 공유되고 구별되는 세포 회로와 동인을 식별하기 위한 규제 네트워크의 다중 규모 및 다중 모드 추론	나탈리 포셰트 올리비에 게베르트 모센 나비안 자옌드라 신데 다른 사람 셀린 에버라에르트 소린 타보르	생체 전도체 프로젝트	2024년 2월 28일
리다	문법에 구애받지 않는 시각화 및 인포그래픽 생성을 위한 도구	빅터 디비아	, 프로젝트 , ,	2024년 2월 6일
ViT	Vision Transformer 및 MLP-Mixer 아키텍처	알렉세이 도소비츠키 루카스 베이어 알렉산더 콜레스니코프 더크 바이센보른 다른 사람 자이 샤오화 토마스 운터시너 모스타파 데가니 마티아스 마인더러 게오르그 하이골드 실뱅 젤리 야콥 우슈코레이트 닐 홀스비	, , , , , , 블로그 게시물 , , , , ,	2024년 2월 6일
켄 번스 3D 모델	PyTorch를 사용하여 단일 이미지에서 3D Ken Burns 효과의 참조 구현 - 단일 입력 이미지가 주어지면 가상 카메라 스캔을 사용하여 이 정지 이미지에 애니메이션을 적용하고 모션 시차에 따라 확대/축소합니다.	마누엘 로메로		2024년 1월 24일
VALL-E X	교차 언어 음성 합성을 위한 교차 언어 신경 코덱 언어 모델	장 지창 롱 저우 왕 청이 산위안 첸 다른 사람 유 우 리우 슈지에 첸 주오 리우 옌칭 왕 후아밍 리 진위 레이 허 자오 셩 푸루 웨이	, , 데모 프로젝트	2024년 1월 19일
포토메이커	임의 개수의 입력된 ID 이미지를 주로 ID 정보 보존을 위해 스택 ID 임베딩으로 인코딩하는 효율적인 개인화 텍스트 이미지 생성 방법	리 젠 카오 밍뎅 왕 신타오 치 종강 다른 사람 밍밍 쳉 잉샨	, , , , , 프로젝트 ,	2024년 1월 18일
DD컬러	이미지 색상화를 위한 듀얼 디코더를 사용한 엔드투엔드 방식	강샤오양 타오양 웬치 어우양 페이란 렌 다른 사람 리 링지 시에 쉬안송	,	2024년 1월 15일
패스	강력한 Real-ISR과 개인화된 스타일화를 달성하기 위한 픽셀 인식 안정적인 확산 네트워크	타오양 페이란 렌 시에 쉬안송 장 레이	,	2024년 12월 1일
핸드리파이너	확산 기반 조건부 인페인팅을 통해 생성된 이미지의 기형 손 개선	루원취안 쉬 유페이 장 징 왕 차오유에 다청 타오	, ,	2024년 8월 1일
그래프캐스트	숙련된 중거리 세계 일기예보 학습	레미 램 알바로 산체스-곤잘레스 매튜 윌슨 피터 윈스베르거 다른 사람 메이레 포르투나토 페란 알렛 수만 라부리 티모 에왈즈 잭 이튼-로젠 후 웨이화 알렉산더 메로즈 스테판 호이어 조지 홀랜드 오리올 바이닐스 재클린 스토트 알렉산더 프리첼 샤키르 모하메드 피터 바탈리아	데이터 , , , , , , , ,	2024년 1월 4일
ESM	진화적 규모 모델링: 단백질에 대한 사전 훈련된 언어 모델	린제밍 로샨 라오 브라이언 히이 주 종카이 다른 사람 알란 도스 산토스 코스타 마리암 파젤-자란디 톰 세르쿠 살바토레 칸디도 알렉산더 리브스 조슈아 마이어 로버트 베르쿠일 제이슨 리우 클로이 수 아담 레러	ESM 아틀라스 FSDP ICML 데이터 종이, 종이, 종이, 종이 출판된 ,	2023년 12월 28일
LLaVA	범용 시각 및 언어 이해를 위해 비전 인코더와 LLM을 연결하는 엔드투엔드 훈련된 대규모 다중 모드 모델인 대규모 언어 및 비전 도우미	하오티안 리우 리춘위안 우 칭양 이용재 리 유헝	, , , , 데모 , , , , , , 프로젝트 , , , , ,	2023년 12월 22일
배경 매트 V2	최신 GPU에서 4K 해상도에서 30fps, HD에서 60fps로 작동하는 실시간 고해상도 배경 교체 기술	린 산촨 안드레이 랴브체프 수미야딥 센굽타 브라이언 컬리스 다른 사람 스티브 사이츠 아이라 케멜마허-슐리제르만	, 프로젝트 ,	2023년 12월 22일
가우스 스플래팅	경쟁력 있는 훈련 시간을 유지하는 동시에 최첨단 시각적 품질을 제공하며 중요한 것은 1080p 해상도에서 고품질 실시간(≥ 100fps) 참신한 뷰 합성을 허용하는 것입니다.	베른하르트 케르블 게오르기오스 코파나스 토마스 라임퀼러 조지 드레타키스	프로젝트 , , , , , ,	2023년 12월 19일
SMPLer-X	최대 ViT-Huge를 백본으로 삼아 최초의 일반 기반 모델을 향해 EHPS를 확장하고 다양한 데이터 소스에서 최대 450만 개의 인스턴스를 학습합니다.	종강 카이 완치 인 병든 젱 첸 웨이 다른 사람 칭핑썬 왕옌준 후이엔팡 하이이 메이 장 밍위안 장 레이 첸 체인지 로이 레이양 지웨이 리우	, , 프로젝트 ,	2023년 12월 18일
딥캐시	모델 아키텍처 관점에서 확산 모델을 가속화하는 학습 없는 패러다임	마 신인 공판팡 왕 신차오	프로젝트	2023년 12월 18일
매직애니메이트	시간적 일관성 향상, 참조 이미지의 충실한 보존, 애니메이션 충실도 향상을 목표로 하는 확산 기반 프레임워크	쉬종콩 장젠펑 류준하오 한슈 얀 다른 사람 리우 지아웨이 장첸수 지아시 펭 마이크 쇼	, , 프로젝트 웹사이트 , ,	2023년 12월 18일
DiffBIR	생성 확산 이전을 이용한 블라인드 이미지 복원을 향하여	린 신치 허 징웬 첸 지얀 류 자오양 다른 사람 벤 페이 보다이 완리 어우양 유교 차오동	프로젝트 ,	2023년 12월 18일
오디오LDM	대조 언어-오디오 사전 훈련 잠재성으로부터 연속적인 오디오 표현을 학습하기 위해 잠재 공간에 구축된 텍스트-오디오 시스템	리우 하오헤 제화 첸 이 위안 메이 신하오 다른 사람 리우 쉬보 다닐로 만디치 왕웬우 마크 플럼블리	, , 프로젝트	2023년 2월 12일
탭PFN	표 형식 데이터 예측을 학습한 신경망	노아 홀만 사무엘 뮐러 카타리나 에겐스퍼거 프랭크 허터	, , , , , 블로그 게시물	2023년 11월 29일
컨셉 슬라이더	사전 학습된 모델 위에 적용되는 플러그 앤 플레이 하위 등급 어댑터	로히트 간디코타 요안나 마테르진스카 저우 팅루이 안토니오 토랄바 데이비드 바우	, 프로젝트	2023년 11월 26일
Qwen-VL	텍스트와 이미지를 모두 인식하고 이해하도록 설계된 대규모 비전 언어 모델 세트	바이 진저 바이 슈아이 양 슈셩 왕 시지에 다른 사람 신안 탄 왕펭 린준양 창저우 저우 징렌	, , 데모 , , , , ,	2023년 11월 24일
애니메이션GANv3	빠른 사진 애니메이션을 위한 이중 꼬리 생성적 적대 네트워크	강 리우 신 첸	프로젝트 , , , , ,	2023년 11월 23일
이타카	고대 그리스 비문의 텍스트 복원, 지리적, 연대적 귀속을 위한 최초의 심층 신경망	야니스 아사엘 테아 좀머쉴드 브렌든 실링포드 마야르 보드바 다른 사람 존 파블로풀로스 마리타 차치파나기토우 이온 안드루소풀로스 조나단 프라그 난도 데 프레이타스	, 프로젝트	2023년 11월 21일
PixArt-Σ	4K 텍스트-이미지 생성을 위한 확산 변환기의 약-강 훈련	첸준송 총지안 게 엔제 시에 우 위에 다른 사람 야오 러웨이 샤오저 렌 왕 종다오 핑 루오 루 후촨 리 정궈	, , , 프로젝트	2023년 7월 11일
제로123++	단일 입력 뷰에서 3D 일관성이 있는 다중 뷰 이미지를 생성하기 위한 이미지 조절 확산 모델	루오시 시 한성 첸 장주오양 류밍화 다른 사람 쑤 차오 웨이 신웨 링하오 첸 종 젱 하오수	, ,	2023년 10월 26일
UniFormerV2	효율적인 시공간 표현 학습을 위한 통합 변환기	리쿤창 얄리 왕 허 이난 리 이주오 다른 사람 왕이 왕리민 유교	, , , , , , ,	2023.10.20
쇼-1	텍스트-비디오 생성을 위해 픽셀 기반 및 잠재 기반 VDM을 결합한 Show-1이라는 하이브리드 모델	데이비드 준하오 장 제이 장지에 우 리우 지아웨이 자오 루이 다른 사람 링민 란 구 유차오 디페이 가오 마이크 정 쇼우	, , , , , 프로젝트	2023년 10월 15일
오디오Sep	자연어 쿼리를 사용한 오픈 도메인 오디오 소스 분리를 위한 기초 모델	리우 쉬보 콩추창 자오얀 리우 하오헤 다른 사람 이 위안 유위주오 루이 샤 왕 위쉬안 마크 플럼블리 왕웬우	프로젝트	2023년 12월 10일
다클립	이미지 복원을 위한 범용 프레임워크로서 사전 학습된 비전 언어 모델을 하위 수준 비전 작업으로 더 효과적으로 전송하기 위한 저하 인식 비전 언어 모델	지웨이 루오 프레드릭 구스타프손 정 자오 Jens Sjölund 토마스 쇤	프로젝트	2023년 11월 10일
SadTalker	오디오에서 3DMM의 3D 동작 계수를 생성하고 말하는 머리 생성을 위한 새로운 3D 인식 얼굴 렌더링을 암시적으로 변조합니다.	장원쉬안 쿤 샤오동 왕쉬안 장용 다른 사람 시 션 유궈 잉샨 왕 페이	, , , , , , , 프로젝트 , , ,	2023년 10월 10일
무지카	단일 소비자 GPU를 사용하여 수백 시간의 음악에 대해 훈련할 수 있고 소비자 CPU에서 임의 길이의 음악을 실시간 생성하는 것보다 훨씬 빠른 음악 생성 시스템	마르코 파시니 얀 슐뤼터	, 데이터 , 프로젝트 ,	2023년 9월 10일
YOLOv6	산업용 애플리케이션 전용 단일 단계 객체 감지 프레임워크	카이헝 웽 멩 쳉 리 이두오 샹샹 추 웨이 샤오린	, 블로그 게시물 데이터 , , , , , ,	2023년 8월 10일
드림가우시안	3D 가우시안을 텍스처 메쉬로 변환하고 미세 조정 단계를 적용하여 세부 사항을 개선하는 알고리즘	탕 지아샹 지아웨이 렌 항저우 지웨이 리우 강 젱	, , 프로젝트	2023년 10월 4일
상	일련의 이미지가 주어지면 이 방법은 각 이미지에서 상세한 3D 표면을 추정한 다음 이를 애니메이션 가능한 아바타로 결합합니다.	율량 슈 양진롱 디미트리오스 치오나스 마이클 블랙	, , , , , , , 프로젝트	2023년 8월 31일
DINOV2	다양한 컴퓨터 비전 작업에서 선형 레이어처럼 간단한 분류기와 함께 직접 사용할 수 있는 고성능 시각적 기능을 생성합니다. 이러한 시각적 기능은 강력하며 미세 조정 요구 사항 없이 여러 도메인에서 잘 작동합니다.	막심 오콰브 티모시 다르셋 테오 무타카니 후이 보 다른 사람 마크 사프라니에츠 바실 칼리도프 피에르 페르난데스 다니엘 하지자 프란시스코 마사 알라엘딘 엘누비 마흐무드 아스란 니콜라스 발라스 보이치에흐 갈루바 러셀 하우즈 황 포야오 리 상웬 이샨 미스라 마이클 라바트 바수 샤르마 가브리엘 신나이브 후 쉬 에르베 제구 줄리앙 마이랄 패트릭 라바투트 아르망 주랭 표트르 보자노프스키	블로그 게시물 데모 , , ,	2023년 8월 31일
올빼미-ViT	Vision Transformer를 사용한 간단한 개방형 어휘 개체 감지	마티아스 마인더러 알렉세이 그리첸코 오스틴 스톤 막심 노이만 다른 사람 더크 바이센보른 알렉세이 도소비츠키 아라빈드 마헨드란 아누라그 아르나브 모스타파 데가니 쉔 주오란 샤오 왕 자이 샤오화 토마스 키프 닐 홀스비		2023년 8월 21일
스타일GAN3	별칭 없는 생성적 적대 신경망	테로 카라스 미카 아이탈라 사무리 레인 에릭 하르코넨 다른 사람 잔느 헬스텐 야코 레티넨 티모 아일라	, , , , , , , , , 프로젝트	2023년 8월 13일
페이트제로	프롬프트별 트레이닝이나 용도별 마스크 없이 실제 영상에 대한 제로샷 텍스트 기반 편집 방법	치첸양 쿤 샤오동 장용 첸양 레이 다른 사람 왕 신타오 잉샨 첸 치펑	, , 프로젝트 동영상	2023년 8월 13일
빅간	고충실도 자연 이미지 합성을 위한 대규모 GAN 훈련	앤드류 브록 제프 도나휴 카렌 시몬얀		2023년 8월 3일
라마승	푸리에 컨볼루션을 사용한 해상도가 뛰어난 대형 마스크 인페인팅	로만 수보로프 엘리자베타 로가체바 안톤 마시킨 아나스타샤 레미조바 다른 사람 아르세니 아슈카 알렉세이 실베스트로프 공내진 하시스 고카 박기웅 빅터 렘피츠키	, , , 프로젝트	2023년 8월 2일
메이크잇톡	오디오를 유일한 입력으로 사용하여 단일 얼굴 이미지에서 표정이 풍부한 말하는 머리 비디오를 생성하는 방법	양저우 한 신통 엘리 셰흐트만 호세 에체베리아 다른 사람 에반겔로스 칼로게라키스 리 딩제유	데이터 프로젝트	2023년 7월 27일
HiDT	고해상도에서 이미지 변환을 적용할 수 있는 생성적 이미지-이미지 모델 및 새로운 업샘플링 방식	데니스 코르젠코프 글렙 스터킨 세르게이 니콜렌코 빅터 렘피츠키	프로젝트 ,	2023년 7월 24일
칼 장수	감독되지 않은 객체 감지 및 분할 모델을 훈련하기 위한 간단한 접근 방식	왕 쉬동 로히트 기르드하르 스텔라 유 이샨 미스라	, 프로젝트	2023년 7월 24일
무엇이든 인식 및 Tag2Text	시각 언어 기능 학습을 안내하기 위해 비전 언어 모델에 이미지 태깅을 도입하는 비전 언어 사전 훈련 프레임워크	황 신유 장 유차이 마진유 리 자오양 다른 사람 셰옌춘 진 위주오 통 루오 리 야첸 궈 옌둥 궈 옌둥 장 레이	, , 프로젝트, 프로젝트	2023년 7월 9일
박판 스플라인 모션 모델	엔드투엔드 비지도 모션 전송 프레임워크	자오 지안 장휘	, , , 저녁을 먹다	2023년 7월 7일
드래그GAN	GAN 드래그: 생성 이미지 매니폴드에서 대화형 포인트 기반 조작	신강판 아유시 테와리 토마스 라임퀼러 리우 링지에 다른 사람 아비미트라 메카 크리스티안 테오발트	프로젝트	2023년 7월 3일
모바일SAM	모바일 애플리케이션을 위한 경량 SAM을 향하여	장 차오닝 한동센 유교 김정욱 다른 사람 배성호 이승규 홍충선	, , , , , , ,	2023년 6월 30일
접지 DINO	오픈 세트 객체 감지를 위한 접지된 사전 훈련과 DINO의 결합	리우 실롱 젱 자오양 렌 티안허 리 펑 다른 사람 장하오 양 지에 리춘위안 양 지안웨이 항수 주 준 장 레이	, , , , , , , , , , , ,	2023년 6월 28일
T5X	다양한 규모의 시퀀스 모델에 대한 고성능, 구성 가능, 셀프 서비스 교육, 평가 및 추론을 위한 모듈식, 구성 가능, 연구 친화적인 프레임워크	아담 로버츠 정형원 안셀름 레프스카야 가우라브 미슈라 다른 사람 제임스 브래드버리 다니엘 안도르 샤란 나랑 브라이언 레스터 콜린 개프니 아프로즈 모히우딘 커티스 호손 아이토르 레프코비치 알렉스 살시아누 마크 반 지 제이콥 오스틴 세바스찬 굿맨 리비오 발디니 소아레스 후 하이탕 사샤 츠뱌시첸코 아칸샤 차우더리 자스민 바스팅스 야니스 불리안 자비에르 가르시아 니 지안모 캐슬린 케닐리 조나단 클라크 댄 가레트 제임스 리-소프 콜린 라펠 노암 셰이저 마빈 리터 마르텐 보스마 알렉상드르 파소스 제레미 마이틴 셰퍼드 노아 피델 브레넌 사에타 라이언 세파시 알렉산더 스피리도노프 조슈아 뉴런 안드레아 게스문도	, , , ,	2023년 6월 27일
코드토커	학습된 코드북의 유한 프록시 공간에서 코드 쿼리 작업으로 음성 기반 얼굴 애니메이션을 캐스팅합니다. 이는 교차 모달 매핑 불확실성을 줄여 생성된 모션의 생생함을 효과적으로 향상시킵니다.	[진보싱](진보싱) 멍한 시아 장 위에첸 쿤 샤오동 다른 사람 왕주 티엔친 웡	, , , , , , , , , , , , , , , 프로젝트	2023년 6월 16일
이미지 애니메이션을 위한 1차 모션 모델	얼굴 움직임을 비디오에서 이미지로 옮기기	알리악산드르 시아로힌	프로젝트	2023년 6월 4일
병렬 WaveGAN	자신만의 멋진 보코더를 만들기 위한 최첨단 비자동회귀 모델	하야시 토모키	, , 데모 ,	2023년 6월 1일
이콘	암시적 표현과 명시적 표현의 최고의 속성을 결합한 "컬러 이미지의 인간 디지털화"를 위해 설계되어 헐렁한 옷을 입고 있거나 어려운 포즈를 취하는 경우에도 야생 이미지에서 충실도가 높은 3D 옷을 입은 인간을 추론합니다.	율량 슈 양진롱 쉬 카오 디미트리오스 치오나스 마이클 블랙	, , , , , , , , ,	2023년 5월 31일
MMS	Massively Multilingual Speech 프로젝트는 1100개 이상의 언어를 지원하는 단일 다국어 음성 인식 모델, 4000개 이상의 언어를 식별할 수 있는 언어 식별 모델, 1400개 이상의 언어를 지원하는 사전 훈련된 모델 및 텍스트 대 1,100개 이상의 언어에 대한 음성 모델	비닐 프라탑 안드로스 찬드라 보웬시 파덴 토마셀로 다른 사람 아룬 바부 사야니 쿤두 알리 엘카키 니 자오헝 아푸르브 비아스 마리암 파젤-자란디 알렉세이 바에프스키 요시 아디 장 샤오후이 슈 웨이닝 알렉시스 코노 마이클 아울리	, , ,	2023년 5월 26일
팹	흐름 AIS 부트스트랩은 AIS를 사용하여 흐름이 대상에 대한 근사치가 좋지 않은 지역에서 샘플을 생성하여 새로운 모드의 발견을 촉진합니다.	로렌스 미글리 빈센트 스팀퍼 그레고르 NC 심 베른하르트 셸코프 호세 미구엘 에르난데스-로바토	,	2023년 4월 29일
코드이전	코드 예측을 위해 저품질 얼굴의 전역 구성 및 컨텍스트를 모델링하는 변환기 기반 예측 네트워크로, 입력이 심각하게 저하되는 경우에도 대상 얼굴에 매우 가까운 자연스러운 얼굴을 발견할 수 있습니다.	저우 상첸 켈빈 찬 리 총이 첸 체인지 로이	, , 프로젝트 , , ,	2023년 4월 21일
Text2Video-제로	텍스트-이미지 확산 모델은 제로샷 비디오 생성기입니다.	레본 카차트리안 안드라닉 모브시시안 바흐람 타데보시안 로베르토 헨첼 다른 사람 왕 장양 샨트 나바사르디안 험프리 시	, , , , , 프로젝트 동영상 ,	2023년 11월 4일
무엇이든 분할하세요	Segment Anything 모델은 점이나 상자와 같은 입력 프롬프트에서 고품질 개체 마스크를 생성하며 이미지의 모든 개체에 대한 마스크를 생성하는 데 사용할 수 있습니다.	알렉산더 키릴로프 에릭 민턴 니힐라 라비 한지 마오 다른 사람 끌로에 롤랜드 로라 구스타프손 테테 샤오 스펜서 화이트헤드 알렉스 버그 로완옌 피오트르 달러르 로스 거식	데이터 , 웹사이트 , ,	2023년 10월 4일
당신의 포즈를 따르세요	포즈 제어가 가능한 캐릭터 비디오를 얻기 위해 이미지 포즈 쌍과 포즈 없는 비디오 데이터 세트 및 사전 훈련된 텍스트-이미지 모델을 활용할 수 있는 2단계 훈련 방식	마 위에 헤 잉칭 쿤 샤오동 왕 신타오 다른 사람 시란 첸 잉샨 리 시우 첸 치펑	, , , 프로젝트 동영상	2023년 4월 7일
EVA3D	훈련을 위해 2D 이미지 컬렉션만 필요한 고품질 무조건 3D 인간 생성 모델	팡저우 홍 자오시 첸 유시 란 리앙 판 지웨이 리우	프로젝트 ,	2023년 4월 6일
안정적인 드림퓨전	사전 훈련된 2D 텍스트-이미지 확산 모델을 사용하여 텍스트-3D 합성 수행	탕 지아샹 벤 풀 아제이 자인 존 배런 벤 밀든홀	, 프로젝트 , , ,	2023년 4월 4일
PIFUHD	고해상도 3D 인간 디지털화를 위한 다단계 픽셀 정렬 암시적 함수	사이토 슌스케 토마스 사이먼 제이슨 사라기 주한별	,	2023년 3월 26일
비디오리토킹	입력 오디오에 따라 실제 말하는 머리 영상의 얼굴을 편집하여 감정이 달라도 립싱크가 가능한 고품질 출력 영상을 제작하는 시스템	쳉 쿤 쿤 샤오동 장용 멍한 시아 다른 사람 페이인 주 밍루이 왕쉬안 왕주 난난 왕	, , , , 프로젝트 , ,	2023년 3월 19일
비주얼 채팅GPT	ChatGPT와 일련의 Visual Foundation 모델을 연결하여 채팅 중에 이미지를 보내고 받을 수 있습니다.	우 천페이 인 셩밍 웨이젠 치 왕 샤오동 다른 사람 탕쩌청 난 두안	, , , ,	2023년 3월 15일
Tune-A-Video	텍스트-비디오 생성을 위한 이미지 확산 모델의 원샷 조정	제이 장지에 우 이샤오 게 왕 신타오 스탠 웨이시안 레이 다른 사람 구 유차오 시 유페이 윈 슈 잉샨 샤오후 치에 마이크 정 쇼우	, , , 프로젝트 ,	2023년 2월 23일
GPEN	야생에서 눈먼 얼굴 복원을 위한 GAN Prior 임베디드 네트워크	타오양 페이란 렌 시에 쉬안송 장 레이	데모 ,	2023년 2월 15일
PyMAF-X	단안 이미지에서 파라메트릭 전신 모델을 복구하기 위한 Kegression 기반 접근 방식	장 홍원 야팅 티안 장 위샹 리 멩청 다른 사람 안량 제난 선 리우 예빈	, , , , 프로젝트	2023년 2월 14일
디스코 디퓨전	AI 아트 및 애니메이션 생성을 위한 노트북, 모델 및 기술의 프랑켄슈타인적 융합	맥스 잉햄 아담 레츠 다니엘 러셀 Chigozie Nri	, ,	2023년 11월 2일
그루베	비트와 드럼 연주를 생성하고 조작하기 위한 기계 학습의 일부 응용	존 길릭 아담 로버츠 제시 엥겔	블로그 게시물 데이터 웹 앱	2023년 2월 2일
멀티트랙 음악VAE	이 노트북의 모델은 기본 코드에 따라 선택적으로 조절되는 최대 8개 트랙의 단일 소절을 인코딩 및 디코딩할 수 있습니다.	이안 사이먼 아담 로버츠 콜린 라펠 제시 엥겔 다른 사람 커티스 호손 더글라스 에크	블로그 게시물	2023년 2월 2일
뮤직VAE	음악의 장기 구조 학습을 위한 계층적 잠재 벡터 모델	아담 로버츠 제시 엥겔 콜린 라펠 커티스 호손 더글라스 에크	블로그 게시물 프로젝트	2023년 2월 2일
그림 배우기	모델 기반 심층 강화 학습을 통한 페인팅 학습	마누엘 로메로		2023년 2월 1일
인스턴트-NGP	다중 해상도 해시 인코딩을 사용한 즉각적인 신경 그래픽 프리미티브	토마스 뮐러 알렉스 에반스 크리스토프 쉬드 알렉산더 켈러	블로그 게시물 , , , , 프로젝트 지도 시간 , , ,	2023년 1월 18일
푸리에 피처 네트워크	푸리에 기능을 통해 네트워크는 저차원 영역에서 고주파 기능을 학습할 수 있습니다.	매튜 탄식 프라툴 스리니바산 벤 밀덴홀 사라 프리도비치-케일 다른 사람 니틴 라가반 우트카르시 싱할 라비 라마무르티 존 배런 렌 응	, 프로젝트	2023년 1월 17일
알파 포즈	전신 부위별 다중 사람 자세 추정 및 실시간 추적	팡 하오슈 리 지에펑 홍양탕 쑤 차오 다른 사람 주 하오이 율량 슈 리용루 세우 루	, 프로젝트 , , ,	2023년 7월 1일
HybrIK	3D 인간 자세 및 형태 추정을 위한 하이브리드 분석-신경 역기구학 솔루션	리 지에펭 쑤 차오 첸 지춘 쓰위안 비안 다른 사람 양 리신 세우 루	프로젝트 저녁을 먹다	2023년 1월 1일
점수 야코비안 체인	학습된 그라디언트에 체인 규칙을 적용하고 미분 가능한 렌더러의 야코비안을 통해 확산 모델의 점수를 역전파합니다. 이를 복셀 복사 필드로 인스턴스화합니다.	왕하오첸 두 샤오단 리 지아하오 레이먼드 예 그렉 샤나로비치	, 프로젝트 ,	2022년 5월 12일
디뮤크	하이브리드 스펙트로그램 및 파형 소스 분리	알렉상드르 데포세즈	, , , , , ,	2022년 11월 21일
스타일CLIP	StyleGAN 이미저의 텍스트 기반 조작	아니면 파타쉬니크 우 종쩌 엘리 셰흐트만 다니엘 코헨-또는 다니 리신스키	, , , ,	2022.10.30
모션 디퓨즈	기존 방법에 비해 몇 가지 원하는 속성을 보여주는 최초의 확산 모델 기반 텍스트 기반 모션 생성 프레임워크	장 밍위안 종강 카이 리앙 판 팡저우 홍 다른 사람 궈 신잉 레이양 지웨이 리우	프로젝트	2022년 10월 13일
VToonify	StyleGAN의 중해상도 및 고해상도 레이어를 활용하여 인코더에서 추출한 다중 규모 콘텐츠 기능을 기반으로 고품질 예술 초상화를 렌더링하여 프레임 세부 정보를 더 잘 보존합니다.	양 슈아이 지앙 리밍 지웨이 리우 첸 체인지 로이	, , , , 프로젝트	2022년 7월 10일
PyMAF	잘 정렬된 신체 메시 복구를 위한 회귀 네트워크의 피라미드 메시 정렬 피드백 루프 및 표현이 풍부한 전신 모델의 복구를 위해 확장	장 홍원 야팅 티안 장 위샹 리 멩청 다른 사람 안량 제난 선 리우 예빈	, , , , 프로젝트 ,	2022년 6월 10일
알파텐서	강화 학습을 통해 더 빠른 행렬 곱셈 알고리즘 발견	알후세인 파우지 마테이 발로그 아자 황 토마스 휴버트 다른 사람 베르나르디노 로메라-파레데스 모하마다민 바레카틴 알렉산더 노비코프 프란시스코 루이스 줄리안 슈리트위저 그르제고르츠 스위르슈치 데이비드 실버 데미스 허사비스 푸시미트 콜리	, , ,	2022년 4월 10일
스윈2SR	이미지 초해상도, 특히 압축 입력 시나리오를 위해 SwinIR을 개선하는 새로운 Swin Transformer V2	마르코스 콘데 최의진 막심 버치 라두 티모프테	, , , , , , ,	2022년 3월 10일
펑타	데이터에서 함수로: 데이터 포인트는 함수이므로 함수처럼 처리할 수 있습니다.	에밀리앙 듀퐁 김현직 알리 에슬라미 다닐로 레젠데 댄 로젠바움	,	2022년 9월 24일
속삭임	웹에서 수집된 680,000시간의 다국어 및 멀티태스킹 지도 데이터를 학습한 자동 음성 인식 시스템	알렉 래드포드 김종욱 타오 쑤 그렉 브록만 다른 사람 크리스틴 맥리비 일리아 수츠케베르	블로그 게시물 , ,	2022년 9월 21일
DeOldify (비디오)	나만의 비디오를 색칠해보세요!	제이슨 앤틱	, 모델 , 웹사이트 ,	2022년 9월 19일
DeOldify (사진)	나만의 사진을 색칠해보세요!	제이슨 앤틱 매트 로빈슨 마리아 베나벤테	, 모델 웹사이트	2022년 9월 19일
실제 ESRGAN	강력한 ESRGAN을 순수 합성 데이터로 학습된 실용적인 복원 애플리케이션으로 확장	왕 신타오 량빈 시에 차오동 잉샨	, , , ,	2022년 9월 18일
IDE-3D	고해상도 3D 인식 인물 사진 합성을 위한 대화형 분리 편집	순 징샹 왕쉬안 시 이춘 리젠 왕 다른 사람 왕주 리우 예빈	, , ,	2022년 8월 9일
의사결정 변환기	RL의 문제를 조건부 시퀀스 모델로 캐스팅하는 아키텍처 확장하다 추가 정보 버전 1.0.0 유형 기타 소스코드 업데이트 시간 2024-12-27 크기 804.02KB 출처 Github 관련 애플리케이션 awesome citygml 2024-11-13 awesome generative ai guide 2024-11-05 GitHub sgrebnov/cordova plugin background download 2024-11-05 awesome swift 2024-11-03 멋진 악마 게임 2023-04-16 멋진 광고 2022-08-08 추천 chat.petals.dev 기타 소스코드 1.0.0 GPT Prompt Templates 기타 소스코드 1.0.0 GPTyped 기타 소스코드 GPTyped 1.0.5 waymo open dataset 기타 소스코드 December 2023 Update SmartTube 기타 소스코드 24.71 Stable Sunamu 기타 소스코드 Release 2.2.0 waymo open dataset 기타 소스코드 December 2023 Update termwind 기타 카테고리 v2.3.0 wp functions 기타 카테고리 1.0.0 관련 정보 전체 Stalker 2: Heart of Chornobyl에서 끊김 문제를 해결하는 방법 2024-11-23 Fortnite에서 Juice WRLD는 어디에 있나요? 2024-11-23 Star Wars Outlaws에서 와일드 카드 확장을 시작하는 방법 2024-11-23 베이징, 인공지능 보안 및 거버넌스 레이아웃 개선을 위해 새로운 R&D 기관 추가 2024-11-22 상하이에서 세미나 개최, 구테레스 참석, 중국의 인공지능 역량강화 협력 제안 유엔총회에서 채택 2024-11-22 가장 효과적인 라이소자임을 찾기 위한 인공지능 프레임워크 구축 2024-11-22 AI 대형 모델이 적용 첫해를 맞이하고 있습니다. 금융기관은 지능형 컴퓨팅 파워의 새로운 생태계를 구축하기 위한 노력을 강화하고 있습니다. 2024-11-22 MiniMax Yan Junjie: 대형 모델에는 빠른 것이 좋지만 때로는 더 빠르기 위해 느린 것이 좋습니다. 2024-11-22 학생들의 과학적 꿈을 밝혀줄 인공지능이 캠퍼스에 들어왔습니다. 2024-11-22 인공지능으로 소비자 제조 활성화, 용강 운동기구 국내외 시장에서 잘 팔려 2024-11-22 Nvidia는 생성 인공 지능 개발을 돕기 위해 Sakana AI의 시리즈 B 자금 조달에 투자합니다. 2024-11-22 AI가 새로운 인지 혁명을 열고 있습니다! 신과학기술 교양과목의 만능읽기, 인공지능 개발시간표 : 2028년에 영상만들기, 2049년에는 베스트셀러 책 집필… 2024-11-22 Products & Services Install APK APK signature verification APK Download Service Company Developer Console Submit APK Monetization of traffic through downcodes Legal About us Contact Us Cooperation [email protected]

awesome colab notebooks

ML 실험을 위한 멋진 Colab 노트북 컬렉션

인기 급상승

연구