awesome colab notebooks
1.0.0
페이지가 제대로 렌더링되지 않을 수 있습니다. README.md 파일을 직접 열어주세요
저장소 | 서류 |
---|---|
|
|
이름 | 설명 | 작가 | 모래밭 | 공동 연구실 | 업데이트 |
---|---|---|---|---|---|
공동 추적기 | 전체 비디오에서 여러 지점을 공동으로 추적하는 아키텍처 |
다른 사람 |
| 2024년 10월 16일 | |
PIFU | 고해상도 옷을 입은 인간 디지털화를 위한 픽셀 정렬 암시적 함수 |
| 2024년 8월 10일 | ||
차이얼굴 | 복잡한 손실 설계 없이 눈에 보이지 않는 복잡한 열화에 보다 우아하게 대처할 수 있는 방법 |
|
| 2024년 5월 10일 | |
세그먼트 무엇이든 2 | 이미지와 비디오의 신속한 시각적 분할을 해결하기 위한 기초 모델 |
다른 사람 |
| 2024년 10월 1일 | |
오픈-언믹스 | 연구원, 오디오 엔지니어 및 아티스트에게 적용 가능한 음악 소스 분리를 위한 심층 신경망 참조 구현 |
|
| 2024년 9월 25일 | |
깊은 회화적 조화 | 알고리즘은 사진 합성이나 글로벌 스타일화 기술보다 훨씬 더 나은 결과를 생성하며 다른 방법으로는 달성하기 어려운 창의적인 회화적 편집을 가능하게 합니다. |
|
| 2024년 9월 23일 | |
오디오2포토리얼 | 두 쌍의 상호 작용의 대화 역학에 따라 몸짓을 하는 사실적인 전신 아바타를 생성하기 위한 프레임워크 |
다른 사람 |
| 2024년 9월 13일 | |
무엇이든 빠르게 세그먼트화 | SAM 작성자가 게시한 SA-1B 데이터 세트의 2%만을 사용하여 훈련된 CNN Segment Anything 모델 |
다른 사람 |
| 2024년 10월 9일 | |
신경안젤로 | RGB 비디오 캡처에서 충실도가 높은 3D 표면 재구성을 위한 프레임워크 |
다른 사람 |
| 2024년 2월 9일 | |
BiRefNet | 고해상도 이분법적 이미지 분할을 위한 양측 참조 프레임워크 |
다른 사람 |
| 2024년 8월 23일 | |
회전 | 루프의 모델 피팅을 통해 3D 인간 자세 및 모양을 재구성하는 방법 학습 |
|
| 2024년 8월 21일 | |
YOLOv10 | 후처리 및 모델 아키텍처 모두에서 YOLO의 성능 효율성 경계를 더욱 발전시키는 것을 목표로 합니다. |
다른 사람 |
| 2024.08.20 | |
사양VQGAN | 훈련 데이터 세트를 일련의 대표 벡터로 축소하여 시각적으로 안내되는 사운드 생성을 길들이기 |
|
| 2024년 7월 12일 | |
라이브 초상화 | 실제 사용을 위한 더 나은 일반화, 제어 가능성 및 효율성에 초점을 맞춘 비디오 기반 초상화 애니메이션 프레임워크 |
다른 사람 |
| 2024년 10월 7일 | |
맥 | 프레임별 초기화 및 시간적 개선을 통해 모든 지점 추적 |
다른 사람 |
| 2024년 5월 7일 | |
Wav2Lip | 립싱크 전문가는 야생에서 음성을 생성하는 데 필요한 모든 것입니다 |
|
| 2024년 6월 27일 | |
DeepLabCut | 최소한의 훈련 데이터로 우수한 결과를 달성하는 심층 신경망을 이용한 전이 학습 기반의 효율적인 마커 없는 자세 추정 방법 |
다른 사람 |
| 2024년 5월 6일 | |
풀이전 | MetaFormer는 실제로 비전에 필요한 것입니다 |
다른 사람 |
| 2024년 6월 1일 | |
스토리확산 | 생성된 이미지 간의 일관성을 크게 높이고 널리 사용되는 사전 학습된 확산 기반 텍스트-이미지 모델을 제로샷 방식으로 강화하는 일관된 Self-Attention이라고 하는 self-attention 계산 방법 |
|
| 2024년 5월 4일 | |
PuLID | 텍스트-이미지 생성을 위한 튜닝이 필요 없는 ID 사용자 정의 방법인 Pure 및 Lightning ID 사용자 정의 |
|
| 2024년 5월 3일 | |
영화 | 중간 움직임이 큰 두 개의 입력 이미지에서 여러 중간 프레임을 합성하는 프레임 보간 알고리즘 |
다른 사람 |
| 2024년 5월 3일 | |
보이스크래프트 | 오디오북, 인터넷 비디오 및 팟캐스트의 음성 편집 및 제로샷 텍스트 음성 변환 모두에서 최첨단 성능을 달성하는 토큰 채우기 신경 코덱 언어 모델 |
|
| 2024년 4월 21일 | |
풍미 | 재료 예시 이미지가 주어지면 입력 이미지의 물체로 제로샷 재료를 전송하는 방법 |
|
| 2024년 4월 16일 | |
인스턴트메시 | 단일 이미지에서 즉각적인 3D 메시 생성을 위한 피드포워드 프레임워크로, 최첨단 생성 품질과 상당한 훈련 확장성을 갖추고 있습니다. |
다른 사람 |
| 2024년 4월 16일 | |
알파폴드 | 매우 정확한 단백질 구조 예측 |
다른 사람 |
| 2024년 4월 15일 | |
뷔르스트헨 | 대규모 텍스트-이미지 확산 모델을 위해 경쟁력 있는 성능과 전례 없는 비용 효율성을 결합한 텍스트-이미지 합성을 위한 아키텍처 |
| 2024년 4월 6일 | ||
AQLM | 추가 양자화를 통한 대규모 언어 모델의 극단적인 압축 |
다른 사람 |
| 2024년 8월 3일 | |
YOLOv9 | 프로그래밍 가능한 기울기 정보를 사용하여 배우고 싶은 내용 학습 |
|
| 2024년 5월 3일 | |
다중 LoRA 구성 | LoRA Switch 및 LoRA Composite는 특히 복잡한 구도에서 정확성과 이미지 품질 측면에서 기존 기술을 능가하는 것을 목표로 하는 접근 방식입니다. |
다른 사람 |
| 2024년 3월 3일 | |
아마레토 | 인간 질병의 생물학적 시스템 내에서 공유되고 구별되는 세포 회로와 동인을 식별하기 위한 규제 네트워크의 다중 규모 및 다중 모드 추론 |
다른 사람 |
| 2024년 2월 28일 | |
리다 | 문법에 구애받지 않는 시각화 및 인포그래픽 생성을 위한 도구 | 빅터 디비아 |
| 2024년 2월 6일 | |
ViT | Vision Transformer 및 MLP-Mixer 아키텍처 |
다른 사람 |
| 2024년 2월 6일 | |
켄 번스 3D 모델 | PyTorch를 사용하여 단일 이미지에서 3D Ken Burns 효과의 참조 구현 - 단일 입력 이미지가 주어지면 가상 카메라 스캔을 사용하여 이 정지 이미지에 애니메이션을 적용하고 모션 시차에 따라 확대/축소합니다. | 마누엘 로메로 | 2024년 1월 24일 | ||
VALL-E X | 교차 언어 음성 합성을 위한 교차 언어 신경 코덱 언어 모델 |
다른 사람 |
| 2024년 1월 19일 | |
포토메이커 | 임의 개수의 입력된 ID 이미지를 주로 ID 정보 보존을 위해 스택 ID 임베딩으로 인코딩하는 효율적인 개인화 텍스트 이미지 생성 방법 |
다른 사람 |
| 2024년 1월 18일 | |
DD컬러 | 이미지 색상화를 위한 듀얼 디코더를 사용한 엔드투엔드 방식 |
다른 사람 |
| 2024년 1월 15일 | |
패스 | 강력한 Real-ISR과 개인화된 스타일화를 달성하기 위한 픽셀 인식 안정적인 확산 네트워크 |
|
| 2024년 12월 1일 | |
핸드리파이너 | 확산 기반 조건부 인페인팅을 통해 생성된 이미지의 기형 손 개선 |
|
| 2024년 8월 1일 | |
그래프캐스트 | 숙련된 중거리 세계 일기예보 학습 |
다른 사람 |
| 2024년 1월 4일 | |
ESM | 진화적 규모 모델링: 단백질에 대한 사전 훈련된 언어 모델 |
다른 사람 |
| 2023년 12월 28일 | |
LLaVA | 범용 시각 및 언어 이해를 위해 비전 인코더와 LLM을 연결하는 엔드투엔드 훈련된 대규모 다중 모드 모델인 대규모 언어 및 비전 도우미 |
|
| 2023년 12월 22일 | |
배경 매트 V2 | 최신 GPU에서 4K 해상도에서 30fps, HD에서 60fps로 작동하는 실시간 고해상도 배경 교체 기술 |
다른 사람 |
| 2023년 12월 22일 | |
가우스 스플래팅 | 경쟁력 있는 훈련 시간을 유지하는 동시에 최첨단 시각적 품질을 제공하며 중요한 것은 1080p 해상도에서 고품질 실시간(≥ 100fps) 참신한 뷰 합성을 허용하는 것입니다. |
|
| 2023년 12월 19일 | |
SMPLer-X | 최대 ViT-Huge를 백본으로 삼아 최초의 일반 기반 모델을 향해 EHPS를 확장하고 다양한 데이터 소스에서 최대 450만 개의 인스턴스를 학습합니다. |
다른 사람 |
| 2023년 12월 18일 | |
딥캐시 | 모델 아키텍처 관점에서 확산 모델을 가속화하는 학습 없는 패러다임 |
|
| 2023년 12월 18일 | |
매직애니메이트 | 시간적 일관성 향상, 참조 이미지의 충실한 보존, 애니메이션 충실도 향상을 목표로 하는 확산 기반 프레임워크 |
다른 사람 |
| 2023년 12월 18일 | |
DiffBIR | 생성 확산 이전을 이용한 블라인드 이미지 복원을 향하여 |
다른 사람 |
| 2023년 12월 18일 | |
오디오LDM | 대조 언어-오디오 사전 훈련 잠재성으로부터 연속적인 오디오 표현을 학습하기 위해 잠재 공간에 구축된 텍스트-오디오 시스템 |
다른 사람 |
| 2023년 2월 12일 | |
탭PFN | 표 형식 데이터 예측을 학습한 신경망 |
|
| 2023년 11월 29일 | |
컨셉 슬라이더 | 사전 학습된 모델 위에 적용되는 플러그 앤 플레이 하위 등급 어댑터 |
|
| 2023년 11월 26일 | |
Qwen-VL | 텍스트와 이미지를 모두 인식하고 이해하도록 설계된 대규모 비전 언어 모델 세트 |
다른 사람 |
| 2023년 11월 24일 | |
애니메이션GANv3 | 빠른 사진 애니메이션을 위한 이중 꼬리 생성적 적대 네트워크 |
|
| 2023년 11월 23일 | |
이타카 | 고대 그리스 비문의 텍스트 복원, 지리적, 연대적 귀속을 위한 최초의 심층 신경망 |
다른 사람 |
| 2023년 11월 21일 | |
PixArt-Σ | 4K 텍스트-이미지 생성을 위한 확산 변환기의 약-강 훈련 |
다른 사람 |
| 2023년 7월 11일 | |
제로123++ | 단일 입력 뷰에서 3D 일관성이 있는 다중 뷰 이미지를 생성하기 위한 이미지 조절 확산 모델 |
다른 사람 |
| 2023년 10월 26일 | |
UniFormerV2 | 효율적인 시공간 표현 학습을 위한 통합 변환기 |
다른 사람 |
| 2023.10.20 | |
쇼-1 | 텍스트-비디오 생성을 위해 픽셀 기반 및 잠재 기반 VDM을 결합한 Show-1이라는 하이브리드 모델 |
다른 사람 |
| 2023년 10월 15일 | |
오디오Sep | 자연어 쿼리를 사용한 오픈 도메인 오디오 소스 분리를 위한 기초 모델 |
다른 사람 |
| 2023년 12월 10일 | |
다클립 | 이미지 복원을 위한 범용 프레임워크로서 사전 학습된 비전 언어 모델을 하위 수준 비전 작업으로 더 효과적으로 전송하기 위한 저하 인식 비전 언어 모델 |
|
| 2023년 11월 10일 | |
SadTalker | 오디오에서 3DMM의 3D 동작 계수를 생성하고 말하는 머리 생성을 위한 새로운 3D 인식 얼굴 렌더링을 암시적으로 변조합니다. |
다른 사람 |
| 2023년 10월 10일 | |
무지카 | 단일 소비자 GPU를 사용하여 수백 시간의 음악에 대해 훈련할 수 있고 소비자 CPU에서 임의 길이의 음악을 실시간 생성하는 것보다 훨씬 빠른 음악 생성 시스템 |
|
| 2023년 9월 10일 | |
YOLOv6 | 산업용 애플리케이션 전용 단일 단계 객체 감지 프레임워크 |
|
| 2023년 8월 10일 | |
드림가우시안 | 3D 가우시안을 텍스처 메쉬로 변환하고 미세 조정 단계를 적용하여 세부 사항을 개선하는 알고리즘 |
|
| 2023년 10월 4일 | |
상 | 일련의 이미지가 주어지면 이 방법은 각 이미지에서 상세한 3D 표면을 추정한 다음 이를 애니메이션 가능한 아바타로 결합합니다. |
|
| 2023년 8월 31일 | |
DINOV2 | 다양한 컴퓨터 비전 작업에서 선형 레이어처럼 간단한 분류기와 함께 직접 사용할 수 있는 고성능 시각적 기능을 생성합니다. 이러한 시각적 기능은 강력하며 미세 조정 요구 사항 없이 여러 도메인에서 잘 작동합니다. |
다른 사람 |
| 2023년 8월 31일 | |
올빼미-ViT | Vision Transformer를 사용한 간단한 개방형 어휘 개체 감지 |
다른 사람 | 2023년 8월 21일 | ||
스타일GAN3 | 별칭 없는 생성적 적대 신경망 |
다른 사람 |
| 2023년 8월 13일 | |
페이트제로 | 프롬프트별 트레이닝이나 용도별 마스크 없이 실제 영상에 대한 제로샷 텍스트 기반 편집 방법 |
다른 사람 |
| 2023년 8월 13일 | |
빅간 | 고충실도 자연 이미지 합성을 위한 대규모 GAN 훈련 |
| 2023년 8월 3일 | ||
라마승 | 푸리에 컨볼루션을 사용한 해상도가 뛰어난 대형 마스크 인페인팅 |
다른 사람 |
| 2023년 8월 2일 | |
메이크잇톡 | 오디오를 유일한 입력으로 사용하여 단일 얼굴 이미지에서 표정이 풍부한 말하는 머리 비디오를 생성하는 방법 |
다른 사람 |
| 2023년 7월 27일 | |
HiDT | 고해상도에서 이미지 변환을 적용할 수 있는 생성적 이미지-이미지 모델 및 새로운 업샘플링 방식 |
|
| 2023년 7월 24일 | |
칼 장수 | 감독되지 않은 객체 감지 및 분할 모델을 훈련하기 위한 간단한 접근 방식 |
|
| 2023년 7월 24일 | |
무엇이든 인식 및 Tag2Text | 시각 언어 기능 학습을 안내하기 위해 비전 언어 모델에 이미지 태깅을 도입하는 비전 언어 사전 훈련 프레임워크 |
다른 사람 |
| 2023년 7월 9일 | |
박판 스플라인 모션 모델 | 엔드투엔드 비지도 모션 전송 프레임워크 |
|
| 2023년 7월 7일 | |
드래그GAN | GAN 드래그: 생성 이미지 매니폴드에서 대화형 포인트 기반 조작 |
다른 사람 |
| 2023년 7월 3일 | |
모바일SAM | 모바일 애플리케이션을 위한 경량 SAM을 향하여 |
다른 사람 |
| 2023년 6월 30일 | |
접지 DINO | 오픈 세트 객체 감지를 위한 접지된 사전 훈련과 DINO의 결합 |
다른 사람 |
| 2023년 6월 28일 | |
T5X | 다양한 규모의 시퀀스 모델에 대한 고성능, 구성 가능, 셀프 서비스 교육, 평가 및 추론을 위한 모듈식, 구성 가능, 연구 친화적인 프레임워크 |
다른 사람 |
| 2023년 6월 27일 | |
코드토커 | 학습된 코드북의 유한 프록시 공간에서 코드 쿼리 작업으로 음성 기반 얼굴 애니메이션을 캐스팅합니다. 이는 교차 모달 매핑 불확실성을 줄여 생성된 모션의 생생함을 효과적으로 향상시킵니다. |
다른 사람 |
| 2023년 6월 16일 | |
이미지 애니메이션을 위한 1차 모션 모델 | 얼굴 움직임을 비디오에서 이미지로 옮기기 | 알리악산드르 시아로힌 |
| 2023년 6월 4일 | |
병렬 WaveGAN | 자신만의 멋진 보코더를 만들기 위한 최첨단 비자동회귀 모델 | 하야시 토모키 |
| 2023년 6월 1일 | |
이콘 | 암시적 표현과 명시적 표현의 최고의 속성을 결합한 "컬러 이미지의 인간 디지털화"를 위해 설계되어 헐렁한 옷을 입고 있거나 어려운 포즈를 취하는 경우에도 야생 이미지에서 충실도가 높은 3D 옷을 입은 인간을 추론합니다. |
|
| 2023년 5월 31일 | |
MMS | Massively Multilingual Speech 프로젝트는 1100개 이상의 언어를 지원하는 단일 다국어 음성 인식 모델, 4000개 이상의 언어를 식별할 수 있는 언어 식별 모델, 1400개 이상의 언어를 지원하는 사전 훈련된 모델 및 텍스트 대 1,100개 이상의 언어에 대한 음성 모델 |
다른 사람 |
| 2023년 5월 26일 | |
팹 | 흐름 AIS 부트스트랩은 AIS를 사용하여 흐름이 대상에 대한 근사치가 좋지 않은 지역에서 샘플을 생성하여 새로운 모드의 발견을 촉진합니다. |
|
| 2023년 4월 29일 | |
코드이전 | 코드 예측을 위해 저품질 얼굴의 전역 구성 및 컨텍스트를 모델링하는 변환기 기반 예측 네트워크로, 입력이 심각하게 저하되는 경우에도 대상 얼굴에 매우 가까운 자연스러운 얼굴을 발견할 수 있습니다. |
|
| 2023년 4월 21일 | |
Text2Video-제로 | 텍스트-이미지 확산 모델은 제로샷 비디오 생성기입니다. |
다른 사람 |
| 2023년 11월 4일 | |
무엇이든 분할하세요 | Segment Anything 모델은 점이나 상자와 같은 입력 프롬프트에서 고품질 개체 마스크를 생성하며 이미지의 모든 개체에 대한 마스크를 생성하는 데 사용할 수 있습니다. |
다른 사람 |
| 2023년 10월 4일 | |
당신의 포즈를 따르세요 | 포즈 제어가 가능한 캐릭터 비디오를 얻기 위해 이미지 포즈 쌍과 포즈 없는 비디오 데이터 세트 및 사전 훈련된 텍스트-이미지 모델을 활용할 수 있는 2단계 훈련 방식 |
다른 사람 |
| 2023년 4월 7일 | |
EVA3D | 훈련을 위해 2D 이미지 컬렉션만 필요한 고품질 무조건 3D 인간 생성 모델 |
|
| 2023년 4월 6일 | |
안정적인 드림퓨전 | 사전 훈련된 2D 텍스트-이미지 확산 모델을 사용하여 텍스트-3D 합성 수행 |
|
| 2023년 4월 4일 | |
PIFUHD | 고해상도 3D 인간 디지털화를 위한 다단계 픽셀 정렬 암시적 함수 |
|
| 2023년 3월 26일 | |
비디오리토킹 | 입력 오디오에 따라 실제 말하는 머리 영상의 얼굴을 편집하여 감정이 달라도 립싱크가 가능한 고품질 출력 영상을 제작하는 시스템 |
다른 사람 |
| 2023년 3월 19일 | |
비주얼 채팅GPT | ChatGPT와 일련의 Visual Foundation 모델을 연결하여 채팅 중에 이미지를 보내고 받을 수 있습니다. |
다른 사람 |
| 2023년 3월 15일 | |
Tune-A-Video | 텍스트-비디오 생성을 위한 이미지 확산 모델의 원샷 조정 |
다른 사람 |
| 2023년 2월 23일 | |
GPEN | 야생에서 눈먼 얼굴 복원을 위한 GAN Prior 임베디드 네트워크 |
|
| 2023년 2월 15일 | |
PyMAF-X | 단안 이미지에서 파라메트릭 전신 모델을 복구하기 위한 Kegression 기반 접근 방식 |
다른 사람 |
| 2023년 2월 14일 | |
디스코 디퓨전 | AI 아트 및 애니메이션 생성을 위한 노트북, 모델 및 기술의 프랑켄슈타인적 융합 |
|
| 2023년 11월 2일 | |
그루베 | 비트와 드럼 연주를 생성하고 조작하기 위한 기계 학습의 일부 응용 |
|
| 2023년 2월 2일 | |
멀티트랙 음악VAE | 이 노트북의 모델은 기본 코드에 따라 선택적으로 조절되는 최대 8개 트랙의 단일 소절을 인코딩 및 디코딩할 수 있습니다. |
다른 사람 |
| 2023년 2월 2일 | |
뮤직VAE | 음악의 장기 구조 학습을 위한 계층적 잠재 벡터 모델 |
|
| 2023년 2월 2일 | |
그림 배우기 | 모델 기반 심층 강화 학습을 통한 페인팅 학습 | 마누엘 로메로 | 2023년 2월 1일 | ||
인스턴트-NGP | 다중 해상도 해시 인코딩을 사용한 즉각적인 신경 그래픽 프리미티브 |
|
| 2023년 1월 18일 | |
푸리에 피처 네트워크 | 푸리에 기능을 통해 네트워크는 저차원 영역에서 고주파 기능을 학습할 수 있습니다. |
다른 사람 |
| 2023년 1월 17일 | |
알파 포즈 | 전신 부위별 다중 사람 자세 추정 및 실시간 추적 |
다른 사람 |
| 2023년 7월 1일 | |
HybrIK | 3D 인간 자세 및 형태 추정을 위한 하이브리드 분석-신경 역기구학 솔루션 |
다른 사람 |
| 2023년 1월 1일 | |
점수 야코비안 체인 | 학습된 그라디언트에 체인 규칙을 적용하고 미분 가능한 렌더러의 야코비안을 통해 확산 모델의 점수를 역전파합니다. 이를 복셀 복사 필드로 인스턴스화합니다. |
|
| 2022년 5월 12일 | |
디뮤크 | 하이브리드 스펙트로그램 및 파형 소스 분리 | 알렉상드르 데포세즈 |
| 2022년 11월 21일 | |
스타일CLIP | StyleGAN 이미저의 텍스트 기반 조작 |
|
| 2022.10.30 | |
모션 디퓨즈 | 기존 방법에 비해 몇 가지 원하는 속성을 보여주는 최초의 확산 모델 기반 텍스트 기반 모션 생성 프레임워크 |
다른 사람 |
| 2022년 10월 13일 | |
VToonify | StyleGAN의 중해상도 및 고해상도 레이어를 활용하여 인코더에서 추출한 다중 규모 콘텐츠 기능을 기반으로 고품질 예술 초상화를 렌더링하여 프레임 세부 정보를 더 잘 보존합니다. |
|
| 2022년 7월 10일 | |
PyMAF | 잘 정렬된 신체 메시 복구를 위한 회귀 네트워크의 피라미드 메시 정렬 피드백 루프 및 표현이 풍부한 전신 모델의 복구를 위해 확장 |
다른 사람 |
| 2022년 6월 10일 | |
알파텐서 | 강화 학습을 통해 더 빠른 행렬 곱셈 알고리즘 발견 |
다른 사람 |
| 2022년 4월 10일 | |
스윈2SR | 이미지 초해상도, 특히 압축 입력 시나리오를 위해 SwinIR을 개선하는 새로운 Swin Transformer V2 |
|
| 2022년 3월 10일 | |
펑타 | 데이터에서 함수로: 데이터 포인트는 함수이므로 함수처럼 처리할 수 있습니다. |
|
| 2022년 9월 24일 | |
속삭임 | 웹에서 수집된 680,000시간의 다국어 및 멀티태스킹 지도 데이터를 학습한 자동 음성 인식 시스템 |
다른 사람 |
| 2022년 9월 21일 | |
DeOldify (비디오) | 나만의 비디오를 색칠해보세요! | 제이슨 앤틱 |
| 2022년 9월 19일 | |
DeOldify (사진) | 나만의 사진을 색칠해보세요! |
|
| 2022년 9월 19일 | |
실제 ESRGAN | 강력한 ESRGAN을 순수 합성 데이터로 학습된 실용적인 복원 애플리케이션으로 확장 |
|
| 2022년 9월 18일 | |
IDE-3D | 고해상도 3D 인식 인물 사진 합성을 위한 대화형 분리 편집 |
다른 사람 |
| 2022년 8월 9일 | |
의사결정 변환기 | RL의 문제를 조건부 시퀀스 모델로 캐스팅하는 아키텍처
확장하다
관련 애플리케이션
추천
관련 정보
전체
|