Tencent의 Hunyuan DiT 대형 모델(HunyuanDiT)은 계속해서 반복적으로 업데이트되어 사용자에게 더욱 강력한 이미지 생성 기능을 제공합니다. Downcodes의 편집자는 HunyuanDiT와 커뮤니티가 최근 제어 가능한 세 가지 플러그인인 ControlNet, 즉 타일(고화질 증폭), 인페인팅(이미지 복구 및 확장) 및 선형(선 그리기)을 출시하여 모델 성능을 크게 향상시켰다는 사실을 알게 되었습니다. . 다양한 적용 범위와 창작의 자유. 이러한 플러그인을 추가하면 Hunyuan DiT는 예술, 창의성, 건축 및 기타 분야에서 더 강력한 응용 가능성을 보여 전 세계 개발자와 창작자에게 보다 정확하고 편리한 이미지 생성 서비스를 제공할 수 있습니다.
Tencent의 HunyuanDiT 대형 모델(HunyuanDiT)은 최근 커뮤니티와 협력하여 제어 가능한 세 가지 플러그인인 ControlNet, 즉 타일(고화질 증폭), 인페인팅(이미지 복구 및 확장), 선화(선 그리기)를 출시했습니다. ControlNet 매트릭스. 이러한 플러그인을 추가하면 Hunyuan DiT 모델이 예술, 창의성, 건축, 사진, 미용 및 전자 상거래와 같은 사례 및 시나리오의 80%를 포함하여 광범위한 응용 시나리오를 포괄하여 글로벌 기업 및 개인 개발자에게 제공할 수 있습니다. 보다 정확한 이미지 생성과 더 큰 창작의 자유를 제공합니다.
Tile 플러그인은 사진에 대한 정보를 확장하고 4K~8K 해상도까지 매우 선명한 증폭을 달성할 수 있어 사진의 세부 묘사를 궁극적으로 추구해야 하는 장면에 적합합니다. Inpainting 플러그인은 작성자의 요구에 따라 그림의 얼룩지거나 얼룩덜룩한 부분을 채우고, 배경 교체 및 문자 주제 변경과 같은 효과를 얻고, 넓은 영역의 이미지 다시 그리기를 처리할 수 있습니다. Lineart 플러그인은 다양한 선 유형을 사용하여 실제, 애니메이션 및 건축 사진을 생성하며 건축 렌더링 생성 및 원고 채색에 적합합니다.
또한 Tencent Hunyuan DiT는 이전에 개발자의 추론을 지원하기 위해 캐니(가장자리), 깊이(깊이), 포즈(인간 자세) 및 기타 조건을 갖춘 ControlNet 모델을 출시했으며 개발자와 제작자가 다음을 수행할 수 있도록 ControlNet 교육 프로그램을 오픈 소스로 공개했습니다. 사용자 정의 ControlNet 모델을 교육하는 기능.
Hunyuan DiT는 지난 5월 포괄적인 업그레이드 및 오픈 소스를 발표한 이후 업계 최초의 중국 기반 DiT 아키텍처 오픈 소스 그래프 생성 모델로서 개발자 생태계를 지속적으로 구축하고 추론 효율성을 향상하고 그래프 생성을 단축하기 위한 독점 가속 라이브러리를 출시했습니다. 그리고 추론 코드를 더욱 오픈소스로 공개했습니다. 지난 7월 Hunyuan DiT는 버전 1.2로 업그레이드되었으며 소형 비디오 메모리 버전이 오픈 소스로 공개되었습니다. 실행하는 데 6G의 비디오 메모리만 필요하므로 개인용 컴퓨터에 로컬로 배포된 개발자에게 더 친숙합니다.
현재 Hunyuan DiT는 Github에서 3.1,000개 이상의 별을 보유하고 있으며, 국내 DiT 오픈 소스 모델 중 가장 인기가 높습니다.
공식 홈페이지
https://dit.hunyuan.tencent.com/
암호
https://github.com/Tencent/HunyuanDiT
모델
https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
종이
https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf
전체적으로 Tencent Hunyuan DiT의 지속적인 업데이트와 오픈 소스 전략은 개발자와 창작자에게 강력한 도구와 리소스를 제공하고 Wenshengtu 기술의 진보와 개발을 촉진하므로 앞으로 더 많은 혁신과 돌파구를 기대할 가치가 있습니다.