목록으로 돌아가기

Z-Image Turbo Fun ControlNet Union

Alibaba PAI 팀이 출시한 다기능 ControlNet Union 모델입니다. Canny(윤곽선), HED(가장자리), Depth(깊이), Pose(자세), MLSD(직선) 등 5가지 핵심 제어 기능을 하나의 모델에 통합하여, 복잡한 이미지 생성 작업에서도 정밀하고 일관된 제어를 가능하게 합니다.

ControlNet
이미지 제어
다기능
PAI

개요

6블록 추가된 ControlNet 모델, 100만 고품질 이미지 데이터셋으로 처음부터 10000단계 훈련.

기능

  • Canny, HED, Depth, Pose, MLSD 제어 지원
  • 1328 해상도 훈련
  • BFloat16 정밀도

이미지

설치

# VideoX-Fun 저장소 클론
git clone https://github.com/aigc-apps/VideoX-Fun.git

사용법

examples/z_image_fun/predict_t2i_control.py 실행

요구사항

  • Z-Image Turbo
  • VideoX-Fun 환경
  • 추가 전처리 의존성
  • GPU 메모리 지원