Terug naar Lijst

Z-Image Turbo Fun ControlNet Union

Multifunctioneel ControlNet uitgebracht door Alibaba PAI, ondersteunt Canny, HED, Depth, Pose en MLSD controls

ControlNet
Beeldbesturing
Multifunctioneel
PAI

Overzicht

Dit is een ControlNet-model met 6 toegevoegde blokken, vanaf nul getraind op een dataset van 1 miljoen hoogwaardige afbeeldingen gedurende 10.000 stappen, en ondersteunt meerdere besturingscondities.

Kenmerken

  • Ondersteunt Canny, HED, Depth, Pose en MLSD besturing
  • Training op 1328 resolutie
  • BFloat16 precisie
  • control_context_scale aanpasbare besturingskracht (0.65-0.80)
  • Gedetailleerde prompts verbeteren de stabiliteit

Afbeeldingen

Pose-besturing invoer
Voorbeeld van pose-besturing invoer
Pose-besturing uitvoer
Generatieresultaat gebaseerd op pose-besturing

Installatie

# Clone VideoX-Fun repository
git clone https://github.com/aigc-apps/VideoX-Fun.git
cd VideoX-Fun
# Maak modelmappen aan
mkdir -p models/Diffusion_Transformer
mkdir -p models/Personalized_Model
# Download gewichten naar de overeenkomstige mappen

Gebruik

Voer examples/z_image_fun/predict_t2i_control.py uit

Vereisten

  • Z-Image Turbo
  • VideoX-Fun omgeving
  • Extra voorbewerkings-afhankelijkheden
  • GPU-geheugen ondersteuning