Zurück zur Liste

Z-Image Turbo Fun ControlNet Union

Multifunktionales ControlNet von Alibaba PAI, unterstützt Steuerung über Canny, HED, Tiefe, Pose und MLSD

ControlNet
Bildsteuerung
Multifunktional
PAI

Übersicht

Dies ist ein ControlNet-Modell mit 6 hinzugefügten Blöcken, das von Grund auf mit einem Datensatz von 1 Million hochwertigen Bildern trainiert wurde.

Funktionen

  • Unterstützt Canny, HED, Tiefe, Pose und MLSD
  • Training mit 1328er Auflösung
  • BFloat16-Präzision
  • Einstellbare Kontrollstärke über control_context_scale (0.65-0.80)
  • Detaillierte Prompts verbessern die Stabilität

Bilder

Pose-Kontroll-Input
Beispiel für Pose-Kontroll-Eingabe
Pose-Kontroll-Output
Generierungsergebnis basierend auf Pose-Steuerung

Installation

# VideoX-Fun Repository klonen
git clone https://github.com/aigc-apps/VideoX-Fun.git
cd VideoX-Fun
# Modellverzeichnisse erstellen
mkdir -p models/Diffusion_Transformer
mkdir -p models/Personalized_Model
# Gewichte in die entsprechenden Verzeichnisse herunterladen

Nutzung

Beispiel unter examples/z_image_fun/predict_t2i_control.py ausführen

Anforderungen

  • Z-Image Turbo
  • VideoX-Fun Umgebung
  • Zusätzliche Vorverarbeitungsabhängigkeiten
  • GPU-Speicherunterstützung