Volver a la lista

Z-Image Turbo Fun ControlNet Union

ControlNet multifuncional lanzado por Alibaba PAI, compatible con controles Canny, HED, Depth, Pose y MLSD

ControlNet
Control de imagen
Multifuncional
PAI

Resumen

Este es un modelo ControlNet con 6 bloques añadidos, entrenado desde cero en un conjunto de datos de 1 millón de imágenes de alta calidad durante 10,000 pasos, admitiendo múltiples condiciones de control.

Características

  • Soporta controles Canny, HED, Depth, Pose y MLSD
  • Entrenamiento de resolución 1328
  • Precisión BFloat16
  • Fuerza de control ajustable control_context_scale (0.65-0.80)
  • Los mensajes detallados mejoran la estabilidad

Imágenes

Entrada de control de pose
Ejemplo de entrada de control de pose
Salida de control de pose
Resultado de generación basado en el control de pose

Instalación

# Clonar repositorio VideoX-Fun
git clone https://github.com/aigc-apps/VideoX-Fun.git
cd VideoX-Fun
# Crear directorios de modelos
mkdir -p models/Diffusion_Transformer
mkdir -p models/Personalized_Model
# Descargar pesos a los directorios correspondientes

Uso

Ejecute examples/z_image_fun/predict_t2i_control.py

Requisitos

  • Z-Image Turbo
  • Entorno VideoX-Fun
  • Dependencias de preprocesamiento adicionales
  • Soporte de memoria GPU