العودة للقائمة

Z-Image Turbo Fun ControlNet Union

由阿里巴巴PAI团队重磅发布的多功能ControlNet模型,集成了Canny边缘检测、HED边缘提取、Depth深度图、Pose姿态识别及MLSD线段检测等多种控制能力。单模型即可满足多样化的精准控制需求,大幅提升画面生成的结构准确性与可控性,是专业创作者的得力助手。立即下载体验,掌控每一个细节。

ControlNet
图像控制
多功能
PAI

نظرة عامة

这是一个添加了6个block的ControlNet模型,在100万高质量图像数据集上从头训练10000步,支持多种控制条件。

الميزات

  • 支持Canny、HED、Depth、Pose和MLSD控制
  • 1328分辨率训练
  • BFloat16精度
  • control_context_scale可调节控制强度(0.65-0.80)
  • 详细提示词提高稳定性

الصور

姿态控制输入
姿态控制输入示例
姿态控制输出
基于姿态控制的生成结果
Canny边缘检测
Canny边缘检测输入
Canny控制输出
Canny边缘控制生成结果

التنصيب

# 克隆VideoX-Fun仓库
git clone https://github.com/aigc-apps/VideoX-Fun.git
cd VideoX-Fun
# 创建模型目录
mkdir -p models/Diffusion_Transformer
mkdir -p models/Personalized_Model
# 下载权重到对应目录

الاستخدام

运行 examples/z_image_fun/predict_t2i_control.py

المتطلبات

  • Z-Image Turbo
  • VideoX-Fun环境
  • 额外预处理依赖
  • GPU内存支持