概述
Z-Image 是一个强大且高效的图像生成基础模型,具有6B参数。利用 Scalable Single-Stream Diffusion Transformer (S3-DiT) 架构,它将文本、视觉语义令牌和图像 VAE 令牌作为统一流处理。Z-Image 是 Z-Image-Turbo 和 Z-Image-Omni-Base 等变体的核心,在开源模型中提供最先进的性能。
特性
- 6B 参数高效基础模型
- 可扩展单流 DiT (S3-DiT) 架构
- Artificial Analysis 排行榜第一开源模型
- 优秀的照片级图像生成
- 准确的双语(中英)文本渲染
- 强大的提示词增强和推理能力
图片展示

Z-Image 在 Artificial Analysis 文本转图像排行榜上的排名