返回列表

Z-Image

具有 6B 參數的高效圖像生成基礎模型,採用單流擴散 Transformer 架構。

基礎模型
S3-DiT
6B 參數
開源 SOTA

概述

Z-Image 是一個強大且高效的圖像生成基礎模型,具有 6B 參數。利用 Scalable Single-Stream Diffusion Transformer (S3-DiT) 架構,它將文本、視覺語義令牌和圖像 VAE 令牌作為統一流處理。Z-Image 是 Z-Image-Turbo 和 Z-Image-Omni-Base 等變體的核心,在開源模型中提供最先進的性能。

特性

  • 6B 參數高效基礎模型
  • 可擴展單流 DiT (S3-DiT) 架構
  • Artificial Analysis 排行榜第一開源模型
  • 優秀的照片級圖像生成
  • 準確的雙語(中英)文本渲染
  • 強大的提示詞增強和推理能力

图片展示

Z-Image 排行榜表現
Z-Image 在 Artificial Analysis 文本轉圖像排行榜上的排名

相关链接