返回列表

Z-Image-Omni-Base

Z-Image-Base 的戰略演進,採用 omni 預訓練技術實現圖像生成與編輯的統一架構,避免任務切換的複雜性和性能損失。

Omni-Base
Omni 預訓練
統一架構
S3-DiT
生成與編輯

概述

Z-Image-Omni-Base 標誌著從原始「Base」模型向「omni」(全能)預訓練架構的戰略轉變。它使用 Scalable Single-Stream Diffusion Transformer (S3-DiT) 在單一框架內統一化圖像生成和編輯/修復任務。這種 omni 預訓練允許在生成新圖像和編輯現有圖像之間無縫切換,無需單獨的專用模型,為開發者提供了更高的參數效率和靈活性。

特性

  • Omni 預訓練實現生成與編輯的統一
  • 無縫任務切換,無性能損失
  • 可擴展單流 DiT (S3-DiT) 架構
  • 支持跨任務 LoRA 適配器
  • 6B 參數高效率
  • 在複雜多模態任務上表現優異

图片展示

Z-Image-Omni-Base 架構與願景
從 Base 到 Omni-Base 的轉變:生成與編輯的統一架構

相关链接