资源中心
Z-Image 资源中心一站式提供官方核心模型下载、ComfyUI 高效工作流、学术研究论文以及社区精选的各类 LoRA 和 ControlNet 扩展工具。无论您是寻求技术突破的开发者,还是追求艺术极致的创作者,这里丰富的资源生态都将为您的 AI 之旅提供强有力的支持,激发无限灵感与创造力。立即访问,获取您所需的一切资源!
开源模型12
Z-Image-Omni-Base 標誌著從原始「Base」模型向「omni」(全能)預訓練架構的戰略轉變。它使用 Scalable Single-Stream Diffusion Transformer (S3-DiT) 在單一框架內統一化圖像生成和編輯/修復任務。這種 omni 預訓練允許在生成新圖像和編輯現有圖像之間無縫切換,無需單獨的專用模型,為開發者提供了更高的參數效率和靈活性。
Z-Image 是一個強大且高效的圖像生成基礎模型,具有 6B 參數。利用 Scalable Single-Stream Diffusion Transformer (S3-DiT) 架構,它將文本、視覺語義令牌和圖像 VAE 令牌作為統一流處理。Z-Image 是 Z-Image-Turbo 和 Z-Image-Omni-Base 等變體的核心,在開源模型中提供最先進的性能。
Z-Image 是一個強大且高效的 6B 參數圖像生成模型。目前有三個變體:Z-Image-Turbo(蒸餾版,僅需 8 步推理)、Z-Image-Omni-Base(基礎模型)和 Z-Image-Edit(圖像編輯變體)。
在 ModelScope 平台上體驗 Z-Image Turbo 模型,提供在線推理服務和 API 接口,方便開發者快速集成和使用。
HuggingFace 社區中的 Z-Image Turbo 模型,提供完整的模型權重、使用示例和社區支持。月下載量達到 111,244 次。
Z-Image De-Turbo 是 Tongyi-MAI/Z-Image-Turbo 的去蒸餾版本,在由 Z-Image-Turbo 生成的圖像上進行微調,以打破 turbo 蒸餾限制。該模型專為訓練和深度微調而設計,與原始的 turbo 模型相比,提供了增強的可訓練性和靈活性。
Red-Z-Image-AIO-1.5 是官方 Z-Image-Turbo 模型的社區增強版本,基於 S³-DiT 單流擴散架構。它解決了安裝複雜性、低端硬件性能以及創作者特定需求等關鍵痛點,包括用於逼真呈現人體結構的專業 NSFW 調優。
官方 Z-Image Turbo ComfyUI 文檔,包含完整的工作流模板、詳細的模型下載說明以及針對低顯存設備的優化設置。非常適合希望完全控制生成過程並進行本地部署用戶。
PrunaAI 優化版的 Tongyi-MAI Z-Image Turbo,通過先進壓縮技術加速。該版本應用了智能緩存、模型編譯和量化技術,使圖像生成速度更快,同時保留了原始模型照片級質量和卓越的中文文本渲染能力。
GGUF-Org 提供官方轉換的 GGUF 量化版 Z-Image Turbo,支持在低至 6GB 顯存的消費級 GPU 上部署。支持多種量化級別,包括 Q3_K_S、IQ4_NL 和 IQ4_XS,以平衡顯存佔用與圖像質量。
Qwen3-4B-GGUF 是 Z-Image GGUF 部署所需的文本編碼器,提供中英雙語理解和先進的推理能力。支持獨特的思考模式,用於處理複雜的邏輯推理任務。
由 Jayn7 維護的社區 GGUF 模型系列,提供多種 Z-Image Turbo 量化變體,並附帶詳細的 ComfyUI 設置指南。在社區中廣受歡迎,獲得超過 200 個贊。
ControlNet & LoRA3
該 LoRA 模型增強了 Z-Image 現有的像素藝術能力,使其更加細緻和精煉。無需觸發詞,但在提示詞中使用「pixel art」可以獲得更好的效果。
這是一個添加了 6 個塊的 ControlNet 模型,在 100 萬張高質量圖像數據集上從頭訓練了 10,000 步,支持多種控制條件。
Qwen-Image-i2L 是一款創新模型,可直接將輸入圖像轉化為針對該圖像訓練的 LoRA 權重。該系統包含四個專業模型:用於風格遷移的 i2L-Style,用於內容保留的 i2L-Coarse 和 i2L-Fine,以及用於使輸出符合 Qwen-Image 審美的 i2L-Bias。
应用演示5
Z-Image Turbo 官方在線試玩應用,由 Tongyi-MAI 團隊維修,提供直接體驗 Z-Image 生成能力的平台。運行在 Zero GPU 上,無需本地配置。
ModelScope 平台上的 Z-Image 畫廊應用,以畫廊形式展示 Z-Image 模型生成效果,提供中文界面優化和集成的 ModelScope 生態系統。
MCP 智能相框是一個基於 Model Context Protocol (MCP) 的應用,專為 Z-Image 模型優化。它允許用戶直接從支持 MCP 的客戶端調用 Z-Image 能力。
Z-Image 自定義 LoRA 模型在線畫廊,託管了多個自定義訓練的 LoRA 模型,包括激進藝術風格和身份模型,支持在線切換和預覽功能。
基于Z-Image开发的推理游戏互动应用,结合图像生成和游戏玩法,展示Z-Image在娱乐应用场景中的创新使用。
学术论文1
該論文提出了 DMDR 框架,將強化學習技術集成到分佈匹配蒸餾過程中。研究表明,對於少步生成器的強化學習,DMD 損失本身比傳統的正則化方法更有效。
官方博客1
Z-Image 項目官方主頁,提供全面的項目介紹,包括核心功能、模型架構、性能評估和技術細節。支持中英雙語內容。




















