返回列表

Z-Image-Omni-Base

Z-Image-Base 的战略演进,采用 omni 预训练技术实现图像生成与编辑的统一架构,避免任务切换的复杂性和性能损失。

Omni-Base
Omni 预训练
统一架构
S3-DiT
生成与编辑

概述

Z-Image-Omni-Base 标志着从原始“Base”模型向“omni”(全能)预训练架构的战略转变。它使用 Scalable Single-Stream Diffusion Transformer (S3-DiT) 在单一框架内统一化图像生成和编辑/修复任务。这种 omni 预训练允许在生成新图像和编辑现有图像之间无缝切换,无需单独的专用模型,为开发者提供了更高的参数效率和灵活性。

特性

  • Omni 预训练实现生成与编辑的统一
  • 无缝任务切换,无性能损失
  • 可扩展单流 DiT (S3-DiT) 架构
  • 支持跨任务 LoRA 适配器
  • 6B 参数高效率
  • 在复杂多模态任务上表现优异

图片展示

Z-Image-Omni-Base 架构与愿景
从 Base 到 Omni-Base 的转变:生成与编辑的统一架构

相关链接

熱門提示詞

發現更多創意靈感