Zurück zur Liste

Z-Image-Omni-Base

Strategische Weiterentwicklung von Z-Image-Base mit Omni-Pre-Training für eine einheitliche Bildgenerierungs- und Bearbeitungsarchitektur, die Komplexität und Leistungsverluste bei Aufgabenwechseln vermeidet.

Omni-Base
Omni-Pre-Training
Einheitliche Architektur
S3-DiT
Generierung & Bearbeitung

Übersicht

Z-Image-Omni-Base markiert einen strategischen Wechsel vom ursprünglichen 'Base'-Modell hin zu einer 'Omni'-Pre-Training-Architektur. Es vereint Bildgenerierung und Bearbeitung/Inpainting in einem einzigen Framework unter Verwendung des Scalable Single-Stream Diffusion Transformer (S3-DiT). Dieses Omni-Pre-Training ermöglicht nahtlose Übergänge zwischen der Generierung neuer Bilder und der Bearbeitung bestehender Bilder ohne separate spezialisierte Modelle und bietet Entwicklern höhere Parametereffizienz und Flexibilität.

Funktionen

  • Omni-Pre-Training für einheitliche Generierung und Bearbeitung
  • Nahtloser Aufgabenwechsel ohne Leistungsverlust
  • Skalierbare Single-Stream DiT (S3-DiT) Architektur
  • Unterstützt aufgabenübergreifende LoRA-Adapter
  • 6B Parameter Effizienz
  • Überlegene Leistung bei komplexen multimodalen Aufgaben

Bilder

Z-Image-Omni-Base Architektur und Vision
Der Übergang von Base zu Omni-Base: Einheitliche Architektur für Generierung und Bearbeitung

Weiterführende Links