Volver a la lista

Z-Image-Omni-Base

Evolución estratégica de Z-Image-Base, con pre-entrenamiento omni para una arquitectura unificada de generación y edición de imágenes, evitando la complejidad y pérdida de rendimiento al cambiar de tareas.

Omni-Base
Pre-entrenamiento Omni
Arquitectura Unificada
S3-DiT
Generación y Edición

Resumen

Z-Image-Omni-Base marca un cambio estratégico desde el modelo 'Base' original hacia una arquitectura de pre-entrenamiento 'omni' (omnipotente). Unifica las tareas de generación de imágenes y edición/inpainting dentro de un marco único utilizando el Scalable Single-Stream Diffusion Transformer (S3-DiT). Este pre-entrenamiento omni permite transiciones fluidas entre la generación de nuevas imágenes y la edición de las existentes sin necesidad de modelos especializados separados, ofreciendo mayor eficiencia de parámetros y flexibilidad para los desarrolladores.

Características

  • Pre-entrenamiento Omni para Generación y Edición Unificadas
  • Cambio de Tarea Fluido sin Pérdida de Rendimiento
  • Arquitectura Scalable Single-Stream DiT (S3-DiT)
  • Soporta Adaptadores LoRA entre Tareas
  • Eficiencia de 6B Parámetros
  • Rendimiento Superior en Tareas Multimodales Complejas

Imágenes

Arquitectura y Visión de Z-Image-Omni-Base
La transición de Base a Omni-Base: Arquitectura unificada para generación y edición

Enlaces relacionados