Volver a la lista

Z-Image

Un modelo fundacional de generación de imágenes eficiente con Single-Stream Diffusion Transformer de 6B parámetros.

Modelo Fundacional
S3-DiT
6B Parámetros
Open Source SOTA

Resumen

Z-Image es un modelo fundacional de generación de imágenes potente y altamente eficiente con 6B parámetros. Aprovechando la arquitectura Scalable Single-Stream Diffusion Transformer (S3-DiT), procesa texto, tokens semánticos visuales y tokens VAE de imagen como un flujo unificado. Z-Image sirve como núcleo para variantes como Z-Image-Turbo y Z-Image-Omni-Base, ofreciendo un rendimiento de vanguardia entre los modelos de código abierto.

Características

  • Modelo Fundacional Eficiente de 6B Parámetros
  • Arquitectura Scalable Single-Stream DiT (S3-DiT)
  • Clasificado #1 Modelo Open-Source en el Leaderboard de Artificial Analysis
  • Excelente Generación de Imágenes Fotorrealistas
  • Renderizado de Texto Bilingüe (Inglés/Chino) Preciso
  • Fuertes Capacidades de Mejora de Prompts y Razonamiento

Imágenes

Rendimiento en Leaderboard de Z-Image
Clasificación de Z-Image en el Leaderboard Text-to-Image de Artificial Analysis

Enlaces relacionados