Recursos
Explore la colección completa de recursos del ecosistema Z-Image
Modelos de código abierto12
Z-Image-Omni-Base marca un cambio estratégico desde el modelo 'Base' original hacia una arquitectura de pre-entrenamiento 'omni' (omnipotente). Unifica las tareas de generación de imágenes y edición/inpainting dentro de un marco único utilizando el Scalable Single-Stream Diffusion Transformer (S3-DiT). Este pre-entrenamiento omni permite transiciones fluidas entre la generación de nuevas imágenes y la edición de las existentes sin necesidad de modelos especializados separados, ofreciendo mayor eficiencia de parámetros y flexibilidad para los desarrolladores.
Z-Image es un modelo fundacional de generación de imágenes potente y altamente eficiente con 6B parámetros. Aprovechando la arquitectura Scalable Single-Stream Diffusion Transformer (S3-DiT), procesa texto, tokens semánticos visuales y tokens VAE de imagen como un flujo unificado. Z-Image sirve como núcleo para variantes como Z-Image-Turbo y Z-Image-Omni-Base, ofreciendo un rendimiento de vanguardia entre los modelos de código abierto.
Z-Image es un modelo de generación de imágenes potente y eficiente con 6B parámetros. Actualmente existen tres variantes: Z-Image-Turbo (versión destilada, solo 8 pasos de inferencia), Z-Image-Omni-Base (modelo base) y Z-Image-Edit (variante de edición de imágenes).
Experimente el modelo Z-Image Turbo en la plataforma ModelScope, que proporciona servicio de inferencia en línea e interfaz API para una rápida integración y uso por parte de los desarrolladores.
Modelo Z-Image Turbo en la comunidad HuggingFace, que proporciona pesos completos del modelo, ejemplos de uso y soporte de la comunidad. Las descargas mensuales alcanzan las 111,244.
Z-Image De-Turbo es una versión desestilada de Tongyi-MAI/Z-Image-Turbo, ajustada finamente en imágenes generadas por Z-Image-Turbo para desglosar las limitaciones de la destilación turbo. Este modelo está diseñado específicamente para entrenamiento y ajuste fino profundo, ofreciendo una mejor capacidad de entrenamiento y flexibilidad en comparación con el modelo turbo original.
Red-Z-Image-AIO-1.5 es una versión mejorada por la comunidad del modelo oficial Z-Image-Turbo, construido sobre la arquitectura de difusión de flujo único S³-DiT. Aborda puntos críticos como la complejidad de la configuración, el rendimiento en hardware de gama baja y las necesidades específicas de los creadores, incluyendo ajustes NSFW especializados para una representación realista de la anatomía humana.
Documentación oficial de ComfyUI para Z-Image Turbo, que presenta plantillas completas de flujo de trabajo, instrucciones detalladas de descarga de modelos y ajustes de optimización para dispositivos con poca VRAM. Perfecto para usuarios que desean un despliegue local con control total sobre el proceso de generación.
Versión optimizada por PrunaAI de Z-Image Turbo de Tongyi-MAI, acelerada a través de técnicas de compresión avanzadas. Esta versión aplica almacenamiento en caché inteligente, compilación de modelos y cuantización para que la generación de imágenes sea aún más rápida, preservando la calidad fotorrealista original y las excelentes capacidades de renderizado de texto en chino del modelo.
GGUF-Org proporciona versiones oficiales cuantizadas GGUF de Z-Image Turbo, permitiendo el despliegue en GPUs de consumo con tan solo 6GB de VRAM. Admite múltiples niveles de cuantización, incluyendo Q3_K_S, IQ4_NL e IQ4_XS para diferentes equilibrios entre VRAM y calidad.
Qwen3-4B-GGUF es el codificador de texto necesario para los despliegues GGUF de Z-Image, proporcionando comprensión bilingüe (chino/inglés) y capacidades de razonamiento avanzado. Admite un modo de pensamiento único para tareas de razonamiento lógico complejas.
Colección de modelos GGUF mantenida por la comunidad por Jayn7, que proporciona múltiples variantes de cuantización de Z-Image Turbo con guías detalladas de configuración de ComfyUI. Elección popular con más de 200 likes en la comunidad.
ControlNet y LoRA3
Este modelo LoRA mejora las capacidades de arte de píxeles existentes de Z-Image, haciéndolas más detalladas y refinadas. No se requieren palabras de activación, pero usar "pixel art" en los mensajes puede lograr mejores resultados.
Este es un modelo ControlNet con 6 bloques añadidos, entrenado desde cero en un conjunto de datos de 1 millón de imágenes de alta calidad durante 10,000 pasos, admitiendo múltiples condiciones de control.
Qwen-Image-i2L是一个创新模型,将图像作为输入,直接输出基于这些图像训练的LoRA权重。系统包含四个专业模型:i2L-Style用于风格迁移,i2L-Coarse和i2L-Fine用于内容保留,i2L-Bias用于与Qwen-Image美学对齐。
Demos de aplicaciones5
Aplicación de demo oficial en línea de Z-Image Turbo, mantenida por el equipo Tongyi-MAI, que proporciona una plataforma para experimentar directamente las capacidades de generación de Z-Image. Se ejecuta en Zero GPU, no se requiere configuración local.
Aplicación de galería de Z-Image en la plataforma ModelScope, que muestra los efectos de generación del modelo Z-Image en formato de galería, proporcionando optimización de la interfaz en chino e integración con el ecosistema de ModelScope.
Aplicación de marco inteligente basada en Z-Image, desarrollada especialmente por el proyecto conmemorativo del 1er aniversario de MCP, que muestra las posibilidades de Z-Image en escenarios de aplicaciones creativas.
Galería en línea de modelos LoRA personalizados de Z-Image, que alberga múltiples modelos LoRA entrenados a medida, incluyendo estilos artísticos radicales y modelos de identidad, con funcionalidad de cambio y vista previa en línea.
Aplicación de juego de misterio interactivo desarrollada basada en Z-Image, que combina la generación de imágenes y el juego, mostrando el uso innovador de Z-Image en escenarios de aplicaciones de entretenimiento.
Artículos académicos1
Este documento propone el marco DMDR, que integra técnicas de aprendizaje por refuerzo en el proceso de destilación por coincidencia de distribución. La investigación muestra que para el aprendizaje por refuerzo de generadores de pocos pasos, la pérdida de DMD en sí misma es más efectiva que los métodos de regularización tradicionales.
Blog oficial1
Página oficial del proyecto Z-Image, que proporciona una presentación completa del proyecto, incluyendo características principales, arquitectura del modelo, evaluación de rendimiento y detalles técnicos. Admite contenido bilingüe en chino e inglés.




















