Recursos

Explore la colección completa de recursos del ecosistema Z-Image

Modelos de código abierto12

Omni-Base
Pre-entrenamiento Omni
Arquitectura Unificada
S3-DiT
Generación y Edición
Z-Image-Omni-Base
Evolución estratégica de Z-Image-Base, con pre-entrenamiento omni para una arquitectura unificada de generación y edición de imágenes, evitando la complejidad y pérdida de rendimiento al cambiar de tareas.

Z-Image-Omni-Base marca un cambio estratégico desde el modelo 'Base' original hacia una arquitectura de pre-entrenamiento 'omni' (omnipotente). Unifica las tareas de generación de imágenes y edición/inpainting dentro de un marco único utilizando el Scalable Single-Stream Diffusion Transformer (S3-DiT). Este pre-entrenamiento omni permite transiciones fluidas entre la generación de nuevas imágenes y la edición de las existentes sin necesidad de modelos especializados separados, ofreciendo mayor eficiencia de parámetros y flexibilidad para los desarrolladores.

Modelo Fundacional
S3-DiT
6B Parámetros
Open Source SOTA
Z-Image
Un modelo fundacional de generación de imágenes eficiente con Single-Stream Diffusion Transformer de 6B parámetros.

Z-Image es un modelo fundacional de generación de imágenes potente y altamente eficiente con 6B parámetros. Aprovechando la arquitectura Scalable Single-Stream Diffusion Transformer (S3-DiT), procesa texto, tokens semánticos visuales y tokens VAE de imagen como un flujo unificado. Z-Image sirve como núcleo para variantes como Z-Image-Turbo y Z-Image-Omni-Base, ofreciendo un rendimiento de vanguardia entre los modelos de código abierto.

Código abierto
Código
Documentación
6B Parámetros
Repositorio GitHub de Z-Image
Repositorio principal de código abierto de Z-Image, que contiene el código completo del modelo y la documentación, modelo de generación de imágenes eficiente de 6B parámetros

Z-Image es un modelo de generación de imágenes potente y eficiente con 6B parámetros. Actualmente existen tres variantes: Z-Image-Turbo (versión destilada, solo 8 pasos de inferencia), Z-Image-Omni-Base (modelo base) y Z-Image-Edit (variante de edición de imágenes).

ModelScope
Experiencia en línea
Turbo
API
Z-Image Turbo en ModelScope
Modelo Z-Image Turbo en la plataforma ModelScope, que proporciona experiencia en línea e interfaz API

Experimente el modelo Z-Image Turbo en la plataforma ModelScope, que proporciona servicio de inferencia en línea e interfaz API para una rápida integración y uso por parte de los desarrolladores.

HuggingFace
Comunidad
Modelo
Más de 110k descargas
Z-Image Turbo en HuggingFace
Modelo Z-Image Turbo en la plataforma HuggingFace, con más de 110k descargas mensuales

Modelo Z-Image Turbo en la comunidad HuggingFace, que proporciona pesos completos del modelo, ejemplos de uso y soporte de la comunidad. Las descargas mensuales alcanzan las 111,244.

Desestilado
Entrenamiento LoRA
Ajuste fino profundo
ComfyUI
Capacidad de entrenamiento
Modelo Z-Image De-distilled
Versión desestilada del modelo Z-Image, rompiendo los límites de destilación turbo y restaurando la capacidad de entrenamiento y flexibilidad

Z-Image De-Turbo es una versión desestilada de Tongyi-MAI/Z-Image-Turbo, ajustada finamente en imágenes generadas por Z-Image-Turbo para desglosar las limitaciones de la destilación turbo. Este modelo está diseñado específicamente para entrenamiento y ajuste fino profundo, ofreciendo una mejor capacidad de entrenamiento y flexibilidad en comparación con el modelo turbo original.

Z-Image
Optimizado por la comunidad
Ajuste fino NSFW
Mensajes en chino
ComfyUI
Stable Diffusion WebUI
VRAM baja
Bloqueo de estilo
Red-Z-Image-AIO-1.5
Versión todo en uno optimizada por la comunidad de Z-Image-Turbo de Alibaba, integrando componentes completos para una fácil configuración, rendimiento mejorado, seguimiento de mensajes en chino y ajuste fino NSFW dedicado con optimización de detalles.

Red-Z-Image-AIO-1.5 es una versión mejorada por la comunidad del modelo oficial Z-Image-Turbo, construido sobre la arquitectura de difusión de flujo único S³-DiT. Aborda puntos críticos como la complejidad de la configuración, el rendimiento en hardware de gama baja y las necesidades específicas de los creadores, incluyendo ajustes NSFW especializados para una representación realista de la anatomía humana.

ComfyUI
Tutorial
Flujo de trabajo
Despliegue local
Z-Image-Turbo
Generación en 8 pasos
Texto en chino
Tutorial de Z-Image Turbo ComfyUI
Tutorial oficial de ComfyUI para Z-Image Turbo, que proporciona configuración completa del flujo de trabajo, guía de descarga de modelos y configuración de parámetros para un rendimiento óptimo

Documentación oficial de ComfyUI para Z-Image Turbo, que presenta plantillas completas de flujo de trabajo, instrucciones detalladas de descarga de modelos y ajustes de optimización para dispositivos con poca VRAM. Perfecto para usuarios que desean un despliegue local con control total sobre el proceso de generación.

Replicate
PrunaAI
Optimizado
Rendimiento
Aumento de velocidad
Costo efectivo
Apache 2.0
Generación en 8 pasos
Z-Image Turbo (Optimizado por PrunaAI)
Versión optimizada por PrunaAI de Z-Image Turbo con velocidad mejorada mediante el almacenamiento inteligente en caché, la compilación de modelos y la cuantización, manteniendo la calidad fotorrealista y las capacidades de renderizado de texto en chino

Versión optimizada por PrunaAI de Z-Image Turbo de Tongyi-MAI, acelerada a través de técnicas de compresión avanzadas. Esta versión aplica almacenamiento en caché inteligente, compilación de modelos y cuantización para que la generación de imágenes sea aún más rápida, preservando la calidad fotorrealista original y las excelentes capacidades de renderizado de texto en chino del modelo.

GGUF
Cuantización
VRAM baja
ComfyUI
Compatible con 6GB
GPU de consumo
Modelos GGUF de Z-Image por GGUF-Org
Versiones oficiales cuantizadas GGUF de los modelos Z-Image Turbo para despliegue con poca VRAM (6GB+), optimizadas para ComfyUI con múltiples niveles de cuantización

GGUF-Org proporciona versiones oficiales cuantizadas GGUF de Z-Image Turbo, permitiendo el despliegue en GPUs de consumo con tan solo 6GB de VRAM. Admite múltiples niveles de cuantización, incluyendo Q3_K_S, IQ4_NL e IQ4_XS para diferentes equilibrios entre VRAM y calidad.

Codificador de texto
LLM
GGUF
Qwen3
4B Parámetros
Bilingüe
Modo de pensamiento
Codificador de texto Qwen3-4B GGUF
Versión cuantizada GGUF del modelo de lenguaje Qwen3-4B, codificador de texto esencial para despliegues GGUF de Z-Image con soporte para modo de pensamiento

Qwen3-4B-GGUF es el codificador de texto necesario para los despliegues GGUF de Z-Image, proporcionando comprensión bilingüe (chino/inglés) y capacidades de razonamiento avanzado. Admite un modo de pensamiento único para tareas de razonamiento lógico complejas.

GGUF
Comunidad
Cuantización
ComfyUI
VRAM baja
Tutorial
Colección GGUF de Z-Image Turbo por Jayn7
Colección GGUF mantenida por la comunidad de Z-Image Turbo con múltiples opciones de cuantización y guías de integración de ComfyUI

Colección de modelos GGUF mantenida por la comunidad por Jayn7, que proporciona múltiples variantes de cuantización de Z-Image Turbo con guías detalladas de configuración de ComfyUI. Elección popular con más de 200 likes en la comunidad.

ControlNet y LoRA3

LoRA
Pixel Art
Estilización
AI Toolkit
Pixel Art Style LoRA para Z-Image Turbo
LoRA de estilo pixel art especialmente diseñado para Z-Image Turbo, mejorando las capacidades de generación de pixel art

Este modelo LoRA mejora las capacidades de arte de píxeles existentes de Z-Image, haciéndolas más detalladas y refinadas. No se requieren palabras de activación, pero usar "pixel art" en los mensajes puede lograr mejores resultados.

ControlNet
Control de imagen
Multifuncional
PAI
Z-Image Turbo Fun ControlNet Union
ControlNet multifuncional lanzado por Alibaba PAI, compatible con controles Canny, HED, Depth, Pose y MLSD

Este es un modelo ControlNet con 6 bloques añadidos, entrenado desde cero en un conjunto de datos de 1 millón de imágenes de alta calidad durante 10,000 pasos, admitiendo múltiples condiciones de control.

Imagen a LoRA
Transferencia de estilo
Generación de LoRA
DiffSynth Studio
Qwen-Image-i2L (Image to LoRA)
Revolucionario modelo Image to LoRA que toma imágenes como entrada y genera modelos LoRA entrenados, permitiendo la transferencia instantánea de estilo y la preservación del contenido

Qwen-Image-i2L是一个创新模型,将图像作为输入,直接输出基于这些图像训练的LoRA权重。系统包含四个专业模型:i2L-Style用于风格迁移,i2L-Coarse和i2L-Fine用于内容保留,i2L-Bias用于与Qwen-Image美学对齐。

Demos de aplicaciones5

HuggingFace Space
Demo oficial
Experiencia en línea
Zero GPU
Demo oficial de Z-Image Turbo
Aplicación de demo oficial en línea de Z-Image Turbo, que proporciona una experiencia directa de las capacidades de generación de Z-Image

Aplicación de demo oficial en línea de Z-Image Turbo, mantenida por el equipo Tongyi-MAI, que proporciona una plataforma para experimentar directamente las capacidades de generación de Z-Image. Se ejecuta en Zero GPU, no se requiere configuración local.

ModelScope Studio
Galería oficial
Interfaz en chino
Muestra de efectos
Galería Z-Image en ModelScope
Aplicación de galería de Z-Image en la plataforma ModelScope, que muestra los efectos de generación del modelo

Aplicación de galería de Z-Image en la plataforma ModelScope, que muestra los efectos de generación del modelo Z-Image en formato de galería, proporcionando optimización de la interfaz en chino e integración con el ecosistema de ModelScope.

HuggingFace Space
Marco inteligente
Proyecto de cumpleaños
Aplicación creativa
Marco inteligente del 1er aniversario de MCP
Aplicación de marco inteligente, proyecto conmemorativo de cumpleaños basado en Z-Image

Aplicación de marco inteligente basada en Z-Image, desarrollada especialmente por el proyecto conmemorativo del 1er aniversario de MCP, que muestra las posibilidades de Z-Image en escenarios de aplicaciones creativas.

HuggingFace Space
Galería LoRA
Estilos artísticos
Modelos de identidad
Galería de LoRAs Z.I.T.
Galería en línea de modelos LoRA personalizados de Z-Image, compatible con múltiples estilos artísticos radicales y modelos de identidad

Galería en línea de modelos LoRA personalizados de Z-Image, que alberga múltiples modelos LoRA entrenados a medida, incluyendo estilos artísticos radicales y modelos de identidad, con funcionalidad de cambio y vista previa en línea.

HuggingFace Space
Juego de misterio
Aplicación interactiva
Boopster Murder Mystery
Aplicación de juego de misterio interactivo basada en Z-Image

Aplicación de juego de misterio interactivo desarrollada basada en Z-Image, que combina la generación de imágenes y el juego, mostrando el uso innovador de Z-Image en escenarios de aplicaciones de entretenimiento.

Artículos académicos1

Documento
Investigación
DMDR
Aprendizaje por refuerzo
La destilación por coincidencia de distribución se encuentra con el aprendizaje por refuerzo
Documento técnico principal de Z-Image, que presenta el marco DMDR: integración del aprendizaje por refuerzo en el proceso de destilación por coincidencia de distribución

Este documento propone el marco DMDR, que integra técnicas de aprendizaje por refuerzo en el proceso de destilación por coincidencia de distribución. La investigación muestra que para el aprendizaje por refuerzo de generadores de pocos pasos, la pérdida de DMD en sí misma es más efectiva que los métodos de regularización tradicionales.

Blog oficial1

Oficial
Blog
Actualizaciones
Bilingüe
Blog oficial de Z-Image
Página oficial del proyecto Z-Image, que contiene las últimas actualizaciones, presentaciones técnicas e información de la comunidad

Página oficial del proyecto Z-Image, que proporciona una presentación completa del proyecto, incluyendo características principales, arquitectura del modelo, evaluación de rendimiento y detalles técnicos. Admite contenido bilingüe en chino e inglés.