Recursos

Explore la colección completa de recursos del ecosistema Z-Image

Modelos de código abierto11

Arquitectura y Visión de Z-Image-Omni-Base

Omni-Base

Pre-entrenamiento Omni

Arquitectura Unificada

S3-DiT

Generación y Edición

Z-Image-Omni-Base

Evolución estratégica de Z-Image-Base, con pre-entrenamiento omni para una arquitectura unificada de generación y edición de imágenes, evitando la complejidad y pérdida de rendimiento al cambiar de tareas.

Z-Image-Omni-Base marca un cambio estratégico desde el modelo 'Base' original hacia una arquitectura de pre-entrenamiento 'omni' (omnipotente). Unifica las tareas de generación de imágenes y edición/inpainting dentro de un marco único utilizando el Scalable Single-Stream Diffusion Transformer (S3-DiT). Este pre-entrenamiento omni permite transiciones fluidas entre la generación de nuevas imágenes y la edición de las existentes sin necesidad de modelos especializados separados, ofreciendo mayor eficiencia de parámetros y flexibilidad para los desarrolladores.

Rendimiento en Leaderboard de Z-Image

Modelo Fundacional

S3-DiT

6B Parámetros

Open Source SOTA

Z-Image

Un modelo fundacional de generación de imágenes eficiente con Single-Stream Diffusion Transformer de 6B parámetros.

Z-Image es un modelo fundacional de generación de imágenes potente y altamente eficiente con 6B parámetros. Aprovechando la arquitectura Scalable Single-Stream Diffusion Transformer (S3-DiT), procesa texto, tokens semánticos visuales y tokens VAE de imagen como un flujo unificado. Z-Image sirve como núcleo para variantes como Z-Image-Turbo y Z-Image-Omni-Base, ofreciendo un rendimiento de vanguardia entre los modelos de código abierto.

Z-Image Elo Rating en AI Arena

Código abierto

Código

Documentación

6B Parámetros

Repositorio GitHub de Z-Image

Repositorio principal de código abierto de Z-Image, que contiene el código completo del modelo y la documentación, modelo de generación de imágenes eficiente de 6B parámetros

Z-Image es un modelo de generación de imágenes potente y eficiente con 6B parámetros. Actualmente existen tres variantes: Z-Image-Turbo (versión destilada, solo 8 pasos de inferencia), Z-Image-Omni-Base (modelo base) y Z-Image-Edit (variante de edición de imágenes).

Z-Image Turbo en ModelScope

ModelScope

Experiencia en línea

Turbo

API

Z-Image Turbo en ModelScope

Modelo Z-Image Turbo en la plataforma ModelScope, que proporciona experiencia en línea e interfaz API

Experimente el modelo Z-Image Turbo en la plataforma ModelScope, que proporciona servicio de inferencia en línea e interfaz API para una rápida integración y uso por parte de los desarrolladores.

Z-Image Elo Rating en AI Arena

HuggingFace

Comunidad

Modelo

Más de 110k descargas

Z-Image Turbo en HuggingFace

Modelo Z-Image Turbo en la plataforma HuggingFace, con más de 110k descargas mensuales

Modelo Z-Image Turbo en la comunidad HuggingFace, que proporciona pesos completos del modelo, ejemplos de uso y soporte de la comunidad. Las descargas mensuales alcanzan las 111,244.

Muestra de generación de Z-Image De-Turbo

Desestilado

Entrenamiento LoRA

Ajuste fino profundo

ComfyUI

Capacidad de entrenamiento

Modelo Z-Image De-distilled

Versión desestilada del modelo Z-Image, rompiendo los límites de destilación turbo y restaurando la capacidad de entrenamiento y flexibilidad

Z-Image De-Turbo es una versión desestilada de Tongyi-MAI/Z-Image-Turbo, ajustada finamente en imágenes generadas por Z-Image-Turbo para desglosar las limitaciones de la destilación turbo. Este modelo está diseñado específicamente para entrenamiento y ajuste fino profundo, ofreciendo una mejor capacidad de entrenamiento y flexibilidad en comparación con el modelo turbo original.

Interfaz del flujo de trabajo de ComfyUI Z-Image

ComfyUI

Tutorial

Flujo de trabajo

Despliegue local

Z-Image-Turbo

Generación en 8 pasos

Texto en chino

Tutorial de Z-Image Turbo ComfyUI

Tutorial oficial de ComfyUI para Z-Image Turbo, que proporciona configuración completa del flujo de trabajo, guía de descarga de modelos y configuración de parámetros para un rendimiento óptimo

Documentación oficial de ComfyUI para Z-Image Turbo, que presenta plantillas completas de flujo de trabajo, instrucciones detalladas de descarga de modelos y ajustes de optimización para dispositivos con poca VRAM. Perfecto para usuarios que desean un despliegue local con control total sobre el proceso de generación.

Comparación de rendimiento de optimización de PrunaAI

Replicate

PrunaAI

Optimizado

Rendimiento

Aumento de velocidad

Costo efectivo

Apache 2.0

Generación en 8 pasos

Z-Image Turbo (Optimizado por PrunaAI)

Versión optimizada por PrunaAI de Z-Image Turbo con velocidad mejorada mediante el almacenamiento inteligente en caché, la compilación de modelos y la cuantización, manteniendo la calidad fotorrealista y las capacidades de renderizado de texto en chino

Versión optimizada por PrunaAI de Z-Image Turbo de Tongyi-MAI, acelerada a través de técnicas de compresión avanzadas. Esta versión aplica almacenamiento en caché inteligente, compilación de modelos y cuantización para que la generación de imágenes sea aún más rápida, preservando la calidad fotorrealista original y las excelentes capacidades de renderizado de texto en chino del modelo.

Modelos GGUF de Z-Image por GGUF-Org

GGUF

Cuantización

VRAM baja

ComfyUI

Compatible con 6GB

GPU de consumo

Modelos GGUF de Z-Image por GGUF-Org

Versiones oficiales cuantizadas GGUF de los modelos Z-Image Turbo para despliegue con poca VRAM (6GB+), optimizadas para ComfyUI con múltiples niveles de cuantización

GGUF-Org proporciona versiones oficiales cuantizadas GGUF de Z-Image Turbo, permitiendo el despliegue en GPUs de consumo con tan solo 6GB de VRAM. Admite múltiples niveles de cuantización, incluyendo Q3_K_S, IQ4_NL e IQ4_XS para diferentes equilibrios entre VRAM y calidad.

Codificador de texto Qwen3-4B GGUF

Codificador de texto

LLM

GGUF

Qwen3

4B Parámetros

Bilingüe

Modo de pensamiento

Codificador de texto Qwen3-4B GGUF

Versión cuantizada GGUF del modelo de lenguaje Qwen3-4B, codificador de texto esencial para despliegues GGUF de Z-Image con soporte para modo de pensamiento

Qwen3-4B-GGUF es el codificador de texto necesario para los despliegues GGUF de Z-Image, proporcionando comprensión bilingüe (chino/inglés) y capacidades de razonamiento avanzado. Admite un modo de pensamiento único para tareas de razonamiento lógico complejas.

Colección GGUF de Z-Image Turbo por Jayn7

GGUF

Comunidad

Cuantización

ComfyUI

VRAM baja

Tutorial

Colección GGUF de Z-Image Turbo por Jayn7

Colección GGUF mantenida por la comunidad de Z-Image Turbo con múltiples opciones de cuantización y guías de integración de ComfyUI

Colección de modelos GGUF mantenida por la comunidad por Jayn7, que proporciona múltiples variantes de cuantización de Z-Image Turbo con guías detalladas de configuración de ComfyUI. Elección popular con más de 200 likes en la comunidad.

ControlNet y LoRA3

Ejemplo de arte de píxeles 1

LoRA

Pixel Art

Estilización

AI Toolkit

Pixel Art Style LoRA para Z-Image Turbo

LoRA de estilo pixel art especialmente diseñado para Z-Image Turbo, mejorando las capacidades de generación de pixel art

Este modelo LoRA mejora las capacidades de arte de píxeles existentes de Z-Image, haciéndolas más detalladas y refinadas. No se requieren palabras de activación, pero usar "pixel art" en los mensajes puede lograr mejores resultados.

Entrada de control de pose

ControlNet

Control de imagen

Multifuncional

PAI

Z-Image Turbo Fun ControlNet Union

ControlNet multifuncional lanzado por Alibaba PAI, compatible con controles Canny, HED, Depth, Pose y MLSD

Este es un modelo ControlNet con 6 bloques añadidos, entrenado desde cero en un conjunto de datos de 1 millón de imágenes de alta calidad durante 10,000 pasos, admitiendo múltiples condiciones de control.

抽象矢量风格输入图像

Imagen a LoRA

Transferencia de estilo

Generación de LoRA

DiffSynth Studio

Qwen-Image-i2L (Image to LoRA)

Revolucionario modelo Image to LoRA que toma imágenes como entrada y genera modelos LoRA entrenados, permitiendo la transferencia instantánea de estilo y la preservación del contenido

Qwen-Image-i2L是一个创新模型，将图像作为输入，直接输出基于这些图像训练的LoRA权重。系统包含四个专业模型：i2L-Style用于风格迁移，i2L-Coarse和i2L-Fine用于内容保留，i2L-Bias用于与Qwen-Image美学对齐。

Demos de aplicaciones5

Interfaz de demo de Z-Image Turbo

HuggingFace Space

Demo oficial

Experiencia en línea

Zero GPU

Demo oficial de Z-Image Turbo

Aplicación de demo oficial en línea de Z-Image Turbo, que proporciona una experiencia directa de las capacidades de generación de Z-Image

Aplicación de demo oficial en línea de Z-Image Turbo, mantenida por el equipo Tongyi-MAI, que proporciona una plataforma para experimentar directamente las capacidades de generación de Z-Image. Se ejecuta en Zero GPU, no se requiere configuración local.

Muestra de la Galería Z-Image

ModelScope Studio

Galería oficial

Interfaz en chino

Muestra de efectos

Galería Z-Image en ModelScope

Aplicación de galería de Z-Image en la plataforma ModelScope, que muestra los efectos de generación del modelo

Aplicación de galería de Z-Image en la plataforma ModelScope, que muestra los efectos de generación del modelo Z-Image en formato de galería, proporcionando optimización de la interfaz en chino e integración con el ecosistema de ModelScope.

Aplicación de marco inteligente

HuggingFace Space

Marco inteligente

Proyecto de cumpleaños

Aplicación creativa

Marco inteligente del 1er aniversario de MCP

Aplicación de marco inteligente, proyecto conmemorativo de cumpleaños basado en Z-Image

Aplicación de marco inteligente basada en Z-Image, desarrollada especialmente por el proyecto conmemorativo del 1er aniversario de MCP, que muestra las posibilidades de Z-Image en escenarios de aplicaciones creativas.

Interfaz de la galería LoRA

HuggingFace Space

Galería LoRA

Estilos artísticos

Modelos de identidad

Galería de LoRAs Z.I.T.

Galería en línea de modelos LoRA personalizados de Z-Image, compatible con múltiples estilos artísticos radicales y modelos de identidad

Galería en línea de modelos LoRA personalizados de Z-Image, que alberga múltiples modelos LoRA entrenados a medida, incluyendo estilos artísticos radicales y modelos de identidad, con funcionalidad de cambio y vista previa en línea.

Interfaz del juego de misterio

HuggingFace Space

Juego de misterio

Aplicación interactiva

Boopster Murder Mystery

Aplicación de juego de misterio interactivo basada en Z-Image

Aplicación de juego de misterio interactivo desarrollada basada en Z-Image, que combina la generación de imágenes y el juego, mostrando el uso innovador de Z-Image en escenarios de aplicaciones de entretenimiento.

Artículos académicos1

Diagrama de arquitectura del modelo del documento

Documento

Investigación

DMDR

Aprendizaje por refuerzo

La destilación por coincidencia de distribución se encuentra con el aprendizaje por refuerzo

Documento técnico principal de Z-Image, que presenta el marco DMDR: integración del aprendizaje por refuerzo en el proceso de destilación por coincidencia de distribución

Este documento propone el marco DMDR, que integra técnicas de aprendizaje por refuerzo en el proceso de destilación por coincidencia de distribución. La investigación muestra que para el aprendizaje por refuerzo de generadores de pocos pasos, la pérdida de DMD en sí misma es más efectiva que los métodos de regularización tradicionales.

Blog oficial1

Muestra del efecto de generación de Z-Image

Oficial

Blog

Actualizaciones

Bilingüe

Blog oficial de Z-Image

Página oficial del proyecto Z-Image, que contiene las últimas actualizaciones, presentaciones técnicas e información de la comunidad

Página oficial del proyecto Z-Image, que proporciona una presentación completa del proyecto, incluyendo características principales, arquitectura del modelo, evaluación de rendimiento y detalles técnicos. Admite contenido bilingüe en chino e inglés.