Volver a la lista

Repositorio GitHub de Z-Image

Repositorio principal de código abierto de Z-Image, que contiene el código completo del modelo y la documentación, modelo de generación de imágenes eficiente de 6B parámetros

Código abierto
Código
Documentación
6B Parámetros

Resumen

Z-Image es un modelo de generación de imágenes potente y eficiente con 6B parámetros. Actualmente existen tres variantes: Z-Image-Turbo (versión destilada, solo 8 pasos de inferencia), Z-Image-Omni-Base (modelo base) y Z-Image-Edit (variante de edición de imágenes).

Características

  • Modelo ligero de 6B parámetros con latencia de inferencia de subsegundos en GPUs H800 de grado empresarial
  • Funciona en dispositivos de consumo con 16G de VRAM
  • Generación de imágenes fotorrealistas
  • Renderizado de texto bilingüe preciso en inglés y chino
  • Fuertes capacidades de seguimiento de instrucciones
  • Arquitectura Scalable Single-Stream DiT (S3-DiT)

Imágenes

Z-Image Elo Rating en AI Arena
Rendimiento del rating Elo de Z-Image en AI Arena

Instalación

pip install -e .

Uso

python inference.py

Requisitos

  • Python 3.8+
  • CUDA 11.0+
  • 8GB+ VRAM (16GB recomendado)
  • Último diffusers: pip install git+https://github.com/huggingface/diffusers

Enlaces relacionados