Voltar para a Lista

Z-Image

Um modelo de fundação de geração de imagem eficiente com Single-Stream Diffusion Transformer de 6B parâmetros.

Modelo de Fundação
S3-DiT
6B Parâmetros
Open Source SOTA

Visão Geral

O Z-Image é um modelo de fundação de geração de imagem poderoso e altamente eficiente com 6B parâmetros. Aproveitando a arquitetura Scalable Single-Stream Diffusion Transformer (S3-DiT), ele processa texto, tokens semânticos visuais e tokens VAE de imagem como um fluxo unificado. O Z-Image serve como núcleo para variantes como Z-Image-Turbo e Z-Image-Omni-Base, oferecendo desempenho de ponta entre modelos de código aberto.

Recursos

  • Modelo de Fundação Eficiente de 6B Parâmetros
  • Arquitetura Scalable Single-Stream DiT (S3-DiT)
  • Classificado como nº 1 Modelo Open-Source no Leaderboard Artificial Analysis
  • Excelente Geração de Imagem Fotorrealista
  • Renderização de Texto Bilíngue (Inglês/Chinês) Precisa
  • Fortes Capacidades de Aprimoramento de Prompt e Raciocínio

Imagens

Desempenho do Leaderboard Z-Image
Classificação do Z-Image no Leaderboard Text-to-Image da Artificial Analysis

Links Relacionados