Voltar para a Lista

Z-Image-Omni-Base

Evolução estratégica do Z-Image-Base, apresentando pré-treinamento omni para geração e edição unificadas de imagens, evitando complexidade e perda de desempenho na troca de tarefas.

Omni-Base
Pré-treinamento Omni
Arquitetura Unificada
S3-DiT
Geração e Edição

Visão Geral

O Z-Image-Omni-Base marca uma mudança estratégica do modelo 'Base' original para uma arquitetura de pré-treinamento 'omni' (onipotente). Ele unifica as tarefas de geração de imagem e edição/inpainting dentro de uma única estrutura usando o Scalable Single-Stream Diffusion Transformer (S3-DiT). Este pré-treinamento omni permite transições perfeitas entre a geração de novas imagens e a edição das existentes sem a necessidade de modelos especializados separados, oferecendo maior eficiência de parâmetros e flexibilidade para desenvolvedores.

Recursos

  • Pré-treinamento Omni para Geração e Edição Unificadas
  • Troca de Tarefa Perfeita sem Perda de Desempenho
  • Arquitetura Scalable Single-Stream DiT (S3-DiT)
  • Suporta Adaptadores LoRA Cross-Task
  • Eficiência de 6B Parâmetros
  • Desempenho Superior em Tarefas Multimodais Complexas

Imagens

Arquitetura e Visão do Z-Image-Omni-Base
A transição de Base para Omni-Base: Arquitetura Unificada para Geração e Edição

Links Relacionados