Voltar à Lista

Z-Image-Omni-Base

Evolução estratégica do Z-Image-Base, apresentando pré-treino omni para geração e edição unificadas de imagens, evitando complexidade e perda de desempenho na troca de tarefas.

Omni-Base
Pré-treino Omni
Arquitetura Unificada
S3-DiT
Geração e Edição

Visão Geral

O Z-Image-Omni-Base marca uma mudança estratégica do modelo 'Base' original para uma arquitetura de pré-treino 'omni' (omnipotente). Ele unifica as tarefas de geração de imagem e edição/inpainting dentro de uma única estrutura usando o Scalable Single-Stream Diffusion Transformer (S3-DiT). Este pré-treino omni permite transições perfeitas entre a geração de novas imagens e a edição das existentes sem a necessidade de modelos especializados separados, oferecendo maior eficiência de parâmetros e flexibilidade para programadores.

Funcionalidades

  • Pré-treino Omni para Geração e Edição Unificadas
  • Troca de Tarefa Perfeita sem Perda de Desempenho
  • Arquitetura Scalable Single-Stream DiT (S3-DiT)
  • Suporta Adaptadores LoRA Cross-Task
  • Eficiência de 6B Parâmetros
  • Desempenho Superior em Tarefas Multimodais Complexas

Imagens

Arquitetura e Visão do Z-Image-Omni-Base
A transição de Base para Omni-Base: Arquitetura Unificada para Geração e Edição

Links Relacionados