January 9, 2026(Updated 2/5/2026)

Z-Image Omni Base está finalmente chegando! O modelo de IA versátil que unifica geração e edição de imagens está prestes a ser lançado

Author: z-image.me Team•5 min read

Z-Image Omni Base finalmente está chegando! O modelo de IA omnipotente para geração e edição unificada está prestes a ser lançado

As últimas novidades do z-image estão agitando a comunidade

Recentemente, as discussões na comunidade do campo de geração de imagens de IA têm sido constantemente inflamadas por um nome - Z-Image Omni Base. Dos tópicos populares no Reddit como "O modelo Z-Image Base está prestes a cumprir sua promessa", "ZImage Omni está chegando" e "Omni Base parece que será lançado", às divulgações graduais de informações oficiais, este altamente esperado modelo base omnipotente finalmente迎来了 um sinal claro de lançamento, e sua chegada trará uma transformação significativa para o campo da geração e edição de imagens de IA.

Z-Image Omni Base Visão geral

O Z-Image Omni Base é uma evolução da série Z-Image da equipe Tongyi-MAI da Alibaba, passando do Z-Image-Base original para enfatizar o pré-treinamento "omni". Este método permite o processamento perfeito da geração de texto para imagem (T2I) e edição de imagem para imagem (I2I) sem perda de desempenho devido à troca de tarefas. Ele é baseado no Transformer de difusão de fluxo único escalável (S3-DiT) com 6B de parâmetros, processando texto, tokens semânticos visuais e tokens de imagem VAE em um fluxo unificado, com suporte a capacidades bilíngues em chinês e inglês.

A atualização estratégica por trás do nome: a transessência fundamental de "Base" para "Omni Base"

O lançamento deste modelo não é simplesmente uma iteração de versão, mas uma atualização estratégica central. Como minha análise anterior (link do artigo original: https://z-image.me/en/blog/Not_Z-Image-Base_but_Z-Image-Omni-Base), o Z-Image-Plane originalmente planejado foi oficialmente renomeado para Z-Image-Omni-Base. Esta mudança de nome não é meramente um ajuste de rótulo, mas sim um símbolo da transição estratégica da arquitetura do modelo para o pré-treinamento "omnipotente (omni)" - ela quebra as barreiras tradicionais que separam as tarefas de geração e edição de modelos, unificando as duas funções centrais através de um pipeline de pré-treinamento de cenário completo que integra dados de geração e edição.

Esta unificação traz vantagens-chave: evita a complexidade e a perda de desempenho dos modelos tradicionais ao alternar entre tarefas de geração e edição, ao mesmo tempo que permite o uso de ferramentas como adaptadores LoRA entre tarefas, fornecendo aos desenvolvedores ferramentas de código aberto mais flexíveis e reduzindo a dependência de múltiplos modelos variantes especializados. Os usuários da comunidade já perceberam com esta mudança, referindo-se a ela como "Omni Base" em discussões, destacando suas propriedades "omnipotentes" em vez de ser apenas um modelo base de geração.

Atualizações da série Z-Image

Além do mais notável Omni Base, a série Z-Image também adicionou um novo ramo variante: Z-Image:

Atualmente, a série inclui quatro variantes principais:

Esta tabela destaca as características balanceadas do Omni Base, tornando-o adequado para desenvolvedores que buscam uma base de modelo personalizada. Integrações comunitárias, como stable-diffusion.cpp, aumentam ainda mais a acessibilidade, permitindo a execução de versões quantizadas em hardware como o RTX 3090.

Os benchmarks de desempenho nos relatórios do arXiv mostram que o Z-Image se equipara a sistemas comerciais em realismo fotográfico e renderização de texto. Por exemplo, o ranking da lista de classificação do Turbo destaca a competitividade da série, e espera-se que o Omni Base construa sobre essa base através de seu paradigma omni, possivelmente habilitando extensões como geração de vídeo (ainda não confirmado).

Evidências apontando para o lançamento iminente

As discussões na comunidade intensificaram nas últimas semanas, especialmente nos subreddits r/StableDiffusion e r/LocalLLaMA. Com base em posts de 8 de janeiro de 2026, os usuários destacaram os preparativos para o Z-Image-Omni-Base. Por exemplo, o thread intitulado "Z-Image OmniBase looking like it's gonna release soon" fez referência a um commit crucial no repositório ModelScope DiffSynth-Studio, por volta da mesma época. Este commit adicionou suporte completo ao Omni Base, incluindo:

Novas configurações de modelo para Z-Image-Omni-Base, Siglip2ImageEncoder428M (modelo visual de 428M de parâmetros), ZImageControlNet e ZImageImage2LoRAModel.
Atualizações no gerenciamento de VRAM para empacotamento de camadas eficiente, permitindo inferência de baixo VRAM.
Modificações no pipeline base para processar LoRA unidirecional e funções de modelo de orientação.
Scripts especializados de inferência e treinamento, como Z-Image-Omni-Base.py e arquivos .sh, para validação de modelo e condicionamento de ControlNet.

Essas mudanças indicam que o framework está sendo alinhado para uso imediato após o lançamento dos pesos. Outro post no Reddit, "Z-image Omni 👀", discutiu o impacto do commit, observando o suporte nativo Image-to-LoRA e a compatibilidade de dia zero com ControlNet. Os usuários especulam que o Omni Base servirá como base para treinamento LoRA, possivelmente superando o Turbo em multifuncionalidade, enquanto complementa seu fluxo de trabalho orientado para velocidade.

O repositório oficial Tongyi-MAI/Z-Image no GitHub gerou ainda mais otimismo. Atualizado recentemente em 7 de janeiro de 2026, ele lista explicitamente o Z-Image-Omni-Base como "a ser lançado" no Hugging Face e ModelScope. Os commits recentes incluem downloads automáticos de checkpoints e backend de atenção configurável, construídos sobre o commit inicial de 26 de novembro de 2025. A integração com Hugging Face Diffusers (através dos PRs #12703 e #12715) garante adoção perfeita.