January 9, 2026(Updated 2/5/2026)

Z-Image Omni Base 정말 출시간 다가왔다! 생성과 편집을 통합한 만능 AI 모델이 곧 등장합니다

Author: z-image.me Team•5 min read

Z-Image Omni Base 정말로 출시된다! 통합 생성 및 편집을 위한 올라운드 AI 모델이 곧 등장

z-image 최신 동향이 커뮤니티를 폭발시키다

최근 AI 이미지 생성 분야의 커뮤니티 토론은 하나의 이름에 의해 계속해서 불타올랐습니다 - Z-Image Omni Base. Reddit 커뮤니티의 "Z-Image Base 모델이 곧 약속을 이행할 것", "ZImage Omni가 곧 출시된다", "Omni Base가 출시될 것 같다"와 같은 뜨거운 논의 주제부터 공식 정보의 점진적인 공개까지, 이 기대를 한 몸에 받는 올라운드 기반 모델은 마침내 명확한 등장 신호를 맞이하게 되었으며, 그 등장은 AI 이미지 생성 및 편집 분야에 중요한 변화를 가져올 것입니다.

Z-Image Omni Base 개요

Z-Image Omni Base는 알리바바 Tongyi-MAI 팀의 Z-Image 시리즈의 진화로, 초기의 Z-Image-Base에서 "omni" 사전 학습을 강조하는 방향으로 전환되었습니다. 이 방법은 작전 전환으로 인한 성능 저하 없이 텍스트에서 이미지(T2I) 생성과 이미지에서 이미지(I2I) 편집을 원활하게 처리할 수 있게 합니다. 이 모델은 6B 파라미터의 확장 가능한 단일 스트림 확산 Transformer(S3-DiT)를 기반으로, 텍스트, 시각적 의미 토큰 및 이미지 VAE 토큰을 통합된 스트림에서 처리하며, 중영 이중어 능력을 지원합니다.

명명 뒤에 있는 전략적 업그레이드: "Base"에서 "Omni Base"로의 본질적 도약

이 모델의 등장은 단순한 버전 반복이 아니라 핵심 전략의 업그레이드입니다. 제 이전 분석(원문 링크: https://z-image.me/en/blog/Not_Z-Image-Base_but_Z-Image-Omni-Base)에 따르면, 원래 계획되었던 Z-Image-Base는 공식적으로 Z-Image-Omni-Base로 이름이 변경되었습니다. 이 명명 변경은 단순한 라벨 조정이 아니라 모델 아키텍처가 "올라운드(omni)" 사전 학습으로의 전환을 상징하는 전략적 변화입니다 - 이는 전통적인 모델의 생성 및 편집 작업 분리 장벽을 깨고, 생성 및 편집 데이터를 통합한 전체 시나리오 사전 학습 파이프라인을 통해 두 가지 핵심 기능의 통합을 실현합니다.

이러한 통합은 중요한 장점을 가져옵니다: 전통적인 모델이 생성 및 편집 작업을 전환할 때의 복잡성과 성능 손실을 피할 수 있으며, 동시에 LoRA 어댑터와 같은 도구의 크로스 작업 사용을 가능하게 하여 개발자에게 더 유연한 오픈 소스 도구를 제공하고 여러 전문 변형 모델에 대한 의존성을 줄입니다. 커뮤니티 사용자들은 이미 이 변화를 예리하게 포착하여 토론에서 "Omni Base"라고 부르며, 단순한 생성 기반 모델이 아닌 "올라운드" 속성을 부각시키고 있습니다.

Z-Image 시리즈 업데이트

이번에는 가장 주목받는 Omni Base 외에도 Z-Image 시리즈에 새로운 변형 분기인 Z-Image가 추가되었습니다:

현재 시리즈에는 네 가지 주요 변형이 포함됩니다:

이 표는 Omni Base의 균형 잡힌 특성을 강조하여 맞춤형 모델 기반을 찾는 개발자에게 적합하게 만듭니다. stable-diffusion.cpp와 같은 커뮤니티 통합은 접근성을 더욱 높여 RTX 3090과 같은 하드웨어에서 양자화 버전을 실행할 수 있게 합니다.

arXiv 보고서의 성능 벤치마크는 Z-Image가 사진의 현실감과 텍스트 렌더링에서 상용 시스템과 동등한 성능을 보인다고 나타냅니다. 예를 들어, Turbo의 순위표는 시리즈의 경쟁력을 부각시키며, Omni Base는 omni 패러다임을 통해 이 기반 위로 구축될 것으로 예상되며, 비디오 생성과 같은 확장 기능(확인되지 않음)을 활성화할 수 있습니다.

곧 출시될 것을 가리키는 증거

커뮤니티 토론은 최근 몇 주간 더욱 격화되었으며, 특히 Reddit의 r/StableDiffusion 및 r/LocalLLaMA 하위 섹션에서 두드러집니다. 2026년 1월 8일 게시물에 따르면, 사용자들은 Z-Image-Omni-Base의 준비 작업을 부각시키고 있습니다. 예를 들어, "Z-Image OmniBase looking like it's gonna release soon"이라는 제목의 스레드는 ModelScope DiffSynth-Studio 저장소의 핵심 제출을 인용하며, 이는 거의 동일한 시기에 발생했습니다. 이 제출은 Omni Base에 대한 포괄적인 지원을 추가했으며, 다음을 포함합니다:

Z-Image-Omni-Base, Siglip2ImageEncoder428M(428M 파라미터 시각 모델), ZImageControlNet 및 ZImageImage2LoRAModel의 새로운 모델 구성.
효율적인 레이어 래핑을 위한 VRAM 관리 업데이트, 저 VRAM 추론 구현.
순방향 LoRA 및 가이드 모델 함수 처리를 위한 기본 파이프라인 수정.
모델 검증 및 ControlNet 조건화를 위한 전용 추론 및 훈련 스크립트, Z-Image-Omni-Base.py 및 .sh 파일.

이러한 변화들은 프레임워크가 가중치 출시 후 즉시 사용할 수 있도록 준비되고 있음을 나타냅니다. 또 다른 Reddit 게시물 "Z-image Omni 👀"는 제출의 영향에 대해 논의하며, 네이티브 Image-to-LoRA 지원과 제로데이 ControlNet 호환성을 언급합니다. 사용자들은 Omni Base가 LoRA 훈련의 기반이 될 것으로 추정하며, 다재다능함에서 Turbo를 초월하면서 그 속도 지향 워크플로우를 보완할 것이라고 예상합니다.

공식 Tongyi-MAI/Z-Image GitHub 저장소는 더욱 낙관적인 분위기를 고조시킵니다. 최근 2026년 1월 7일에 업데이트되어 Z-Image-Omni-Base를 Hugging Face와 ModelScope에서 "출시 예정"으로 명시적으로 나열합니다. 최근 제출에는 자동 체크포인트 다운로드 및 구성 가능한 어텐션 백엔드의 향상이 포함되어 있으며, 2025년 11월 26일의 초기 제출을 기반으로 합니다. Hugging Face Diffusers와의 통합(PR #12703 및 #12715을 통해)이 원활한 채택을 보장합니다.