목록으로 돌아가기

Z-Image-Omni-Base

Z-Image-Base의 전략적 진화로, 통합된 이미지 생성 및 편집을 위한 옴니 사전 학습을 특징으로 하며, 작업 전환의 복잡성과 성능 저하를 방지합니다.

Omni-Base
옴니 사전 학습
통합 아키텍처
S3-DiT
생성 및 편집

개요

Z-Image-Omni-Base는 원래의 'Base' 모델에서 'omni'(전능) 사전 학습 아키텍처로의 전략적 전환을 나타냅니다. Scalable Single-Stream Diffusion Transformer (S3-DiT)를 사용하여 단일 프레임워크 내에서 이미지 생성 및 편집/인페인팅 작업을 통합합니다. 이 옴니 사전 학습을 통해 별도의 특수 모델 없이도 새 이미지 생성과 기존 이미지 편집 간의 원활한 전환이 가능하여 개발자에게 더 높은 파라미터 효율성과 유연성을 제공합니다.

기능

  • 통합 생성 및 편집을 위한 옴니 사전 학습
  • 성능 저하 없는 원활한 작업 전환
  • 확장 가능한 단일 스트림 DiT (S3-DiT) 아키텍처
  • 크로스 태스크 LoRA 어댑터 지원
  • 6B 파라미터 효율성
  • 복잡한 멀티모달 작업에서의 우수한 성능

이미지

Z-Image-Omni-Base 아키텍처 및 비전
Base에서 Omni-Base로의 전환: 생성 및 편집을 위한 통합 아키텍처

인기 프롬프트

창의적인 영감을 더 많이 발견하세요