Ресурсы
Исследуйте полную коллекцию ресурсов экосистемы Z-Image
Модели с открытым кодом12
Z-Image-Omni-Base знаменует собой стратегический переход от оригинальной модели «Base» к архитектуре «omni» (всемогущего) предварительного обучения. Он объединяет задачи генерации изображений и редактирования/inpainting в единую структуру с использованием масштабируемого однопоточного диффузионного трансформера (S3-DiT). Это omni-предварительное обучение позволяет плавно переключаться между созданием новых изображений и редактированием существующих без необходимости использования отдельных специализированных моделей, предлагая разработчикам более высокую эффективность параметров и гибкость.
Z-Image — это мощная и высокоэффективная фундаментальная модель генерации изображений с 6 млрд параметров. Используя архитектуру Scalable Single-Stream Diffusion Transformer (S3-DiT), она обрабатывает текст, визуальные семантические токены и токены VAE изображений как единый поток. Z-Image служит ядром для таких вариантов, как Z-Image-Turbo и Z-Image-Omni-Base, обеспечивая передовую производительность среди моделей с открытым исходным кодом.
Z-Image — это мощная и эффективная модель генерации изображений с 6 млрд параметров. В настоящее время существует три варианта: Z-Image-Turbo (дистиллированная версия, всего 8 шагов вывода), Z-Image-Omni-Base (базовая модель) и Z-Image-Edit (вариант для редактирования изображений).
Попробуйте модель Z-Image Turbo на платформе ModelScope, предлагающей сервис онлайн-вывода и API для быстрой интеграции разработчиками.
Модель Z-Image Turbo в сообществе HuggingFace с полными весами, примерами использования и поддержкой. Ежемесячное количество скачиваний достигает 111 244.
Z-Image De-Turbo — это версия Tongyi-MAI/Z-Image-Turbo с обратной дистилляцией. Эта модель специально разработана для глубокого дообучения, предлагая большую гибкость по сравнению с оригинальной turbo-моделью.
Red-Z-Image-AIO-1.5 — это улучшенная версия официальной модели Z-Image-Turbo, построенная на архитектуре S³-DiT. Она решает проблемы сложности настройки и производительности на слабом железе.
ComfyUI官方Z-Image Turbo文档,包含完整工作流模板、详细模型下载说明和低显存设备优化设置。适合需要本地部署、完全控制生成过程的用户。
PrunaAI优化的Tongyi-MAI Z-Image Turbo版本,通过高级压缩技术进一步加速。该版本应用智能缓存、模型编译和量化技术,使图像生成更快,同时保持原始模型的照片级质量和优秀的中文文本渲染能力。
GGUF-Org 提供官方转换的 Z-Image Turbo GGUF 量化版本,可在显存低至 6GB 的消费级 GPU 上部署。支持多种量化级别,包括 Q3_K_S、IQ4_NL 和 IQ4_XS,提供不同的显存/质量权衡选择。
Qwen3-4B-GGUF 是 Z-Image GGUF 部署所需的文本编码器,提供双语(中英文)理解和高级推理能力。支持独特的思维链模式用于复杂逻辑推理任务。
由 Jayn7 维护的社区 GGUF 模型合集,提供多个 Z-Image Turbo 量化变体和详细的 ComfyUI 设置指南。社区人气之选,获得超过 200 个点赞。
ControlNet и LoRA3
这个LoRA模型增强了Z-Image已有的像素艺术能力,使其更加详细和精细。无需触发词,但在提示词中使用"pixel art"可以获得更好效果。
这是一个添加了6个block的ControlNet模型,在100万高质量图像数据集上从头训练10000步,支持多种控制条件。
Qwen-Image-i2L是一个创新模型,将图像作为输入,直接输出基于这些图像训练的LoRA权重。系统包含四个专业模型:i2L-Style用于风格迁移,i2L-Coarse和i2L-Fine用于内容保留,i2L-Bias用于与Qwen-Image美学对齐。
Демо-приложения5
Z-Image Turbo官方在线演示应用,由Tongyi-MAI团队维护,提供直接体验Z-Image生成能力的平台。基于Zero GPU运行,无需本地配置即可使用。
ModelScope平台上的Z-Image画廊应用,以画廊形式展示Z-Image模型的生成效果,提供中文界面优化,集成ModelScope生态系统。
基于Z-Image的智能相框应用,专为MCP 1st生日纪念项目开发,展示Z-Image在创意应用场景中的可能性。
Z-Image定制LoRA模型在线画廊,托管多种定制训练的LoRA模型,包括激进艺术风格和身份模型,支持在线切换和预览功能。
基于Z-Image开发的推理游戏互动应用,结合图像生成和游戏玩法,展示Z-Image在娱乐应用场景中的创新使用。
Научные статьи1
В этой статье предлагается фреймворк DMDR, объединяющий методы обучения с подкреплением и дистилляцию сопоставления распределений. Исследование показывает, что для генераторов с малым количеством шагов лосс DMD более эффективен, чем традиционные методы регуляризации.
Официальный блог1
Z-Image项目官方主页,提供项目的全面介绍,包括核心特性、模型架构、性能评估和技术细节。支持中英双语内容。




















