الموارد
اكتشف مجموعة الموارد الكاملة لنظام Z-Image
موديلات مفتوحة المصدر12
يمثل Z-Image-Omni-Base تحولًا استراتيجيًا من نموذج 'Base' الأصلي نحو بنية تدريب مسبق 'omni' (شاملة القدرات). يوحد مهام توليد الصور والتعديل/الرسم الداخلي في إطار عمل واحد باستخدام Scalable Single-Stream Diffusion Transformer (S3-DiT). يسمح هذا التدريب المسبق الشامل بالانتقال السلس بين توليد صور جديدة وتعديل الصور الموجودة دون الحاجة إلى نماذج متخصصة منفصلة، مما يوفر كفاءة ومرونة أعلى في المعلمات للمطورين.
Z-Image هو نموذج أساسي قوي وعالي الكفاءة لتوليد الصور بمعلمات 6B. من خلال الاستفادة من بنية Scalable Single-Stream Diffusion Transformer (S3-DiT)، فإنه يعالج النص والرموز الدلالية المرئية ورموز VAE للصور كتدفق موحد. يعمل Z-Image كجوهر لمتغيرات مثل Z-Image-Turbo و Z-Image-Omni-Base، ويقدم أداءً متطورًا بين النماذج مفتوحة المصدر.
Z-Image هو نموذج توليد صور قوي وفعال بـ 6 مليار معلمة. حاليًا هناك ثلاثة متغيرات: Z-Image-Turbo (نسخة مقطرة، استدلال بـ 8 خطوات فقط)، Z-Image-Omni-Base (النموذج الأساسي) و Z-Image-Edit (متغير تحرير الصور).
جرب نموذج Z-Image Turbo على منصة ModelScope، التي توفر خدمة استدلال عبر الإنترنت وواجهة برمجة تطبيقات للدمج السريع والاستخدام من قبل المطورين.
نموذج Z-Image Turbo في مجتمع HuggingFace، حيث يوفر أوزان النموذج الكاملة وأمثلة للاستخدام ودعم المجتمع. تصل التنزيلات الشهرية إلى 111,244.
Z-Image De-Turbo هو نسخة من Tongyi-MAI/Z-Image-Turbo تمت إزالة التقطير منها، وتم ضبطها بدقة على الصور المولدة بواسطة Z-Image-Turbo لكسر حدود تقطير الـ turbo. تم تصميم هذا النموذج خصيصًا للتدريب والضبط الدقيق العميق، حيث يوفر قابلية تدريب ومرونة معززة مقارنة بنموذج الـ turbo الأصلي.
Red-Z-Image-AIO-1.5 هو نسخة محسنة من المجتمع لنموذج Z-Image-Turbo الرسمي، مبني على بنية انتشار أحادية التدفق S³-DiT. يعالج نقاط الألم الرئيسية مثل تعقيد الإعداد، والأداء على الأجهزة منخفضة المواصفات، واحتياجات المبدعين المحددة، بما في ذلك ضبط NSFW المتخصص للرندرة الواقعية للتشريح البشري.
ComfyUI官方Z-Image Turbo文档,包含完整工作流模板、详细模型下载说明和低显存设备优化设置。适合需要本地部署、完全控制生成过程的用户。
نسخة محسنة بواسطة PrunaAI من نموذج Z-Image Turbo التابع لفريق Tongyi-MAI، تم تسريعها من خلال تقنيات ضغط متقدمة. تطبق هذه النسخة التخزين المؤقت الذكي، وتجميع النماذج، والتكميم لجعل توليد الصور أسرع مع الحفاظ على جودة النموذج الأصلي ورندرة النصوص الصينية الممتازة.
توفر GGUF-Org نسخ تكميم GGUF المحولة رسميًا لـ Z-Image Turbo، مما يتيح النشر على وحدات معالجة الرسومات الاستهلاكية بذاكرة VRAM منخفضة تصل إلى 6 جيجابايت. يدعم مستويات تكميم متعددة بما في ذلك Q3_K_S و IQ4_NL و IQ4_XS لمقايضات VRAM/الجودة المختلفة.
Qwen3-4B-GGUF هو مشفر النصوص المطلوب لعمليات نشر Z-Image GGUF، مما يوفر فهماً ثنائي اللغة (صيني/إنجليزي) وقدرات تفكير متقدمة. يدعم وضع تفكير فريد لمهام الاستدلال المنطقي المعقدة.
مجموعة نماذج GGUF يديرها المجتمع بواسطة Jayn7، توفر متغيرات تكميم متعددة لـ Z-Image Turbo مع أدلة إعداد مفصلة لـ ComfyUI. خيار شائع مع أكثر من 200 إعجاب في المجتمع.
ControlNet & LoRA3
يعزز نموذج LoRA هذا قدرات فن البكسل الموجودة في Z-Image، مما يجعلها أكثر تفصيلاً ودقة. لا حاجة لكلمات تحفيزية، ولكن استخدام "pixel art" في المطالبات يحقق نتائج أفضل.
هذا نموذج ControlNet مع إضافة 6 كتل، تم تدريبه من الصفر على مجموعة بيانات من مليون صورة عالية الجودة لمدة 10,000 خطوة، ويدعم شروط تحكم متعددة.
Qwen-Image-i2L هو نموذج مبتكر يأخذ الصور كمدخلات ويخرج مباشرة أوزان LoRA مدربة على تلك الصور. يتضمن النظام أربعة نماذج متخصصة: i2L-Style لنقل النمط، و i2L-Coarse و i2L-Fine للحفاظ على المحتوى، و i2L-Bias لمواءمة المخرج مع جماليات Qwen-Image.
تطبيقات عرض5
تطبيق العرض الرسمي عبر الإنترنت لـ Z-Image Turbo، الذي يشرف عليه فريق Tongyi-MAI، ويوفر منصة لتجربة قدرات توليد Z-Image مباشرة. يعمل على Zero GPU، ولا يتطلب أي تكوين محلي.
تطبيق معرض Z-Image على منصة ModelScope، يعرض تأثيرات توليد نموذج Z-Image بتنسيق معرض، ويوفر تحسينًا للواجهة الصينية ونظام ModelScope المتكامل.
تطبيق إطار ذكي يعتمد على Z-Image، تم تطويره خصيصًا لمشروع ذكرى عيد ميلاد MCP الأول، ويعرض إمكانيات Z-Image في سيناريوهات التطبيقات الإبداعية.
معرض عبر الإنترنت يعرض مجموعة متنوعة من نماذج LoRA بناءً على Z-Image، ويغطي أنماطًا فنية مبتكرة ونماذج شخصيات ونماذج هوية، مما يوفر للمستخدمين موارد إبداعية غنية.
Interactive mystery game application developed based on Z-Image, combining image generation and gameplay, showcasing Z-Image's innovative use in entertainment application scenarios.
أوراق أكاديمية1
تقترح هذه الورقة إطار عمل DMDR، الذي يدمج تقنيات التعلم التعزيزي في عملية تقطير مطابقة التوزيع. يظهر البحث أنه بالنسبة للتعلم التعزيزي للمولدات ذات الخطوات القليلة، فإن خسارة DMD نفسها أكثر فعالية من طرق التنظيم التقليدية.
المدونة الرسمية1
الصفحة الرئيسية الرسمية لمشروع Z-Image، توفر مقدمة شاملة للمشروع بما في ذلك الميزات الأساسية، وبنية النموذج، وتقييم الأداء والتفاصيل التقنية. تدعم المحتوى ثنائي اللغة بالصينية والإنجليزية.




















