Distribution Matching Distillation Meets Reinforcement Learning

Z-Image 核心技术论文，介绍DMDR框架：将强化学习融入分布匹配蒸馏过程

论文

研究

DMDR

强化学习

概述

本文提出DMDR框架，将强化学习技术融入分布匹配蒸馏过程。研究发现对于少步生成器的强化学习，DMD损失本身比传统正则化方法更有效。

特性

DMDR: DMD与强化学习融合框架
动态分布引导策略
动态重噪声采样训练
少步生成器性能突破
超越多步教师模型性能

图片展示

论文模型架构图

DMDR框架的模型架构设计

使用方法

PDF下载: https://arxiv.org/pdf/2511.13649.pdf

相关链接

PDF 下载 HTML 版本引用格式

热门工具

探索最受欢迎的创意工具

Z-Image Edit

上传图片，一句话即可改变一切。

创意引擎

一句话让AI 为你提供无限提示词创意

图像解析

上传图片，立即读取提示词

提示词库

发现成千上万的高质量 AI 提示词。

Z-Image LoRA

多 LoRA 组合生成，创造独一无二的 AI 艺术作品。

AI 视频生成

输入文字或上传图片，AI 自动生成创意视频。

AI 绘图生成器

输入文字，瞬间转化为精美的 AI 绘图作品。

样式库

探索为您创作精心挑选的艺术风格。

智能抠图

一键移除图片背景，实现专业级高精度抠图。

画质增强

将图片无损放大至 4K/8K，恢复清晰细节。

图片重构

使用 AI 外绘技术将图片扩展至任意比例背景。