Retour à la Liste

Distribution Matching Distillation Meets Reinforcement Learning

Article technique principal Z-Image, présentant le cadre DMDR

Article
Recherche
DMDR
Apprentissage renforcé

Aperçu

Cet article propose le cadre DMDR, intégrant l'apprentissage renforcé dans la distillation par appariement de distribution.

Caractéristiques

  • Cadre DMDR
  • Stratégie de guidage dynamique
  • Performance de pointe

Images

Utilisation

Téléchargement PDF : https://arxiv.org/pdf/2511.13649.pdf

Liens Connexes