Retour à la Liste
Distribution Matching Distillation Meets Reinforcement Learning
Article technique principal Z-Image, présentant le cadre DMDR
Article
Recherche
DMDR
Apprentissage renforcé
Aperçu
Cet article propose le cadre DMDR, intégrant l'apprentissage renforcé dans la distillation par appariement de distribution.
Caractéristiques
- Cadre DMDR
- Stratégie de guidage dynamique
- Performance de pointe
Images
Utilisation
Téléchargement PDF : https://arxiv.org/pdf/2511.13649.pdf