
Z-Image Turbo FP8 Hires Workflow (Optimisé pour faible VRAM)
Ceci est un workflow ComfyUI à haute efficacité conçu spécifiquement pour les utilisateurs avec faible VRAM. En utilisant des Modèles Quantifiés FP8 et la technologie de Latent Upscale, il génère des images de haute résolution (1024x1792) rapidement tout en maintenant une utilisation minimale des ressources. 📂 Modèles Requis & Téléchargements Pour assurer le bon fonctionnement du workflow, veuillez télécharger les modèles suivants et les placer dans vos dossiers ComfyUI respectifs : 1. Modèle UNet (Placez dans models/unet/) Nom de fichier : z-image-turbo-fp8-e4m3fn.safetensors Téléchargement : HuggingFace - Z-Image-Turbo-FP8 2. CLIP / Text Encoder (Placez dans models/clip/) Nom de fichier : qwen3-4b-fp8-scaled.safetensors Téléchargement : HuggingFace - Qwen3-4B-FP8 ⚙️ Paramètres Clés & Configuration Ce workflow fonctionne sur un système à 2 passages. Veuillez respecter les paramètres suivants pour obtenir les meilleurs résultats : 🔹 Phase 1 : Génération de Base Taille Latente : Génère à une résolution initiale plus faible (par exemple, 512x896) pour économiser les ressources de calcul. 🔹 Phase 2 : Latent Upscale Méthode d'Upscale : Utilise LatentUpscaleBy. Facteur d'Échelle : Par défaut est 2 (résultant en une sortie finale de 1024x1792). 🔹 Phase 3 : Hires Fix (Refiner) Cette étape est cruciale pour la clarté et le détail de l'image : Échantillonneur : res_multistep (Très recommandé). Denoise : Plage recommandée 0.5 - 0.6. < 0.5 : Les changements sont minimes ; l'image peut rester légèrement floue. > 0.6 : Ajoute plus de détail, mais une valeur trop élevée peut modifier la structure de l'image ou causer des hallucinations. 📊 Benchmark de Performance Données basées sur des tests réels : GPURésolution de SortieTempsNVIDIA RTX 5070 Ti1024 x 17928 ~ 9 sec 📝 Conseils d'Utilisation Gestion de la Mémoire : Si vous êtes extrêmement limité en VRAM, assurez-vous qu'aucun autre grand modèle n'est chargé en arrière-plan. Prompting : Puisque cela utilise l'encodeur de texte Qwen, il a une forte compréhension du langage naturel. Des prompts détaillés, basés sur des phrases, fonctionnent très bien. Dépannage : Si vous remarquez que les détails de l'image se brisent ou semblent "brûlés", essayez de légèrement diminuer la valeur de denoise dans le second KSampler.
Features & Nodes
✨ Fonctionnalités Clés Utilisation Extrêmement Faible de VRAM : Pipeline complet FP8 (Modèle & Text Encoder) pour réduire drastiquement l'empreinte mémoire. Très Rapide : Optimisé pour les modèles Turbo et les étapes d'échantillonnage efficaces. Pipeline Hires Fix : Utilise Latent Upscale + 2ème Passage KSampler pour garantir des détails nets sans coût élevé en VRAM. Architecture AuraFlow : Optimisé en utilisant le nœud ModelSamplingAuraFlow.