Changer de langue
Changer le thème

Guide complet ComfyUI pour débutants : installation, interface, nœuds, modèles et première image

L’endroit où l’on bloque le plus souvent en tant que débutant ComfyUI, ce n’est pas l’écriture des prompts. C’est la première fois que vous ouvrez l’interface et tombez sur tout un graphe de nœuds : Load Checkpoint, CLIP Text Encode, KSampler, VAE Decode, Save Image. Beaucoup croient alors qu’il faut d’abord apprendre la théorie des modèles de diffusion avant de générer une seule image.

Ce n’est pas le cas. Au départ, voyez ComfyUI comme un pipeline de génération visuel : le modèle fournit la capacité de génération, le prompt décrit l’image, le sampler génère pas à pas, et le nœud de sauvegarde produit le résultat. Cet article ne traite qu’un problème précis : choisir un mode d’installation, placer le modèle au bon endroit, faire tourner le workflow text-to-image par défaut, et dépanner la première série d’erreurs dans un ordre sensé.

Conclusion clé

Votre situationVoie recommandéeCe qu’il vaut mieux éviter d’emblée
Windows + GPU NVIDIA, vous voulez juste une image rapidementDesktop ou Windows portableConfigurer Python à la main dès le premier jour
macOS Apple SiliconDesktopReprendre des tutoriels CUDA pour Windows
Linux ou besoin de maîtriser PyTorch/CUDAInstallation manuelleCopier aveuglément les variables d’environnement d’un autre
Pas de GPU local, vous voulez juste comprendre les workflowsComfy CloudAcheter du matériel ou des packs de modèles
Vous avez déjà une bibliothèque de modèles Automatic1111Installation locale + extra_model_paths.yamlRecopier des dizaines de Go de modèles

L’objectif du premier jour n’est pas « une belle image », mais de confirmer trois choses : ComfyUI démarre, Load Checkpoint détecte un modèle, et le workflow text-to-image par défaut va jusqu’au bout. Une fois ces trois points acquis, apprendre LoRA, ControlNet, IP-Adapter et des workflows complexes — et les déboguer — devient bien plus simple.

Ce qu’est réellement ComfyUI

ComfyUI est une interface open source à base de nœuds et un moteur d’inférence pour l’IA générative. Il diffère des outils Stable Diffusion qui ressemblent surtout à un formulaire : au lieu de remplir prompt, taille et seed dans un seul panneau, vous voyez un workflow sur un canevas.

Un workflow text-to-image minimal se découpe en cinq parties :

  1. Load Checkpoint : charge le modèle de base, par exemple SD 1.5, SDXL ou un autre checkpoint.
  2. CLIP Text Encode : transforme les prompts positif et négatif en conditioning utilisable par le modèle.
  3. KSampler : génère le latent selon le nombre de pas, le seed, le CFG et les autres paramètres.
  4. VAE Decode : décode le latent en image.
  5. Save Image : enregistre le résultat dans le dossier de sortie.

C’est la chaîne minimale qu’un débutant doit comprendre en premier. Les workflows complexes ne font que découper ces étapes plus finement ou insérer d’autres nœuds entre elles : ControlNet lit une image de pose, IP-Adapter référence une image de personnage, LoRA modifie le style, et les nœuds d’upscale agrandissent l’image.

Pourquoi le graphe de nœuds fait peur

ComfyUI expose de nombreuses étapes que d’autres outils masquent. L’avantage, c’est le contrôle ; l’inconvénient, c’est qu’au premier regard on croit devoir comprendre chaque nœud. Inutile. Lisez d’abord le graphe dans le sens du flux : de gauche à droite, de haut en bas, et repérez le modèle, les prompts, le sampler et le nœud de sauvegarde.

Le dépannage suit la même direction. Si le modèle n’est pas chargé, la suite ne peut pas tourner. Si le prompt est trop faible, le résultat sera flou. Si les paramètres du sampler sont modifiés au hasard, l’image devient instable. Si le nœud de sauvegarde n’est pas connecté, vous croirez qu’aucune image n’a été générée.

Comment choisir un mode d’installation

La documentation officielle propose plusieurs voies : Desktop, portable, installation manuelle et cloud. Ce qu’un débutant doit vraiment faire, ce n’est pas choisir « la voie la plus puissante », mais celle qui offre le moins de friction.

Desktop : adapté à la plupart des premiers essais

L’avantage de Desktop, c’est la tranquillité. Vous n’avez pas à trancher d’emblée la version de Python, le build de PyTorch ou le backend CUDA, ni à créer un environnement virtuel. Pour les utilisateurs macOS Apple Silicon, Desktop est aussi le point d’entrée le plus naturel selon la documentation.

Connaissez quand même la limite : la documentation indique que Desktop s’appuie sur des versions stables, donc les nouveautés arrivent parfois plus tard que dans portable ou l’installation manuelle. Pour la première image, cela change peu de chose. Quand vous aurez besoin de nouveaux nœuds, de nouveaux formats de modèles ou de compatibilité de plugins, vous pourrez envisager de changer de mode d’installation.

Windows portable : bon pour les utilisateurs de GPU NVIDIA

Windows avec un GPU NVIDIA est une combinaison courante pour générer des images Stable Diffusion en local. L’avantage du paquet portable, c’est une structure de dossiers claire, proche de celle de nombreux tutoriels. Vous voyez directement des dossiers comme ComfyUI/models/ et ComfyUI/output/, ce qui facilite le dépannage des emplacements de modèles.

Si votre but est seulement d’apprendre ComfyUI, le portable local suffit. N’installez pas dès le premier jour des custom nodes, le Manager, des dizaines de modèles et une dizaine de LoRA. L’ennui le plus fréquent chez les débutants n’est pas « pas assez de fonctions », mais de ne plus savoir quelle étape a cassé après avoir trop installé.

Installation manuelle : pour qui doit maîtriser son environnement

L’installation manuelle convient mieux aux utilisateurs Linux, aux développeurs, ou à ceux qui savent déjà qu’ils doivent contrôler Python, PyTorch ou le backend CUDA/ROCm/MPS. Elle est souple, mais elle ouvre aussi plus de portes aux erreurs.

Si vous choisissez l’installation manuelle, traitez l’environnement comme un projet à part entière :

git clone https://github.com/comfy-org/ComfyUI.git
cd ComfyUI
python -m venv venv
source venv/bin/activate
pip install -r requirements.txt
python main.py

Ces commandes montrent seulement la forme générale d’une installation manuelle. Le backend PyTorch réel, le pilote GPU et les différences de système doivent suivre la documentation officielle d’installation manuelle. Ne copiez pas une commande CUDA d’un vieux tutoriel pour l’exécuter telle quelle.

Cloud : utile pour découvrir d’abord le workflow

Si vous n’avez pas encore de GPU local, ou si vous voulez juste savoir si ComfyUI vous convient, commencez par la voie cloud. Elle ne remplace pas l’apprentissage d’un environnement local, mais elle vous aide à comprendre le lien entre nœuds, workflow, modèles et prompts.

Une fois sûr de vouloir l’utiliser durablement, revenez à l’installation locale. C’est plus stable que d’acheter du matériel et de télécharger un tas de modèles dès le départ.

Où placer les fichiers de modèles

Beaucoup de problèmes de débutants ComfyUI reviennent à la même question : pourquoi Load Checkpoint est-il vide ?

La documentation officielle explique que la plupart des installations n’incluent pas de modèle de base. Les modèles se trouvent en général sous le dossier models/ dans le répertoire d’installation de ComfyUI. Les sous-dossiers courants sont :

Type de fichierDossier courantUsage
checkpoint / .safetensors / .ckptComfyUI/models/checkpoints/Modèle de base pour la génération d’images
LoRAComfyUI/models/loras/Réglage fin de style, personnage, action ou concept
VAEComfyUI/models/vae/Décodage d’image, couleurs et détails
embedding / textual inversionComfyUI/models/embeddings/Vecteurs déclencheurs pour certains termes
modèle d’upscaleComfyUI/models/upscale_model/Agrandissement d’image

Pour la première image, ne traitez que le checkpoint. Placez un modèle de base utilisable dans models/checkpoints/, démarrez ou actualisez ComfyUI, puis sélectionnez-le dans la liste déroulante de Load Checkpoint.

Le dossier de modèles de Desktop peut différer

Les utilisateurs Desktop ne doivent pas s’accrocher aux chemins portable des tutoriels en ligne. La documentation mentionne d’ouvrir le dossier de modèles depuis le menu, via Help / Open folder / Open models folder. Fiez-vous au dossier ouvert par l’application, pas au chemin d’installation d’un autre.

Si vous avez déjà une bibliothèque de modèles dans Automatic1111, Forge ou un autre outil, envisagez de configurer extra_model_paths.yaml. ComfyUI lira alors des dossiers de modèles externes, sans recopier des dizaines de Go de fichiers.

Un critère pratique :

  • Un ou deux modèles seulement : placez-les directement dans le dossier ComfyUI correspondant.
  • Une grande bibliothèque existante : mappez-la avec extra_model_paths.yaml.
  • Vous ne savez pas encore si vous l’utiliserez longtemps : gardez la configuration des modèles simple.

Générer votre première image

Pour la première image, utilisez le workflow par défaut, et n’ouvrez pas tout de suite un JSON complexe partagé par quelqu’un d’autre. La valeur du workflow par défaut tient à ses faibles variables : s’il tourne, c’est que l’environnement, le modèle et les nœuds de base sont connectés.

Étapes

  1. Démarrez ComfyUI et ouvrez l’interface web.
  2. Chargez le workflow « Image Generation » par défaut.
  3. Si l’interface signale un modèle manquant, installez-le via l’invite ou placez un modèle téléchargé dans models/checkpoints/.
  4. Sélectionnez le modèle dans Load Checkpoint.
  5. Écrivez le sujet de l’image dans le prompt positif, par exemple a cozy desk setup, soft light, detailed illustration.
  6. Écrivez ce que vous ne voulez pas dans le prompt négatif, par exemple blurry, low quality, distorted hands.
  7. Gardez d’abord la taille, le sampler et les steps par défaut. Ne changez pas tout à la fois.
  8. Cliquez sur Run, ou utilisez Ctrl + Enter.
  9. Consultez le résultat dans le nœud Save Image, la zone de sortie de l’interface ou le dossier output/.

Peu importe si la première image est banale, voire moche. Son rôle est de prouver que la chaîne fonctionne. Ce que vous devez noter : le modèle utilisé, le prompt, l’apparition éventuelle d’une erreur et l’emplacement du dossier de sortie.

Comment écrire le premier prompt

En tant que débutant, n’écrivez pas un prompt trop abstrait. Des termes comme « belle fille » ou « ville du futur » peuvent générer une image, mais ils vous donnent peu de retour quand le résultat est mauvais. Un prompt mieux adapté à la première validation est :

a small wooden cabin beside a lake, morning fog, soft sunlight, detailed illustration, calm mood

Le prompt négatif peut rester simple :

blurry, low quality, distorted, extra fingers, bad anatomy

N’empilez pas dès la première manche une longue liste de termes de style, de vocabulaire photo et de noms d’artistes. Faites d’abord produire des sorties stables au modèle, puis ajustez prompt, taille, steps, CFG et seed un par un.

Comment dépanner la première série d’erreurs

Procédez dans l’ordre. Ne réinstallez pas l’environnement, ne changez pas de modèle et ne modifiez pas le workflow en même temps. Ne changez qu’une variable à la fois pour savoir d’où vient le problème.

Load Checkpoint est vide ou affiche null

Vérifiez d’abord trois choses :

  1. Le fichier modèle est-il bien un .safetensors ou un .ckpt ?
  2. Est-il dans ComfyUI/models/checkpoints/ — sous Desktop, dans le dossier de modèles ouvert par l’application ?
  3. Avez-vous actualisé ou relancé ComfyUI après avoir déplacé le modèle ?

Si vous utilisez extra_model_paths.yaml, réduisez d’abord la configuration à un seul chemin. Confirmez que ce chemin est lu, puis étendez-le. Les chemins contenant des caractères chinois, des espaces ou des restrictions de droits peuvent créer des problèmes supplémentaires.

Des nœuds rouges apparaissent à l’ouverture d’un workflow

Les nœuds rouges signalent souvent des custom nodes manquants, des modèles absents, ou une version de workflow qui ne correspond pas à votre environnement. Ne commencez pas le dépannage par un workflow complexe. Revenez d’abord au workflow text-to-image par défaut et confirmez que la chaîne de base fonctionne.

Si le workflow par défaut tourne, traitez ensuite le workflow partagé :

  • Lisez d’abord les noms des nœuds rouges pour repérer le custom node manquant.
  • Vérifiez ensuite les nœuds de chargement de modèle et que checkpoint, LoRA et VAE sont trouvés.
  • Ne touchez aux paramètres qu’en dernier, sans recâbler le graphe au hasard dès le début.

C’est plutôt un sujet de deuxième jour. Ne laissez pas les custom nodes vous détourner le premier jour.

Erreurs CUDA, Torch ou backend

Ces erreurs ne viennent généralement pas du prompt, mais d’un environnement d’exécution inadapté. Les utilisateurs Windows vérifient d’abord le pilote GPU et le paquet d’installation ; les utilisateurs Linux comparent Python, PyTorch et le backend à la documentation d’installation manuelle ; les utilisateurs macOS n’appliquent pas les tutoriels CUDA.

Si vous ne voulez pas encore passer du temps sur l’environnement, faites d’abord tourner le concept via Desktop ou le cloud. Une fois sûr de travailler en local sur la durée, revenez aux détails du GPU et du backend.

L’image est floue ou ne ressemble pas au prompt

Ne soupçonnez pas tout de suite ComfyUI d’être cassé. Les causes courantes sont :

  • Le modèle ne convient pas au type d’image visé.
  • Le prompt est trop abstrait, sans sujet, scène, lumière ni style.
  • La taille ou les paramètres du sampler ont été modifiés trop brutalement.
  • Le prompt négatif bride trop le modèle.

Gardez le modèle et les paramètres fixes, puis modifiez seulement le prompt sur trois manches comparatives. Dans la première, seulement le sujet ; dans la deuxième, la scène ; dans la troisième, la lumière et le style. Vous verrez bien plus facilement comment le prompt influe sur le résultat.

Ce qu’un débutant ne doit pas faire au départ

ComfyUI est puissant, mais cette puissance est justement ce qui ralentit le plus les débutants.

Premièrement, n’installez pas d’emblée des dizaines de custom nodes. Plus il y a de nœuds, plus le risque de conflits et de dépendances manquantes augmente. Quand le workflow par défaut tourne de façon stable, installez des nœuds pour un besoin précis.

Deuxièmement, ne téléchargez pas une dizaine de modèles en même temps. Faites d’abord tourner un modèle de base, notez ce pour quoi il est bon, puis ajoutez-en progressivement. Trop de modèles rendent difficile de savoir si le problème vient du prompt ou du modèle.

Troisièmement, ne vous précipitez pas sur l’automatisation par API. L’API de ComfyUI est utile, mais si vous ne comprenez pas encore le workflow, l’automatisation ne fait que multiplier les erreurs.

Quatrièmement, ne prenez pas le workflow d’un autre pour une réponse universelle. Beaucoup de workflows partagés dépendent de modèles, de versions de nœuds et de chemins précis. Apprenez leur structure, mais n’attendez pas que chaque workflow copié tourne immédiatement.

Ordre d’apprentissage recommandé

Une progression plus solide ressemble à ceci :

  1. Faire tourner le workflow text-to-image par défaut.
  2. Comprendre la différence entre checkpoint, LoRA et VAE.
  3. Apprendre à lire un JSON de workflow et à savoir ce que signifient les nœuds rouges.
  4. Apprendre une direction d’amélioration précise, par exemple ControlNet ou IP-Adapter.
  5. Ensuite seulement, étudier la génération par lots, l’API, l’automatisation et la réutilisation de workflows.

Si vous connaissez déjà les LLM locaux, voyez ComfyUI comme un établi d’inférence local pour la génération d’images. Lisez d’abord Démarrer avec Ollama : votre premier pas pour exécuter des grands modèles de langage en local pour relier fichiers de modèles, environnement d’exécution et paramètres d’inférence ; pour l’écriture de prompts, poursuivez avec Le prompt engineering en pratique métier ; pour les questions de GPU et d’environnement d’exécution, consultez Configurer l’accélération GPU d’Ollama.

Conclusion

Démarrer ComfyUI n’oblige pas à commencer par des workflows complexes. Gardez un objectif réduit : choisir un mode d’installation qui vous convient, placer le modèle de base dans le bon dossier, et générer votre première image avec le workflow text-to-image par défaut.

Une fois cette chaîne fonctionnelle, apprenez LoRA, ControlNet, les custom nodes et la réutilisation de workflows. Chaque étape a alors un critère clair : le modèle est-il détecté, des nœuds manquent-ils, le prompt est-il assez précis, la sortie a-t-elle été enregistrée ? La courbe d’apprentissage de ComfyUI est réelle, mais si vous ne mélangez pas tout le premier jour, le graphe de nœuds intimidant devient un flux de génération que vous pourrez déboguer et réutiliser sans cesse.

Ressources

FAQ

Un débutant ComfyUI doit-il choisir Desktop, portable ou l'installation manuelle ?
Si vous voulez seulement générer vite votre première image, choisissez Desktop ou Windows portable. Optez pour l'installation manuelle si vous êtes sous Linux ou si vous devez maîtriser Python, PyTorch et les backends CUDA/ROCm/MPS.
Dans quel dossier placer les modèles ComfyUI ?
Les checkpoints de base vont dans ComfyUI/models/checkpoints/, les LoRA dans models/loras/, les VAE dans models/vae/ et les embeddings dans models/embeddings/. Les utilisateurs Desktop se fient au dossier de modèles ouvert par l'application.
Pourquoi Load Checkpoint est-il vide ou affiche-t-il null dans ComfyUI ?
Vérifiez d'abord le format du fichier modèle, son emplacement et le fait d'avoir actualisé ou relancé ComfyUI. La plupart des installations n'incluent pas de modèle de base, et sans modèle dans le dossier checkpoints, ComfyUI ne détecte rien.
Que faire quand un workflow partagé affiche des nœuds rouges ?
Les nœuds rouges signalent souvent des custom nodes manquants, des modèles absents ou un workflow qui ne correspond pas à votre environnement. En tant que débutant, revenez d'abord au workflow text-to-image par défaut et confirmez que la chaîne de base fonctionne avant de traiter les workflows partagés.
Une première image ratée signifie-t-elle une mauvaise installation ?
Pas forcément. La première image sert seulement à prouver que l'environnement, le modèle et le workflow sont connectés. Une image floue ou éloignée du prompt vient généralement du choix du modèle, du niveau de détail du prompt, de la taille, des paramètres du sampler ou d'un negative prompt trop strict.

13 min de lecture · Publié le: 1 juin 2026 · Mis à jour le: 20 juin 2026

Articles liés

Commentaires

Connectez-vous avec GitHub pour laisser un commentaire