Guía completa de ComfyUI para principiantes: instalación, interfaz, nodos, modelos y primera imagen
El punto donde más se atasca un principiante de ComfyUI no es escribir prompts. Es la primera vez que abres la interfaz y te encuentras con un grafo de nodos entero: Load Checkpoint, CLIP Text Encode, KSampler, VAE Decode, Save Image. Es fácil suponer que primero hay que aprender la teoría de los modelos de difusión antes de generar una sola imagen.
No hace falta. Al principio, trata ComfyUI como un pipeline de generación visual: el modelo aporta la capacidad de generar, el prompt describe la imagen, el sampler la genera paso a paso y el nodo de guardado produce el resultado. Este artículo resuelve solo un problema concreto: elegir un modo de instalación, colocar el modelo en la carpeta correcta, hacer funcionar el workflow text-to-image por defecto y depurar la primera ronda de errores en un orden sensato.
Conclusión clave
| Tu situación | Vía recomendada | Lo que conviene evitar de entrada |
|---|---|---|
| Windows + GPU NVIDIA, solo quieres una imagen rápido | Desktop o Windows portable | Configurar Python a mano el primer día |
| macOS Apple Silicon | Desktop | Seguir tutoriales de CUDA para Windows |
| Linux o necesitas controlar PyTorch/CUDA | Instalación manual | Copiar a ciegas las variables de entorno de otra persona |
| Sin GPU local, solo quieres entender los workflows | Comfy Cloud | Comprar hardware o packs de modelos |
| Ya tienes una biblioteca de modelos de Automatic1111 | Instalación local + extra_model_paths.yaml | Copiar decenas de GB de modelos por duplicado |
El objetivo del primer día no es “una imagen bonita”, sino confirmar tres cosas: ComfyUI arranca, Load Checkpoint detecta un modelo y el workflow text-to-image por defecto llega hasta el final. Cuando esas tres cosas funcionan, aprender LoRA, ControlNet, IP-Adapter y workflows complejos —y depurarlos— se vuelve mucho más sencillo.
Qué es realmente ComfyUI
ComfyUI es una interfaz open source basada en nodos y un motor de inferencia para IA generativa. Se diferencia de las herramientas de Stable Diffusion que se sienten sobre todo como un formulario: en lugar de rellenar prompt, tamaño y seed en un solo panel, ves un workflow sobre un lienzo.
Un workflow text-to-image mínimo se divide en cinco partes:
Load Checkpoint: carga el modelo base, por ejemplo SD 1.5, SDXL u otro checkpoint.CLIP Text Encode: convierte los prompts positivo y negativo en conditioning que el modelo puede usar.KSampler: genera el latent según los pasos de sampling, el seed, el CFG y otros parámetros.VAE Decode: decodifica el latent en una imagen.Save Image: guarda el resultado en la carpeta de salida.
Esa es la cadena mínima que un principiante debe entender primero. Los workflows complejos solo dividen estos pasos con más detalle o insertan más nodos entre medias: ControlNet lee una imagen de pose, IP-Adapter referencia una imagen de personaje, LoRA cambia el estilo y los nodos de upscale agrandan la imagen.
Por qué el grafo de nodos asusta
ComfyUI expone muchos pasos que otras herramientas ocultan. La ventaja es el control; la desventaja es que a primera vista crees que tienes que entender cada nodo. No es así. Lee primero el grafo en el sentido del flujo: de izquierda a derecha, de arriba abajo, y localiza el modelo, los prompts, el sampler y el nodo de guardado.
La depuración sigue la misma dirección. Si el modelo no se carga, lo demás no puede funcionar. Si el prompt es débil, el resultado puede salir borroso. Si cambias los parámetros del sampler al azar, la imagen se vuelve inestable. Si el nodo de guardado no está conectado, creerás que no se generó nada.
Cómo elegir un modo de instalación
La documentación oficial ofrece varias vías: Desktop, portable, instalación manual y cloud. Lo que un principiante debe hacer no es elegir “la vía más potente”, sino la de menor fricción.
Desktop: adecuado para la mayoría de primeros intentos
La ventaja de Desktop es que te quita trabajo. No tienes que decidir de entrada la versión de Python, el build de PyTorch o el backend CUDA, ni crear un entorno virtual. Para los usuarios de macOS Apple Silicon, Desktop es además el punto de entrada más natural según la documentación.
Conoce también el límite: la documentación indica que Desktop se basa en versiones estables, así que las novedades llegan a veces más tarde que en portable o en la instalación manual. Para la primera imagen apenas importa. Cuando empieces a necesitar nodos nuevos, formatos de modelo nuevos o compatibilidad de plugins, podrás plantearte cambiar de modo de instalación.
Windows portable: bueno para usuarios de GPU NVIDIA
Windows con una GPU NVIDIA es una combinación habitual para generar imágenes de Stable Diffusion en local. La ventaja del paquete portable es una estructura de carpetas clara, cercana a la de muchos tutoriales. Ves directamente carpetas como ComfyUI/models/ y ComfyUI/output/, lo que facilita depurar la ubicación de los modelos.
Si tu objetivo es solo aprender ComfyUI, el portable local basta. No instales el primer día custom nodes, el Manager, decenas de modelos y una decena de LoRA. El problema más común en principiantes no es “faltan funciones”, sino no saber qué paso se rompió tras instalar demasiado.
Instalación manual: para quien necesita controlar su entorno
La instalación manual encaja mejor con usuarios de Linux, desarrolladores o quien ya sabe que necesita controlar Python, PyTorch o el backend CUDA/ROCm/MPS. Es flexible, pero también abre más puntos donde pueden aparecer errores.
Si eliges la instalación manual, trata el entorno como un proyecto independiente:
git clone https://github.com/comfy-org/ComfyUI.git
cd ComfyUI
python -m venv venv
source venv/bin/activate
pip install -r requirements.txt
python main.py
Estos comandos solo muestran la forma general de una instalación manual. El backend real de PyTorch, el driver de la GPU y las diferencias del sistema deben seguir la documentación oficial de instalación manual. No copies un comando de CUDA de un tutorial antiguo y lo ejecutes tal cual.
Cloud: útil para probar primero el workflow
Si todavía no tienes una GPU local, o solo quieres saber si ComfyUI encaja contigo, empieza por la vía cloud. No sustituye al aprendizaje de un entorno local, pero te ayuda a entender la relación entre nodos, workflow, modelos y prompts.
Cuando tengas claro que lo vas a usar a largo plazo, vuelve a la instalación local. Es más estable que comprar hardware y descargar un montón de modelos desde el principio.
Dónde colocar los archivos de modelos
Muchos problemas de principiantes de ComfyUI acaban en la misma pregunta: ¿por qué Load Checkpoint está vacío?
La documentación oficial explica que la mayoría de instalaciones no incluyen un modelo base. Los modelos suelen vivir bajo la carpeta models/ dentro del directorio de instalación de ComfyUI. Las subcarpetas habituales son:
| Tipo de archivo | Carpeta habitual | Uso |
|---|---|---|
checkpoint / .safetensors / .ckpt | ComfyUI/models/checkpoints/ | Modelo base de generación de imágenes |
| LoRA | ComfyUI/models/loras/ | Ajuste de estilo, personaje, acción o concepto |
| VAE | ComfyUI/models/vae/ | Decodificación de imagen, color y detalle |
| embedding / textual inversion | ComfyUI/models/embeddings/ | Vectores disparadores de ciertos términos |
| modelo de upscale | ComfyUI/models/upscale_model/ | Ampliación de imagen |
Para la primera imagen, ocúpate solo del checkpoint. Coloca un modelo base utilizable en models/checkpoints/, arranca o actualiza ComfyUI y luego selecciónalo en el desplegable de Load Checkpoint.
La carpeta de modelos de Desktop puede ser distinta
Los usuarios de Desktop no deben aferrarse a las rutas portable de los tutoriales en línea. La documentación menciona abrir la carpeta de modelos desde el menú, en Help / Open folder / Open models folder. Guíate por la carpeta que abre la aplicación, no por la ruta de instalación de otra persona.
Si ya tienes una biblioteca de modelos en Automatic1111, Forge u otra herramienta, plantéate configurar extra_model_paths.yaml. Así ComfyUI leerá carpetas de modelos externas sin copiar decenas de GB de archivos.
Un criterio práctico:
- Solo uno o dos modelos: colócalos directamente en la carpeta correspondiente de ComfyUI.
- Una biblioteca grande ya existente: mapéala con
extra_model_paths.yaml. - Aún no sabes si lo usarás a largo plazo: mantén la configuración de modelos sencilla.
Genera tu primera imagen
Para la primera imagen, usa el workflow por defecto y no abras de entrada un JSON complejo compartido por otra persona. El valor del workflow por defecto está en sus pocas variables: si funciona, el entorno, el modelo y los nodos base están conectados.
Paso a paso
- Arranca ComfyUI y abre la interfaz web.
- Carga el workflow “Image Generation” por defecto.
- Si la interfaz avisa de un modelo faltante, instálalo desde el aviso o coloca un modelo descargado en
models/checkpoints/. - Selecciona el modelo en
Load Checkpoint. - Escribe el sujeto de la imagen en el prompt positivo, por ejemplo
a cozy desk setup, soft light, detailed illustration. - Escribe lo que no quieres en el prompt negativo, por ejemplo
blurry, low quality, distorted hands. - Mantén al principio el tamaño, el sampler y los steps por defecto. No cambies todo a la vez.
- Pulsa
Runo usaCtrl + Enter. - Revisa el resultado en el nodo
Save Image, en la zona de salida de la interfaz o en la carpetaoutput/.
No pasa nada si la primera imagen es sosa o incluso fea. Su función es demostrar que la cadena funciona. Lo que debes anotar: qué modelo usaste, el prompt, si apareció algún error y dónde está la carpeta de salida.
Cómo escribir el primer prompt
Como principiante, no escribas un prompt demasiado abstracto. Términos como “chica guapa” o “ciudad del futuro” pueden generar imágenes, pero te dan poca información cuando el resultado es malo. Un prompt mejor para la primera validación es:
a small wooden cabin beside a lake, morning fog, soft sunlight, detailed illustration, calm mood
El prompt negativo puede ser sencillo al principio:
blurry, low quality, distorted, extra fingers, bad anatomy
No amontones en la primera ronda una larga lista de términos de estilo, vocabulario de cámara y nombres de artistas. Haz que el modelo produzca primero salidas estables y luego ajusta prompt, tamaño, steps, CFG y seed de uno en uno.
Cómo depurar la primera ronda de errores
Procede en orden. No reinstales el entorno, cambies de modelo y modifiques el workflow al mismo tiempo. Cambia solo una variable cada vez para saber de dónde viene el problema.
Load Checkpoint está vacío o muestra null
Revisa primero tres cosas:
- ¿El archivo del modelo es un
.safetensorso un.ckpt? - ¿Está en
ComfyUI/models/checkpoints/o, en Desktop, en la carpeta de modelos que abre la aplicación? - ¿Has actualizado o reiniciado ComfyUI después de mover el modelo?
Si usas extra_model_paths.yaml, reduce primero la configuración a una sola ruta. Confirma que esa ruta se lee y luego amplíala. Las rutas con caracteres chinos, espacios o restricciones de permisos pueden causar problemas adicionales.
Aparecen nodos rojos al abrir un workflow
Los nodos rojos suelen indicar custom nodes faltantes, modelos ausentes o una versión de workflow que no coincide con tu entorno. No empieces la depuración por un workflow complejo. Vuelve primero al workflow text-to-image por defecto y confirma que la cadena básica funciona.
Si el workflow por defecto funciona, atiende luego el workflow compartido:
- Lee primero los nombres de los nodos rojos para identificar el custom node que falta.
- Comprueba después los nodos de carga de modelo y que se encuentren checkpoint, LoRA y VAE.
- Toca los parámetros en último lugar, sin recablear el grafo al azar desde el principio.
Esto es más bien un tema de segundo día. No dejes que los custom nodes te desvíen el primer día.
Errores de CUDA, Torch o backend
Estos errores no suelen venir del prompt, sino de un entorno de ejecución que no encaja. Los usuarios de Windows revisan primero el driver de la GPU y el paquete de instalación; los de Linux comparan Python, PyTorch y el backend con la documentación de instalación manual; los de macOS no aplican tutoriales de CUDA.
Si todavía no quieres dedicar tiempo al entorno, haz funcionar primero el concepto con Desktop o cloud. Cuando tengas claro que vas a trabajar en local de forma continua, vuelve a los detalles de GPU y backend.
La imagen sale borrosa o no se parece al prompt
No supongas de inmediato que ComfyUI está roto. Las causas comunes son:
- El modelo no es adecuado para el tipo de imagen buscado.
- El prompt es demasiado abstracto, sin sujeto, escena, luz ni estilo.
- El tamaño o los parámetros del sampler se cambiaron de forma demasiado brusca.
- El prompt negativo limita demasiado al modelo.
Mantén fijos el modelo y los parámetros, y cambia solo el prompt en tres rondas comparativas. En la primera, solo el sujeto; en la segunda, la escena; en la tercera, la luz y el estilo. Así verás mucho mejor cómo influye el prompt en el resultado.
Qué no debe hacer un principiante al empezar
ComfyUI es potente, pero esa potencia es justo lo que más frena a los principiantes.
Primero, no instales de golpe decenas de custom nodes. Cuantos más nodos, mayor probabilidad de conflictos y dependencias faltantes. Cuando el workflow por defecto funcione de forma estable, instala nodos para una necesidad concreta.
Segundo, no descargues una decena de modelos a la vez. Haz funcionar primero un modelo base, anota para qué es bueno y añade más poco a poco. Demasiados modelos dificultan saber si el problema viene del prompt o del modelo.
Tercero, no te lances demasiado pronto a la automatización por API. La API de ComfyUI es útil, pero si aún no entiendes el workflow, la automatización solo multiplica los errores.
Cuarto, no tomes el workflow de otra persona como respuesta universal. Muchos workflows compartidos dependen de modelos, versiones de nodos y rutas concretas. Aprende su estructura, pero no esperes que cada workflow copiado funcione de inmediato.
Orden de aprendizaje recomendado
Un camino más sólido es así:
- Hacer funcionar el workflow text-to-image por defecto.
- Entender la diferencia entre checkpoint, LoRA y VAE.
- Aprender a leer un JSON de workflow y a saber qué significan los nodos rojos.
- Aprender una dirección de mejora concreta, por ejemplo ControlNet o IP-Adapter.
- Solo después, estudiar la generación por lotes, la API, la automatización y la reutilización de workflows.
Si ya conoces los LLM locales, piensa en ComfyUI como un banco de trabajo de inferencia local para la generación de imágenes. Lee primero Introducción a Ollama: tu primer paso para ejecutar grandes modelos de lenguaje en local para conectar archivos de modelos, entorno de ejecución y parámetros de inferencia; para escribir prompts, continúa con Prompt engineering aplicado al negocio; para problemas de GPU y entorno de ejecución, consulta Configurar la aceleración por GPU de Ollama.
Resumen
Empezar con ComfyUI no obliga a comenzar por workflows complejos. Mantén un objetivo pequeño: elegir un modo de instalación que te encaje, colocar el modelo base en la carpeta correcta y generar tu primera imagen con el workflow text-to-image por defecto.
Cuando esa cadena funcione, aprende LoRA, ControlNet, los custom nodes y la reutilización de workflows. Cada paso tendrá entonces un criterio claro: ¿se detecta el modelo, faltan nodos, es el prompt lo bastante concreto, se guardó la salida? La curva de aprendizaje de ComfyUI es real, pero si no lo mezclas todo el primer día, el intimidante grafo de nodos se convierte en un flujo de generación que podrás depurar y reutilizar una y otra vez.
Referencias
- Documentación de ComfyUI
- Getting Started with AI Image Generation
- Manual Installation
- ComfyUI Models
- ComfyUI GitHub
FAQ
¿Un principiante de ComfyUI debe elegir Desktop, portable o instalación manual?
¿En qué carpeta hay que colocar los modelos de ComfyUI?
¿Por qué Load Checkpoint aparece vacío o muestra null en ComfyUI?
¿Qué hago cuando un workflow compartido muestra nodos rojos?
¿Una primera imagen mala significa que la instalación falló?
13 min de lectura · Publicado el: 1 jun 2026 · Actualizado el: 20 jun 2026
Guía práctica de ComfyUI y Stable Diffusion
Estás leyendo el primer artículo de esta serie. Continúa con el siguiente o abre el hub para ver toda la ruta.
Anterior
Estás al inicio de esta serie.
Siguiente
Guía de reutilización de workflows en ComfyUI: descargar, importar, modificar y gestionar
Reutilizar un workflow de ComfyUI suele atascarse en nodos faltantes, rutas de modelos y parámetros incoherentes. Esta guía ofrece una checklist para importar el JSON, corregir custom nodes, mapear modelos y archivar runs reproducibles.
Parte 2 de 2
Artículos relacionados
female-portrait-director: convierte los prompts de retrato en un Skill reutilizable
female-portrait-director: convierte los prompts de retrato en un Skill reutilizable
Continuum y la elección de un agent runtime: 7 capacidades que mirar del notebook a producción
Continuum y la elección de un agent runtime: 7 capacidades que mirar del notebook a producción
ADHD: cómo curar la convergencia prematura de los agentes de código con razonamiento divergente paralelo
Comentarios
Inicia sesión con GitHub para dejar un comentario