Guía completa de ComfyUI para principiantes: instalación, interfaz, nodos, modelos y primera imagen

El punto donde más se atasca un principiante de ComfyUI no es escribir prompts. Es la primera vez que abres la interfaz y te encuentras con un grafo de nodos entero: Load Checkpoint, CLIP Text Encode, KSampler, VAE Decode, Save Image. Es fácil suponer que primero hay que aprender la teoría de los modelos de difusión antes de generar una sola imagen.

No hace falta. Al principio, trata ComfyUI como un pipeline de generación visual: el modelo aporta la capacidad de generar, el prompt describe la imagen, el sampler la genera paso a paso y el nodo de guardado produce el resultado. Este artículo resuelve solo un problema concreto: elegir un modo de instalación, colocar el modelo en la carpeta correcta, hacer funcionar el workflow text-to-image por defecto y depurar la primera ronda de errores en un orden sensato.

Conclusión clave

Tu situación	Vía recomendada	Lo que conviene evitar de entrada
Windows + GPU NVIDIA, solo quieres una imagen rápido	Desktop o Windows portable	Configurar Python a mano el primer día
macOS Apple Silicon	Desktop	Seguir tutoriales de CUDA para Windows
Linux o necesitas controlar PyTorch/CUDA	Instalación manual	Copiar a ciegas las variables de entorno de otra persona
Sin GPU local, solo quieres entender los workflows	Comfy Cloud	Comprar hardware o packs de modelos
Ya tienes una biblioteca de modelos de Automatic1111	Instalación local + `extra_model_paths.yaml`	Copiar decenas de GB de modelos por duplicado

El objetivo del primer día no es “una imagen bonita”, sino confirmar tres cosas: ComfyUI arranca, Load Checkpoint detecta un modelo y el workflow text-to-image por defecto llega hasta el final. Cuando esas tres cosas funcionan, aprender LoRA, ControlNet, IP-Adapter y workflows complejos —y depurarlos— se vuelve mucho más sencillo.

Qué es realmente ComfyUI

ComfyUI es una interfaz open source basada en nodos y un motor de inferencia para IA generativa. Se diferencia de las herramientas de Stable Diffusion que se sienten sobre todo como un formulario: en lugar de rellenar prompt, tamaño y seed en un solo panel, ves un workflow sobre un lienzo.

Un workflow text-to-image mínimo se divide en cinco partes:

Load Checkpoint: carga el modelo base, por ejemplo SD 1.5, SDXL u otro checkpoint.
CLIP Text Encode: convierte los prompts positivo y negativo en conditioning que el modelo puede usar.
KSampler: genera el latent según los pasos de sampling, el seed, el CFG y otros parámetros.
VAE Decode: decodifica el latent en una imagen.
Save Image: guarda el resultado en la carpeta de salida.

Esa es la cadena mínima que un principiante debe entender primero. Los workflows complejos solo dividen estos pasos con más detalle o insertan más nodos entre medias: ControlNet lee una imagen de pose, IP-Adapter referencia una imagen de personaje, LoRA cambia el estilo y los nodos de upscale agrandan la imagen.

Por qué el grafo de nodos asusta

ComfyUI expone muchos pasos que otras herramientas ocultan. La ventaja es el control; la desventaja es que a primera vista crees que tienes que entender cada nodo. No es así. Lee primero el grafo en el sentido del flujo: de izquierda a derecha, de arriba abajo, y localiza el modelo, los prompts, el sampler y el nodo de guardado.

La depuración sigue la misma dirección. Si el modelo no se carga, lo demás no puede funcionar. Si el prompt es débil, el resultado puede salir borroso. Si cambias los parámetros del sampler al azar, la imagen se vuelve inestable. Si el nodo de guardado no está conectado, creerás que no se generó nada.

Cómo elegir un modo de instalación

La documentación oficial ofrece varias vías: Desktop, portable, instalación manual y cloud. Lo que un principiante debe hacer no es elegir “la vía más potente”, sino la de menor fricción.

Desktop: adecuado para la mayoría de primeros intentos

La ventaja de Desktop es que te quita trabajo. No tienes que decidir de entrada la versión de Python, el build de PyTorch o el backend CUDA, ni crear un entorno virtual. Para los usuarios de macOS Apple Silicon, Desktop es además el punto de entrada más natural según la documentación.

Conoce también el límite: la documentación indica que Desktop se basa en versiones estables, así que las novedades llegan a veces más tarde que en portable o en la instalación manual. Para la primera imagen apenas importa. Cuando empieces a necesitar nodos nuevos, formatos de modelo nuevos o compatibilidad de plugins, podrás plantearte cambiar de modo de instalación.

Windows portable: bueno para usuarios de GPU NVIDIA

Windows con una GPU NVIDIA es una combinación habitual para generar imágenes de Stable Diffusion en local. La ventaja del paquete portable es una estructura de carpetas clara, cercana a la de muchos tutoriales. Ves directamente carpetas como ComfyUI/models/ y ComfyUI/output/, lo que facilita depurar la ubicación de los modelos.

Si tu objetivo es solo aprender ComfyUI, el portable local basta. No instales el primer día custom nodes, el Manager, decenas de modelos y una decena de LoRA. El problema más común en principiantes no es “faltan funciones”, sino no saber qué paso se rompió tras instalar demasiado.

Instalación manual: para quien necesita controlar su entorno

La instalación manual encaja mejor con usuarios de Linux, desarrolladores o quien ya sabe que necesita controlar Python, PyTorch o el backend CUDA/ROCm/MPS. Es flexible, pero también abre más puntos donde pueden aparecer errores.

Si eliges la instalación manual, trata el entorno como un proyecto independiente:

git clone https://github.com/comfy-org/ComfyUI.git
cd ComfyUI
python -m venv venv
source venv/bin/activate
pip install -r requirements.txt
python main.py

Estos comandos solo muestran la forma general de una instalación manual. El backend real de PyTorch, el driver de la GPU y las diferencias del sistema deben seguir la documentación oficial de instalación manual. No copies un comando de CUDA de un tutorial antiguo y lo ejecutes tal cual.

Cloud: útil para probar primero el workflow

Si todavía no tienes una GPU local, o solo quieres saber si ComfyUI encaja contigo, empieza por la vía cloud. No sustituye al aprendizaje de un entorno local, pero te ayuda a entender la relación entre nodos, workflow, modelos y prompts.

Cuando tengas claro que lo vas a usar a largo plazo, vuelve a la instalación local. Es más estable que comprar hardware y descargar un montón de modelos desde el principio.

Dónde colocar los archivos de modelos

Muchos problemas de principiantes de ComfyUI acaban en la misma pregunta: ¿por qué Load Checkpoint está vacío?

La documentación oficial explica que la mayoría de instalaciones no incluyen un modelo base. Los modelos suelen vivir bajo la carpeta models/ dentro del directorio de instalación de ComfyUI. Las subcarpetas habituales son:

Tipo de archivo	Carpeta habitual	Uso
checkpoint / `.safetensors` / `.ckpt`	`ComfyUI/models/checkpoints/`	Modelo base de generación de imágenes
LoRA	`ComfyUI/models/loras/`	Ajuste de estilo, personaje, acción o concepto
VAE	`ComfyUI/models/vae/`	Decodificación de imagen, color y detalle
embedding / textual inversion	`ComfyUI/models/embeddings/`	Vectores disparadores de ciertos términos
modelo de upscale	`ComfyUI/models/upscale_model/`	Ampliación de imagen

Para la primera imagen, ocúpate solo del checkpoint. Coloca un modelo base utilizable en models/checkpoints/, arranca o actualiza ComfyUI y luego selecciónalo en el desplegable de Load Checkpoint.

La carpeta de modelos de Desktop puede ser distinta

Los usuarios de Desktop no deben aferrarse a las rutas portable de los tutoriales en línea. La documentación menciona abrir la carpeta de modelos desde el menú, en Help / Open folder / Open models folder. Guíate por la carpeta que abre la aplicación, no por la ruta de instalación de otra persona.

Si ya tienes una biblioteca de modelos en Automatic1111, Forge u otra herramienta, plantéate configurar extra_model_paths.yaml. Así ComfyUI leerá carpetas de modelos externas sin copiar decenas de GB de archivos.

Un criterio práctico:

Solo uno o dos modelos: colócalos directamente en la carpeta correspondiente de ComfyUI.
Una biblioteca grande ya existente: mapéala con extra_model_paths.yaml.
Aún no sabes si lo usarás a largo plazo: mantén la configuración de modelos sencilla.

Genera tu primera imagen

Para la primera imagen, usa el workflow por defecto y no abras de entrada un JSON complejo compartido por otra persona. El valor del workflow por defecto está en sus pocas variables: si funciona, el entorno, el modelo y los nodos base están conectados.

Paso a paso

Arranca ComfyUI y abre la interfaz web.
Carga el workflow “Image Generation” por defecto.
Si la interfaz avisa de un modelo faltante, instálalo desde el aviso o coloca un modelo descargado en models/checkpoints/.
Selecciona el modelo en Load Checkpoint.
Escribe el sujeto de la imagen en el prompt positivo, por ejemplo a cozy desk setup, soft light, detailed illustration.
Escribe lo que no quieres en el prompt negativo, por ejemplo blurry, low quality, distorted hands.
Mantén al principio el tamaño, el sampler y los steps por defecto. No cambies todo a la vez.
Pulsa Run o usa Ctrl + Enter.
Revisa el resultado en el nodo Save Image, en la zona de salida de la interfaz o en la carpeta output/.

No pasa nada si la primera imagen es sosa o incluso fea. Su función es demostrar que la cadena funciona. Lo que debes anotar: qué modelo usaste, el prompt, si apareció algún error y dónde está la carpeta de salida.

Cómo escribir el primer prompt

Como principiante, no escribas un prompt demasiado abstracto. Términos como “chica guapa” o “ciudad del futuro” pueden generar imágenes, pero te dan poca información cuando el resultado es malo. Un prompt mejor para la primera validación es:

a small wooden cabin beside a lake, morning fog, soft sunlight, detailed illustration, calm mood

El prompt negativo puede ser sencillo al principio:

blurry, low quality, distorted, extra fingers, bad anatomy

No amontones en la primera ronda una larga lista de términos de estilo, vocabulario de cámara y nombres de artistas. Haz que el modelo produzca primero salidas estables y luego ajusta prompt, tamaño, steps, CFG y seed de uno en uno.

Cómo depurar la primera ronda de errores

Procede en orden. No reinstales el entorno, cambies de modelo y modifiques el workflow al mismo tiempo. Cambia solo una variable cada vez para saber de dónde viene el problema.

`Load Checkpoint` está vacío o muestra `null`

Revisa primero tres cosas:

¿El archivo del modelo es un .safetensors o un .ckpt?
¿Está en ComfyUI/models/checkpoints/ o, en Desktop, en la carpeta de modelos que abre la aplicación?
¿Has actualizado o reiniciado ComfyUI después de mover el modelo?

Si usas extra_model_paths.yaml, reduce primero la configuración a una sola ruta. Confirma que esa ruta se lee y luego amplíala. Las rutas con caracteres chinos, espacios o restricciones de permisos pueden causar problemas adicionales.

Aparecen nodos rojos al abrir un workflow

Los nodos rojos suelen indicar custom nodes faltantes, modelos ausentes o una versión de workflow que no coincide con tu entorno. No empieces la depuración por un workflow complejo. Vuelve primero al workflow text-to-image por defecto y confirma que la cadena básica funciona.

Si el workflow por defecto funciona, atiende luego el workflow compartido:

Lee primero los nombres de los nodos rojos para identificar el custom node que falta.
Comprueba después los nodos de carga de modelo y que se encuentren checkpoint, LoRA y VAE.
Toca los parámetros en último lugar, sin recablear el grafo al azar desde el principio.

Esto es más bien un tema de segundo día. No dejes que los custom nodes te desvíen el primer día.

Errores de CUDA, Torch o backend

Estos errores no suelen venir del prompt, sino de un entorno de ejecución que no encaja. Los usuarios de Windows revisan primero el driver de la GPU y el paquete de instalación; los de Linux comparan Python, PyTorch y el backend con la documentación de instalación manual; los de macOS no aplican tutoriales de CUDA.

Si todavía no quieres dedicar tiempo al entorno, haz funcionar primero el concepto con Desktop o cloud. Cuando tengas claro que vas a trabajar en local de forma continua, vuelve a los detalles de GPU y backend.

La imagen sale borrosa o no se parece al prompt

No supongas de inmediato que ComfyUI está roto. Las causas comunes son:

El modelo no es adecuado para el tipo de imagen buscado.
El prompt es demasiado abstracto, sin sujeto, escena, luz ni estilo.
El tamaño o los parámetros del sampler se cambiaron de forma demasiado brusca.
El prompt negativo limita demasiado al modelo.

Mantén fijos el modelo y los parámetros, y cambia solo el prompt en tres rondas comparativas. En la primera, solo el sujeto; en la segunda, la escena; en la tercera, la luz y el estilo. Así verás mucho mejor cómo influye el prompt en el resultado.

Qué no debe hacer un principiante al empezar

ComfyUI es potente, pero esa potencia es justo lo que más frena a los principiantes.

Primero, no instales de golpe decenas de custom nodes. Cuantos más nodos, mayor probabilidad de conflictos y dependencias faltantes. Cuando el workflow por defecto funcione de forma estable, instala nodos para una necesidad concreta.

Segundo, no descargues una decena de modelos a la vez. Haz funcionar primero un modelo base, anota para qué es bueno y añade más poco a poco. Demasiados modelos dificultan saber si el problema viene del prompt o del modelo.

Tercero, no te lances demasiado pronto a la automatización por API. La API de ComfyUI es útil, pero si aún no entiendes el workflow, la automatización solo multiplica los errores.

Cuarto, no tomes el workflow de otra persona como respuesta universal. Muchos workflows compartidos dependen de modelos, versiones de nodos y rutas concretas. Aprende su estructura, pero no esperes que cada workflow copiado funcione de inmediato.

Orden de aprendizaje recomendado

Un camino más sólido es así:

Hacer funcionar el workflow text-to-image por defecto.
Entender la diferencia entre checkpoint, LoRA y VAE.
Aprender a leer un JSON de workflow y a saber qué significan los nodos rojos.
Aprender una dirección de mejora concreta, por ejemplo ControlNet o IP-Adapter.
Solo después, estudiar la generación por lotes, la API, la automatización y la reutilización de workflows.

Si ya conoces los LLM locales, piensa en ComfyUI como un banco de trabajo de inferencia local para la generación de imágenes. Lee primero Introducción a Ollama: tu primer paso para ejecutar grandes modelos de lenguaje en local para conectar archivos de modelos, entorno de ejecución y parámetros de inferencia; para escribir prompts, continúa con Prompt engineering aplicado al negocio; para problemas de GPU y entorno de ejecución, consulta Configurar la aceleración por GPU de Ollama.

Resumen

Empezar con ComfyUI no obliga a comenzar por workflows complejos. Mantén un objetivo pequeño: elegir un modo de instalación que te encaje, colocar el modelo base en la carpeta correcta y generar tu primera imagen con el workflow text-to-image por defecto.

Cuando esa cadena funcione, aprende LoRA, ControlNet, los custom nodes y la reutilización de workflows. Cada paso tendrá entonces un criterio claro: ¿se detecta el modelo, faltan nodos, es el prompt lo bastante concreto, se guardó la salida? La curva de aprendizaje de ComfyUI es real, pero si no lo mezclas todo el primer día, el intimidante grafo de nodos se convierte en un flujo de generación que podrás depurar y reutilizar una y otra vez.

Referencias

FAQ

¿Un principiante de ComfyUI debe elegir Desktop, portable o instalación manual?

Si solo quieres generar rápido tu primera imagen, empieza con Desktop o Windows portable. Elige la instalación manual cuando uses Linux o necesites controlar Python, PyTorch y los backends CUDA/ROCm/MPS.

¿En qué carpeta hay que colocar los modelos de ComfyUI?

Los checkpoints base van en ComfyUI/models/checkpoints/, los LoRA en models/loras/, los VAE en models/vae/ y los embeddings en models/embeddings/. Los usuarios de Desktop deben guiarse por la carpeta de modelos que abre la aplicación.

¿Por qué Load Checkpoint aparece vacío o muestra null en ComfyUI?

Revisa primero el formato del archivo del modelo, su ubicación y si has actualizado o reiniciado ComfyUI. La mayoría de instalaciones no incluyen un modelo base, y sin un modelo en la carpeta checkpoints, ComfyUI no detecta nada.

¿Qué hago cuando un workflow compartido muestra nodos rojos?

Los nodos rojos suelen indicar custom nodes faltantes, modelos ausentes o un workflow que no coincide con tu entorno. Como principiante, vuelve primero al workflow text-to-image por defecto y confirma que la cadena básica funciona antes de tocar los workflows compartidos.

¿Una primera imagen mala significa que la instalación falló?

No necesariamente. La primera imagen solo sirve para demostrar que el entorno, el modelo y el workflow están conectados. Una imagen borrosa o que se aleja del prompt suele deberse a la elección del modelo, al nivel de detalle del prompt, al tamaño, a los parámetros del sampler o a un negative prompt demasiado estricto.

13 min de lectura · Publicado el: 1 jun 2026 · Actualizado el: 20 jun 2026

Easton

IA e inteligencia

Ruta de lectura de la serie Parte 1 de 2

Guía práctica de ComfyUI y Stable Diffusion

Estás leyendo el primer artículo de esta serie. Continúa con el siguiente o abre el hub para ver toda la ruta.

Ver hub de la serie

Estás al inicio de esta serie.

Guía de reutilización de workflows en ComfyUI: descargar, importar, modificar y gestionar

Reutilizar un workflow de ComfyUI suele atascarse en nodos faltantes, rutas de modelos y parámetros incoherentes. Esta guía ofrece una checklist para importar el JSON, corregir custom nodes, mapear modelos y archivar runs reproducibles.

Parte 2 de 2

10 jun 2026 IA e inteligencia

female-portrait-director: convierte los prompts de retrato en un Skill reutilizable

Flujo para convertir prompts de retrato con IA en un Skill reutilizable con bloqueo de parámetros, enrutamiento bajo demanda y expansión dirigida

10 jun 2026 IA e inteligencia

female-portrait-director: convierte los prompts de retrato en un Skill reutilizable

8 jun 2026 IA e inteligencia

Continuum y la elección de un agent runtime: 7 capacidades que mirar del notebook a producción

Diagrama del agent runtime Continuum y sus dimensiones de selección

8 jun 2026 IA e inteligencia

Continuum y la elección de un agent runtime: 7 capacidades que mirar del notebook a producción

8 jun 2026 IA e inteligencia

ADHD: cómo curar la convergencia prematura de los agentes de código con razonamiento divergente paralelo

Un agente de código abre ideas en paralelo a través de frames cognitivos aislados, y luego un critic separado las puntúa y poda

8 jun 2026 IA e inteligencia

ADHD: cómo curar la convergencia prematura de los agentes de código con razonamiento divergente paralelo

Comentarios

Inicia sesión con GitHub para dejar un comentario

Conclusión clave

Qué es realmente ComfyUI

Por qué el grafo de nodos asusta

Cómo elegir un modo de instalación

Desktop: adecuado para la mayoría de primeros intentos

Windows portable: bueno para usuarios de GPU NVIDIA

Instalación manual: para quien necesita controlar su entorno

Cloud: útil para probar primero el workflow

Dónde colocar los archivos de modelos

La carpeta de modelos de Desktop puede ser distinta

Genera tu primera imagen

Paso a paso

Cómo escribir el primer prompt

Cómo depurar la primera ronda de errores

Load Checkpoint está vacío o muestra null

Aparecen nodos rojos al abrir un workflow

Errores de CUDA, Torch o backend

La imagen sale borrosa o no se parece al prompt

Qué no debe hacer un principiante al empezar

Orden de aprendizaje recomendado

Resumen

Referencias

FAQ

Guía práctica de ComfyUI y Stable Diffusion

Guía de reutilización de workflows en ComfyUI: descargar, importar, modificar y gestionar

Artículos relacionados

female-portrait-director: convierte los prompts de retrato en un Skill reutilizable

female-portrait-director: convierte los prompts de retrato en un Skill reutilizable

Continuum y la elección de un agent runtime: 7 capacidades que mirar del notebook a producción

Continuum y la elección de un agent runtime: 7 capacidades que mirar del notebook a producción

ADHD: cómo curar la convergencia prematura de los agentes de código con razonamiento divergente paralelo

ADHD: cómo curar la convergencia prematura de los agentes de código con razonamiento divergente paralelo

Comentarios

`Load Checkpoint` está vacío o muestra `null`