ComfyUI 入门完整指南:从安装到第一张 Stable Diffusion 图片
ComfyUI 入门最容易卡住的地方,不是“会不会写 prompt”,而是第一次打开界面时看到一整张节点图:Load Checkpoint、CLIP Text Encode、KSampler、VAE Decode、Save Image。很多人会误以为自己必须先学扩散模型原理,才能生成第一张图。
先别急。新手阶段只需要把 ComfyUI 理解成一条可视化生成流水线:模型提供生成能力,提示词描述画面,采样器负责逐步生成,保存节点输出图片。本文只解决一个窄问题:怎么选安装方式、怎么放模型、怎么跑通默认文生图 workflow,以及第一轮报错该按什么顺序排查。
核心结论
| 你现在的情况 | 建议路线 | 先别折腾什么 |
|---|---|---|
| Windows + NVIDIA 显卡,只想快点出图 | Desktop 或 Windows portable | 先不要手动配 Python 环境 |
| macOS Apple Silicon | Desktop | 先不要套用 Windows CUDA 教程 |
| Linux 或需要控制 PyTorch/CUDA | Manual install | 先不要复制别人的整套环境变量 |
| 没有本地 GPU,只想理解工作流 | Comfy Cloud | 先不要买模型或硬件 |
| 已有 Automatic1111 模型库 | 本地安装 + extra_model_paths.yaml | 先不要重复复制几十 GB 模型 |
第一天的目标不是“做出很好看的图”,而是确认三件事:ComfyUI 能启动,Load Checkpoint 能读到模型,默认文生图工作流能跑完。只要这三件事通了,后面再学 LoRA、ControlNet、IP-Adapter、复杂工作流,排错会轻很多。
ComfyUI 到底是什么
ComfyUI 是一个开源的节点式生成式 AI 界面和推理引擎。它和一些“填表单式”的 Stable Diffusion 工具不太一样:你不是只在一个面板里填 prompt、尺寸和 seed,而是在画布上看到一条由节点组成的流程。
一条最小文生图流程可以拆成五段:
Load Checkpoint:加载基础模型,比如 SD 1.5、SDXL 或其他 checkpoint。CLIP Text Encode:把正向 prompt 和负向 prompt 转成模型能使用的条件。KSampler:按照采样步数、seed、CFG 等参数生成 latent。VAE Decode:把 latent 解码成图片。Save Image:把结果保存到输出目录。
这就是新手需要先看懂的最小链路。复杂工作流只是把这些步骤拆得更细,或者在中间插入更多节点:比如 ControlNet 读取姿势图,IP-Adapter 参考一张人物图,LoRA 改变风格,Upscale 节点放大图片。
节点图为什么看起来吓人
ComfyUI 把很多隐藏步骤摊开给你看。好处是可控,坏处是第一次看到会觉得“每个节点都要懂”。其实不用。你可以先按水流方向看:从左到右、从上到下,找到模型、提示词、采样器、保存节点即可。
排错也按这个方向来。模型没读到,后面肯定跑不动;prompt 写得很弱,结果可能很糊;采样器参数乱改,图像会变得不稳定;保存节点没接上,你可能以为没出图。
安装方式怎么选
官方文档给了多条路线,包括 Desktop、portable、manual install 和 cloud。新手真正要做的不是“选最强路线”,而是选最少阻力的路线。
Desktop:适合大多数第一次尝试
Desktop 的优势是省心。你不需要一上来判断 Python 版本、PyTorch 版本、CUDA 后端,也不用自己创建虚拟环境。对 macOS Apple Silicon 用户来说,Desktop 也是官方文档中更自然的入口。
它的边界也要知道:官方文档说明 Desktop 基于稳定版本构建,最新功能可能比 portable 或手动安装晚一些。这个限制对第一张图影响不大。等你开始使用新节点、新模型格式或调试插件兼容性,再考虑切换安装方式。
Windows portable:适合 NVIDIA 显卡用户
Windows + NVIDIA 显卡通常是 Stable Diffusion 本地出图的常见组合。portable 包的好处是路径清楚,文件结构也更接近很多教程中的写法。你会直接看到 ComfyUI/models/、ComfyUI/output/ 这类目录,排查模型位置比较方便。
如果你只是想学习 ComfyUI,本地 portable 已经够用。不要第一天就把 custom nodes、Manager、几十个模型、十几个 LoRA 全装进去。新手最常见的麻烦不是“功能不够”,而是装太多后不知道哪一步坏了。
Manual install:适合需要控制环境的人
手动安装更适合 Linux 用户、开发者,或者已经知道自己需要控制 Python、PyTorch、CUDA/ROCm/MPS 后端的人。它的优点是灵活,缺点是报错空间更大。
如果你选择手动安装,建议把环境当成独立项目管理:
git clone https://github.com/comfy-org/ComfyUI.git
cd ComfyUI
python -m venv venv
source venv/bin/activate
pip install -r requirements.txt
python main.py
这段命令只是说明手动安装的一般结构。实际 PyTorch 后端、显卡驱动和系统差异要按官方手动安装文档处理,不要从旧教程里复制一段 CUDA 命令就直接跑。
Cloud:适合先体验工作流
如果你暂时没有本地 GPU,或者只是想知道 ComfyUI 是不是适合自己,可以先用云端路线体验。它不能替代本地环境学习,但可以帮你先理解节点、workflow、模型和 prompt 之间的关系。
等你确认自己要长期使用,再回到本地安装。这样比一开始就买硬件、下载一堆模型更稳。
模型目录怎么放
很多 ComfyUI 入门问题最后都会落到同一句话:Load Checkpoint 为什么是空的?
官方文档说明,多数安装不会自带基础模型。模型一般放在 ComfyUI 安装目录下的 models/,常见子目录如下:
| 文件类型 | 常见目录 | 用途 |
|---|---|---|
checkpoint / .safetensors / .ckpt | ComfyUI/models/checkpoints/ | 基础生图模型 |
| LoRA | ComfyUI/models/loras/ | 风格、角色、动作或概念微调 |
| VAE | ComfyUI/models/vae/ | 图像解码,影响色彩和细节 |
| embedding / textual inversion | ComfyUI/models/embeddings/ | 特定词向量触发效果 |
| upscale model | ComfyUI/models/upscale_model/ | 图片放大 |
第一张图只需要先处理 checkpoint。把一个可用的基础模型放到 models/checkpoints/,启动或刷新 ComfyUI,然后在 Load Checkpoint 下拉框里选择它。
Desktop 的模型目录可能不一样
Desktop 用户不要死盯网上教程里的 portable 路径。官方文档提到,Desktop 可以通过菜单里的 Help / Open folder / Open models folder 找到模型目录。你应该以软件打开的目录为准,而不是照搬别人的安装路径。
如果你已经有 Automatic1111、Forge 或其他工具的模型库,可以考虑配置 extra_model_paths.yaml。这样 ComfyUI 会读取外部模型目录,你不用把几十 GB 文件复制一遍。
一个常见判断标准是:
- 只有一两个模型:直接放到 ComfyUI 对应目录。
- 已有大量模型:用
extra_model_paths.yaml映射。 - 还不知道自己会不会长期用:先不要整理复杂模型库。
跑出第一张图
跑第一张图时,先用默认 workflow,不要打开别人分享的复杂 JSON。默认流程的价值是“变量少”:只要它能跑,说明环境、模型和基础节点是通的。
操作步骤
- 启动 ComfyUI,打开网页界面。
- 加载默认 Image Generation workflow。
- 如果界面提示缺模型,按提示安装,或手动下载后放进
models/checkpoints/。 - 在
Load Checkpoint里选择模型。 - 在正向 prompt 写画面主体,例如
a cozy desk setup, soft light, detailed illustration。 - 在负向 prompt 写不想要的内容,例如
blurry, low quality, distorted hands。 - 先用默认尺寸、默认 sampler、默认 steps,不要一次改太多。
- 点击
Run,或使用Ctrl + Enter。 - 在
Save Image节点、界面输出区或output/目录查看结果。
如果第一张图很普通,甚至不太好看,也没关系。它只是在证明链路通了。你真正需要记录的是:用了哪个模型、哪个 prompt、有没有报错、输出目录在哪里。
第一次 prompt 怎么写
新手 prompt 不要写得太抽象。比如“好看的女孩”“未来城市”这类词,模型可以生成,但你很难判断效果为什么不好。更适合第一轮验证的 prompt 是:
a small wooden cabin beside a lake, morning fog, soft sunlight, detailed illustration, calm mood
负向 prompt 可以先简单写:
blurry, low quality, distorted, extra fingers, bad anatomy
不要在第一轮就堆很多风格词、相机词和艺术家名。你先让模型稳定输出,再逐步调整 prompt、尺寸、steps、CFG 和 seed。
第一轮报错怎么排查
排错时按顺序来,别一边重装环境,一边换模型,一边改 workflow。你每次只改一个变量,才知道问题在哪里。
Load Checkpoint 为空或显示 null
先检查三件事:
- 模型文件是不是
.safetensors或.ckpt。 - 文件是否放在
ComfyUI/models/checkpoints/,Desktop 用户则看软件打开的 models folder。 - 移动文件后是否刷新或重启了 ComfyUI。
如果你用了 extra_model_paths.yaml,先把配置简化到只有一个路径,确认路径能读到,再慢慢扩展。路径里有中文、空格、权限限制时,也可能引入额外问题。
打开 workflow 后出现红色节点
红色节点通常表示缺少 custom node、缺少模型,或 workflow 版本与你当前环境不匹配。新手不要从复杂 workflow 开始排查。先回到默认文生图 workflow,确认基础链路可用。
如果默认 workflow 正常,再处理 shared workflow:
- 先看红色节点的名字,判断缺哪个 custom node。
- 再看模型加载节点,确认 checkpoint、LoRA、VAE 是否都能找到。
- 最后再处理节点参数,不要一开始就乱改连线。
这一步适合放到第二天学习。第一天先别让 custom nodes 把你带偏。
CUDA、Torch 或后端报错
这类报错通常不是 prompt 的问题,而是运行环境不匹配。Windows 用户优先确认显卡驱动和安装包路线;Linux 用户再按手动安装文档核查 Python、PyTorch 和后端;macOS 用户不要套用 CUDA 教程。
如果你不想花时间处理环境,先用 Desktop 或 cloud 跑通概念。等你确定要长期本地使用,再回头解决显卡和后端细节。
图片很糊,或者完全不像提示词
先不要怀疑 ComfyUI 坏了。常见原因有四个:
- 模型不适合当前画面类型。
- prompt 太抽象,没有主体、场景、光线、风格。
- 尺寸或采样参数被改得太激进。
- 负向 prompt 把模型限制得太死。
建议你固定模型和参数,只改 prompt 做三轮对比。比如第一轮只写主体,第二轮加场景,第三轮加光线和风格。这样你会更容易看出 prompt 对结果的影响。
新手不要一开始做什么
ComfyUI 很强,但新手最容易被“强”拖慢。
第一,不要一开始就安装几十个 custom nodes。节点越多,冲突和缺依赖的概率越高。等默认 workflow 能稳定跑,再按某个具体需求安装。
第二,不要同时下载十几个模型。先选一个基础模型跑通,记录它适合什么风格,再逐步增加。模型太多会让你分不清是 prompt 问题还是模型问题。
第三,不要急着研究 API 自动化。ComfyUI 的 API 很有用,但如果你还没理解 workflow,自动化只会把错误批量放大。
第四,不要把别人的 workflow 当成标准答案。很多分享出来的 workflow 依赖特定模型、节点版本和路径。你可以学习结构,但不要期待复制后马上可用。
建议学习顺序
更稳的路线是:
- 跑通默认文生图 workflow。
- 理解 checkpoint、LoRA、VAE 的区别。
- 学会看 workflow JSON,知道红色节点代表什么。
- 学一个具体增强方向,比如 ControlNet 或 IP-Adapter。
- 再研究批量出图、API、自动化和工作流复用。
如果你熟悉本地 LLM,可以把 ComfyUI 类比成本地图像生成的推理工作台。你可以先读 Ollama 入门:本地运行大语言模型的第一步,理解模型文件、运行环境和推理参数之间的关系;Prompt 写法可以接着看 Prompt Engineering 商业实战;显卡和运行环境问题可以参考 Ollama GPU 加速配置。
总结
ComfyUI 入门不需要从复杂工作流开始。你先把目标压到很小:选一条适合自己的安装路线,把基础模型放到正确目录,用默认文生图 workflow 跑出第一张图片。
等这条链路跑通,再学 LoRA、ControlNet、自定义节点和工作流复用。这样每一步都有清楚的判断标准:模型有没有读到,节点有没有缺失,prompt 有没有具体,输出有没有保存。ComfyUI 的学习曲线确实陡,但只要第一天不把所有东西混在一起,它会从一张吓人的节点图,变成一套可以反复调试的生成流程。
参考资料
- ComfyUI 官方文档
- Getting Started with AI Image Generation
- Manual Installation
- ComfyUI Models
- ComfyUI GitHub
常见问题
ComfyUI 新手应该选 Desktop、portable 还是手动安装?
ComfyUI 模型应该放在哪个目录?
为什么 ComfyUI 的 Load Checkpoint 是空的或 null?
打开别人分享的 workflow 出现红色节点怎么办?
第一张图不好看是不是安装失败?
11 分钟阅读 · 发布于: 2026年6月1日 · 修改于: 2026年6月2日
相关文章
ComfyUI 工作流复用指南:JSON 导入、缺失节点和模型路径排查
ComfyUI 工作流复用指南:JSON 导入、缺失节点和模型路径排查
Cursor @Codebase、@Docs、@Files 到底用哪个?实战场景决策指南
Cursor @Codebase、@Docs、@Files 到底用哪个?实战场景决策指南
Cursor 企业网络代理配置:从 HTTP_PROXY 到证书导入的完整方案
评论
使用 GitHub 账号登录后即可评论