Skip to content

Fooocus

Fooocus 是一款极简主义的 Stable Diffusion 图像生成界面,由 lllyasviel(Lvmin Zhang,ControlNet 原作者)开发。其设计哲学是 "像 Midjourney 一样简单" —— 用户只需输入提示词,其余所有参数自动优化。

核心特性

零配置出图

  • 自动提示词扩展:内置 GPT-2 风格的提示词增强,将简单描述扩展为高质量提示词
  • 自动参数优化:采样器、步数、CFG、分辨率等自动选择最优组合
  • 内置风格预设:摄影、动漫、数字艺术、电影等多种风格一键切换
  • 智能负面提示词:自动添加常用负面提示词,减少畸形输出

性能优化

  • 内存优化:4GB VRAM 即可运行 SDXL
  • 速度快:精简的推理管线,启动和生成速度快
  • 量化支持:内置 INT8 量化选项,低显存友好

高级功能

  • Inpaint/Outpaint:内置图像修复和扩展
  • Image Prompt:参考图引导生成(类似 IP-Adapter)
  • Civitai 模型支持:可加载自定义 LoRA 和 Checkpoint
  • 批量生成:支持一次生成多张图片

设计理念

Fooocus 明确放弃了"全能工具"路线,选择极致简化

Midjourney 的体验 + Stable Diffusion 的开放性 = Fooocus
  • 不暴露技术参数:没有采样器选择、没有步数调节、没有 CFG 滑动条
  • 预设驱动:通过"风格"和"模型"两个维度控制输出
  • 即开即用:下载后双击运行,无需配置环境

与 ComfyUI 和 A1111 WebUI 的对比

维度FooocusA1111 WebUIComfyUI
目标用户初学者、设计师爱好者、进阶用户专业用户、开发者
参数控制极简(风格+模型)丰富(全部可调)完全开放(节点级)
学习曲线极平缓中等陡峭
扩展性有限极丰富极丰富
自动化有限API + 脚本完全可编程
最佳场景快速出图、新手入门日常创作、参数调优生产管线、复杂工作流

技术架构

  • 基于 Gradio:与 A1111 相同的技术栈
  • 精简后端:移除了大量不常用的功能和扩展点
  • 跨平台:Windows(一键包)、Linux、macOS

生态定位

  • Midjourney 的免费替代品:相似的简单体验,完全开源免费
  • Stable Diffusion 的入门门户:降低新用户的尝试门槛
  • 快速原型工具:设计师快速验证创意的工具

局限

  • 扩展性有限:不支持 ControlNet 等高级插件(设计上)
  • 自动化困难:没有官方 API,不适合集成到生产管线
  • 高级用户受限:无法精细调节生成参数

相关页面

AI Knowledge Base — 持续积累