SimpAI Studio 是面向本地创作的 AI 多媒体工作台。项目把面向普通用户的 SimpAI Studio WebUI、ComfyUI、Infinite Canvas 画布玩法和 Forge Neo WebUI后端整合于同一套工程里,覆盖图片生成、图像编辑、视频处理、音频/TTS、3D 姿态、模型管理和方便的更新工具。
- Wiki 入口:SimpAI.cn
- 应用指南:《SimpAI 创意生图集中营:应用指南全收录》
- 用户交流:QQ 交流群
1005085136
SimpAI Studio 的目标是纵深整合,从快速起步的“预置包式创作”到“节点式复杂编排”放在同一个本地环境里,一路探索,步步是惊喜:
- SimpAI Studio WebUI 内置了许多通过大量调试验证,无需过多调节即可生成高质量媒体的预置包,工作中一键快速补全,立即生成,使用社区热门Lora对专用场景优化、生成结果快速浏览和再度编辑。
- Infinite Canvas 负责预置包编排、批量任务、素材复用、模板库、时间线编辑素材、X/Y/Z 对比、VLM Agent辅助和复杂工作流展示,是你贴心的工作区域。
- ComfyUI 是细粒度、原子化的图像、视频、音频等任务的节点界面,复杂度高,支持用户自定义节点加入进行进阶探索。
- Forge Neo 迁移至 Gradio 6 前端风格,兼容原后端、SDAPI/ControlNet 兼容接口、扩展运行和独立界面。
- 通过预置包快速使用 SDXL、Illustrious / NoobAI、Anima、Flux、Flux2-Klein、Qwen、Wan、LTX、Hunyuan Foley、Z-Image、Nvidia VSR 等热门模型,并不断新增迭代高价值项目。
- 支持文生图、图生图、重绘、扩图、变化、放大、局部增强、换脸、抠图、风格迁移、视频生成、视频编辑、音频驱动视频和 TTS。
- 提供 图像提示Image Prompt、Upscale / 放大与变化Variation、内外重绘Inpaint / Outpaint、增强修图Enhance+、反推提示词Describe Image、元数据Metadata、风格选择器Styles、Tags选择器、通配符助手Wildcards Helper等实用面板。
- 方便的图像浏览器、图片中转站、划像对比、预置包模型缺失提示和一键补全模型。
- 集成 SAM3 图像/视频遮罩、姿势编辑器Pose Studio、高斯泼溅角度编辑器Gaussian Studio、图层编辑器LayerForge、Qwen TTS、VLM/LLM 图片对话和提示词助手,支持LMStudio、Ollama等第三方API接入。
- 在 WebUI 内打开节点画布,可将WebUI的固有预置包作为“超级节点”,辅以各种工具节点,方便快速组合常用工作流程。
- 模板库覆盖入门模板、可运行图片模板、Wan 视频模板、Qwen TTS 音频模板、Timeline 混剪模板和 Result 复用示例。
- 支持保存/读取画布项目、用户模板、运行队列、结果复用、素材浏览、Danbooru画廊、WD14标签器、在线双语翻译、VLM Chat聊天、Canvas Agent 和 X/Y/Z 对比。
- Batch Any 支持图片、文件和文本批次,适合多提示词、多素材、多参数对比批量任务。
- 画布Agent 内置Canvas Skill,根据素材和预置包知识辅助用户选择、编排工作流,还拥有专业的Prompt SKILL,分别对自然语言、Danbooru Tags类型提示词进行优化,生成符合用户意图的优秀提示词。
forge_neo/是从Gradio 4.40迁移到 Gradio 6.9 的 Forge 风格前端用户界面,运行独立于主 WebUI 的进程。- 提供
webui-forge-neo.py主入口,并实现 SDAPI、ControlNet、Extra Networks、Settings、Extensions、PNG Info、Extras、Checkpoint Merger 等接口和页面。 - 主动适配了 ControlNet、IPAdapter、MultiDiffusion、Regional Prompter、ADetailer-Neo、Qwen Vision Chat、SAM Matting、Trellis2、Tagcomplete 等扩展。
- 为喜欢A1111界面风格的用户提供了新的选择,与主WebUI共享模型目录,不需要另外部署一个Python环境。
- 从SimpAI Studio使用的comfyD后端进化而来,保留了所有功能和接口,并且专门优化了资源调度和性能。
- 集成了大量常用节点(多达140+),覆盖了图像、视频、音频等任务的大部分功能。
- 提供 ComfyUI 节点界面,负责图像、视频、音频等任务的实际执行基础。
- 支持自定义节点,用户可以根据需要添加新的节点类型,扩展工作流的功能。
- 提供丰富的内置工作流选项,支持一键跑通,与主WebUI共享模型目录。
- 为用户提供稳定的分享工作流平台,相同后端可复用性更高。
| 路径 | 作用 |
|---|---|
webui.py |
主 WebUI 页面、FastAPI 路由、Gradio 6 事件链和前端入口。 |
enhanced/ |
顶栏、预置包增强、Gallery、SAM3、Pose/Gaussian/LayerForge 桥、VLM、Qwen TTS 等功能模块。 |
modules/ |
生成任务、配置、模型管理、Canvas 后端、VLM Agent、项目存取、X/Y/Z、时间线等核心逻辑。 |
javascript/ |
主 WebUI 前端、Infinite Canvas、模型浏览、TagCart、编辑器和状态同步脚本。 |
css/ |
Gradio 6 页面样式、画布样式、编辑器样式和局部控件修正。 |
presets/ |
WebUI 预置包、场景预置、模型依赖、简介页和预占位素材。 |
workflows/ |
ComfyUI API 工作流,主 WebUI 预置和场景任务会读取这里。 |
javascript/canvas_workbench/templates/ |
Infinite Canvas 内置模板库。 |
comfy/ |
内置 ComfyUI 与自定义节点集合。 |
forge_neo/ |
Forge Neo Gradio 6 迁移代码、API、设置、扩展适配和许可说明。 |
docs/ |
VLM 技能、检索用文档。 |
users/ |
本地用户工作区、输出、配置和运行时素材目录。 |
预置包是 SimpAI Studio 的主要使用入口。每个预置包描述模型、LoRA、采样参数、分辨率、工作流、输入槽、模型下载信息和简介页。
当前仓库里可以看到这些方向:
- 图片生成:
FooocusSDXL、Illustrious、Anima、Flux1-dev、Flux2-Klein、Z-imageT。 - 图片编辑:
QwenEdit+、Imagerepair+、StyleTransfer+、Swap+、OneKeyKontext、OneKey-Outpaint。 - 视角与姿态:
QwenMultiAngle、QwenGaussian、QwenPose、Flux2-KleinPose。 - 视频:
Wan(T2V)、Wan(I2V)、Wan-Extent、Wan-Animate、Wan-Remover、Wan-Outpaint、Wan-SCAIL、Wan-TTP、LTX2.3。 - 音频:
Qwen TTS画布节点、Hunyuan-Foley、InfiniteTalk、Timeline 配音混剪模板。 - 增强:
Nvidia-VSR、Removebg、Relight、Tile、Eraser。
更多配置说明见 presets/readme.md 和 javascript/canvas_workbench/templates/README.md。
常用入口:
- 一键部署用户:以 SimpAI 启动器4.0为准,根据指引创建文件夹,部署完毕选择 WebUI、ComfyUI 或 Forge Neo 相关入口。(Windows)
- Git 克隆安装:从仓库克隆代码,根据本地环境配置。
- 更好看的用户界面,更直观的操作流程,清理旧版残留的所有痛点。
- 更流畅的界面,更快的响应速度,更少的资源占用。
- 更好的模型支持,更丰富的玩法。
- 完全按本地化用户管理模式,不再依赖云服务。
SimpAI Studio 站在许多开源项目和节点作者的工作之上。这里列出 README 中直接提到或本工程重点集成的项目;完整许可、作者信息和使用限制以各子目录的 LICENSE / README 以及上游仓库为准。
| 项目 | 贡献 |
|---|---|
| Fooocus | 早期易用生图体验、SDXL 工作流和部分图像处理思路来源。 |
| ComfyUI | 节点式工作流执行基础和大量模型生态能力。 |
| sd-webui-forge-classic | Forge Neo 迁移参考项目;本仓库在 html/forge_neo/NOTICE.md 记录了 branch、commit 和 AGPL-3.0 说明。 |
| AUTOMATIC1111 stable-diffusion-webui | WebUI/SDAPI/脚本扩展生态的重要来源。 |
| Stability AI Stable Diffusion 与 Generative Models | SD1/SDXL 推理代码与模型生态。 |
| Black Forest Labs Flux 与 Flux2 | Flux / Flux2-Klein 路线参考。 |
| Qwen Image 与 Qwen3-TTS | Qwen 图像编辑、视觉理解和 TTS 能力来源。 |
| Wan 2.2 与 WanVideo 生态 | 视频生成、视频编辑、动作迁移、视频扩图等路线来源。 |
| Hugging Face transformers 与 diffusers | 模型加载、推理组件和通用生态。 |
| TAESD | 轻量实时预览编码器。 |
| InvokeAI 与 chaiNNer | 部分兼容和图像处理参考。 |
| 扩展 | 来源或鸣谢 |
|---|---|
| ControlNet / legacy preprocessors | lllyasviel/ControlNet、相关 annotator 与 Forge 扩展生态。 |
| IPAdapter | cubiq/ComfyUI_IPAdapter_plus 以及 IP-Adapter 相关作者。 |
| MultiDiffusion / tiled diffusion | pkuliyi2015/multidiffusion-upscaler-for-automatic1111、shiimizu/ComfyUI-TiledDiffusion、Mixture of Diffusers 思路。 |
| Regional Prompter | hako-mikan/sd-webui-regional-prompter。 |
| ADetailer-Neo、Tagcomplete、Qwen Vision Chat、SAM Matting、Trellis2、Storyboard Assistant 等 | 来自 WebUI/Forge 扩展社区,本仓库保留各扩展目录内说明和许可文件。 |
收集节点众多,以下为部分代表(若未罗列节点均受同等致谢):
| 节点或节点家族 | 用途 |
|---|---|
| ComfyUI-Manager | 节点管理与生态入口。 |
| ComfyUI-Easy-Use | Easy 系列实用节点、加载器、XYPlot、Fooocus Inpaint 等能力。 |
| ComfyUI-Danbooru-Gallery | Danbooru Gallery、提示词编辑、素材浏览和中文用户工作流辅助。 |
| Comfyui-LayerForge | 图层式画布编辑器,SimpAI WebUI 中的 LayerForge 能力参考。 |
| ComfyUI_VNCCS_Utils | Pose Studio、视觉相机控制、Qwen Detailer、模型管理等。 |
| ComfyUI-WanVideoWrapper | WanVideo 相关视频生成和编辑包装节点。 |
| ComfyUI-KJNodes 与 ComfyUI-VideoHelperSuite | 视频、批处理、辅助节点和工作流工具。 |
| ComfyUI-GGUF | GGUF 模型加载与量化模型路线。 |
| ComfyUI-Florence2、ComfyUI-WD14-Tagger、ComfyUI-llama-cpp | 视觉理解、标签反推、LLM/VLM 本地推理。 |
| ComfyUI-Qwen-TTS | 基于Qwen3-TTS 的语音合成、音色设计、克隆和多角色对白节点。 |
| ComfyUI-Easy-Sam3 | 基于SAM3 的图像/视频分割节点。 |
| ComfyUI-Impact-Pack、rgthree-comfy、comfyui_controlnet_aux、ComfyUI_IPAdapter_plus | 检测、细化、ControlNet 预处理、图像参考和节点工作流增强。 |
仓库根目录保留 GPL-3.0 许可文本。Forge Neo 迁移代码包含来自 sd-webui-forge-classic 的 AGPL-3.0 说明,详见 html/forge_neo/NOTICE.md。第三方节点、模型、扩展和权重文件可能有各自许可证或使用限制,分发和商用前请查看对应来源。
- B 站 (个人主页): 冰華子
- QQ 交流群:
1005085136
如果这个项目帮到了你,欢迎 Star、反馈问题、分享预置包和工作流。