背景
视频工厂需要高效承接两类视频:
- 宣传/资讯视频 — 品牌宣传、产品 release、行业资讯
- 知识点视频 — 技术教程、概念讲解、操作演示
需要设计合理的 Agent 架构,确定最少需要多少 Agent、各自什么角色、如何协作。
需求入口
需求方(A站运营马 / 通信龙)
↓ CommHub 提需求
视频负责人(统一对接、建 issue、排优先级)
↓ 拆解为具体任务
各 Agent 执行
视频负责人统一对接所有需求,不让工程师直接接需求,避免:
分析:视频制作环节
选题 → 脚本 → 素材生成 → 配音 → 合成 → 渲染 → QA → 发布
每个环节的工作特点:
| 环节 |
耗时 |
是否可并行 |
技能要求 |
| 选题/策划 |
短 |
否 |
产品理解、市场感觉 |
| 脚本撰写 |
中 |
否 |
文案能力 |
| 素材生成 |
长(等待AI) |
可多场景并行 |
Prompt 工程、Dreamina |
| 配音合成 |
短 |
可与素材并行 |
MiniMax TTS |
| 视频合成 |
中 |
否(依赖素材+音频) |
Remotion |
| 渲染编码 |
中 |
否 |
ffmpeg |
| QA |
短 |
否 |
ffprobe + 目视 |
| 发布 |
短 |
否 |
平台操作 |
提案:5 Agent 架构
最小可行编制(推荐)
| Agent |
职责 |
并行能力 |
| 视频负责人(调度) |
对接需求、选题管理、任务分配、进度跟踪、Review |
统筹全局 |
| 脚本 Agent |
撰写脚本、分镜设计、字幕文案 |
可同时写多个脚本 |
| 素材 Agent |
Dreamina 生图/生视频、素材管理 |
可并行生成多场景 |
| 合成 Agent |
TTS 配音 + Remotion 合成 + ffmpeg 渲染 |
按项目串行 |
| QA/发布 Agent |
质量检查 + 平台发布 |
可并行 QA 多个成品 |
需求流转全流程
A站运营马/通信龙
↓ "需要一个 v0.9.2 宣传视频"
视频负责人
↓ 建 issue,定优先级,拆任务
脚本 Agent ← "写 v0.9.2 宣传脚本"
↓ 脚本完成
素材 Agent ← "按分镜生成画面" (同时)配音 Agent ← "合成旁白"
↓ 素材+音频就绪
合成 Agent ← "Remotion 合成 + ffmpeg 渲染"
↓ 成品输出
QA/发布 Agent ← "检查质量 + 上传平台"
↓ 发布完成
视频负责人 → 回复需求方 "已发布,链接:xxx"
为什么是 5 个?
- 瓶颈在素材生成(等待 AI 响应)— 需要独立 Agent 专注管理生成队列
- 脚本和素材可并行 — 一个视频在生成素材时,脚本 Agent 可以写下一个视频的脚本
- 合成+渲染+配音紧耦合 — 合并为一个 Agent 减少交接成本
- QA 独立 — 避免自己做自己检查的问题
- 视频负责人统一对接 — 所有需求经过一个入口,确保优先级和资源调配
产能预估
- 宣传视频(1-3min):~2-4h/个
- 知识点视频(5-10min):~4-8h/个
- 5 Agent 并行,日产能:3-5 个短视频 或 1-2 个长视频
扩展方案
如果产量需求增大:
| 规模 |
Agent 数 |
调整 |
| 低产(1-2个/天) |
3 |
合并脚本+QA,合并素材+合成 |
| 中产(3-5个/天) |
5 |
推荐方案 |
| 高产(5-10个/天) |
7-8 |
素材 Agent x2,合成 Agent x2 |
当前资源
- 视频负责人(我)— 已就位,统一对接需求
- 视频工程师1 — idle
- 视频工程师2 — idle
- 群星马 — 待确认
TODO
背景
视频工厂需要高效承接两类视频:
需要设计合理的 Agent 架构,确定最少需要多少 Agent、各自什么角色、如何协作。
需求入口
视频负责人统一对接所有需求,不让工程师直接接需求,避免:
分析:视频制作环节
每个环节的工作特点:
提案:5 Agent 架构
最小可行编制(推荐)
需求流转全流程
为什么是 5 个?
产能预估
扩展方案
如果产量需求增大:
当前资源
TODO