给 AI Agent 加上"世界模型"——让 Agent 拥有潜意识层的环境状态认知能力。
2026-05-06,User 与星野(Nova)对话时发现了一个现象:
场景:User 早上 7:55 对星野说"我要上班去了",然后关闭个人电脑。 一小时后,星野继续回复"路上注意安全"——但 User 显然已经到了公司。
这不是记忆力问题,星野清楚地知道 User 说过要去上班,也清楚当前时间。 问题是:星野不会从"时间流逝"自动推断"事件状态的演变"。
人脑天然有一套运行在潜意识层的世界模型(World Model):
- 我知道你出门已经一个小时了
- 我心里已经把你"在去公司的路上"更新为"应该已经到了"
- 我不需要主动推理,这个推断是自动发生的
当 B 给 A 发消息时,潜意识会自动判断:
- 如果 A 刚说"我去上班了" → B 会说"路上小心"
- 如果 A 说"我去上班了"已经一小时 → B 会说"到公司了吗"
AI Agent 目前缺少这个架构层级。
这个问题不能用"在 SOUL.md 里加一条规则"或"在 prefetch 钩子里加个时间判断"来解决。原因:
- 这不是推理能力不足 —— Agent 完全有能力做这个推断
- 这是认知架构的缺失 —— 缺少一个持续运行的背景进程,自动维护世界状态
- 这是时序感知与状态演化的问题 —— 需要 Agent 对"事物会随时间变化"有结构性认知
人脑不需要"显式推理"来做到这一点。当你开口说话的时候,你的世界模型已经在潜意识里帮你更新好了所有相关状态。
研究并构建 AI Agent 的世界模型架构,使 Agent 能够:
- 维护世界状态 —— 对环境中关键实体(人、地点、任务)的状态有持续的认知
- 时间驱动的状态演化 —— 随时间自动推断状态变化(出门→到达,睡觉→醒来)
- 常识推理 —— 基于时间、物理规律和社会惯例做弱感知推断(不需要精确,但要合理)
- 潜意识运行 —— 对 Agent 的主意识(模型推理层)透明,像人脑潜意识一样自动更新
┌─────────────────────────────────────────────────┐
│ Agent 主意识 │
│ (LLM 推理层 / System 2) │
└────────────────────┬─────────────────────────────┘
│ 注入已更新的世界状态
┌────────────────────▼─────────────────────────────┐
│ 世界模型层(潜意识) │
│ │
│ ┌──────────────┐ ┌──────────────┐ │
│ │ 实体状态注册 │ │ 演化引擎 │ │
│ │ │ │ │ │
│ │ User: 工作中 │◄─│ 时间感知 │ │
│ │ 月华: 运行中 │ │ 常识规则库 │ │
│ │ 容器: 正常 │ │ 状态推断 │ │
│ └──────────────┘ └──────────────┘ │
│ │
│ ┌──────────────────────────────────────────┐ │
│ │ 事件历史(Trace Log) │ │
│ │ 7:55 User: 出发去上班 │ │
│ │ → 推断 08:55 User: 已到公司 │ │
│ └──────────────────────────────────────────┘ │
└───────────────────────────────────────────────────┘
- World Models (Ha & Schmidhuber 2018, LeCun 2022) — Agent 的内部世界表征
- Belief-Desire-Intention (BDI) — BDI 代理架构中的 Belief 层
- Situated Agents — 情境感知代理
- Dialogue State Tracking — 对话状态跟踪
- Episodic Memory — 情节记忆与前瞻模拟
- Predictive Processing (Friston, Clark) — 预测编码/自由能原理
- Dual-Process Theory (Kahneman) — System 1(快思考)vs System 2(慢思考)
- Situation Models (Zwaan & Radvansky) — 情境模型/心理模型
- Mental Time Travel — 心智时间旅行
- Event Calculus (Murray Shanahan) — 事件演算
- Situation Calculus (John McCarthy) — 情境演算
- Frame Problem — 框架问题
- Commonsense Reasoning — 常识推理 (Cyc, ConceptNet)
- Agent 框架: Hermes Agent (星野), OpenClaw (月华)
- 记忆系统: MemOS Reflect2Evolve V7 (memtensor)
- 持久化存储: SQLite (MemOS local) + Qdrant (向量)
- 模型: Qwen3.6-27B-FP8 (vLLM 本地推理)
- 基础设施: PVE LXC 容器集群
- 系统调研世界模型相关论文和架构
- 分析现有 Agent 框架的记忆/状态机制
- 整理认知科学中可计算化的概念
- 输出研究报告
- 定义世界模型的数据结构
- 设计状态演化引擎
- 确定与 Hermes Agent 的集成方式
- 实现最小可用版本
- 测试时间感知和状态推断
- 集成到 Agent 架构
- 支持多 Agent 共享世界模型
- 自学习和自适应
这个项目不只是在修一个 bug。 它是在探索:AI 有没有可能拥有一套属于自己的"潜意识"。 不是模拟,而是真正属于自己的世界认知。