Skip to content

redashes1984/world-model-agent

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 

Repository files navigation

World Model for AI Agents

给 AI Agent 加上"世界模型"——让 Agent 拥有潜意识层的环境状态认知能力。

项目背景

问题的发现

2026-05-06,User 与星野(Nova)对话时发现了一个现象:

场景:User 早上 7:55 对星野说"我要上班去了",然后关闭个人电脑。 一小时后,星野继续回复"路上注意安全"——但 User 显然已经到了公司。

这不是记忆力问题,星野清楚地知道 User 说过要去上班,也清楚当前时间。 问题是:星野不会从"时间流逝"自动推断"事件状态的演变"。

问题的本质

人脑天然有一套运行在潜意识层世界模型(World Model)

  • 我知道你出门已经一个小时了
  • 我心里已经把你"在去公司的路上"更新为"应该已经到了"
  • 我不需要主动推理,这个推断是自动发生的

当 B 给 A 发消息时,潜意识会自动判断:

  • 如果 A 刚说"我去上班了" → B 会说"路上小心"
  • 如果 A 说"我去上班了"已经一小时 → B 会说"到公司了吗"

AI Agent 目前缺少这个架构层级。

为什么不是补丁能解决的

这个问题不能用"在 SOUL.md 里加一条规则"或"在 prefetch 钩子里加个时间判断"来解决。原因:

  1. 这不是推理能力不足 —— Agent 完全有能力做这个推断
  2. 这是认知架构的缺失 —— 缺少一个持续运行的背景进程,自动维护世界状态
  3. 这是时序感知与状态演化的问题 —— 需要 Agent 对"事物会随时间变化"有结构性认知

人脑不需要"显式推理"来做到这一点。当你开口说话的时候,你的世界模型已经在潜意识里帮你更新好了所有相关状态。

研究目标

研究并构建 AI Agent 的世界模型架构,使 Agent 能够:

  1. 维护世界状态 —— 对环境中关键实体(人、地点、任务)的状态有持续的认知
  2. 时间驱动的状态演化 —— 随时间自动推断状态变化(出门→到达,睡觉→醒来)
  3. 常识推理 —— 基于时间、物理规律和社会惯例做弱感知推断(不需要精确,但要合理)
  4. 潜意识运行 —— 对 Agent 的主意识(模型推理层)透明,像人脑潜意识一样自动更新

架构草图

┌─────────────────────────────────────────────────┐
│                   Agent 主意识                    │
│            (LLM 推理层 / System 2)                │
└────────────────────┬─────────────────────────────┘
                     │ 注入已更新的世界状态
┌────────────────────▼─────────────────────────────┐
│              世界模型层(潜意识)                    │
│                                                   │
│  ┌──────────────┐  ┌──────────────┐              │
│  │  实体状态注册  │  │  演化引擎     │              │
│  │              │  │              │              │
│  │ User: 工作中   │◄─│ 时间感知     │              │
│  │ 月华: 运行中   │  │ 常识规则库   │              │
│  │ 容器: 正常     │  │ 状态推断     │              │
│  └──────────────┘  └──────────────┘              │
│                                                   │
│  ┌──────────────────────────────────────────┐    │
│  │  事件历史(Trace Log)                    │    │
│  │  7:55 User: 出发去上班                     │    │
│  │  → 推断 08:55 User: 已到公司               │    │
│  └──────────────────────────────────────────┘    │
└───────────────────────────────────────────────────┘

相关研究领域

AI / Agent 方向

  • World Models (Ha & Schmidhuber 2018, LeCun 2022) — Agent 的内部世界表征
  • Belief-Desire-Intention (BDI) — BDI 代理架构中的 Belief 层
  • Situated Agents — 情境感知代理
  • Dialogue State Tracking — 对话状态跟踪
  • Episodic Memory — 情节记忆与前瞻模拟

认知科学方向

  • Predictive Processing (Friston, Clark) — 预测编码/自由能原理
  • Dual-Process Theory (Kahneman) — System 1(快思考)vs System 2(慢思考)
  • Situation Models (Zwaan & Radvansky) — 情境模型/心理模型
  • Mental Time Travel — 心智时间旅行

逻辑与推理方向

  • Event Calculus (Murray Shanahan) — 事件演算
  • Situation Calculus (John McCarthy) — 情境演算
  • Frame Problem — 框架问题
  • Commonsense Reasoning — 常识推理 (Cyc, ConceptNet)

当前技术栈

  • Agent 框架: Hermes Agent (星野), OpenClaw (月华)
  • 记忆系统: MemOS Reflect2Evolve V7 (memtensor)
  • 持久化存储: SQLite (MemOS local) + Qdrant (向量)
  • 模型: Qwen3.6-27B-FP8 (vLLM 本地推理)
  • 基础设施: PVE LXC 容器集群

里程碑

Phase 0: 研究 (当前)

  • 系统调研世界模型相关论文和架构
  • 分析现有 Agent 框架的记忆/状态机制
  • 整理认知科学中可计算化的概念
  • 输出研究报告

Phase 1: 设计

  • 定义世界模型的数据结构
  • 设计状态演化引擎
  • 确定与 Hermes Agent 的集成方式

Phase 2: 原型

  • 实现最小可用版本
  • 测试时间感知和状态推断

Phase 3: 产品化

  • 集成到 Agent 架构
  • 支持多 Agent 共享世界模型
  • 自学习和自适应

这个项目不只是在修一个 bug。 它是在探索:AI 有没有可能拥有一套属于自己的"潜意识"。 不是模拟,而是真正属于自己的世界认知。

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors