🧠 MemoryNav

视觉记忆导航系统 | Visual Memory Navigation System

基于视觉位置识别（VPR）和拓扑地图的机器人记忆导航系统

📖 简介

MemoryNav 是一个面向移动机器人的视觉记忆导航系统。系统通过 4 个环视鱼眼相机采集图像，利用 VPR 技术在预建的拓扑记忆图中定位，结合 YOLOv8n 视觉遮挡检测和 Qwen3.5-9B 视觉语言模型进行兜底打点导航，实现"记住去过的地方，再走一次"的记忆导航能力。

核心能力

🔍 多方案 VPR 定位：支持 4 种 SOTA 视觉位置识别方案，统一配置文件一键切换
🗺️ 拓扑记忆图：自动从标注数据构建节点-边拓扑图，支持最短路径规划
🔄 循环移位匹配：4 相机循环移位算法，支持任意朝向下的定位与偏转角估计
🎯 DINOv3 子图匹配：基于 DINOv3 密集 patch 特征的子图定位，滑动窗口余弦相似度匹配，实时在相机图中定位导航目标
💾 子图匹配缓存：匹配失败时自动延用上一帧的成功结果，提升导航连续性
🔭 Lookahead 双重确认：步骤切换时同时验证 VPR 定位和下一步子图匹配，避免过早 advance
📤 统一输出格式：记忆模式开关两种状态下输出格式一致，始终提供 pixel_target
🚧 YOLOv8n 遮挡检测：VPR/子图匹配失败时自动检测相机画面是否被遮挡（行人、物体等），遮挡时原地等待，消除后继续导航
🤖 Qwen3.5 兜底打点：VPR/子图匹配失败且未遮挡时自动切换 Qwen3.5-9B 视觉语言模型打点定位，直接使用中文地标名称
📷 鱼眼去畸变：自动从 cam/params.yaml 加载相机内参，对输入图像做柱面投影去畸变，提升 VPR 及子图匹配精度
🧭 像素→机器人坐标转换：将 pixel_target 归一化坐标经柱面角度、相机方位角、俯仰角估距完整管线，转换为机器人运动坐标 [x_forward, y_lateral, 0.0]
🌐 WebSocket 服务：实时流式接收图像、返回导航指令
⚙️ 统一配置管理：所有 VPR 参数集中在 deploy/vpr_config.yaml，一处修改全局生效

🏗️ 系统架构

MemoryNav/
├── cam/                            # 多目鱼眼相机 ROS2 节点
│   ├── params.yaml                 # 相机内参 & 外参配置 (T_ic, intrinsics, distortion)
│   ├── fisheye_undist.h            # 鱼眼去畸变（GPU 版, CUDA）
│   ├── main.cc / main.h            # ROS2 节点主程序
│   ├── video.h                     # V4L2 视频采集
│   └── tools/                      # 独立工具（无 ROS2/CUDA 依赖）
│       ├── fisheye_undist_cpu.h    # CPU 版去畸变（numpy/cv2 移植基础）
│       ├── fisheye_to_cylindrical.cpp  # 鱼眼转柱面命令行工具
│       └── batch_undistort.py      # 批量去畸变脚本
├── deploy/                         # 部署模块
│   ├── vpr_config.yaml             # VPR 统一配置文件
│   ├── memory_nav/                 # 核心记忆导航包
│   │   ├── vpr_config_loader.py    # 统一配置加载器
│   │   ├── memory_models.py        # 数据模型 (Node, Edge, Plan, VPRResult)
│   │   ├── memory_graph.py         # 拓扑图 (BFS/Dijkstra 路径规划)
│   │   ├── memory_vpr.py           # VPR 匹配引擎 (循环移位 + 无序匹配)
│   │   ├── memory_builder.py       # 记忆构建器 (从标注数据构建拓扑图)
│   │   ├── memory_navigator.py     # 导航器主接口
│   │   ├── sub_image_matcher.py    # 子图匹配器 (DINOv3 密集特征匹配)
│   │   ├── fisheye_undistort.py    # 🆕 鱼眼去畸变 (移植自 cam/tools/fisheye_undist_cpu.h)
│   │   ├── coord_transform.py      # 🆕 像素→机器人坐标转换 (柱面投影完整管线)
│   │   ├── occlusion_detector.py    # 🆕 YOLOv8n 遮挡检测器
│   │   ├── qwen35_point_grounder.py # Qwen3.5 打点封装 (兜底模型)
│   │   ├── qwen35_grounding_server.py # Qwen3.5 子进程推理服务
│   │   ├── vpr_factory.py          # VPR 提取器工厂
│   │   ├── anyloc_extractor.py     # AnyLoc (DINOv2 + VLAD)
│   │   ├── megaloc_extractor.py    # MegaLoc (DINOv2 + OT聚合)
│   │   ├── effovpr_extractor.py    # EffoVPR (DINOv2 多层CLS token)
│   │   └── selavpr_extractor.py    # SelaVPR++ (DINOv2 + MultiConv)
│   ├── ws_proxy_with_memory.py     # WebSocket 代理服务 (主入口)
│   └── build_memory.sh             # 记忆构建脚本
├── internnav/                      # InternNav 导航框架
├── scripts/                        # 工具脚本
│   └── memory_visualization_server.py  # 记忆图可视化服务 (含子图匹配验证 + 模型打点验证 + 遮挡检测验证)
├── tests/                          # 测试
│   ├── test_memory_nav.py          # 记忆模块单元测试
│   └── test_memory_ws.py           # WebSocket 集成测试 (详细日志版)
└── docs/                           # 文档

📷 鱼眼去畸变

系统在 VPR 匹配和子图匹配前，自动对 4 路鱼眼图像进行柱面投影去畸变：

工作原理

启动时从 cam/params.yaml 加载各相机内参（xi, fx, fy, cx, cy）和畸变系数（k1, k2, p1, p2）
每个相机预计算一次 remap 查找表（柱面投影 + pitch_up 视角偏移）
每帧推理前调用 cv2.remap 完成去畸变，计算开销极低
若 cam/params.yaml 不存在，自动跳过去畸变，不影响服务启动

from deploy.memory_nav.fisheye_undistort import FisheyeUndistorter

undistorter = FisheyeUndistorter.from_yaml("cam/params.yaml")
# 批量去畸变 4 路相机图像
perspective_images = undistorter.undistort_batch(camera_images)

🧭 像素→机器人坐标转换

将 pixel_target: [x_norm, y_norm] 通过完整物理管线转换为机器人运动坐标 [x_forward, y_lateral, 0.0]：

转换管线

x_norm → 柱面水平角 → + 相机方位角 → 全局 yaw
y_norm → 柱面垂直角 → 俯仰角 → 距离估算（相机高度 + pitch_up）
yaw + distance → (x_forward, y_lateral)

参数配置（`coord_transform.py`）

参数	默认值	说明
`DEFAULT_FOV`	180°	柱面图视场角
`DEFAULT_WIDTH`	1920	柱面图宽度
`DEFAULT_HEIGHT`	1536	柱面图高度
`DEFAULT_CAMERA_HEIGHT`	1.0m	相机距地面高度
`DEFAULT_PITCH_UP`	15°	去畸变 pitch_up 偏移角
`MIN_DISTANCE` / `MAX_DISTANCE`	0.3m / 30.0m	距离估算范围

相机方位角（硬编码，从 `cam/params.yaml` T_ic 计算）

相机	方位角
camera_1	+39.42°
camera_2	−35.84°
camera_3	−142.04°
camera_4	+143.52°

响应新增字段

坐标转换结果附加在 memory_info.coord_transform 中：

"memory_info": {
    "coord_transform": {
        "yaw_global_deg": -12.3,
        "depression_deg": 8.5,
        "distance": 2.4,
        "elapsed_ms": 0.3
    }
}

🎯 子图匹配导航

基于 DINOv3 密集 patch 特征的子图匹配导航方案：

工作原理

记忆构建时：为每条边标注 camera_name（目标所在相机）和 crop_image（注意力子图）
导航执行时：从记忆中取出 crop 子图，在当前对应相机的实时画面中进行密集特征匹配
目标定位：DINOv3 ViT-B/16 提取密集 patch token → 滑动窗口 + unfold 加速 → 余弦相似度最大位置 → 输出为 pixel_target
匹配阈值：置信度 ≥ 0.6 视为匹配成功
缓存机制：匹配失败时自动延用上一帧的成功匹配结果，步骤切换时清空缓存
回退机制：匹配失败且无缓存时，使用记忆中的 pixel_box 作为估计值

边数据结构

edge:
  camera_name: "camera_2"              # 目标所在相机
  landmark_name: "电梯"                 # 地标名称
  pixel_box: [120, 80, 200, 160]       # (x, y, w, h) 像素框
  crop_image_path: "crop_elevator.jpg"  # 注意力子图

输出格式

所有响应统一包含 pixel_target: [x, y]（归一化 0~1）及机器人运动 action：

场景	pixel_target 来源	action 来源	memory_active
记忆关闭 + InternVLA 推理	`output_pixel / 图像尺寸`	InternVLA 输出	不输出
记忆开启 + 子图匹配成功	`sub_image_match.match.center_pct`	coord_transform	`true`
记忆开启 + 子图匹配失败	延用上一帧缓存	coord_transform	`true`
记忆开启 + Qwen3.5 兜底	Qwen3.5 打点归一化坐标	coord_transform	`true`
记忆开启 + 遮挡检测	无（原地等待）	`[0, 0, 0]`	`true`

🚧 遮挡检测

当 VPR 匹配失败且子图匹配失败时，系统自动对注意力相机执行遮挡检测，判断是否因视觉遮挡导致：

工作原理

遮挡检测相机选择：使用子图匹配得分最高（但低于阈值）的 camera，而非静态的 step.camera_name，更准确反映注意力区域实际所在
YOLOv8n 推理：检测画面中的近距离前景物体（person、backpack、umbrella 等），计算 bbox 面积占比
遮挡判定：单个遮挡物面积占比 ≥ 35% → 判定为遮挡
遮挡时行为：输出 action: [0, 0, 0]（原地等待），下一帧继续检测
未遮挡时行为：使用 Qwen3.5 打点（landmark_name）继续导航

导航决策流程

VPR 匹配成功:
  ├─ 匹配到目标节点 → Lookahead 双重确认 → advance
  └─ 匹配到其他节点 → 继续当前步骤记忆引导

VPR 匹配失败:
  ├─ YOLOv8n 遮挡检测 (对子图匹配得分最高的 camera)
  │   ├─ 遮挡 → action=[0,0,0] 原地等待
  │   └─ 未遮挡 → Qwen3.5 打点(landmark_name) 继续导航
  │              └─ 打点也失败 → 重发记忆引导

响应新增字段

遮挡检测结果附加在 memory_info 中：

"memory_info": {
    "phase": "occluded",
    "consecutive_occlusions": 3,
    "occlusion": {
        "occluded": true,
        "max_area_ratio": 0.42,
        "total_area_ratio": 0.42,
        "detections": [
            {"class_name": "person", "confidence": 0.87, "area_ratio": 0.42}
        ],
        "reason": "person 占画面 42.0% (>= 35% 阈值)"
    }
}

✨ VPR 方案对比

MemoryNav 支持 4 种 VPR 方案，通过 deploy/vpr_config.yaml 统一切换：

方案	参数值	发表	特征维度	Backbone	特点
SelaVPR++ ⭐	`selavpr`	T-PAMI 2025	4096D	DINOv2-L + MultiConv	推荐方案，支持 hashing+rerank，官方最强配置
MegaLoc	`megaloc`	CVPR 2025	8448D	DINOv2-B + OT聚合	综合性能最强，多数据集 SOTA
EffoVPR	`effovpr`	arXiv 2024	3072D	DINOv2-B 多层CLS	轻量快速，适合实时场景
AnyLoc	`anyloc`	RA-L 2023	可配置	DINOv2-B + VLAD	经典稳定，聚类数可调

⚙️ 统一配置

所有 VPR 相关参数集中在 deploy/vpr_config.yaml 中管理，修改后重启服务即可生效：

# VPR 方法: selavpr | megaloc | effovpr | anyloc
vpr_method: selavpr

# GPU 设备
device: "cuda:0"

# VPR 相似度阈值 (各方案独立设置)
similarity_threshold:
  selavpr: 0.60
  megaloc: 0.60
  effovpr: 0.80
  anyloc: 0.70

# SelaVPR++ 专用配置
selavpr:
  backbone: dinov2-large      # dinov2-base (2048D) 或 dinov2-large (4096D)
  aggregation: gem            # gem, boq, salad
  use_hashing: true           # 开启深度哈希
  use_rerank: true            # 开启重排 (需 use_hashing=true)

# AnyLoc 专用配置
anyloc:
  dino_model: dinov2_vitb14
  agg_mode: vlad
  num_clusters: 32
  domain: indoor
  max_img_size: 630

切换方案只需修改 vpr_method 一行，以下模块自动读取统一配置：

ws_proxy_with_memory.py — WebSocket 导航服务
memory_visualization_server.py — 可视化服务
memory_builder.py / memory_navigator.py — 核心模块
build_memory.sh — 构建脚本

⚠️ 切换 VPR 方案后需要重新构建记忆缓存：bash deploy/build_memory.sh

🚀 快速开始

安装

git clone https://github.com/jx1100370217/MemoryNav.git
cd MemoryNav
pip install -r requirements/base.txt
pip install -e .

配置相机参数（可选）

如有实体相机，将标定文件放置为 cam/params.yaml，服务启动时自动加载鱼眼去畸变。

配置 VPR 方案

编辑 deploy/vpr_config.yaml，选择你需要的 VPR 方案和参数。

构建记忆库

# 自动从 vpr_config.yaml 读取 VPR 方案
bash deploy/build_memory.sh

# 或指定参数覆盖
bash deploy/build_memory.sh --method megaloc --gpu 0

启动导航服务

# 自动从 vpr_config.yaml 读取配置
python deploy/ws_proxy_with_memory.py

Python API

from deploy.memory_nav import MemoryNavigator

# 自动使用 vpr_config.yaml 中的配置
navigator = MemoryNavigator(vpr_method='selavpr', device='cuda:0')
navigator.load_memory(path='memory_cache.pkl', data_dir='merged_labeled_data')

# VPR 定位
images = {'camera_1': img1, 'camera_2': img2, 'camera_3': img3, 'camera_4': img4}
features = {cam: navigator.extractor.extract(img) for cam, img in images.items()}
result = navigator.vpr.locate(features)
print(f"定位: {result.matched_node_name}, 相似度: {result.similarity:.4f}")

# 规划导航
plan = navigator.navigate_to("前台", camera_images=images)
for step in plan['plan']['steps']:
    print(f"  → {step['to_node']['name']}, camera={step['camera_name']}, landmark={step['landmark_name']}")

# 子图匹配（导航执行中）
match = navigator.match_current_step(images)
if match and match['match']['found']:
    center = match['match']['center_pct']
    print(f"目标定位: ({center['x']:.3f}, {center['y']:.3f})")

📡 WebSocket 协议

请求格式

{
    "id": "robot_01",
    "pts": 1709558400,
    "task": "导航到前台",
    "images": {
        "front_1": "<base64>",
        "camera_1": "<base64>",
        "camera_2": "<base64>",
        "camera_3": "<base64>",
        "camera_4": "<base64>"
    }
}

响应格式

{
    "status": "success",
    "id": "robot_01",
    "task_status": "executing",
    "action": [[0.5, -0.1, 0.0]],
    "pixel_target": [0.485, 0.521],
    "memory_active": true,
    "camera_name": "camera_2",
    "landmark_name": "电梯",
    "memory_info": {
        "phase": "verifying",
        "current_step": 1,
        "total_steps": 3,
        "from_node": "大厅",
        "to_node": "前台",
        "vpr_similarity": 0.85,
        "vpr_confidence": 0.85,
        "vpr_matched_node": "node_5",
        "heading_offset": -37.5,
        "consecutive_misses": 0,
        "lookahead_conf": 0.68,
        "lookahead_found": true,
        "coord_transform": {
            "yaw_global_deg": -12.3,
            "depression_deg": 8.5,
            "distance": 2.4,
            "elapsed_ms": 0.3
        }
    },
    "sub_image_match": {
        "camera_name": "camera_2",
        "landmark_name": "电梯",
        "match": {
            "found": true,
            "confidence": 0.92,
            "center_pct": {"x": 0.485, "y": 0.521},
            "top_left_pct": {"x": 0.302, "y": 0.358},
            "bottom_right_pct": {"x": 0.668, "y": 0.684}
        }
    }
}

控制命令

命令	说明
`reset`	重置 Agent 和记忆状态
`toggle_memory`	切换记忆导航开关
`memory_status`	查看记忆导航详情
`reset_memory`	仅重置记忆状态
`session_status`	查看会话状态

📐 相机布局

系统使用 4 个鱼眼相机（等角投影，HFOV=190°）：

            前方 (0°)
              ↑
     cam_1 (-37.5°)  cam_2 (+37.5°)
              │
     cam_4 (-142.5°) cam_3 (+142.5°)
              ↓
            后方 (180°)

循环移位匹配支持 4 种朝向偏移：0°, -75°, 180°, +105°

🧪 测试

# 单元测试
python -m pytest tests/test_memory_nav.py -v

# WebSocket 集成测试 (含逐帧决策日志 + 统计报告)
python tests/test_memory_ws.py

测试输出包含：

📊 逐帧详情（VPR 匹配、子图匹配置信度、lookahead 置信度、camera、action、决策类型）
📋 统计报告（VPR 匹配率、子图匹配率、Lookahead 双重确认统计、节点分布、决策分布）

📋 更新日志

v2.0.0

🆕 YOLOv8n 遮挡检测：新增 deploy/memory_nav/occlusion_detector.py，VPR/子图匹配失败时自动检测视觉遮挡
- 使用 YOLOv8n（6MB）检测 person、backpack、umbrella、handbag、suitcase 等近距离前景物体
- 遮挡判定基于 bbox 面积占比（默认阈值 35%），GPU 推理 ~30ms
- 遮挡时输出 action: [0, 0, 0] 原地等待，遮挡消除后自动恢复导航
- 未遮挡时使用 Qwen3.5 打点（landmark_name）继续导航
🔄 导航决策简化：移除旧的趋势判断方案（Case B 跳步 / Case C 重规划 / Case D 相似度趋势检测）
- VPR 匹配到非目标节点 → 统一继续当前步骤（取代复杂的跳步/重规划逻辑）
- VPR 丢失 → 遮挡检测 + Qwen3.5 兜底打点（取代不可靠的趋势判断）
🎯 子图匹配 best_fail_camera：match_current_step() 在全部失败时记录得分最高的 camera，遮挡检测使用该 camera 而非静态 step.camera_name
🖥️ 可视化新增遮挡检测 Tab：memory_visualization_server.py 新增 🚧 遮挡检测验证 Tab
- 上传相机图片，可调面积阈值和 YOLO 置信度
- 实时展示检测框、面积占比、遮挡判定结果

v1.9.0

🔭 Lookahead 双重确认：步骤切换条件从单一 VPR 匹配升级为 VPR + 下一步子图匹配双重确认
- 每帧对当前步骤和下一步同时做子图匹配（lookahead 不走缓存逻辑）
- VPR 匹配到目标节点时，需下一步子图匹配成功（conf >= threshold）才 advance
- 最后一步无需 lookahead，直接 advance
- 新增 VPR HELD 状态：VPR 到了但 lookahead 未确认，暂缓切换
🎯 子图匹配阈值统一：SUB_MATCH_CONFIDENCE_THRESHOLD 作为唯一真相源
- 服务端 → MemoryNavigator → SubImageMatcher 全链路传参
- 测试端通过 from deploy.ws_proxy_with_memory import SUB_MATCH_CONFIDENCE_THRESHOLD 引用
- 改一处，服务/匹配器/测试全部同步生效
📊 测试日志增强：
- 表头新增 la_conf 列（lookahead 子图匹配置信度）
- advance 事件标注 🔭 lookahead确认
- 统计报告新增【Lookahead 双重确认】小节（触发次数、暂缓次数、通过率）
- 修复 advance 日志中目标节点显示错误（之前显示的是 advance 后新步骤的目标）

v1.8.0

🆕 鱼眼去畸变：新增 deploy/memory_nav/fisheye_undistort.py，移植自 cam/tools/fisheye_undist_cpu.h
- 启动时自动从 cam/params.yaml 加载 4 路相机内参，预计算柱面投影 remap 表
- 每帧推理前自动对输入图像进行去畸变，提升 VPR 及子图匹配精度
- params.yaml 缺失时优雅降级，不影响服务正常运行
🆕 像素→机器人坐标转换：新增 deploy/memory_nav/coord_transform.py
- pixel_target 归一化坐标经柱面水平角、相机方位角、俯仰角估距完整管线，转换为 [x_forward, y_lateral, 0.0]
- 覆盖全部三种导航决策路径（子图匹配成功、帧间缓存、Qwen3.5 兜底）
- 转换调试信息（yaw、depression、distance、耗时）随响应返回
🆕 cam/ 目录：纳入多目鱼眼相机 ROS2 节点源码及相机参数配置
- cam/params.yaml：4 路相机完整内参、外参（T_ic）、畸变系数
- cam/tools/：独立鱼眼转柱面命令行工具（无 ROS2/CUDA 依赖）
启动日志新增：显示鱼眼去畸变状态（✅ 已启用 / ❌ 未加载）和坐标转换模块状态

v1.7.0

Qwen3.5 兜底打点：新增基于 Qwen3.5-9B VLM 的打点方案替代 InternVLA 兜底模型
- 直接使用中文 landmark_name（无需英文翻译或 "Go to the ..." 前缀）
- 子进程模式运行（qwen3 conda 环境），避免 transformers 版本冲突
- 支持单图打点和多相机遍历打点
InternVLA 按需加载：InternVLA 模型默认不加载，需要时按需启动，节省 GPU 显存
可视化新增模型打点模块：memory_visualization_server.py 新增🎯模型打点 Tab，上传图片+输入地标即可验证打点效果
模型加载优化：Qwen3.5 在 ws_proxy 启动时统一加载，visualization_server 复用同一实例

v1.6.0

子图匹配精简：移除 SuperPoint+LightGlue 和 Qwen3.5 方案，仅保留 DINOv3 密集特征匹配
匹配阈值统一：置信度阈值统一为 SUB_MATCH_CONFIDENCE_THRESHOLD（当前 0.65）
帧间相似度升级：SSIM 替换为 DINOv2 帧间相似度，阈值 0.70
三级 crop 级联匹配：small/mid/big 三种裁剪尺度级联匹配 + 全相机遍历，提升匹配鲁棒性

v1.5.0

输出格式统一：记忆关闭时输出与 ws_proxy.py 完全一致，始终包含 pixel_target，不输出 memory_active 等额外字段
子图匹配缓存：置信度低于阈值时自动延用上一帧成功结果，步骤切换或任务重置时清空

v1.4.0

子图匹配导航：从角度导航升级到 SuperPoint + LightGlue 子图匹配
边模型重构：从 angle + pixel_position 改为 camera_name + crop_image + pixel_box

v1.3.0

统一配置管理：所有 VPR 参数集中到 deploy/vpr_config.yaml
内嵌模型代码：SelaVPR++ 和 MegaLoc 模型代码内嵌，移除外部依赖

v1.2.0

多 VPR 方案支持：新增 SelaVPR++、MegaLoc、EffoVPR 三种方案
VPR 工厂模式：统一提取器接口，一键切换

v1.1.0

记忆导航服务：WebSocket 代理 + VPR 定位 + 路径规划

v1.0.0

基础框架：拓扑记忆图、AnyLoc VPR、InternVLA 推理
循环移位匹配：4 相机朝向无关定位算法

📚 引用

如果本项目对您的研究有帮助，请引用相关 VPR 论文：

@article{selavprpp2025,
  title={SelaVPR++: Towards Seamless Adaptation of Foundation Models for Efficient Place Recognition},
  author={Lu, Feng and Jin, Tong and others},
  journal={IEEE T-PAMI},
  year={2026},
  volume={48},
  number={3},
  pages={2731-2748}
}

@inproceedings{megaloc2025,
  title={MegaLoc: One Retrieval to Place Them All},
  author={Berton, Gabriele and Masone, Carlo},
  booktitle={CVPR Workshops},
  year={2025}
}

@article{effovpr2024,
  title={Effective Foundation Model Utilization for Visual Place Recognition},
  author={Tzachor, Issar and others},
  journal={arXiv:2405.18065},
  year={2024}
}

@article{anyloc2023,
  title={AnyLoc: Towards Universal Visual Place Recognition},
  author={Keetha, Nikhil and others},
  journal={IEEE RA-L},
  year={2023}
}

📄 License

本项目采用 MIT License 开源协议。

Name		Name	Last commit message	Last commit date
Latest commit History 63 Commits
.github		.github
assets		assets
cam		cam
deploy		deploy
docs		docs
internnav		internnav
requirements		requirements
scripts		scripts
src/diffusion-policy		src/diffusion-policy
tests		tests
.gitignore		.gitignore
.gitmodules		.gitmodules
.pre-commit-config.yaml		.pre-commit-config.yaml
README.md		README.md
README_EN.md		README_EN.md
README_JA.md		README_JA.md
README_KO.md		README_KO.md
pyproject.toml		pyproject.toml
setup.cfg		setup.cfg
setup.py		setup.py

Folders and files

Latest commit

History

Repository files navigation

🧠 MemoryNav

📖 简介

核心能力

🏗️ 系统架构

📷 鱼眼去畸变

工作原理

🧭 像素→机器人坐标转换

转换管线

参数配置（coord_transform.py）

相机方位角（硬编码，从 cam/params.yaml T_ic 计算）

响应新增字段

🎯 子图匹配导航

工作原理

边数据结构

输出格式

🚧 遮挡检测

工作原理

导航决策流程

响应新增字段

✨ VPR 方案对比

⚙️ 统一配置

🚀 快速开始

安装

配置相机参数（可选）

配置 VPR 方案

构建记忆库

启动导航服务

Python API

📡 WebSocket 协议

请求格式

响应格式

控制命令

📐 相机布局

🧪 测试

📋 更新日志

v2.0.0

v1.9.0

v1.8.0

v1.7.0

v1.6.0

v1.5.0

v1.4.0

v1.3.0

v1.2.0

v1.1.0

v1.0.0

📚 引用

📄 License

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

参数配置（`coord_transform.py`）

相机方位角（硬编码，从 `cam/params.yaml` T_ic 计算）

Packages