Jarvis 架构评审

TL;DR 总结（修正版）

初版报告低估了 Jarvis——Skills 自动化体系（SHA256 热检测 + Prompt 飞书配置化 + Skill3 自动审核 + Claude Code Skill 自动发现）、Multi-Agent 能力（Agent Teams 并行 + 5 种特化类型 + 预算控制）均强于初版评估。
WakingDB 不存在——字节跳动的实际产品叫 VikingDB（火山引擎商业服务，不开源）。其开源项目 OpenViking（2026年1月发布）是”上下文数据库”而非向量库，且处于极早期阶段（v0.1），Python-only。
Jarvis 记忆系统的真正瓶颈不是”现在不够用”，而是扩展性——当未来接入 Discord / Telegram、多 Agent 人格、对话量增长后，当前的 JSON 文件 + 关键词匹配会成为天花板。推荐方案：Mem0 + LanceDB/Qdrant + Qwen3-Embedding。

修正后评分

基于服务器实际代码和深度调研：

Jarvis 综合: 7.8 (上调 0.6)
OpenClaw 综合: 8.5
差距: 0.7 (缩小)

各维度对比

维度	Jarvis	OpenClaw
消息渠道覆盖	3	9
记忆系统	7	8
技能/扩展体系	7 (上调2)	9
多 Agent 协作	7 (上调3)	7
安全模型	6	7
自动化/Cron	8	7
业务深度（飞书生态）	9	3
部署自动化	8	5
中国本土适配	10	2
社区 & 生态	1	10

逐项对比（修正版）

维度	Jarvis	OpenClaw	胜者
核心架构	单进程 Gateway + Channel Adapters，约 4,800 行 + Agents 约 980 行	Gateway + Pi Agent Runtime 分离，数万行 + 插件体系	OpenClaw
消息渠道	飞书 (WebSocket) + 企微 (HTTP)，2 个渠道，适配器模式易扩展	WhatsApp, Telegram, Slack, Discord, iMessage 等 15+ 渠道	OpenClaw
Agent 引擎	Claude Agent SDK + Agent Teams，5 种特化子 Agent + 并行执行 + $2 预算控制	Pi Agent (模型无关)，Claude/GPT/DeepSeek/本地模型	各有优势
记忆系统	三层：短期 JSON → 摘要 → JSONL 归档，关键词匹配 + 时间衰减	JSONL + SQLite-vec 混合检索，向量 70% + BM25 30% + session compaction	OpenClaw
技能体系	双层：Claude Code Skills（热加载）+ Agent Prompt 系统（SHA256 自动检测 + 飞书配置 + 自动审核）	SKILL.md 声明式 + ClawHub 1200+ 市场，三级优先级覆盖	各有优势
多 Agent	Agent Teams 并行执行 + 5 种特化类型（Explore/Plan/Bash/general-purpose），预算控制，但统一人格	Multi-SOUL.md 独立人格，按渠道路由，共享记忆，但串行执行	各有优势
人格定义	CLAUDE.md 单一人格	Multi-SOUL.md 多人格，每个 Agent 独立身份	OpenClaw
自动部署	TaskExecutor → Deployer，Nginx + SSL + 子域名，全自动	无内置部署能力	Jarvis
飞书生态	深度集成：Bitable 8 API、群聊、卡片、图片压缩	无飞书支持	Jarvis
Prompt 管理	飞书 Bitable 动态配置 + SHA256 哈希自动检测，零停机热更新，有缓存 fallback	SKILL.md 文件监听，手动编辑文件	Jarvis
审核机制	Skill3 自动审核 + 失败重试（max 2 次），Pre-execution hooks 安全拦截	无内置审核，社区审查 + VirusTotal	Jarvis

Skills 系统深度分析

Jarvis 实际具备的能力（初版报告低估了）

能力	实现方式	位置
Skill 自动发现	Claude Code 内置 skill-discovery.md + skill-manager，遇到未知任务时自动搜索 GitHub / agentskill.sh / skills.sh	`.claude/skills/`
MCP 自动发现	mcp-discovery.md 指导搜索 MCP Registry（10,000+ 服务），用户审批后安装	`.claude/skills/mcp-discovery.md`
Skill 热加载	Claude Code v2.1.0+ 支持保存到 .claude/skills/ 后自动加载，无需重启	Claude Code 内置
Prompt 自动更新	SHA256 哈希检测飞书 Bitable → 有变更自动拉取，零停机，有缓存 fallback	`agents/utils/prompt-loader.js`
自动审核	Skill3 对生成内容 4 维度审核，不通过自动重试（max 2 次）	`agents/skills/skill3-reviewer.js`
技能统计	执行次数、审核通过率、Token 消耗自动记录	`agents/memory/skill_stats.json`
回溯学习	Skill5 框架已有，分析历史选择偏好	`agents/utils/retrospective.js`

Jarvis 的 Skill “内化”机制 vs OpenClaw 的 SKILL.md

Jarvis 的模式可以理解为”变相实现了 OpenClaw”——不是运行时实时加载外部 Skill，而是提取 Skill 内容 → 更新 Prompt → 内化到系统中 → 下次执行直接使用。

环节	Jarvis	OpenClaw
发现	对话中遇到需求 → Claude Code 搜索 Skill，提取 Prompt 内容并内化	SKILL.md 目录扫描，ClawHub 市场搜索
注册	保存到 .claude/skills/ → 自动热加载，Prompt 存到飞书 Bitable	放入 workspace/.openclaw/skills/，文件监听自动注册
生效	下次对话/Cron 执行时生效（非实时，但零停机）	实时生效（文件监听毫秒级）
审核	Skill3 自动审核内容质量，Pre-execution hooks 安全拦截	无内置审核，社区信任模式
差距	Jarvis 的 Prompt 内化更安全但生效延迟	OpenClaw 更即时但缺审核

Multi-Agent 深度对比

Jarvis (Agent Teams) 更强的

并行执行：多个 Task Agent 同时运行，OpenClaw 按渠道串行
5 种特化类型：Explore / Plan / Bash / general-purpose 等，OpenClaw 只有统一 Pi Agent
预算控制：$2 USD per task，50 turn max，OpenClaw 无内置限制
任务隔离：每个 Agent 独立工作空间，互不污染

OpenClaw (Multi-SOUL) 更强的

持久人格隔离：每个 Agent 有独立 SOUL.md，不同渠道不同角色
渠道路由：WhatsApp → Agent A，Discord → Agent B，自动分发
共享记忆：Agent 间通过文件共享信息
USER.md / MEMORY.md：人格 + 记忆 + 用户画像完整分离

关键判断：Agent Teams 的优势在于任务执行力（并行、特化、预算控制）——适合”一个管家指挥多个工人干活”。Multi-SOUL 的优势在于角色管理（多人格、渠道路由、记忆隔离）——适合”多个角色服务不同场景”。两者不冲突，未来应该叠加使用：Multi-SOUL 管”谁来应答”，Agent Teams 管”怎么干活”。

记忆系统专题：全行业方案对比

Jarvis 当前记忆 vs 行业主流方案

维度	Jarvis 现状	OpenClaw	ChatGPT	行业最佳实践
存储	JSON 文件 + JSONL 归档	JSONL + SQLite (FTS5 + sqlite-vec)	云端数据库	向量库 + 图谱 + KV 混合
检索	关键词匹配（tag 40% + entity 40% + 时间 20%）	向量 70% + BM25 30% 混合检索	四层注入（元数据+长期+摘要+当前）	语义 + 关键词 + 图遍历混合检索
压缩	80 条 / 8MB / 2h 触发，LLM 摘要压缩	176K token 触发，Session compaction + memory flush	自动摘要滚动窗口	分层压缩 + 重要度保留
多 Agent 隔离	无（chatId 隔离）	agentId 隔离（但有过 memory bleed bug）	N/A	agent_id + user_id + scope 三维
跨会话	短期记忆 100 条，7/30 天分级保留	MEMORY.md 持久化，Daily notes 自动写入	Saved Memories 永久	语义去重 + 时间衰减

记忆框架对比（可用于 Jarvis 升级）

框架	类型	Node.js	自托管	特点	适合度
Mem0	记忆层 SDK	npm	pip/npm	向量+图谱混合，user/agent/session 三级 scope，41K stars，Netflix 在用	推荐
Zep (Graphiti)	时序知识图谱	Python only	需 Neo4j	双时序模型，关系推理最强，P95 300ms 无 LLM 检索	过重
LangMem	框架模块	Python only	支持	语义/情景/程序三种记忆，Prompt 自优化	无 Node.js
Letta (MemGPT)	自编辑记忆	REST API	Docker	Agent 自主管理记忆，“虚拟内存”分页机制	有趣但复杂
OpenClaw 内置	文件+SQLite	N/A	支持	JSONL + sqlite-vec + FTS5，轻量但缺图谱	可借鉴架构

推荐方案：Mem0。原因：(1) 有 Node.js SDK，直接集成到 Gateway；(2) user_id + agent_id + session 三级 scope 完美匹配未来多渠道多角色需求；(3) 自带向量+图谱混合存储；(4) 41K GitHub stars，生产验证（Netflix / Lemonade）；(5) 已有 OpenClaw 插件，架构被验证。

向量数据库 & Embedding 方案

WakingDB 调研结论

“WakingDB”这个名字不存在。字节跳动的向量数据库叫 VikingDB，是火山引擎上的商业云服务，不开源，无 Node.js SDK。其开源项目 OpenViking（2026.1 发布）是”上下文数据库”而非向量库，v0.1 极早期，Python-only。两者都不适合 Jarvis 使用。

向量数据库对比（适用于 VPS 自托管）

方案	类型	RAM 需求	Node.js	中文	评估
LanceDB	嵌入式库	~50MB	原生 TS	靠 Embedding	首选，零运维，直接 import
Qdrant	独立服务	~500MB	官方 SDK	支持	推荐，功能最全，Rust 高性能
sqlite-vec	SQLite 扩展	~30MB	better-sqlite3	支持	最轻量，适合起步
ChromaDB	独立服务	~200MB	npm	支持	可选，但资源占用中等
Weaviate	独立服务	~2GB+	支持	支持	过重
Milvus	独立服务	~4GB+	支持	支持	过重
VikingDB	云服务	N/A	无 SDK	支持	不适用，不开源，无 Node.js

Embedding 模型推荐（中英双语）

模型	参数量	中文	部署	成本	推荐
Qwen3-Embedding-0.6B	0.6B	原生，MTEB #1	Ollama 本地	免费	首选
BGE-M3	568M	原生优秀	本地 / API	免费	备选
text-embedding-3-small	API	良好	OpenAI API	$0.02/1M tokens	API 首选
Voyage-3	API	良好	Voyage API	$0.06/1M tokens	质量最高

推荐记忆架构（未来演进）

┌──────────────────────────────────────────────────────────┐
│                    Jarvis Gateway                        │
│                                                          │
│  ┌─────────┐  ┌─────────┐  ┌──────────┐  ┌──────────┐  │
│  │ Feishu  │  │ WeChat  │  │ Discord  │  │ Telegram │  │
│  └────┬────┘  └────┬────┘  └────┬─────┘  └────┬─────┘  │
│       └────────────┼────────────┼──────────────┘        │
│                    ▼                                     │
│           ┌────────────────┐                             │
│           │ Message Router │ ← 按渠道/群路由到 Agent     │
│           └───────┬────────┘                             │
│                   ▼                                      │
│      ┌──────────────────────┐                            │
│      │   Agent Registry     │                            │
│      │  ┌────────────────┐  │                            │
│      │  │ jarvis (主管家) │ ← SOUL-jarvis.md             │
│      │  │ agent-b (营养) │ ← SOUL-nutrition.md           │
│      │  │ agent-c (游戏) │ ← SOUL-gaming.md              │
│      │  └────────────────┘  │                            │
│      └──────────┬───────────┘                            │
│                 ▼                                        │
│        ┌────────────────┐                                │
│        │  Memory Router │ ← scope: global/agent/user     │
│        └───────┬────────┘                                │
└────────────────┼─────────────────────────────────────────┘
                 ▼
    ┌────────────────────────────┐
    │      Mem0 Memory Layer     │
    │                            │
    │  ┌──────┐  ┌───────────┐  │
    │  │Vector│  │  Graph    │  │
    │  │Store │  │  Memory   │  │
    │  └──┬───┘  └─────┬─────┘  │
    │     ▼            ▼        │
    │  ┌──────────────────────┐ │
    │  │  LanceDB / Qdrant   │ │
    │  │  + Qwen3-Embedding  │ │
    │  └──────────────────────┘ │
    └────────────────────────────┘

Memory Scope 模型：
┌─────────────────────────────────────────┐
│ GLOBAL    所有 Agent 共享               │
│ (服务器知识、技术决策、基础设施事实)    │
├─────────────────────────────────────────┤
│ AGENT     按 agentId 隔离               │
│ (人格偏好、角色行为、SOUL 细化)        │
├─────────────────────────────────────────┤
│ USER      按 userId 跨 Agent            │
│ (姓名、时区、沟通风格、个人偏好)       │
├─────────────────────────────────────────┤
│ SESSION   按对话隔离                    │
│ (当前话题、工作上下文、临时决策)       │
└─────────────────────────────────────────┘

Jarvis 更强的地方

飞书深度集成：Bitable CRUD（8 API）、WebSocket 实时、群聊 @ 过滤、富文本卡片、图片压缩上传。OpenClaw 完全没有飞书支持。（不可替代）
自动部署闭环：代码生成 → Nginx → SSL → DNS → 上线，全自动完成。OpenClaw 无内置部署能力。（独有）
生产级自动化管线：8 个 Cron 任务覆盖热搜聚合、AI 推荐、日报周报、清理、心跳。已在生产运行，不是”可以做”而是”已经跑”。（生产验证）
Prompt 自动审核：Skill3 四维度质量审核 + 失败自动重试。SHA256 哈希 Prompt 热检测。OpenClaw 无内置审核机制。（安全优势）
Agent Teams 执行力：5 种特化子 Agent 并行执行 + 预算控制。OpenClaw 的 Pi Agent 是统一型、按渠道串行。（执行力更强）
中国本土化：腾讯 COS、ICP 备案域名、mihomo 代理、飞书+企微双渠道。OpenClaw 在中国大陆几乎无法使用。（本土壁垒）

OpenClaw 更强的地方（值得借鉴）

语义记忆检索：SQLite-vec 向量 70% + BM25 关键词 30% 混合检索。Jarvis 只有关键词匹配，“反向代理”不等于”nginx”找不到。（核心差距，P1 升级）
Multi-SOUL.md：每个 Agent 独立人格 + 记忆，按渠道路由。未来接入 Discord/Telegram 时必须有此能力。（未来必需，P2 规划）
渠道广度：15+ 消息渠道开箱即用。Jarvis 适配器模式设计好但只有 2 个实现。（按需扩展）
Canvas 可视化：A2UI Canvas 让 Agent 实时渲染交互式界面。Jarvis 只能输出飞书卡片 Markdown。（可考虑）

冗余项分析

模块	状态	评估	建议
MemoryMetrics	106 行，6 维度采集	采集了但没消费端（无仪表盘、无告警）	浪费，要么接告警，要么精简
PM2 残留	.pm2 目录存在	已迁移到 systemd，完全无用	清理
Task 临时部署	t-{id}.mistprism.com	子域名无过期清理机制	加 TTL 自动过期
企微适配器	708 行	如使用率低，15% 代码量投产比不划算	评估使用率
可观测仪表盘	无	单人场景飞书通知够用，OpenClaw 的 Clawtrol/ClawMetry 是给多人团队的	暂不需要

修正后进阶路线

P1 - 本月：记忆系统升级

引入语义检索。当前关键词匹配 → Embedding 向量 + 关键词混合检索。

方案 A（最轻量）：LanceDB 嵌入式 + OpenAI text-embedding-3-small API
方案 B（自主可控）：LanceDB + Qwen3-Embedding-0.6B (Ollama 本地)
方案 C（功能最全）：Mem0 SDK + Qdrant + Qwen3-Embedding
保留现有 MemoryManager 作为 fallback，渐进迁移
预计工作量：方案 A 约 2-3 天，方案 C 约 5-7 天

P2 - 下月：Multi-SOUL 人格系统

为未来多渠道、多角色做准备。

创建 SOUL-{agentId}.md 文件，每个 Agent 独立人格和系统提示词
Message Router：按渠道 / 群 ID / @ 对象路由到对应 Agent
Memory Scope：global / agent / user / session 四级隔离
共享知识层：基础设施知识、项目信息所有 Agent 可读
预计工作量：5-7 天

P3 - 下月：新渠道接入（Discord 等）

当前适配器模式已支持扩展，按需新增。

基于 ChannelAdapter 基类新增 DiscordAdapter
与 Multi-SOUL 配合：Discord 渠道 → 指定 Agent 人格
预计工作量：2-3 天 / 渠道

P4 - 远期：MCP 动态配置 + 声明式 Skill 注册

当前 3 个 MCP 稳定够用，等需要第 4 个时再做。

创建 mcp-config.json 统一管理，支持运行时增删
SKILL.yaml 声明式定义，自动注册
预计工作量：2-3 天

P5 - 远期：配置中心化 + Skill5 回溯完善

.env + config.js → 统一 jarvis.config.json + Zod 校验
Skill5 回溯学习闭环：分析历史 → 偏好提取 → Prompt 自优化
预计工作量：各 2-3 天

结论（修正版）

核心判断

差距比初版报告小。 修正后 Jarvis 7.8 vs OpenClaw 8.5，差距 0.7 分（初版 1.3）。Skills 双层体系 + Agent Teams 并行执行 + Prompt 自动审核，这些被初版严重低估了。
真正的短板只有一个：语义记忆。 其他维度 Jarvis 要么持平要么领先（飞书生态、自动部署、审核机制、中国本土化）。语义记忆是唯一影响用户体验的核心差距。
Multi-SOUL 是未来方向而非当前瓶颈。 当前单管家单渠道够用，但接入 Discord / 多角色时就必须有了。建议 P2 优先级。
不需要仪表盘、不需要追渠道数量。 单人场景飞书通知够用；渠道按需扩展，不用追 OpenClaw 的 15 个。

一句话总结

Jarvis 的架构已经比初版评估的成熟得多。当前最高 ROI 的升级是记忆系统语义化（Mem0 + LanceDB），其次是Multi-SOUL 多人格为未来多渠道铺路。其他差距要么不影响（社区生态）、要么不需要（15 个渠道）、要么已经够用（可观测性）。

Jarvis vs OpenClaw Architecture Review v2 | 2026-02-22 Generated by Jarvis Agent Teams (3 parallel sub-agents) Sources: OpenClaw GitHub, Mem0, LanceDB, Qdrant, Zep/Graphiti, VikingDB, OpenViking, Qwen3-Embedding

MistPrism SOP

探索