TL;DR 总结(修正版)
-
初版报告低估了 Jarvis——Skills 自动化体系(SHA256 热检测 + Prompt 飞书配置化 + Skill3 自动审核 + Claude Code Skill 自动发现)、Multi-Agent 能力(Agent Teams 并行 + 5 种特化类型 + 预算控制)均强于初版评估。
-
WakingDB 不存在——字节跳动的实际产品叫 VikingDB(火山引擎商业服务,不开源)。其开源项目 OpenViking(2026年1月发布)是”上下文数据库”而非向量库,且处于极早期阶段(v0.1),Python-only。
-
Jarvis 记忆系统的真正瓶颈不是”现在不够用”,而是扩展性——当未来接入 Discord / Telegram、多 Agent 人格、对话量增长后,当前的 JSON 文件 + 关键词匹配会成为天花板。推荐方案:Mem0 + LanceDB/Qdrant + Qwen3-Embedding。
修正后评分
基于服务器实际代码和深度调研:
- Jarvis 综合: 7.8 (上调 0.6)
- OpenClaw 综合: 8.5
- 差距: 0.7 (缩小)
各维度对比
| 维度 | Jarvis | OpenClaw |
|---|---|---|
| 消息渠道覆盖 | 3 | 9 |
| 记忆系统 | 7 | 8 |
| 技能/扩展体系 | 7 (上调2) | 9 |
| 多 Agent 协作 | 7 (上调3) | 7 |
| 安全模型 | 6 | 7 |
| 自动化/Cron | 8 | 7 |
| 业务深度(飞书生态) | 9 | 3 |
| 部署自动化 | 8 | 5 |
| 中国本土适配 | 10 | 2 |
| 社区 & 生态 | 1 | 10 |
逐项对比(修正版)
| 维度 | Jarvis | OpenClaw | 胜者 |
|---|---|---|---|
| 核心架构 | 单进程 Gateway + Channel Adapters,约 4,800 行 + Agents 约 980 行 | Gateway + Pi Agent Runtime 分离,数万行 + 插件体系 | OpenClaw |
| 消息渠道 | 飞书 (WebSocket) + 企微 (HTTP),2 个渠道,适配器模式易扩展 | WhatsApp, Telegram, Slack, Discord, iMessage 等 15+ 渠道 | OpenClaw |
| Agent 引擎 | Claude Agent SDK + Agent Teams,5 种特化子 Agent + 并行执行 + $2 预算控制 | Pi Agent (模型无关),Claude/GPT/DeepSeek/本地模型 | 各有优势 |
| 记忆系统 | 三层:短期 JSON → 摘要 → JSONL 归档,关键词匹配 + 时间衰减 | JSONL + SQLite-vec 混合检索,向量 70% + BM25 30% + session compaction | OpenClaw |
| 技能体系 | 双层:Claude Code Skills(热加载)+ Agent Prompt 系统(SHA256 自动检测 + 飞书配置 + 自动审核) | SKILL.md 声明式 + ClawHub 1200+ 市场,三级优先级覆盖 | 各有优势 |
| 多 Agent | Agent Teams 并行执行 + 5 种特化类型(Explore/Plan/Bash/general-purpose),预算控制,但统一人格 | Multi-SOUL.md 独立人格,按渠道路由,共享记忆,但串行执行 | 各有优势 |
| 人格定义 | CLAUDE.md 单一人格 | Multi-SOUL.md 多人格,每个 Agent 独立身份 | OpenClaw |
| 自动部署 | TaskExecutor → Deployer,Nginx + SSL + 子域名,全自动 | 无内置部署能力 | Jarvis |
| 飞书生态 | 深度集成:Bitable 8 API、群聊、卡片、图片压缩 | 无飞书支持 | Jarvis |
| Prompt 管理 | 飞书 Bitable 动态配置 + SHA256 哈希自动检测,零停机热更新,有缓存 fallback | SKILL.md 文件监听,手动编辑文件 | Jarvis |
| 审核机制 | Skill3 自动审核 + 失败重试(max 2 次),Pre-execution hooks 安全拦截 | 无内置审核,社区审查 + VirusTotal | Jarvis |
Skills 系统深度分析
Jarvis 实际具备的能力(初版报告低估了)
| 能力 | 实现方式 | 位置 |
|---|---|---|
| Skill 自动发现 | Claude Code 内置 skill-discovery.md + skill-manager,遇到未知任务时自动搜索 GitHub / agentskill.sh / skills.sh | .claude/skills/ |
| MCP 自动发现 | mcp-discovery.md 指导搜索 MCP Registry(10,000+ 服务),用户审批后安装 | .claude/skills/mcp-discovery.md |
| Skill 热加载 | Claude Code v2.1.0+ 支持保存到 .claude/skills/ 后自动加载,无需重启 | Claude Code 内置 |
| Prompt 自动更新 | SHA256 哈希检测飞书 Bitable → 有变更自动拉取,零停机,有缓存 fallback | agents/utils/prompt-loader.js |
| 自动审核 | Skill3 对生成内容 4 维度审核,不通过自动重试(max 2 次) | agents/skills/skill3-reviewer.js |
| 技能统计 | 执行次数、审核通过率、Token 消耗自动记录 | agents/memory/skill_stats.json |
| 回溯学习 | Skill5 框架已有,分析历史选择偏好 | agents/utils/retrospective.js |
Jarvis 的 Skill “内化”机制 vs OpenClaw 的 SKILL.md
Jarvis 的模式可以理解为”变相实现了 OpenClaw”——不是运行时实时加载外部 Skill,而是提取 Skill 内容 → 更新 Prompt → 内化到系统中 → 下次执行直接使用。
| 环节 | Jarvis | OpenClaw |
|---|---|---|
| 发现 | 对话中遇到需求 → Claude Code 搜索 Skill,提取 Prompt 内容并内化 | SKILL.md 目录扫描,ClawHub 市场搜索 |
| 注册 | 保存到 .claude/skills/ → 自动热加载,Prompt 存到飞书 Bitable | 放入 workspace/.openclaw/skills/,文件监听自动注册 |
| 生效 | 下次对话/Cron 执行时生效(非实时,但零停机) | 实时生效(文件监听毫秒级) |
| 审核 | Skill3 自动审核内容质量,Pre-execution hooks 安全拦截 | 无内置审核,社区信任模式 |
| 差距 | Jarvis 的 Prompt 内化更安全但生效延迟 | OpenClaw 更即时但缺审核 |
Multi-Agent 深度对比
Jarvis (Agent Teams) 更强的
- 并行执行:多个 Task Agent 同时运行,OpenClaw 按渠道串行
- 5 种特化类型:Explore / Plan / Bash / general-purpose 等,OpenClaw 只有统一 Pi Agent
- 预算控制:$2 USD per task,50 turn max,OpenClaw 无内置限制
- 任务隔离:每个 Agent 独立工作空间,互不污染
OpenClaw (Multi-SOUL) 更强的
- 持久人格隔离:每个 Agent 有独立 SOUL.md,不同渠道不同角色
- 渠道路由:WhatsApp → Agent A,Discord → Agent B,自动分发
- 共享记忆:Agent 间通过文件共享信息
- USER.md / MEMORY.md:人格 + 记忆 + 用户画像完整分离
关键判断:Agent Teams 的优势在于任务执行力(并行、特化、预算控制)——适合”一个管家指挥多个工人干活”。Multi-SOUL 的优势在于角色管理(多人格、渠道路由、记忆隔离)——适合”多个角色服务不同场景”。两者不冲突,未来应该叠加使用:Multi-SOUL 管”谁来应答”,Agent Teams 管”怎么干活”。
记忆系统专题:全行业方案对比
Jarvis 当前记忆 vs 行业主流方案
| 维度 | Jarvis 现状 | OpenClaw | ChatGPT | 行业最佳实践 |
|---|---|---|---|---|
| 存储 | JSON 文件 + JSONL 归档 | JSONL + SQLite (FTS5 + sqlite-vec) | 云端数据库 | 向量库 + 图谱 + KV 混合 |
| 检索 | 关键词匹配(tag 40% + entity 40% + 时间 20%) | 向量 70% + BM25 30% 混合检索 | 四层注入(元数据+长期+摘要+当前) | 语义 + 关键词 + 图遍历混合检索 |
| 压缩 | 80 条 / 8MB / 2h 触发,LLM 摘要压缩 | 176K token 触发,Session compaction + memory flush | 自动摘要滚动窗口 | 分层压缩 + 重要度保留 |
| 多 Agent 隔离 | 无(chatId 隔离) | agentId 隔离(但有过 memory bleed bug) | N/A | agent_id + user_id + scope 三维 |
| 跨会话 | 短期记忆 100 条,7/30 天分级保留 | MEMORY.md 持久化,Daily notes 自动写入 | Saved Memories 永久 | 语义去重 + 时间衰减 |
记忆框架对比(可用于 Jarvis 升级)
| 框架 | 类型 | Node.js | 自托管 | 特点 | 适合度 |
|---|---|---|---|---|---|
| Mem0 | 记忆层 SDK | npm | pip/npm | 向量+图谱混合,user/agent/session 三级 scope,41K stars,Netflix 在用 | 推荐 |
| Zep (Graphiti) | 时序知识图谱 | Python only | 需 Neo4j | 双时序模型,关系推理最强,P95 300ms 无 LLM 检索 | 过重 |
| LangMem | 框架模块 | Python only | 支持 | 语义/情景/程序三种记忆,Prompt 自优化 | 无 Node.js |
| Letta (MemGPT) | 自编辑记忆 | REST API | Docker | Agent 自主管理记忆,“虚拟内存”分页机制 | 有趣但复杂 |
| OpenClaw 内置 | 文件+SQLite | N/A | 支持 | JSONL + sqlite-vec + FTS5,轻量但缺图谱 | 可借鉴架构 |
推荐方案:Mem0。原因:(1) 有 Node.js SDK,直接集成到 Gateway;(2) user_id + agent_id + session 三级 scope 完美匹配未来多渠道多角色需求;(3) 自带向量+图谱混合存储;(4) 41K GitHub stars,生产验证(Netflix / Lemonade);(5) 已有 OpenClaw 插件,架构被验证。
向量数据库 & Embedding 方案
WakingDB 调研结论
“WakingDB”这个名字不存在。字节跳动的向量数据库叫 VikingDB,是火山引擎上的商业云服务,不开源,无 Node.js SDK。其开源项目 OpenViking(2026.1 发布)是”上下文数据库”而非向量库,v0.1 极早期,Python-only。两者都不适合 Jarvis 使用。
向量数据库对比(适用于 VPS 自托管)
| 方案 | 类型 | RAM 需求 | Node.js | 中文 | 评估 |
|---|---|---|---|---|---|
| LanceDB | 嵌入式库 | ~50MB | 原生 TS | 靠 Embedding | 首选,零运维,直接 import |
| Qdrant | 独立服务 | ~500MB | 官方 SDK | 支持 | 推荐,功能最全,Rust 高性能 |
| sqlite-vec | SQLite 扩展 | ~30MB | better-sqlite3 | 支持 | 最轻量,适合起步 |
| ChromaDB | 独立服务 | ~200MB | npm | 支持 | 可选,但资源占用中等 |
| Weaviate | 独立服务 | ~2GB+ | 支持 | 支持 | 过重 |
| Milvus | 独立服务 | ~4GB+ | 支持 | 支持 | 过重 |
| VikingDB | 云服务 | N/A | 无 SDK | 支持 | 不适用,不开源,无 Node.js |
Embedding 模型推荐(中英双语)
| 模型 | 参数量 | 中文 | 部署 | 成本 | 推荐 |
|---|---|---|---|---|---|
| Qwen3-Embedding-0.6B | 0.6B | 原生,MTEB #1 | Ollama 本地 | 免费 | 首选 |
| BGE-M3 | 568M | 原生优秀 | 本地 / API | 免费 | 备选 |
| text-embedding-3-small | API | 良好 | OpenAI API | $0.02/1M tokens | API 首选 |
| Voyage-3 | API | 良好 | Voyage API | $0.06/1M tokens | 质量最高 |
推荐记忆架构(未来演进)
┌──────────────────────────────────────────────────────────┐
│ Jarvis Gateway │
│ │
│ ┌─────────┐ ┌─────────┐ ┌──────────┐ ┌──────────┐ │
│ │ Feishu │ │ WeChat │ │ Discord │ │ Telegram │ │
│ └────┬────┘ └────┬────┘ └────┬─────┘ └────┬─────┘ │
│ └────────────┼────────────┼──────────────┘ │
│ ▼ │
│ ┌────────────────┐ │
│ │ Message Router │ ← 按渠道/群路由到 Agent │
│ └───────┬────────┘ │
│ ▼ │
│ ┌──────────────────────┐ │
│ │ Agent Registry │ │
│ │ ┌────────────────┐ │ │
│ │ │ jarvis (主管家) │ ← SOUL-jarvis.md │
│ │ │ agent-b (营养) │ ← SOUL-nutrition.md │
│ │ │ agent-c (游戏) │ ← SOUL-gaming.md │
│ │ └────────────────┘ │ │
│ └──────────┬───────────┘ │
│ ▼ │
│ ┌────────────────┐ │
│ │ Memory Router │ ← scope: global/agent/user │
│ └───────┬────────┘ │
└────────────────┼─────────────────────────────────────────┘
▼
┌────────────────────────────┐
│ Mem0 Memory Layer │
│ │
│ ┌──────┐ ┌───────────┐ │
│ │Vector│ │ Graph │ │
│ │Store │ │ Memory │ │
│ └──┬───┘ └─────┬─────┘ │
│ ▼ ▼ │
│ ┌──────────────────────┐ │
│ │ LanceDB / Qdrant │ │
│ │ + Qwen3-Embedding │ │
│ └──────────────────────┘ │
└────────────────────────────┘
Memory Scope 模型:
┌─────────────────────────────────────────┐
│ GLOBAL 所有 Agent 共享 │
│ (服务器知识、技术决策、基础设施事实) │
├─────────────────────────────────────────┤
│ AGENT 按 agentId 隔离 │
│ (人格偏好、角色行为、SOUL 细化) │
├─────────────────────────────────────────┤
│ USER 按 userId 跨 Agent │
│ (姓名、时区、沟通风格、个人偏好) │
├─────────────────────────────────────────┤
│ SESSION 按对话隔离 │
│ (当前话题、工作上下文、临时决策) │
└─────────────────────────────────────────┘
Jarvis 更强的地方
- 飞书深度集成:Bitable CRUD(8 API)、WebSocket 实时、群聊 @ 过滤、富文本卡片、图片压缩上传。OpenClaw 完全没有飞书支持。(不可替代)
- 自动部署闭环:代码生成 → Nginx → SSL → DNS → 上线,全自动完成。OpenClaw 无内置部署能力。(独有)
- 生产级自动化管线:8 个 Cron 任务覆盖热搜聚合、AI 推荐、日报周报、清理、心跳。已在生产运行,不是”可以做”而是”已经跑”。(生产验证)
- Prompt 自动审核:Skill3 四维度质量审核 + 失败自动重试。SHA256 哈希 Prompt 热检测。OpenClaw 无内置审核机制。(安全优势)
- Agent Teams 执行力:5 种特化子 Agent 并行执行 + 预算控制。OpenClaw 的 Pi Agent 是统一型、按渠道串行。(执行力更强)
- 中国本土化:腾讯 COS、ICP 备案域名、mihomo 代理、飞书+企微双渠道。OpenClaw 在中国大陆几乎无法使用。(本土壁垒)
OpenClaw 更强的地方(值得借鉴)
- 语义记忆检索:SQLite-vec 向量 70% + BM25 关键词 30% 混合检索。Jarvis 只有关键词匹配,“反向代理”不等于”nginx”找不到。(核心差距,P1 升级)
- Multi-SOUL.md:每个 Agent 独立人格 + 记忆,按渠道路由。未来接入 Discord/Telegram 时必须有此能力。(未来必需,P2 规划)
- 渠道广度:15+ 消息渠道开箱即用。Jarvis 适配器模式设计好但只有 2 个实现。(按需扩展)
- Canvas 可视化:A2UI Canvas 让 Agent 实时渲染交互式界面。Jarvis 只能输出飞书卡片 Markdown。(可考虑)
冗余项分析
| 模块 | 状态 | 评估 | 建议 |
|---|---|---|---|
| MemoryMetrics | 106 行,6 维度采集 | 采集了但没消费端(无仪表盘、无告警) | 浪费,要么接告警,要么精简 |
| PM2 残留 | .pm2 目录存在 | 已迁移到 systemd,完全无用 | 清理 |
| Task 临时部署 | t-{id}.mistprism.com | 子域名无过期清理机制 | 加 TTL 自动过期 |
| 企微适配器 | 708 行 | 如使用率低,15% 代码量投产比不划算 | 评估使用率 |
| 可观测仪表盘 | 无 | 单人场景飞书通知够用,OpenClaw 的 Clawtrol/ClawMetry 是给多人团队的 | 暂不需要 |
修正后进阶路线
P1 - 本月:记忆系统升级
引入语义检索。当前关键词匹配 → Embedding 向量 + 关键词混合检索。
- 方案 A(最轻量):LanceDB 嵌入式 + OpenAI text-embedding-3-small API
- 方案 B(自主可控):LanceDB + Qwen3-Embedding-0.6B (Ollama 本地)
- 方案 C(功能最全):Mem0 SDK + Qdrant + Qwen3-Embedding
- 保留现有 MemoryManager 作为 fallback,渐进迁移
- 预计工作量:方案 A 约 2-3 天,方案 C 约 5-7 天
P2 - 下月:Multi-SOUL 人格系统
为未来多渠道、多角色做准备。
- 创建 SOUL-{agentId}.md 文件,每个 Agent 独立人格和系统提示词
- Message Router:按渠道 / 群 ID / @ 对象路由到对应 Agent
- Memory Scope:global / agent / user / session 四级隔离
- 共享知识层:基础设施知识、项目信息所有 Agent 可读
- 预计工作量:5-7 天
P3 - 下月:新渠道接入(Discord 等)
当前适配器模式已支持扩展,按需新增。
- 基于 ChannelAdapter 基类新增 DiscordAdapter
- 与 Multi-SOUL 配合:Discord 渠道 → 指定 Agent 人格
- 预计工作量:2-3 天 / 渠道
P4 - 远期:MCP 动态配置 + 声明式 Skill 注册
当前 3 个 MCP 稳定够用,等需要第 4 个时再做。
- 创建 mcp-config.json 统一管理,支持运行时增删
- SKILL.yaml 声明式定义,自动注册
- 预计工作量:2-3 天
P5 - 远期:配置中心化 + Skill5 回溯完善
- .env + config.js → 统一 jarvis.config.json + Zod 校验
- Skill5 回溯学习闭环:分析历史 → 偏好提取 → Prompt 自优化
- 预计工作量:各 2-3 天
结论(修正版)
核心判断
-
差距比初版报告小。 修正后 Jarvis 7.8 vs OpenClaw 8.5,差距 0.7 分(初版 1.3)。Skills 双层体系 + Agent Teams 并行执行 + Prompt 自动审核,这些被初版严重低估了。
-
真正的短板只有一个:语义记忆。 其他维度 Jarvis 要么持平要么领先(飞书生态、自动部署、审核机制、中国本土化)。语义记忆是唯一影响用户体验的核心差距。
-
Multi-SOUL 是未来方向而非当前瓶颈。 当前单管家单渠道够用,但接入 Discord / 多角色时就必须有了。建议 P2 优先级。
-
不需要仪表盘、不需要追渠道数量。 单人场景飞书通知够用;渠道按需扩展,不用追 OpenClaw 的 15 个。
一句话总结
Jarvis 的架构已经比初版评估的成熟得多。当前最高 ROI 的升级是记忆系统语义化(Mem0 + LanceDB),其次是Multi-SOUL 多人格为未来多渠道铺路。其他差距要么不影响(社区生态)、要么不需要(15 个渠道)、要么已经够用(可观测性)。
Jarvis vs OpenClaw Architecture Review v2 | 2026-02-22 Generated by Jarvis Agent Teams (3 parallel sub-agents) Sources: OpenClaw GitHub, Mem0, LanceDB, Qdrant, Zep/Graphiti, VikingDB, OpenViking, Qwen3-Embedding