MBE 引擎工具扩展分析 —— 基于 Claude 平台工具文档
版本: v1.2 | 日期: 2026-02-12 参考: Claude Platform 工具文档
零、可行性约束(重要)
国内访问限制
MBE 当前通过 OpenRouter 中转访问 Claude,而非直接调用 Anthropic API。这带来以下约束:
| Claude 工具类型 | 是否可通过 OpenRouter 使用 | 说明 |
|---|---|---|
| 服务器端工具 (web_search, web_fetch, code_execution) | 不可以 | 这些工具在 Anthropic 服务器上运行,需要直接调用 api.anthropic.com,OpenRouter 不支持透传 |
| 客户端工具 (memory, text_editor, computer_use, bash) | 可以 | 客户端工具由 MBE 自己实现和执行,与 LLM 提供商无关 |
| Tool Search | 不可以(服务器端变体) | 但可以自己实现客户端版本的工具搜索 |
国内可直接访问的 API 服务
| 服务 | 国内直连 | 说明 |
|---|---|---|
OpenRouter (openrouter.ai) |
需代理 | MBE 已通过 Cloudflare Tunnel 解决 |
DeepSeek (api.deepseek.com) |
可直连 | MBE 默认 LLM 提供商 |
通义千问 (dashscope.aliyuncs.com) |
可直连 | 阿里云服务 |
豆包 (ark.cn-beijing.volces.com) |
可直连 | 字节跳动服务 |
Anthropic (api.anthropic.com) |
不可直连 | 需代理或中转 |
搜索服务质量与成本对比
| 搜索服务 | 准确率 (SimpleQA) | 定价 | 国内可直连 | 中文质量 | 适合 MBE |
|---|---|---|---|---|---|
| Claude Web Search | ~90%+ | $10/1,000 次 | 不可 | 一般 | 不可用(服务器端工具) |
| Tavily AI Search | 93.3% | 免费 1,000次/月 → $5/1,000 次 | 需代理 | 一般 | 首选(AI Agent 专用,准确率最高) |
| ~80% | - | 已退役 (2025.8) | |||
| Google (via Serper) | 82.15% | $2.5/1,000 次 | 需代理 | 好 | 备选 |
| SearXNG | 依赖上游引擎 | 免费(自建) | 可直连 | 依赖引擎 | 推荐(零成本 + 隐私) |
| 博查 AI Search | 未公开 | 免费 500次/天 | 可直连 | 最佳 | 强烈推荐(国内首选) |
| Perplexity Sonar | 与 GPT-4o 相当 | $5/1,000 次 | 需代理 | 好 | 高质量但需代理 |
数据来源:Tavily Search Evals · YOU.com 2025 API Benchmark · KnewSearch 2026 AI Visibility Report
质量分析
Tier 1 — AI 原生搜索(为 LLM/Agent 设计):
- Tavily:SimpleQA 准确率 93.3%,比 Google (Serper) 高 11 个百分点。返回结构化 JSON,包含摘要、引用、相关度评分,零集成成本。SOC 2 认证。
- 博查 AI Search:国产方案,支持 Web/AI/Agent 三种搜索模式,内置语义 Reranker,中文搜索质量最优,符合国内数据合规要求。
Tier 2 — 元搜索引擎(聚合多源):
- SearXNG:聚合 247+ 搜索引擎(Google、Bing、DuckDuckGo、Wolfram Alpha 等),质量取决于上游引擎,自建零成本、完全隐私。适合预算有限的初期阶段。
Tier 3 — 传统搜索 API:
Bing Search API:已于 2025 年 8 月退役,微软推荐迁移到 Azure AI Agents 的 "Grounding with Bing Search"。- Google (via Serper/SerpAPI):质量好但国内不可直连,需代理。
推荐方案
MBE 应采用"博查 + Tavily"双通道方案:
- 博查 AI Search 作为主通道(国内直连、中文最优、免费额度充裕)
- Tavily 作为备用/英文通道(准确率最高、AI Agent 专用设计)
- SearXNG 作为兜底方案(完全免费、无限额度、自建可控)
不依赖任何 Claude/Anthropic 服务器端工具,全部自建为 MBE MCP 客户端工具。
一、背景
Claude 平台目前提供了 8 大类工具(Web Search、Web Fetch、Memory、Code Execution、Tool Search、Computer Use、Text Editor、Bash Tool),覆盖了信息获取、持久化记忆、代码执行、动态工具发现、桌面操作等能力。
MBE 引擎当前在 tools.py 中注册了 8 个 MCP 工具(mises_analyze、ask_expert、list_experts、mises_feedback、capture_and_analyze、analyze_image、get_camera_upload_info、request_human_review),而在 server.py 中实际处理了 100+ 工具调用(QT2、经济学、销售、教育、健身、美食、哲学等领域)。
本文档对比分析 Claude 平台的工具体系与 MBE 现状,提出需要添加的工具及实施路线图。
二、Claude 平台工具全景 vs MBE 现状
| # | Claude 平台工具 | 类型 | 版本标识 | MBE 实现状态 | 实现方案 |
|---|---|---|---|---|---|
| 1 | Web Search (网络搜索) | 服务器端 | web_search_20250305 |
✅ 已实现 | 三通道容灾:博查→Tavily→SearXNG (search_providers.py) |
| 2 | Web Fetch (网页获取) | 服务器端 | web_fetch_20250910 |
✅ 已实现 | httpx + BeautifulSoup + pypdf (web_fetch_provider.py) |
| 3 | Memory (记忆工具) | 客户端 | memory_20250818 |
✅ 已实现 | PostgreSQL 持久化 + TITANS 互补 (memory_provider.py) |
| 4 | Code Execution (代码执行) | 服务器端 | code_execution_20250825 |
✅ 已实现 | AST 安全检查 + subprocess 沙箱 (code_execution_provider.py) |
| 5 | Tool Search (工具搜索) | 服务器端 | tool_search_tool_bm25_20251119 |
✅ 已实现 | IDF 加权搜索,115 工具 / 20 领域 (tool_search_provider.py) |
| 6 | Computer Use (计算机使用) | 客户端 | computer_20250124 |
✅ 已实现 | pyautogui 跨平台桌面控制 (computer_use_provider.py) |
| 7 | Text Editor (文本编辑器) | 客户端 | text_editor_20250124 |
⚡ 已覆盖 | Memory Tool 的 str_replace/insert 操作已覆盖 |
| 8 | Bash Tool (命令行) | 客户端 | bash_20250124 |
⚡ 内部已有 | CodeRunner (src/deploy/code_runner.py) 面向运维 |
三、需要添加的工具详细分析
3.1 web_search — 网络搜索工具 (最高优先)
为什么 MBE 急需它:
- MBE 的专家系统(43 个 MoE 专家 + 25+ 领域专家)目前只能依赖预训练知识和本地知识库(MIRAS),无法访问实时信息
- 法律专家需要查最新法规、金融专家需要查实时行情、健康专家需要查最新医学文献
- 与 MBE 的 Self-Critique "来源引用验证"模块完美互补 —— 有了真实来源可引用,幻觉率将大幅降低
Claude 平台参考:
- 类型:
web_search_20250305(服务器端工具,由 Anthropic 执行) - 定价:$10 / 1,000 次搜索 + 标准 token 费用
- 支持域名过滤(
allowed_domains/blocked_domains)、本地化搜索(user_location) - 结果自带引用(
citations),引用字段不计入 token 用量
注意: Claude Web Search 是 Anthropic 服务器端工具,MBE 通过 OpenRouter 访问无法使用。
Bing Search API 已于 2025.8 退役。MBE 推荐方案:
- 博查 AI Search(国内直连、中文最优、免费 500次/天)
- Tavily(SimpleQA 准确率 93.3%、AI Agent 专用设计)
- SearXNG(免费自建、兜底方案)
建议 MBE 工具定义:
WEB_SEARCH_TOOL = {
"name": "web_search",
"description": """实时网络搜索。当专家回答需要最新信息时自动调用:
- 法律法规查询(最新司法解释、政策变更)
- 金融市场数据(实时行情、公告)
- 医学/健康最新研究
- 时事新闻、行业动态
- 任何需要超出知识截止日期的信息
支持域名过滤和本地化搜索。结果自带引用来源。""",
"inputSchema": {
"type": "object",
"properties": {
"query": {"type": "string", "description": "搜索查询"},
"device_id": {"type": "string", "description": "设备ID"},
"allowed_domains": {
"type": "array", "items": {"type": "string"},
"description": "限定搜索域名(可选)"
},
"max_results": {
"type": "integer", "default": 5,
"description": "最大结果数"
}
},
"required": ["query", "device_id"]
}
}
与 MBE 架构的集成点:
- SmartRouter 在路由到专家前,可先触发
web_search预取上下文(对应 Factor 13: Pre-fetch context) - Self-Critique 的"来源引用验证"模块可直接使用搜索结果做 fact-checking
- 搜索结果进入 MIRAS 的短期记忆,供后续对话引用
3.2 web_fetch — 网页内容获取工具 (最高优先)
为什么 MBE 需要它:
- 配合
web_search使用:搜索找到相关链接后,fetch 获取完整内容 - 支持 PDF 解析 —— 对法律文书、学术论文、技术文档极其重要
- 自带引用系统,可以精确标注"这段回答来自哪份文档的第几段"
Claude 平台参考:
- 类型:
web_fetch_20250910(服务器端工具) - 定价:无额外费用,仅标准 token 费用
- 支持 PDF 自动文本提取
- 可选引用标注(
citations.enabled: true) - 支持
max_content_tokens控制获取内容量 - 安全注意:仅能获取对话上下文中已出现的 URL
注意: 与 web_search 一样,web_fetch 也是 Anthropic 服务器端工具,MBE 无法直接使用。 MBE 应自建 URL 内容提取工具,推荐:Python
httpx+readability-lxml+PyPDF2,实现成本极低。
建议 MBE 工具定义:
WEB_FETCH_TOOL = {
"name": "web_fetch",
"description": """获取指定URL的完整网页或PDF内容。用于:
- 深度阅读搜索结果中的文章
- 解析用户分享的链接内容
- 提取PDF文档(法律文书、论文、报告)
- 获取API文档、技术规范等
支持引用标注,可精确到段落级别。""",
"inputSchema": {
"type": "object",
"properties": {
"url": {"type": "string", "description": "要获取的URL"},
"device_id": {"type": "string", "description": "设备ID"},
"enable_citations": {
"type": "boolean", "default": true,
"description": "是否启用引用标注"
}
},
"required": ["url", "device_id"]
}
}
与 web_search 协同工作流:
- 用户提问 → 专家判断需要最新信息
- 调用
web_search搜索相关内容 → 返回搜索结果列表 - 调用
web_fetch获取最相关的文章全文 → 返回带引用的完整内容 - 专家基于获取的内容生成带引用的回答
- Self-Critique 验证引用来源的真实性
3.3 mises_memory — 持久化记忆工具 (高优先)
为什么这对 MBE 至关重要:
- MBE 已有 TITANS 三层记忆,但记忆存储在神经网络参数中(Factor 12 指出的问题),不可审计、不可重放
- Claude 的 Memory Tool 理念更优:记忆是文件,可创建/读取/更新/删除,完全持久化
- 直接解决 Factor 5(统一状态)和 Factor 6(暂停/恢复)中的痛点
- 与 Claude 的"上下文编辑"能力配合,可支撑无限长对话
Claude 平台参考:
- 类型:
memory_20250818(客户端工具) - 操作:
view/create/str_replace/insert/delete/rename - 自动协议:Claude 在每次任务开始前自动检查记忆目录
- 可与"上下文编辑"配合:上下文窗口满时,Claude 将关键信息保存到记忆,清除旧工具结果后继续工作
建议 MBE 工具定义:
MISES_MEMORY_TOOL = {
"name": "mises_memory",
"description": """持久化记忆管理。在对话间存储和检索用户相关信息:
- 用户偏好、习惯、历史决策
- 行为分析五步框架的中间状态(支持暂停/恢复)
- 专家咨询记录和跟进事项
- 长期目标追踪(职业规划、健康管理等)
支持操作:view/create/update/delete
记忆按用户隔离,跨会话持久化。""",
"inputSchema": {
"type": "object",
"properties": {
"command": {
"type": "string",
"enum": ["view", "create", "str_replace", "insert", "delete"],
"description": "记忆操作命令"
},
"path": {"type": "string", "description": "记忆文件路径"},
"device_id": {"type": "string", "description": "设备ID"},
"user_id": {"type": "string", "description": "用户ID"},
"file_text": {"type": "string", "description": "文件内容(create时)"},
"old_str": {"type": "string", "description": "替换原文(str_replace时)"},
"new_str": {"type": "string", "description": "替换新文(str_replace时)"}
},
"required": ["command", "path", "device_id"]
}
}
与现有 TITANS 的关系:
不是替代,而是互补。TITANS 负责隐式学习(注意力模式、偏好权重),Memory Tool 负责显式知识(用户档案、决策记录、待办事项)。两者通过 session_state 表统一索引。
┌─────────────────────────────────────────┐
│ MBE 记忆双轨系统 │
├──────────────────┬──────────────────────┤
│ TITANS (隐式记忆) │ Memory Tool (显式记忆) │
├──────────────────┼──────────────────────┤
│ 注意力模式偏好 │ 用户档案文件 │
│ 交互风格学习 │ 决策记录 & 跟进事项 │
│ 偏好权重调整 │ 五步框架检查点 │
│ 短/中/长期衰减 │ 持久化,永不丢失 │
│ 不可审计 │ 完全可审计/可重放 │
└──────────────────┴──────────────────────┘
3.4 code_execution — 代码执行工具 (高优先)
为什么 MBE 需要它:
- MBE 已有 QT2 量化交易模块(
get_signals,analyze_stock),但无法执行实时计算 - 金融分析需要精确数值计算、数据可视化
- 教育辅导需要演示代码运行(编程教学、数学计算)
- 数据分析场景(CSV/Excel 处理、统计分析)
Claude 平台参考:
- 类型:
code_execution_20250825(服务器端工具) - 环境:Python 3.11 + Bash,安全沙箱,5GiB RAM
- 预装库:pandas、numpy、scipy、scikit-learn、matplotlib、seaborn 等
- 子工具:
bash_code_execution+text_editor_code_execution - 支持 Files API 上传/下载文件
- 容器可跨请求复用(
container_id) - 无网络访问(安全隔离)
建议 MBE 工具定义:
CODE_EXECUTION_TOOL = {
"name": "code_execution",
"description": """在安全沙箱中执行代码。用于:
- 精确数值计算(金融分析、统计学)
- 数据处理(CSV/Excel分析、图表生成)
- 编程教学演示(运行示例代码)
- 数学公式求解(符号计算)
- 逻辑推理验证(形式化证明)
支持 Python,预装 pandas/numpy/matplotlib 等数据科学库。""",
"inputSchema": {
"type": "object",
"properties": {
"code": {"type": "string", "description": "要执行的Python代码"},
"device_id": {"type": "string", "description": "设备ID"},
"timeout": {
"type": "integer", "default": 30,
"description": "执行超时(秒)"
}
},
"required": ["code", "device_id"]
}
}
对 MBE 各领域专家的赋能:
| 领域专家 | 代码执行场景 |
|---|---|
| QT2 金融分析 | 实时计算 RSI、MACD、收益率,生成 K 线图 |
| 数学教学 | 求解方程、绘制函数图像、验证证明 |
| 逻辑推理 | 形式化逻辑验证、真值表生成 |
| 数据分析 | CSV/Excel 处理、统计检验、数据可视化 |
| 编程教学 | 运行示例代码、调试演示 |
| 健康营养 | BMI 计算、卡路里追踪、营养分析 |
3.5 tool_search — 工具搜索/动态发现工具 (高优先)
为什么这对 MBE 特别重要:
- MBE 在
server.py中有 100+ 工具处理器,但tools.py只注册了 8 个 - Claude 文档明确指出:超过 30-50 个工具时,工具选择准确性会显著下降
- MBE 的场景正好命中这个问题:有 QT2、经济学、销售、教育、健身、美食、哲学等几十个领域工具
- Tool Search 可以让 LLM 按需搜索并加载工具,而不是一次性全部塞入上下文
Claude 平台参考:
- 两种变体:正则表达式搜索(
tool_search_tool_regex_20251119)和 BM25 搜索(tool_search_tool_bm25_20251119) - 每次返回 3-5 个最相关工具
- 支持
defer_loading: true延迟加载 - 最大支持 10,000 个工具目录
- 建议将最常用的 3-5 个工具保持为非延迟
建议 MBE 工具定义:
TOOL_SEARCH_TOOL = {
"name": "mises_tool_search",
"description": """在MBE工具库中搜索合适的工具。当用户问题可能需要特定领域工具时调用:
- 搜索金融工具(股票分析、风险评估)
- 搜索教育工具(辅导、练习)
- 搜索健康工具(运动指导、营养建议)
- 搜索专业工具(法律、建筑、销售)
返回最相关的3-5个工具供后续调用。""",
"inputSchema": {
"type": "object",
"properties": {
"query": {"type": "string", "description": "搜索查询(自然语言)"},
"device_id": {"type": "string", "description": "设备ID"},
"domain": {
"type": "string",
"description": "限定搜索域(可选,如 finance/education/health)"
}
},
"required": ["query", "device_id"]
}
}
架构改进建议:
将 server.py 中的 100+ 工具处理器按域注册到一个工具目录中,支持 BM25 或正则搜索。只有被搜索命中的工具才加载到上下文。
当前架构(有问题):
┌─────────────┐ ┌──────────────────────────┐
│ tools.py │ │ server.py │
│ 8 个工具注册 │ │ 100+ 个处理器(未注册) │
│ MISES_TOOLS │ │ if/elif 链分发 │
└─────────────┘ └──────────────────────────┘
改进后架构:
┌─────────────────────────────────────────────┐
│ 工具目录 (Tool Catalog) │
│ ┌─────────┐ ┌─────────┐ ┌─────────┐ │
│ │核心工具 │ │金融工具 │ │教育工具 │ ... │
│ │(非延迟) │ │(延迟) │ │(延迟) │ │
│ │8个 │ │15个 │ │12个 │ │
│ └─────────┘ └─────────┘ └─────────┘ │
├─────────────────────────────────────────────┤
│ tool_search (BM25/正则) │
│ 按需加载 → 返回 3-5 个工具 │
└─────────────────────────────────────────────┘
3.6 computer_use — 计算机操作工具 (中优先)
适用场景:
- MBE Desktop 应用中,Agent 可以帮用户操作桌面应用
- 老年用户辅助(MBE 有老年医学模块),帮助完成复杂操作
- 自动化测试 MBE Desktop 的 UI 交互
Claude 平台参考:
- 类型:
computer_20250124(客户端工具) - 能力:屏幕截图、鼠标点击、键盘输入、滚动
- 需要客户端实现执行逻辑
3.7 text_editor — 文本编辑工具 (中优先)
适用场景:
- 用户需要起草文档(法律文书、商业计划)
- 配合 Memory Tool 管理记忆文件
- 协作编辑、内容审阅
Claude 平台参考:
- 类型:
text_editor_20250124(客户端工具) - 操作:
view/create/str_replace/insert/undo_edit - 需要客户端实现文件系统操作
四、实施路线图
Phase 1(立即)—— 信息获取能力
├── web_search → 让专家获得实时信息
│ 实现方式:自建客户端工具,博查(主) + Tavily(备) + SearXNG(兜底)
│ 预估工期:2-3 天
└── web_fetch → 深度内容分析 + PDF 解析
实现方式:自建客户端工具(httpx + readability + PyPDF2)
预估工期:2 天
Phase 2(短期,1-2 周)—— 智能管理能力
├── mises_memory → 持久化记忆,解决 Factor 5/6/12
│ 实现方式:客户端工具,基于 PostgreSQL 实现存储后端
│ 预估工期:3-5 天
└── tool_search → 动态工具发现,解决 100+ 工具注册问题
实现方式:重构工具目录 + BM25 搜索引擎
预估工期:3-5 天
Phase 3(中期,2-4 周)—— 计算与执行能力
├── code_execution → 精确计算 + 数据可视化
│ 实现方式:自建 Docker 沙箱(参考 Claude 设计:5GiB RAM、无网络、30s 超时)
│ 预估工期:5-7 天
└── text_editor → 文档编辑能力
实现方式:客户端工具,基于文件系统
预估工期:2-3 天
Phase 4(远期,1-2 月)—— 自动化操作能力
└── computer_use → 桌面操作辅助
实现方式:Electron IPC 集成
预估工期:2-3 周
五、与 12-Factor Agents 改进计划的关联
| 新工具 | 解决的 Factor | 具体价值 |
|---|---|---|
web_search |
Factor 13 (预取上下文) | 专家回答前预取最新信息,减少幻觉 |
web_fetch |
Factor 3 (上下文工程) | 丰富上下文来源,精确引用减少幻觉 |
mises_memory |
Factor 5+6+12 (状态/暂停/无状态) | 显式持久化状态,支持暂停恢复,可审计 |
tool_search |
Factor 10 (小而专注) | 让 100+ 工具按需加载,不污染上下文 |
code_execution |
Factor 4 (结构化输出) | 精确计算作为结构化工具输出 |
text_editor |
Factor 9 (错误压缩进上下文) | 编辑操作的结构化反馈 |
六、关键架构建议
6.1 自建搜索和内容获取工具(替代 Claude 服务器端工具)
由于 MBE 通过 OpenRouter 中转访问 Claude,无法使用 Anthropic 服务器端工具(web_search / web_fetch / code_execution)。需要自建客户端工具,作为 MCP 工具注册到 MBE。
推荐技术栈:
| 能力 | 推荐方案 | 成本 | 国内可用 | 质量 |
|---|---|---|---|---|
| 网络搜索 | 博查 AI Search (主) + Tavily (备) | 免费→$5/千次 | 博查可直连 | 93.3% (Tavily) |
| 网页获取 | httpx + readability-lxml + BeautifulSoup |
免费 | 可直连 | 好 |
| PDF 解析 | PyPDF2 / pdfplumber |
免费 | 本地执行 | 好 |
| 代码执行 | Docker 沙箱 + subprocess |
免费 | 本地执行 | 好 |
实现模式:MBE 客户端工具(LLM 发起调用 → MBE 执行 → 结果返回 LLM)
# 在 MBE server.py 中处理搜索工具调用
async def _handle_web_search(self, params: dict) -> dict:
"""MBE 自建搜索:博查(主) + Tavily(备) 双通道"""
query = params["query"]
async with httpx.AsyncClient() as client:
# 方案 A(主通道):博查 AI Search(国内直连,中文最优)
try:
resp = await client.post(
"https://api.bochaai.com/v1/web-search",
headers={"Authorization": f"Bearer {BOCHA_API_KEY}"},
json={"query": query, "count": 5}
)
results = resp.json()["data"]
return {"source": "bocha", "results": results}
except Exception:
pass
# 方案 B(备用通道):Tavily(准确率 93.3%,AI Agent 专用)
try:
resp = await client.post(
"https://api.tavily.com/search",
json={"api_key": TAVILY_API_KEY, "query": query,
"max_results": 5, "include_answer": True}
)
return {"source": "tavily", "results": resp.json()["results"]}
except Exception:
pass
# 方案 C(兜底):SearXNG 自建(零成本)
resp = await client.get(
f"http://searxng:8080/search?q={query}&format=json&language=zh-CN"
)
return {"source": "searxng", "results": resp.json()["results"][:5]}
6.2 Memory Tool 与 TITANS 双轨运行
TITANS 负责隐式偏好学习,Memory Tool 负责可审计的显式记忆。两者通过 session_state 表统一索引。
6.3 Tool Search 解决注册断层问题
当前 MISES_TOOLS 只注册了 8 个工具,但 server.py 处理了 100+ 工具。引入 Tool Search 后,所有工具都进入目录但标记 defer_loading: true,只有搜索命中才加载。
6.4 结构化输出标准化(Factor 4)
所有新工具的输入/输出都应定义 Pydantic 模型,便于:
- 监控和审计(决策审计链路)
- 测试和重放(确定性输入输出)
- 错误处理(Factor 9: 错误压缩进上下文)
from pydantic import BaseModel
class WebSearchInput(BaseModel):
query: str
device_id: str
allowed_domains: list[str] | None = None
max_results: int = 5
class WebSearchResult(BaseModel):
url: str
title: str
snippet: str
page_age: str | None = None
七、成本估算(修正版 v1.2:自建方案)
| 工具 | 实现方案 | 定价模式 | 预估月成本(1万用户) |
|---|---|---|---|
| Web Search | 博查 AI Search (主) | 免费 500次/天 (15,000/月) | $0(免费额度内)→ 按需付费 |
| Web Search | Tavily (备用) | 免费 1,000次/月 → $5/1,000 次 | $0-100 |
| Web Search | SearXNG (兜底) | 免费(自建) | 仅服务器 $5-10/月 |
| Web Fetch | 自建(httpx+readability) | 免费 | 仅带宽成本 |
| Memory | PostgreSQL 存储 | 客户端 | 可忽略 |
| Code Execution | Docker 沙箱 | 自建 | 服务器资源成本 |
| Tool Search | BM25 自建 | 自建 | 可忽略 |
对比:
| 方案 | 月成本(1万用户) | 国内可用 | 搜索质量 |
|---|---|---|---|
| Claude 服务器端工具 | $300-700 | 不可用 | ~90%+ |
| 已退役 | |||
| 博查 + Tavily + SearXNG | $5-110 | 完全可用 | 93.3% (Tavily) |
| SearXNG 全自建 | $5-10 | 完全可用 | 依赖上游引擎 |
结论: 自建方案不仅解决国内访问问题,成本降低 85-98%,且搜索质量(Tavily 93.3%)超过 Google (82.15%)。
八、参考文档
| 文档 | 链接 |
|---|---|
| Claude 工具使用概览 | overview |
| Web Search 工具 | web-search-tool |
| Web Fetch 工具 | web-fetch-tool |
| Memory 工具 | memory-tool |
| Code Execution 工具 | code-execution-tool |
| Tool Search 工具 | tool-search-tool |
| Computer Use 工具 | computer-use-tool |
| Text Editor 工具 | text-editor-tool |
| MBE 现有工具定义 | mises-behavior-engine/src/mcp/tools.py |
| MBE MCP 服务器 | mises-behavior-engine/src/mcp/server.py |
| 12-Factor Agents 分析 | 2-Factor Agents 对 MBE 的价值分析.md |
| 12-Factor 实施计划 | docs/MBE_12FACTOR_IMPLEMENTATION_PLAN.md |
MBE Claude 工具扩展分析 v1.2 | 2026-02-12