MBE 引擎工具扩展分析 —— 基于 Claude 平台工具文档

版本: v1.2 | 日期: 2026-02-12 参考: Claude Platform 工具文档

零、可行性约束（重要）

国内访问限制

MBE 当前通过 OpenRouter 中转访问 Claude，而非直接调用 Anthropic API。这带来以下约束：

Claude 工具类型	是否可通过 OpenRouter 使用	说明
服务器端工具 (web_search, web_fetch, code_execution)	不可以	这些工具在 Anthropic 服务器上运行，需要直接调用 `api.anthropic.com`，OpenRouter 不支持透传
客户端工具 (memory, text_editor, computer_use, bash)	可以	客户端工具由 MBE 自己实现和执行，与 LLM 提供商无关
Tool Search	不可以（服务器端变体）	但可以自己实现客户端版本的工具搜索

国内可直接访问的 API 服务

服务	国内直连	说明
OpenRouter (`openrouter.ai`)	需代理	MBE 已通过 Cloudflare Tunnel 解决
DeepSeek (`api.deepseek.com`)	可直连	MBE 默认 LLM 提供商
通义千问 (`dashscope.aliyuncs.com`)	可直连	阿里云服务
豆包 (`ark.cn-beijing.volces.com`)	可直连	字节跳动服务
Anthropic (`api.anthropic.com`)	不可直连	需代理或中转

搜索服务质量与成本对比

搜索服务	准确率 (SimpleQA)	定价	国内可直连	中文质量	适合 MBE
Claude Web Search	~90%+	$10/1,000 次	不可	一般	不可用（服务器端工具）
Tavily AI Search	93.3%	免费 1,000次/月 → $5/1,000 次	需代理	一般	首选（AI Agent 专用，准确率最高）
~~Bing Search API~~	~80%	~~$3/1,000 次~~	~~可直连~~	-	已退役 (2025.8)
Google (via Serper)	82.15%	$2.5/1,000 次	需代理	好	备选
SearXNG	依赖上游引擎	免费（自建）	可直连	依赖引擎	推荐（零成本 + 隐私）
博查 AI Search	未公开	免费 500次/天	可直连	最佳	强烈推荐（国内首选）
Perplexity Sonar	与 GPT-4o 相当	$5/1,000 次	需代理	好	高质量但需代理

数据来源：Tavily Search Evals · YOU.com 2025 API Benchmark · KnewSearch 2026 AI Visibility Report

质量分析

Tier 1 — AI 原生搜索（为 LLM/Agent 设计）：

Tavily：SimpleQA 准确率 93.3%，比 Google (Serper) 高 11 个百分点。返回结构化 JSON，包含摘要、引用、相关度评分，零集成成本。SOC 2 认证。
博查 AI Search：国产方案，支持 Web/AI/Agent 三种搜索模式，内置语义 Reranker，中文搜索质量最优，符合国内数据合规要求。

Tier 2 — 元搜索引擎（聚合多源）：

SearXNG：聚合 247+ 搜索引擎（Google、Bing、DuckDuckGo、Wolfram Alpha 等），质量取决于上游引擎，自建零成本、完全隐私。适合预算有限的初期阶段。

Tier 3 — 传统搜索 API：

~~Bing Search API~~：已于 2025 年 8 月退役，微软推荐迁移到 Azure AI Agents 的 "Grounding with Bing Search"。
Google (via Serper/SerpAPI)：质量好但国内不可直连，需代理。

一、背景

Claude 平台目前提供了 8 大类工具（Web Search、Web Fetch、Memory、Code Execution、Tool Search、Computer Use、Text Editor、Bash Tool），覆盖了信息获取、持久化记忆、代码执行、动态工具发现、桌面操作等能力。

MBE 引擎当前在 tools.py 中注册了 8 个 MCP 工具（mises_analyze、ask_expert、list_experts、mises_feedback、capture_and_analyze、analyze_image、get_camera_upload_info、request_human_review），而在 server.py 中实际处理了 100+ 工具调用（QT2、经济学、销售、教育、健身、美食、哲学等领域）。

本文档对比分析 Claude 平台的工具体系与 MBE 现状，提出需要添加的工具及实施路线图。

二、Claude 平台工具全景 vs MBE 现状

#	Claude 平台工具	类型	版本标识	MBE 实现状态	实现方案
1	Web Search (网络搜索)	服务器端	`web_search_20250305`	✅ 已实现	三通道容灾：博查→Tavily→SearXNG (`search_providers.py`)
2	Web Fetch (网页获取)	服务器端	`web_fetch_20250910`	✅ 已实现	httpx + BeautifulSoup + pypdf (`web_fetch_provider.py`)
3	Memory (记忆工具)	客户端	`memory_20250818`	✅ 已实现	PostgreSQL 持久化 + TITANS 互补 (`memory_provider.py`)
4	Code Execution (代码执行)	服务器端	`code_execution_20250825`	✅ 已实现	AST 安全检查 + subprocess 沙箱 (`code_execution_provider.py`)
5	Tool Search (工具搜索)	服务器端	`tool_search_tool_bm25_20251119`	✅ 已实现	IDF 加权搜索，115 工具 / 20 领域 (`tool_search_provider.py`)
6	Computer Use (计算机使用)	客户端	`computer_20250124`	✅ 已实现	pyautogui 跨平台桌面控制 (`computer_use_provider.py`)
7	Text Editor (文本编辑器)	客户端	`text_editor_20250124`	⚡ 已覆盖	Memory Tool 的 str_replace/insert 操作已覆盖
8	Bash Tool (命令行)	客户端	`bash_20250124`	⚡ 内部已有	`CodeRunner` (src/deploy/code_runner.py) 面向运维

三、需要添加的工具详细分析

3.1 `web_search` — 网络搜索工具 (最高优先)

为什么 MBE 急需它：

MBE 的专家系统（43 个 MoE 专家 + 25+ 领域专家）目前只能依赖预训练知识和本地知识库（MIRAS），无法访问实时信息
法律专家需要查最新法规、金融专家需要查实时行情、健康专家需要查最新医学文献
与 MBE 的 Self-Critique "来源引用验证"模块完美互补 —— 有了真实来源可引用，幻觉率将大幅降低

Claude 平台参考：

类型：web_search_20250305（服务器端工具，由 Anthropic 执行）
定价：$10 / 1,000 次搜索 + 标准 token 费用
支持域名过滤（allowed_domains / blocked_domains）、本地化搜索（user_location）
结果自带引用（citations），引用字段不计入 token 用量

注意： Claude Web Search 是 Anthropic 服务器端工具，MBE 通过 OpenRouter 访问无法使用。 ~~Bing Search API 已于 2025.8 退役~~。MBE 推荐方案：

博查 AI Search（国内直连、中文最优、免费 500次/天）

Tavily（SimpleQA 准确率 93.3%、AI Agent 专用设计）

SearXNG（免费自建、兜底方案）

建议 MBE 工具定义：

WEB_SEARCH_TOOL = {
    "name": "web_search",
    "description": """实时网络搜索。当专家回答需要最新信息时自动调用：
- 法律法规查询（最新司法解释、政策变更）
- 金融市场数据（实时行情、公告）
- 医学/健康最新研究
- 时事新闻、行业动态
- 任何需要超出知识截止日期的信息

支持域名过滤和本地化搜索。结果自带引用来源。""",
    "inputSchema": {
        "type": "object",
        "properties": {
            "query": {"type": "string", "description": "搜索查询"},
            "device_id": {"type": "string", "description": "设备ID"},
            "allowed_domains": {
                "type": "array", "items": {"type": "string"},
                "description": "限定搜索域名（可选）"
            },
            "max_results": {
                "type": "integer", "default": 5,
                "description": "最大结果数"
            }
        },
        "required": ["query", "device_id"]
    }
}

与 MBE 架构的集成点：

SmartRouter 在路由到专家前，可先触发 web_search 预取上下文（对应 Factor 13: Pre-fetch context）
Self-Critique 的"来源引用验证"模块可直接使用搜索结果做 fact-checking
搜索结果进入 MIRAS 的短期记忆，供后续对话引用

3.2 `web_fetch` — 网页内容获取工具 (最高优先)

为什么 MBE 需要它：

配合 web_search 使用：搜索找到相关链接后，fetch 获取完整内容
支持 PDF 解析 —— 对法律文书、学术论文、技术文档极其重要
自带引用系统，可以精确标注"这段回答来自哪份文档的第几段"

Claude 平台参考：

类型：web_fetch_20250910（服务器端工具）
定价：无额外费用，仅标准 token 费用
支持 PDF 自动文本提取
可选引用标注（citations.enabled: true）
支持 max_content_tokens 控制获取内容量
安全注意：仅能获取对话上下文中已出现的 URL

注意： 与 web_search 一样，web_fetch 也是 Anthropic 服务器端工具，MBE 无法直接使用。 MBE 应自建 URL 内容提取工具，推荐：Python httpx + readability-lxml + PyPDF2，实现成本极低。

建议 MBE 工具定义：

WEB_FETCH_TOOL = {
    "name": "web_fetch",
    "description": """获取指定URL的完整网页或PDF内容。用于：
- 深度阅读搜索结果中的文章
- 解析用户分享的链接内容
- 提取PDF文档（法律文书、论文、报告）
- 获取API文档、技术规范等

支持引用标注，可精确到段落级别。""",
    "inputSchema": {
        "type": "object",
        "properties": {
            "url": {"type": "string", "description": "要获取的URL"},
            "device_id": {"type": "string", "description": "设备ID"},
            "enable_citations": {
                "type": "boolean", "default": true,
                "description": "是否启用引用标注"
            }
        },
        "required": ["url", "device_id"]
    }
}

与 web_search 协同工作流：

用户提问 → 专家判断需要最新信息
调用 web_search 搜索相关内容 → 返回搜索结果列表
调用 web_fetch 获取最相关的文章全文 → 返回带引用的完整内容
专家基于获取的内容生成带引用的回答
Self-Critique 验证引用来源的真实性

3.3 `mises_memory` — 持久化记忆工具 (高优先)

为什么这对 MBE 至关重要：

MBE 已有 TITANS 三层记忆，但记忆存储在神经网络参数中（Factor 12 指出的问题），不可审计、不可重放
Claude 的 Memory Tool 理念更优：记忆是文件，可创建/读取/更新/删除，完全持久化
直接解决 Factor 5（统一状态）和 Factor 6（暂停/恢复）中的痛点
与 Claude 的"上下文编辑"能力配合，可支撑无限长对话

Claude 平台参考：

类型：memory_20250818（客户端工具）
操作：view / create / str_replace / insert / delete / rename
自动协议：Claude 在每次任务开始前自动检查记忆目录
可与"上下文编辑"配合：上下文窗口满时，Claude 将关键信息保存到记忆，清除旧工具结果后继续工作

建议 MBE 工具定义：

MISES_MEMORY_TOOL = {
    "name": "mises_memory",
    "description": """持久化记忆管理。在对话间存储和检索用户相关信息：
- 用户偏好、习惯、历史决策
- 行为分析五步框架的中间状态（支持暂停/恢复）
- 专家咨询记录和跟进事项
- 长期目标追踪（职业规划、健康管理等）

支持操作：view/create/update/delete
记忆按用户隔离，跨会话持久化。""",
    "inputSchema": {
        "type": "object",
        "properties": {
            "command": {
                "type": "string",
                "enum": ["view", "create", "str_replace", "insert", "delete"],
                "description": "记忆操作命令"
            },
            "path": {"type": "string", "description": "记忆文件路径"},
            "device_id": {"type": "string", "description": "设备ID"},
            "user_id": {"type": "string", "description": "用户ID"},
            "file_text": {"type": "string", "description": "文件内容（create时）"},
            "old_str": {"type": "string", "description": "替换原文（str_replace时）"},
            "new_str": {"type": "string", "description": "替换新文（str_replace时）"}
        },
        "required": ["command", "path", "device_id"]
    }
}

与现有 TITANS 的关系：

不是替代，而是互补。TITANS 负责隐式学习（注意力模式、偏好权重），Memory Tool 负责显式知识（用户档案、决策记录、待办事项）。两者通过 session_state 表统一索引。

┌─────────────────────────────────────────┐
│            MBE 记忆双轨系统              │
├──────────────────┬──────────────────────┤
│ TITANS (隐式记忆) │ Memory Tool (显式记忆) │
├──────────────────┼──────────────────────┤
│ 注意力模式偏好     │ 用户档案文件          │
│ 交互风格学习       │ 决策记录 & 跟进事项    │
│ 偏好权重调整       │ 五步框架检查点         │
│ 短/中/长期衰减     │ 持久化，永不丢失       │
│ 不可审计           │ 完全可审计/可重放      │
└──────────────────┴──────────────────────┘

3.4 `code_execution` — 代码执行工具 (高优先)

为什么 MBE 需要它：

MBE 已有 QT2 量化交易模块（get_signals, analyze_stock），但无法执行实时计算
金融分析需要精确数值计算、数据可视化
教育辅导需要演示代码运行（编程教学、数学计算）
数据分析场景（CSV/Excel 处理、统计分析）

Claude 平台参考：

类型：code_execution_20250825（服务器端工具）
环境：Python 3.11 + Bash，安全沙箱，5GiB RAM
预装库：pandas、numpy、scipy、scikit-learn、matplotlib、seaborn 等
子工具：bash_code_execution + text_editor_code_execution
支持 Files API 上传/下载文件
容器可跨请求复用（container_id）
无网络访问（安全隔离）

建议 MBE 工具定义：

CODE_EXECUTION_TOOL = {
    "name": "code_execution",
    "description": """在安全沙箱中执行代码。用于：
- 精确数值计算（金融分析、统计学）
- 数据处理（CSV/Excel分析、图表生成）
- 编程教学演示（运行示例代码）
- 数学公式求解（符号计算）
- 逻辑推理验证（形式化证明）

支持 Python，预装 pandas/numpy/matplotlib 等数据科学库。""",
    "inputSchema": {
        "type": "object",
        "properties": {
            "code": {"type": "string", "description": "要执行的Python代码"},
            "device_id": {"type": "string", "description": "设备ID"},
            "timeout": {
                "type": "integer", "default": 30,
                "description": "执行超时（秒）"
            }
        },
        "required": ["code", "device_id"]
    }
}

对 MBE 各领域专家的赋能：

领域专家	代码执行场景
QT2 金融分析	实时计算 RSI、MACD、收益率，生成 K 线图
数学教学	求解方程、绘制函数图像、验证证明
逻辑推理	形式化逻辑验证、真值表生成
数据分析	CSV/Excel 处理、统计检验、数据可视化
编程教学	运行示例代码、调试演示
健康营养	BMI 计算、卡路里追踪、营养分析

3.5 `tool_search` — 工具搜索/动态发现工具 (高优先)

为什么这对 MBE 特别重要：

MBE 在 server.py 中有 100+ 工具处理器，但 tools.py 只注册了 8 个
Claude 文档明确指出：超过 30-50 个工具时，工具选择准确性会显著下降
MBE 的场景正好命中这个问题：有 QT2、经济学、销售、教育、健身、美食、哲学等几十个领域工具
Tool Search 可以让 LLM 按需搜索并加载工具，而不是一次性全部塞入上下文

Claude 平台参考：

两种变体：正则表达式搜索（tool_search_tool_regex_20251119）和 BM25 搜索（tool_search_tool_bm25_20251119）
每次返回 3-5 个最相关工具
支持 defer_loading: true 延迟加载
最大支持 10,000 个工具目录
建议将最常用的 3-5 个工具保持为非延迟

建议 MBE 工具定义：

TOOL_SEARCH_TOOL = {
    "name": "mises_tool_search",
    "description": """在MBE工具库中搜索合适的工具。当用户问题可能需要特定领域工具时调用：
- 搜索金融工具（股票分析、风险评估）
- 搜索教育工具（辅导、练习）
- 搜索健康工具（运动指导、营养建议）
- 搜索专业工具（法律、建筑、销售）

返回最相关的3-5个工具供后续调用。""",
    "inputSchema": {
        "type": "object",
        "properties": {
            "query": {"type": "string", "description": "搜索查询（自然语言）"},
            "device_id": {"type": "string", "description": "设备ID"},
            "domain": {
                "type": "string",
                "description": "限定搜索域（可选，如 finance/education/health）"
            }
        },
        "required": ["query", "device_id"]
    }
}

架构改进建议：

将 server.py 中的 100+ 工具处理器按域注册到一个工具目录中，支持 BM25 或正则搜索。只有被搜索命中的工具才加载到上下文。

当前架构（有问题）：
┌─────────────┐    ┌──────────────────────────┐
│ tools.py    │    │ server.py                │
│ 8 个工具注册 │    │ 100+ 个处理器（未注册）    │
│ MISES_TOOLS │    │ if/elif 链分发            │
└─────────────┘    └──────────────────────────┘

改进后架构：
┌─────────────────────────────────────────────┐
│              工具目录 (Tool Catalog)          │
│  ┌─────────┐ ┌─────────┐ ┌─────────┐       │
│  │核心工具  │ │金融工具  │ │教育工具  │ ...   │
│  │(非延迟)  │ │(延迟)   │ │(延迟)   │       │
│  │8个      │ │15个     │ │12个     │       │
│  └─────────┘ └─────────┘ └─────────┘       │
├─────────────────────────────────────────────┤
│         tool_search (BM25/正则)              │
│         按需加载 → 返回 3-5 个工具            │
└─────────────────────────────────────────────┘

3.6 `computer_use` — 计算机操作工具 (中优先)

适用场景：

MBE Desktop 应用中，Agent 可以帮用户操作桌面应用
老年用户辅助（MBE 有老年医学模块），帮助完成复杂操作
自动化测试 MBE Desktop 的 UI 交互

Claude 平台参考：

类型：computer_20250124（客户端工具）
能力：屏幕截图、鼠标点击、键盘输入、滚动
需要客户端实现执行逻辑

3.7 `text_editor` — 文本编辑工具 (中优先)

适用场景：

用户需要起草文档（法律文书、商业计划）
配合 Memory Tool 管理记忆文件
协作编辑、内容审阅

Claude 平台参考：

类型：text_editor_20250124（客户端工具）
操作：view / create / str_replace / insert / undo_edit
需要客户端实现文件系统操作

四、实施路线图

Phase 1（立即）—— 信息获取能力
├── web_search    → 让专家获得实时信息
│   实现方式：自建客户端工具，博查(主) + Tavily(备) + SearXNG(兜底)
│   预估工期：2-3 天
└── web_fetch     → 深度内容分析 + PDF 解析
    实现方式：自建客户端工具（httpx + readability + PyPDF2）
    预估工期：2 天

Phase 2（短期，1-2 周）—— 智能管理能力
├── mises_memory  → 持久化记忆，解决 Factor 5/6/12
│   实现方式：客户端工具，基于 PostgreSQL 实现存储后端
│   预估工期：3-5 天
└── tool_search   → 动态工具发现，解决 100+ 工具注册问题
    实现方式：重构工具目录 + BM25 搜索引擎
    预估工期：3-5 天

Phase 3（中期，2-4 周）—— 计算与执行能力
├── code_execution → 精确计算 + 数据可视化
│   实现方式：自建 Docker 沙箱（参考 Claude 设计：5GiB RAM、无网络、30s 超时）
│   预估工期：5-7 天
└── text_editor    → 文档编辑能力
    实现方式：客户端工具，基于文件系统
    预估工期：2-3 天

Phase 4（远期，1-2 月）—— 自动化操作能力
└── computer_use   → 桌面操作辅助
    实现方式：Electron IPC 集成
    预估工期：2-3 周

五、与 12-Factor Agents 改进计划的关联

新工具	解决的 Factor	具体价值
`web_search`	Factor 13 (预取上下文)	专家回答前预取最新信息，减少幻觉
`web_fetch`	Factor 3 (上下文工程)	丰富上下文来源，精确引用减少幻觉
`mises_memory`	Factor 5+6+12 (状态/暂停/无状态)	显式持久化状态，支持暂停恢复，可审计
`tool_search`	Factor 10 (小而专注)	让 100+ 工具按需加载，不污染上下文
`code_execution`	Factor 4 (结构化输出)	精确计算作为结构化工具输出
`text_editor`	Factor 9 (错误压缩进上下文)	编辑操作的结构化反馈

六、关键架构建议

6.1 自建搜索和内容获取工具（替代 Claude 服务器端工具）

由于 MBE 通过 OpenRouter 中转访问 Claude，无法使用 Anthropic 服务器端工具（web_search / web_fetch / code_execution）。需要自建客户端工具，作为 MCP 工具注册到 MBE。

推荐技术栈：

能力	推荐方案	成本	国内可用	质量
网络搜索	博查 AI Search (主) + Tavily (备)	免费→$5/千次	博查可直连	93.3% (Tavily)
网页获取	`httpx` + `readability-lxml` + `BeautifulSoup`	免费	可直连	好
PDF 解析	`PyPDF2` / `pdfplumber`	免费	本地执行	好
代码执行	Docker 沙箱 + `subprocess`	免费	本地执行	好

实现模式：MBE 客户端工具（LLM 发起调用 → MBE 执行 → 结果返回 LLM）

# 在 MBE server.py 中处理搜索工具调用
async def _handle_web_search(self, params: dict) -> dict:
    """MBE 自建搜索：博查(主) + Tavily(备) 双通道"""
    query = params["query"]
    
    async with httpx.AsyncClient() as client:
        # 方案 A（主通道）：博查 AI Search（国内直连，中文最优）
        try:
            resp = await client.post(
                "https://api.bochaai.com/v1/web-search",
                headers={"Authorization": f"Bearer {BOCHA_API_KEY}"},
                json={"query": query, "count": 5}
            )
            results = resp.json()["data"]
            return {"source": "bocha", "results": results}
        except Exception:
            pass
        
        # 方案 B（备用通道）：Tavily（准确率 93.3%，AI Agent 专用）
        try:
            resp = await client.post(
                "https://api.tavily.com/search",
                json={"api_key": TAVILY_API_KEY, "query": query,
                      "max_results": 5, "include_answer": True}
            )
            return {"source": "tavily", "results": resp.json()["results"]}
        except Exception:
            pass
        
        # 方案 C（兜底）：SearXNG 自建（零成本）
        resp = await client.get(
            f"http://searxng:8080/search?q={query}&format=json&language=zh-CN"
        )
        return {"source": "searxng", "results": resp.json()["results"][:5]}

6.2 Memory Tool 与 TITANS 双轨运行

TITANS 负责隐式偏好学习，Memory Tool 负责可审计的显式记忆。两者通过 session_state 表统一索引。

6.3 Tool Search 解决注册断层问题

当前 MISES_TOOLS 只注册了 8 个工具，但 server.py 处理了 100+ 工具。引入 Tool Search 后，所有工具都进入目录但标记 defer_loading: true，只有搜索命中才加载。

6.4 结构化输出标准化（Factor 4）

所有新工具的输入/输出都应定义 Pydantic 模型，便于：

监控和审计（决策审计链路）
测试和重放（确定性输入输出）
错误处理（Factor 9: 错误压缩进上下文）

from pydantic import BaseModel

class WebSearchInput(BaseModel):
    query: str
    device_id: str
    allowed_domains: list[str] | None = None
    max_results: int = 5

class WebSearchResult(BaseModel):
    url: str
    title: str
    snippet: str
    page_age: str | None = None

七、成本估算（修正版 v1.2：自建方案）

工具	实现方案	定价模式	预估月成本（1万用户）
Web Search	博查 AI Search (主)	免费 500次/天 (15,000/月)	$0（免费额度内）→ 按需付费
Web Search	Tavily (备用)	免费 1,000次/月 → $5/1,000 次	$0-100
Web Search	SearXNG (兜底)	免费（自建）	仅服务器 $5-10/月
Web Fetch	自建（httpx+readability）	免费	仅带宽成本
Memory	PostgreSQL 存储	客户端	可忽略
Code Execution	Docker 沙箱	自建	服务器资源成本
Tool Search	BM25 自建	自建	可忽略

对比：

方案	月成本（1万用户）	国内可用	搜索质量
Claude 服务器端工具	$300-700	不可用	~90%+
~~Bing Search API~~	~~$60-150~~	可用	已退役
博查 + Tavily + SearXNG	$5-110	完全可用	93.3% (Tavily)
SearXNG 全自建	$5-10	完全可用	依赖上游引擎

结论： 自建方案不仅解决国内访问问题，成本降低 85-98%，且搜索质量（Tavily 93.3%）超过 Google (82.15%)。

八、参考文档

文档	链接
Claude 工具使用概览	overview
Web Search 工具	web-search-tool
Web Fetch 工具	web-fetch-tool
Memory 工具	memory-tool
Code Execution 工具	code-execution-tool
Tool Search 工具	tool-search-tool
Computer Use 工具	computer-use-tool
Text Editor 工具	text-editor-tool
MBE 现有工具定义	`mises-behavior-engine/src/mcp/tools.py`
MBE MCP 服务器	`mises-behavior-engine/src/mcp/server.py`
12-Factor Agents 分析	`2-Factor Agents 对 MBE 的价值分析.md`
12-Factor 实施计划	`docs/MBE_12FACTOR_IMPLEMENTATION_PLAN.md`

MBE Claude 工具扩展分析 v1.2 | 2026-02-12

MBE 引擎工具扩展分析 —— 基于 Claude 平台工具文档

零、可行性约束（重要）

国内访问限制

国内可直接访问的 API 服务

搜索服务质量与成本对比

质量分析

推荐方案

一、背景

二、Claude 平台工具全景 vs MBE 现状

三、需要添加的工具详细分析

3.1 web_search — 网络搜索工具 (最高优先)

3.2 web_fetch — 网页内容获取工具 (最高优先)

3.3 mises_memory — 持久化记忆工具 (高优先)

3.4 code_execution — 代码执行工具 (高优先)

3.5 tool_search — 工具搜索/动态发现工具 (高优先)

3.6 computer_use — 计算机操作工具 (中优先)

3.7 text_editor — 文本编辑工具 (中优先)

四、实施路线图

五、与 12-Factor Agents 改进计划的关联

六、关键架构建议

6.1 自建搜索和内容获取工具（替代 Claude 服务器端工具）

6.2 Memory Tool 与 TITANS 双轨运行

6.3 Tool Search 解决注册断层问题

6.4 结构化输出标准化（Factor 4）

七、成本估算（修正版 v1.2：自建方案）

八、参考文档

3.1 `web_search` — 网络搜索工具 (最高优先)

3.2 `web_fetch` — 网页内容获取工具 (最高优先)

3.3 `mises_memory` — 持久化记忆工具 (高优先)

3.4 `code_execution` — 代码执行工具 (高优先)

3.5 `tool_search` — 工具搜索/动态发现工具 (高优先)

3.6 `computer_use` — 计算机操作工具 (中优先)

3.7 `text_editor` — 文本编辑工具 (中优先)