MBE 引擎工具扩展分析 —— 基于 Claude 平台工具文档

版本: v1.2 | 日期: 2026-02-12 参考: Claude Platform 工具文档


零、可行性约束(重要)

国内访问限制

MBE 当前通过 OpenRouter 中转访问 Claude,而非直接调用 Anthropic API。这带来以下约束:

Claude 工具类型 是否可通过 OpenRouter 使用 说明
服务器端工具 (web_search, web_fetch, code_execution) 不可以 这些工具在 Anthropic 服务器上运行,需要直接调用 api.anthropic.com,OpenRouter 不支持透传
客户端工具 (memory, text_editor, computer_use, bash) 可以 客户端工具由 MBE 自己实现和执行,与 LLM 提供商无关
Tool Search 不可以(服务器端变体) 但可以自己实现客户端版本的工具搜索

国内可直接访问的 API 服务

服务 国内直连 说明
OpenRouter (openrouter.ai) 需代理 MBE 已通过 Cloudflare Tunnel 解决
DeepSeek (api.deepseek.com) 可直连 MBE 默认 LLM 提供商
通义千问 (dashscope.aliyuncs.com) 可直连 阿里云服务
豆包 (ark.cn-beijing.volces.com) 可直连 字节跳动服务
Anthropic (api.anthropic.com) 不可直连 需代理或中转

搜索服务质量与成本对比

搜索服务 准确率 (SimpleQA) 定价 国内可直连 中文质量 适合 MBE
Claude Web Search ~90%+ $10/1,000 次 不可 一般 不可用(服务器端工具)
Tavily AI Search 93.3% 免费 1,000次/月 → $5/1,000 次 需代理 一般 首选(AI Agent 专用,准确率最高)
Bing Search API ~80% $3/1,000 次 可直连 - 已退役 (2025.8)
Google (via Serper) 82.15% $2.5/1,000 次 需代理 备选
SearXNG 依赖上游引擎 免费(自建) 可直连 依赖引擎 推荐(零成本 + 隐私)
博查 AI Search 未公开 免费 500次/天 可直连 最佳 强烈推荐(国内首选)
Perplexity Sonar 与 GPT-4o 相当 $5/1,000 次 需代理 高质量但需代理

数据来源Tavily Search Evals · YOU.com 2025 API Benchmark · KnewSearch 2026 AI Visibility Report

质量分析

Tier 1 — AI 原生搜索(为 LLM/Agent 设计):

  • Tavily:SimpleQA 准确率 93.3%,比 Google (Serper) 高 11 个百分点。返回结构化 JSON,包含摘要、引用、相关度评分,零集成成本。SOC 2 认证。
  • 博查 AI Search:国产方案,支持 Web/AI/Agent 三种搜索模式,内置语义 Reranker,中文搜索质量最优,符合国内数据合规要求。

Tier 2 — 元搜索引擎(聚合多源):

  • SearXNG:聚合 247+ 搜索引擎(Google、Bing、DuckDuckGo、Wolfram Alpha 等),质量取决于上游引擎,自建零成本、完全隐私。适合预算有限的初期阶段。

Tier 3 — 传统搜索 API:

  • Bing Search API已于 2025 年 8 月退役,微软推荐迁移到 Azure AI Agents 的 "Grounding with Bing Search"。
  • Google (via Serper/SerpAPI):质量好但国内不可直连,需代理。

推荐方案

MBE 应采用"博查 + Tavily"双通道方案:

  • 博查 AI Search 作为主通道(国内直连、中文最优、免费额度充裕)
  • Tavily 作为备用/英文通道(准确率最高、AI Agent 专用设计)
  • SearXNG 作为兜底方案(完全免费、无限额度、自建可控)

不依赖任何 Claude/Anthropic 服务器端工具,全部自建为 MBE MCP 客户端工具。


一、背景

Claude 平台目前提供了 8 大类工具(Web Search、Web Fetch、Memory、Code Execution、Tool Search、Computer Use、Text Editor、Bash Tool),覆盖了信息获取、持久化记忆、代码执行、动态工具发现、桌面操作等能力。

MBE 引擎当前在 tools.py 中注册了 8 个 MCP 工具mises_analyzeask_expertlist_expertsmises_feedbackcapture_and_analyzeanalyze_imageget_camera_upload_inforequest_human_review),而在 server.py 中实际处理了 100+ 工具调用(QT2、经济学、销售、教育、健身、美食、哲学等领域)。

本文档对比分析 Claude 平台的工具体系与 MBE 现状,提出需要添加的工具及实施路线图。


二、Claude 平台工具全景 vs MBE 现状

# Claude 平台工具 类型 版本标识 MBE 实现状态 实现方案
1 Web Search (网络搜索) 服务器端 web_search_20250305 ✅ 已实现 三通道容灾:博查→Tavily→SearXNG (search_providers.py)
2 Web Fetch (网页获取) 服务器端 web_fetch_20250910 ✅ 已实现 httpx + BeautifulSoup + pypdf (web_fetch_provider.py)
3 Memory (记忆工具) 客户端 memory_20250818 ✅ 已实现 PostgreSQL 持久化 + TITANS 互补 (memory_provider.py)
4 Code Execution (代码执行) 服务器端 code_execution_20250825 ✅ 已实现 AST 安全检查 + subprocess 沙箱 (code_execution_provider.py)
5 Tool Search (工具搜索) 服务器端 tool_search_tool_bm25_20251119 ✅ 已实现 IDF 加权搜索,115 工具 / 20 领域 (tool_search_provider.py)
6 Computer Use (计算机使用) 客户端 computer_20250124 ✅ 已实现 pyautogui 跨平台桌面控制 (computer_use_provider.py)
7 Text Editor (文本编辑器) 客户端 text_editor_20250124 ⚡ 已覆盖 Memory Tool 的 str_replace/insert 操作已覆盖
8 Bash Tool (命令行) 客户端 bash_20250124 ⚡ 内部已有 CodeRunner (src/deploy/code_runner.py) 面向运维

三、需要添加的工具详细分析

3.1 web_search — 网络搜索工具 (最高优先)

为什么 MBE 急需它:

  • MBE 的专家系统(43 个 MoE 专家 + 25+ 领域专家)目前只能依赖预训练知识和本地知识库(MIRAS),无法访问实时信息
  • 法律专家需要查最新法规、金融专家需要查实时行情、健康专家需要查最新医学文献
  • 与 MBE 的 Self-Critique "来源引用验证"模块完美互补 —— 有了真实来源可引用,幻觉率将大幅降低

Claude 平台参考:

  • 类型:web_search_20250305(服务器端工具,由 Anthropic 执行)
  • 定价:$10 / 1,000 次搜索 + 标准 token 费用
  • 支持域名过滤(allowed_domains / blocked_domains)、本地化搜索(user_location
  • 结果自带引用(citations),引用字段不计入 token 用量

注意: Claude Web Search 是 Anthropic 服务器端工具,MBE 通过 OpenRouter 访问无法使用。 Bing Search API 已于 2025.8 退役。MBE 推荐方案:

  • 博查 AI Search(国内直连、中文最优、免费 500次/天)
  • Tavily(SimpleQA 准确率 93.3%、AI Agent 专用设计)
  • SearXNG(免费自建、兜底方案)

建议 MBE 工具定义:

WEB_SEARCH_TOOL = {
    "name": "web_search",
    "description": """实时网络搜索。当专家回答需要最新信息时自动调用:
- 法律法规查询(最新司法解释、政策变更)
- 金融市场数据(实时行情、公告)
- 医学/健康最新研究
- 时事新闻、行业动态
- 任何需要超出知识截止日期的信息

支持域名过滤和本地化搜索。结果自带引用来源。""",
    "inputSchema": {
        "type": "object",
        "properties": {
            "query": {"type": "string", "description": "搜索查询"},
            "device_id": {"type": "string", "description": "设备ID"},
            "allowed_domains": {
                "type": "array", "items": {"type": "string"},
                "description": "限定搜索域名(可选)"
            },
            "max_results": {
                "type": "integer", "default": 5,
                "description": "最大结果数"
            }
        },
        "required": ["query", "device_id"]
    }
}

与 MBE 架构的集成点:

  • SmartRouter 在路由到专家前,可先触发 web_search 预取上下文(对应 Factor 13: Pre-fetch context)
  • Self-Critique 的"来源引用验证"模块可直接使用搜索结果做 fact-checking
  • 搜索结果进入 MIRAS 的短期记忆,供后续对话引用

3.2 web_fetch — 网页内容获取工具 (最高优先)

为什么 MBE 需要它:

  • 配合 web_search 使用:搜索找到相关链接后,fetch 获取完整内容
  • 支持 PDF 解析 —— 对法律文书、学术论文、技术文档极其重要
  • 自带引用系统,可以精确标注"这段回答来自哪份文档的第几段"

Claude 平台参考:

  • 类型:web_fetch_20250910(服务器端工具)
  • 定价:无额外费用,仅标准 token 费用
  • 支持 PDF 自动文本提取
  • 可选引用标注(citations.enabled: true
  • 支持 max_content_tokens 控制获取内容量
  • 安全注意:仅能获取对话上下文中已出现的 URL

注意: 与 web_search 一样,web_fetch 也是 Anthropic 服务器端工具,MBE 无法直接使用。 MBE 应自建 URL 内容提取工具,推荐:Python httpx + readability-lxml + PyPDF2,实现成本极低。

建议 MBE 工具定义:

WEB_FETCH_TOOL = {
    "name": "web_fetch",
    "description": """获取指定URL的完整网页或PDF内容。用于:
- 深度阅读搜索结果中的文章
- 解析用户分享的链接内容
- 提取PDF文档(法律文书、论文、报告)
- 获取API文档、技术规范等

支持引用标注,可精确到段落级别。""",
    "inputSchema": {
        "type": "object",
        "properties": {
            "url": {"type": "string", "description": "要获取的URL"},
            "device_id": {"type": "string", "description": "设备ID"},
            "enable_citations": {
                "type": "boolean", "default": true,
                "description": "是否启用引用标注"
            }
        },
        "required": ["url", "device_id"]
    }
}

与 web_search 协同工作流:

  1. 用户提问 → 专家判断需要最新信息
  2. 调用 web_search 搜索相关内容 → 返回搜索结果列表
  3. 调用 web_fetch 获取最相关的文章全文 → 返回带引用的完整内容
  4. 专家基于获取的内容生成带引用的回答
  5. Self-Critique 验证引用来源的真实性

3.3 mises_memory — 持久化记忆工具 (高优先)

为什么这对 MBE 至关重要:

  • MBE 已有 TITANS 三层记忆,但记忆存储在神经网络参数中(Factor 12 指出的问题),不可审计、不可重放
  • Claude 的 Memory Tool 理念更优:记忆是文件,可创建/读取/更新/删除,完全持久化
  • 直接解决 Factor 5(统一状态)和 Factor 6(暂停/恢复)中的痛点
  • 与 Claude 的"上下文编辑"能力配合,可支撑无限长对话

Claude 平台参考:

  • 类型:memory_20250818(客户端工具)
  • 操作:view / create / str_replace / insert / delete / rename
  • 自动协议:Claude 在每次任务开始前自动检查记忆目录
  • 可与"上下文编辑"配合:上下文窗口满时,Claude 将关键信息保存到记忆,清除旧工具结果后继续工作

建议 MBE 工具定义:

MISES_MEMORY_TOOL = {
    "name": "mises_memory",
    "description": """持久化记忆管理。在对话间存储和检索用户相关信息:
- 用户偏好、习惯、历史决策
- 行为分析五步框架的中间状态(支持暂停/恢复)
- 专家咨询记录和跟进事项
- 长期目标追踪(职业规划、健康管理等)

支持操作:view/create/update/delete
记忆按用户隔离,跨会话持久化。""",
    "inputSchema": {
        "type": "object",
        "properties": {
            "command": {
                "type": "string",
                "enum": ["view", "create", "str_replace", "insert", "delete"],
                "description": "记忆操作命令"
            },
            "path": {"type": "string", "description": "记忆文件路径"},
            "device_id": {"type": "string", "description": "设备ID"},
            "user_id": {"type": "string", "description": "用户ID"},
            "file_text": {"type": "string", "description": "文件内容(create时)"},
            "old_str": {"type": "string", "description": "替换原文(str_replace时)"},
            "new_str": {"type": "string", "description": "替换新文(str_replace时)"}
        },
        "required": ["command", "path", "device_id"]
    }
}

与现有 TITANS 的关系:

不是替代,而是互补。TITANS 负责隐式学习(注意力模式、偏好权重),Memory Tool 负责显式知识(用户档案、决策记录、待办事项)。两者通过 session_state 表统一索引。

┌─────────────────────────────────────────┐
│            MBE 记忆双轨系统              │
├──────────────────┬──────────────────────┤
│ TITANS (隐式记忆) │ Memory Tool (显式记忆) │
├──────────────────┼──────────────────────┤
│ 注意力模式偏好     │ 用户档案文件          │
│ 交互风格学习       │ 决策记录 & 跟进事项    │
│ 偏好权重调整       │ 五步框架检查点         │
│ 短/中/长期衰减     │ 持久化,永不丢失       │
│ 不可审计           │ 完全可审计/可重放      │
└──────────────────┴──────────────────────┘

3.4 code_execution — 代码执行工具 (高优先)

为什么 MBE 需要它:

  • MBE 已有 QT2 量化交易模块(get_signals, analyze_stock),但无法执行实时计算
  • 金融分析需要精确数值计算、数据可视化
  • 教育辅导需要演示代码运行(编程教学、数学计算)
  • 数据分析场景(CSV/Excel 处理、统计分析)

Claude 平台参考:

  • 类型:code_execution_20250825(服务器端工具)
  • 环境:Python 3.11 + Bash,安全沙箱,5GiB RAM
  • 预装库:pandas、numpy、scipy、scikit-learn、matplotlib、seaborn 等
  • 子工具:bash_code_execution + text_editor_code_execution
  • 支持 Files API 上传/下载文件
  • 容器可跨请求复用(container_id
  • 无网络访问(安全隔离)

建议 MBE 工具定义:

CODE_EXECUTION_TOOL = {
    "name": "code_execution",
    "description": """在安全沙箱中执行代码。用于:
- 精确数值计算(金融分析、统计学)
- 数据处理(CSV/Excel分析、图表生成)
- 编程教学演示(运行示例代码)
- 数学公式求解(符号计算)
- 逻辑推理验证(形式化证明)

支持 Python,预装 pandas/numpy/matplotlib 等数据科学库。""",
    "inputSchema": {
        "type": "object",
        "properties": {
            "code": {"type": "string", "description": "要执行的Python代码"},
            "device_id": {"type": "string", "description": "设备ID"},
            "timeout": {
                "type": "integer", "default": 30,
                "description": "执行超时(秒)"
            }
        },
        "required": ["code", "device_id"]
    }
}

对 MBE 各领域专家的赋能:

领域专家 代码执行场景
QT2 金融分析 实时计算 RSI、MACD、收益率,生成 K 线图
数学教学 求解方程、绘制函数图像、验证证明
逻辑推理 形式化逻辑验证、真值表生成
数据分析 CSV/Excel 处理、统计检验、数据可视化
编程教学 运行示例代码、调试演示
健康营养 BMI 计算、卡路里追踪、营养分析

3.5 tool_search — 工具搜索/动态发现工具 (高优先)

为什么这对 MBE 特别重要:

  • MBE 在 server.py 中有 100+ 工具处理器,但 tools.py 只注册了 8 个
  • Claude 文档明确指出:超过 30-50 个工具时,工具选择准确性会显著下降
  • MBE 的场景正好命中这个问题:有 QT2、经济学、销售、教育、健身、美食、哲学等几十个领域工具
  • Tool Search 可以让 LLM 按需搜索并加载工具,而不是一次性全部塞入上下文

Claude 平台参考:

  • 两种变体:正则表达式搜索(tool_search_tool_regex_20251119)和 BM25 搜索(tool_search_tool_bm25_20251119
  • 每次返回 3-5 个最相关工具
  • 支持 defer_loading: true 延迟加载
  • 最大支持 10,000 个工具目录
  • 建议将最常用的 3-5 个工具保持为非延迟

建议 MBE 工具定义:

TOOL_SEARCH_TOOL = {
    "name": "mises_tool_search",
    "description": """在MBE工具库中搜索合适的工具。当用户问题可能需要特定领域工具时调用:
- 搜索金融工具(股票分析、风险评估)
- 搜索教育工具(辅导、练习)
- 搜索健康工具(运动指导、营养建议)
- 搜索专业工具(法律、建筑、销售)

返回最相关的3-5个工具供后续调用。""",
    "inputSchema": {
        "type": "object",
        "properties": {
            "query": {"type": "string", "description": "搜索查询(自然语言)"},
            "device_id": {"type": "string", "description": "设备ID"},
            "domain": {
                "type": "string",
                "description": "限定搜索域(可选,如 finance/education/health)"
            }
        },
        "required": ["query", "device_id"]
    }
}

架构改进建议:

server.py 中的 100+ 工具处理器按域注册到一个工具目录中,支持 BM25 或正则搜索。只有被搜索命中的工具才加载到上下文。

当前架构(有问题):
┌─────────────┐    ┌──────────────────────────┐
│ tools.py    │    │ server.py                │
│ 8 个工具注册 │    │ 100+ 个处理器(未注册)    │
│ MISES_TOOLS │    │ if/elif 链分发            │
└─────────────┘    └──────────────────────────┘

改进后架构:
┌─────────────────────────────────────────────┐
│              工具目录 (Tool Catalog)          │
│  ┌─────────┐ ┌─────────┐ ┌─────────┐       │
│  │核心工具  │ │金融工具  │ │教育工具  │ ...   │
│  │(非延迟)  │ │(延迟)   │ │(延迟)   │       │
│  │8个      │ │15个     │ │12个     │       │
│  └─────────┘ └─────────┘ └─────────┘       │
├─────────────────────────────────────────────┤
│         tool_search (BM25/正则)              │
│         按需加载 → 返回 3-5 个工具            │
└─────────────────────────────────────────────┘

3.6 computer_use — 计算机操作工具 (中优先)

适用场景:

  • MBE Desktop 应用中,Agent 可以帮用户操作桌面应用
  • 老年用户辅助(MBE 有老年医学模块),帮助完成复杂操作
  • 自动化测试 MBE Desktop 的 UI 交互

Claude 平台参考:

  • 类型:computer_20250124(客户端工具)
  • 能力:屏幕截图、鼠标点击、键盘输入、滚动
  • 需要客户端实现执行逻辑

3.7 text_editor — 文本编辑工具 (中优先)

适用场景:

  • 用户需要起草文档(法律文书、商业计划)
  • 配合 Memory Tool 管理记忆文件
  • 协作编辑、内容审阅

Claude 平台参考:

  • 类型:text_editor_20250124(客户端工具)
  • 操作:view / create / str_replace / insert / undo_edit
  • 需要客户端实现文件系统操作

四、实施路线图

Phase 1(立即)—— 信息获取能力
├── web_search    → 让专家获得实时信息
│   实现方式:自建客户端工具,博查(主) + Tavily(备) + SearXNG(兜底)
│   预估工期:2-3 天
└── web_fetch     → 深度内容分析 + PDF 解析
    实现方式:自建客户端工具(httpx + readability + PyPDF2)
    预估工期:2 天

Phase 2(短期,1-2 周)—— 智能管理能力
├── mises_memory  → 持久化记忆,解决 Factor 5/6/12
│   实现方式:客户端工具,基于 PostgreSQL 实现存储后端
│   预估工期:3-5 天
└── tool_search   → 动态工具发现,解决 100+ 工具注册问题
    实现方式:重构工具目录 + BM25 搜索引擎
    预估工期:3-5 天

Phase 3(中期,2-4 周)—— 计算与执行能力
├── code_execution → 精确计算 + 数据可视化
│   实现方式:自建 Docker 沙箱(参考 Claude 设计:5GiB RAM、无网络、30s 超时)
│   预估工期:5-7 天
└── text_editor    → 文档编辑能力
    实现方式:客户端工具,基于文件系统
    预估工期:2-3 天

Phase 4(远期,1-2 月)—— 自动化操作能力
└── computer_use   → 桌面操作辅助
    实现方式:Electron IPC 集成
    预估工期:2-3 周

五、与 12-Factor Agents 改进计划的关联

新工具 解决的 Factor 具体价值
web_search Factor 13 (预取上下文) 专家回答前预取最新信息,减少幻觉
web_fetch Factor 3 (上下文工程) 丰富上下文来源,精确引用减少幻觉
mises_memory Factor 5+6+12 (状态/暂停/无状态) 显式持久化状态,支持暂停恢复,可审计
tool_search Factor 10 (小而专注) 让 100+ 工具按需加载,不污染上下文
code_execution Factor 4 (结构化输出) 精确计算作为结构化工具输出
text_editor Factor 9 (错误压缩进上下文) 编辑操作的结构化反馈

六、关键架构建议

6.1 自建搜索和内容获取工具(替代 Claude 服务器端工具)

由于 MBE 通过 OpenRouter 中转访问 Claude,无法使用 Anthropic 服务器端工具(web_search / web_fetch / code_execution)。需要自建客户端工具,作为 MCP 工具注册到 MBE。

推荐技术栈:

能力 推荐方案 成本 国内可用 质量
网络搜索 博查 AI Search (主) + Tavily (备) 免费→$5/千次 博查可直连 93.3% (Tavily)
网页获取 httpx + readability-lxml + BeautifulSoup 免费 可直连
PDF 解析 PyPDF2 / pdfplumber 免费 本地执行
代码执行 Docker 沙箱 + subprocess 免费 本地执行

实现模式:MBE 客户端工具(LLM 发起调用 → MBE 执行 → 结果返回 LLM)

# 在 MBE server.py 中处理搜索工具调用
async def _handle_web_search(self, params: dict) -> dict:
    """MBE 自建搜索:博查(主) + Tavily(备) 双通道"""
    query = params["query"]
    
    async with httpx.AsyncClient() as client:
        # 方案 A(主通道):博查 AI Search(国内直连,中文最优)
        try:
            resp = await client.post(
                "https://api.bochaai.com/v1/web-search",
                headers={"Authorization": f"Bearer {BOCHA_API_KEY}"},
                json={"query": query, "count": 5}
            )
            results = resp.json()["data"]
            return {"source": "bocha", "results": results}
        except Exception:
            pass
        
        # 方案 B(备用通道):Tavily(准确率 93.3%,AI Agent 专用)
        try:
            resp = await client.post(
                "https://api.tavily.com/search",
                json={"api_key": TAVILY_API_KEY, "query": query,
                      "max_results": 5, "include_answer": True}
            )
            return {"source": "tavily", "results": resp.json()["results"]}
        except Exception:
            pass
        
        # 方案 C(兜底):SearXNG 自建(零成本)
        resp = await client.get(
            f"http://searxng:8080/search?q={query}&format=json&language=zh-CN"
        )
        return {"source": "searxng", "results": resp.json()["results"][:5]}

6.2 Memory Tool 与 TITANS 双轨运行

TITANS 负责隐式偏好学习,Memory Tool 负责可审计的显式记忆。两者通过 session_state 表统一索引。

6.3 Tool Search 解决注册断层问题

当前 MISES_TOOLS 只注册了 8 个工具,但 server.py 处理了 100+ 工具。引入 Tool Search 后,所有工具都进入目录但标记 defer_loading: true,只有搜索命中才加载。

6.4 结构化输出标准化(Factor 4)

所有新工具的输入/输出都应定义 Pydantic 模型,便于:

  • 监控和审计(决策审计链路)
  • 测试和重放(确定性输入输出)
  • 错误处理(Factor 9: 错误压缩进上下文)
from pydantic import BaseModel

class WebSearchInput(BaseModel):
    query: str
    device_id: str
    allowed_domains: list[str] | None = None
    max_results: int = 5

class WebSearchResult(BaseModel):
    url: str
    title: str
    snippet: str
    page_age: str | None = None

七、成本估算(修正版 v1.2:自建方案)

工具 实现方案 定价模式 预估月成本(1万用户)
Web Search 博查 AI Search (主) 免费 500次/天 (15,000/月) $0(免费额度内)→ 按需付费
Web Search Tavily (备用) 免费 1,000次/月 → $5/1,000 次 $0-100
Web Search SearXNG (兜底) 免费(自建) 仅服务器 $5-10/月
Web Fetch 自建(httpx+readability) 免费 仅带宽成本
Memory PostgreSQL 存储 客户端 可忽略
Code Execution Docker 沙箱 自建 服务器资源成本
Tool Search BM25 自建 自建 可忽略

对比:

方案 月成本(1万用户) 国内可用 搜索质量
Claude 服务器端工具 $300-700 不可用 ~90%+
Bing Search API $60-150 可用 已退役
博查 + Tavily + SearXNG $5-110 完全可用 93.3% (Tavily)
SearXNG 全自建 $5-10 完全可用 依赖上游引擎

结论: 自建方案不仅解决国内访问问题,成本降低 85-98%,且搜索质量(Tavily 93.3%)超过 Google (82.15%)


八、参考文档

文档 链接
Claude 工具使用概览 overview
Web Search 工具 web-search-tool
Web Fetch 工具 web-fetch-tool
Memory 工具 memory-tool
Code Execution 工具 code-execution-tool
Tool Search 工具 tool-search-tool
Computer Use 工具 computer-use-tool
Text Editor 工具 text-editor-tool
MBE 现有工具定义 mises-behavior-engine/src/mcp/tools.py
MBE MCP 服务器 mises-behavior-engine/src/mcp/server.py
12-Factor Agents 分析 2-Factor Agents 对 MBE 的价值分析.md
12-Factor 实施计划 docs/MBE_12FACTOR_IMPLEMENTATION_PLAN.md

MBE Claude 工具扩展分析 v1.2 | 2026-02-12