MBE 对标 Claude 参考文档差距分析

分析日期: 2026-02-11
对标对象: Claude Platform Docs(英文 547 页,12 种语言)
MBE 现状: 约 700+ 文档,覆盖 4 个子项目


一、分析背景

Claude 平台文档(platform.claude.com)是当前 AI 平台文档的标杆之一,其文档体系包含:

板块 页数 说明
Developer Guide 100+ SDK、Agent、工具、Prompt 工程、构建指南
API Reference 400+ 多语言 SDK 的完整 API 文档
Test & Evaluate 10+ 测试方法论、安全护栏
Resources 20+ 模型卡、课程、Cookbook、术语表、Prompt 库
Use Case Guides 10+ 行业用例生产级指南

MBE 在内部架构文档运维文档方面非常完善,但在面向外部开发者/用户的文档方面存在显著差距。核心问题是:MBE 的文档更偏"工程内参",而 Claude 的文档是"开发者产品文档"——需要一个从内部视角到外部视角的转变。


二、差距详细分析

差距 1:SDK 文档与多语言 SDK 参考 — 严重缺失

Claude 有:Python / TypeScript / Go / Java / Kotlin / Ruby 六种语言的完整 SDK 文档,每个 API 端点都有多语言代码示例。

MBE 现状

  • mises-behavior-engine/docs/developer/SDK_EXAMPLES.md 仅为示例片段
  • mbe-monorepo/docs/SDK_GUIDE.md 存在但不完整
  • 无多语言 SDK 封装(Python SDK、JS SDK 等独立包)
  • API 端点仅有表格式列表,缺少请求/响应 Schema、错误码、代码示例

建议:为 MBE 核心 API 编写正式的 SDK 参考文档,至少覆盖 Python 和 TypeScript,包含完整的请求/响应 JSON Schema。


差距 2:开发者入门(Getting Started / Quickstart)— 分散且不统一

Claude 有:统一的 get-started.md(快速开始)+ intro.md(Claude 简介),从零到第一次 API 调用只需 5 分钟。

MBE 现状

  • QUICK_START.mdDEVELOPER_QUICKSTART.mdCURSOR_QUICKSTART.md 等多个入口,分散在不同目录
  • 无统一的"从零到 Hello World"教程
  • 缺少在线可交互的 Playground / Console

建议:编写一个统一的 MBE Getting Started 文档,5 分钟内让开发者完成第一次专家调用。


差距 3:Prompt 工程 / 最佳实践指南 — 基本空白

Claude 有:完整的 Prompt Engineering 体系(14+ 篇文档):

  • 链式思维 (Chain of Thought)
  • 多轮示例 (Multishot Prompting)
  • XML 标签结构化
  • System Prompt 设计
  • 长上下文提示技巧
  • Prompt 模板与变量
  • Prompt Generator / Prompt Improver 工具

MBE 现状

  • 有小智的 Prompt 指南(XIAOZHI-PROMPT-GUIDE.md)但仅限小智场景
  • 无通用的 MBE Prompt 最佳实践
  • 无 Prompt 模板库

建议:创建 docs/guides/PROMPT_ENGINEERING.md,针对 MBE 的专家系统场景编写 Prompt 最佳实践,包含专家定义、知识库问答、Self-Critique 触发等场景的模板。


差距 4:测试与评估指南 — 有工具无方法论

Claude 有

  • 定义成功标准 (define-success.md)
  • 开发测试用例 (develop-tests.md)
  • 评估工具使用 (eval-tool.md)
  • 安全护栏系列(7 篇):减少幻觉、防止越狱、保持角色、减少 Prompt 泄漏、降低延迟等

MBE 现状

  • 有评估 API(/api/evaluation/*)和自动测试框架
  • 有 Self-Critique 11 模块和可靠性门禁
  • 但缺少:如何设计测试用例的方法论文档、如何定义成功标准的指南、针对幻觉/越狱/角色偏移的防护指南

建议:编写面向用户/开发者的评估方法论指南,而非仅有内部实现文档。


差距 5:Agent / Tool Use 框架文档 — 缺乏系统性

Claude 有

  • Agent SDK(概述、Python/TS SDK、子代理、Hook、权限、会话管理等 20+ 篇)
  • Agent Skills(概述、快速开始、最佳实践、企业版)
  • Tool Use 体系(概述、Bash Tool、Code Execution、Computer Use、Memory Tool、Web Search/Fetch 等 10+ 篇)
  • MCP Connector / Remote MCP Servers

MBE 现状

  • 有 MCP 设计(MBE_MCP_DESIGN.md)和 mcps/ 目录下的工具定义
  • 有专家市场设计(EXPERT_MARKETPLACE_DESIGN.md
  • 无完整的 Agent 框架文档和 Tool Use 体系文档

建议:随着 MBE 向 Agent 方向发展(Level 6 多智能体),需要系统性的 Agent/Tool 文档体系。


差距 6:模型卡 / 系统卡 — 完全缺失

Claude 有:每个模型版本都有正式的 System Card(性能、安全、能力边界等)。

MBE 现状

  • MBE_CAPABILITIES.mdMBE_VS_GEMINI.md 做能力对比
  • MBE_POSITIONING_AND_EVALUATION.md
  • 无正式的 System Card:不含基准测试数据、安全评估、能力边界说明

建议:为 MBE 引擎编写正式的系统卡 / 能力白皮书,对标 Claude 的 System Card 格式,包含基准测试、安全评估、已知局限。


差距 7:定价与商业文档 — 面向外部不足

Claude 有:清晰的 pricing.md,按模型/Token 定价,公开透明。

MBE 现状

  • BUSINESS_MODEL.mdBUSINESS_MODEL_V2.mdEQUITY_STRUCTURE.md 等商业文档
  • 有写作到出版系统商业计划书
  • 但缺少面向外部的定价页面、订阅计划说明、Token/调用量计费文档

建议:编写面向客户/开发者的定价与计费文档


差距 8:国际化 / 多语言支持 — 起步阶段

Claude 有:文档支持 12 种语言(英、德、西、法、意、日、韩、葡、俄、中简、中繁、印尼),有专门的 multilingual-support.md

MBE 现状

  • mbe-monorepoI18N_MAINTENANCE_GUIDE.mdI18N_QUICK_REFERENCE.mdMULTILINGUAL_IMPLEMENTATION_PLAN.md
  • 文档全部为中文,无英文版

建议:如需拓展国际市场,至少需要核心文档(Getting Started、API Reference、SDK Guide)的英文版。


差距 9:安全与隐私合规文档 — 不够体系化

Claude 有

  • 数据驻留 (data-residency.md)
  • 零数据保留 (zero-data-retention.md)
  • 安全部署 (secure-deployment.md)
  • 越狱防护 (mitigate-jailbreaks.md)

MBE 现状

  • legal/PRIVACY_POLICY.mdTERMS_OF_SERVICE.md
  • DATA_SAFETY_STRATEGY.mdSECURITY_OPTIMIZATION.md
  • 缺少:数据驻留策略、零数据保留选项、安全部署指南的系统化文档

建议:整合为统一的安全与合规文档中心


差距 10:学习资源与 AI 可读文档 — 未覆盖

Claude 有

  • Cookbook(可复现的代码示例)
  • Courses(在线课程)
  • Glossary(术语表)
  • Prompt Library(分类 Prompt 模板库)
  • Use Case Guides(行业用例生产级指南)
  • llms.txt / llms-full.txt(AI 可读的文档索引)
  • API Primer for Claude ingestion

MBE 现状

  • 有行业方案(法律、金融、营销)但多为规划阶段
  • 有教程(tutorials/PSYCHOTHERAPY_EXPERT_FULL_WORKFLOW.md)但仅 1 篇
  • Glossary、Cookbook、在线课程
  • llms.txt 或 AI 可读格式
  • Prompt 模板库

建议

  1. 编写 MBE Glossary(术语表:专家、HOPE、TITANS、MIRAS、Self-Critique 等)
  2. 创建 llms.txt 让 AI 助手能高效读取 MBE 文档
  3. 积累 Cookbook 示例(专家创建、KB 上传、评估闭环等场景)

三、差距优先级总结

优先级 差距领域 影响 难度 建议产出
P0 SDK 文档 + API Reference 完善 开发者体验核心瓶颈 docs/developer/API_COMPLETE_REFERENCE.md
P0 统一 Getting Started 新用户上手第一关 docs/guides/GETTING_STARTED.md
P1 Prompt 工程最佳实践 用户使用效果 docs/guides/PROMPT_ENGINEERING.md
P1 评估方法论指南 质量保障可复制性 docs/guides/EVALUATION_METHODOLOGY.md
P1 术语表 (Glossary) 理解门槛 docs/reference/GLOSSARY.md
P2 系统卡 / 能力白皮书 商业可信度 docs/product/MBE_SYSTEM_CARD.md
P2 安全合规文档体系化 企业客户准入 docs/guides/SECURITY_COMPLIANCE.md
P2 定价与计费文档 商业化必需 docs/business/PRICING.md
P3 Agent/Tool 框架文档 未来方向 docs/developer/AGENT_FRAMEWORK.md
P3 国际化 (英文文档) 国际市场 docs/en/ 目录
P3 llms.txt + Cookbook 生态建设 llms.txt + docs/cookbook/

四、MBE 的优势领域(Claude 文档未重点覆盖)

MBE 在以下方面的文档反而优于 Claude 的公开文档:

领域 MBE 文档 Claude 对比
闭环自进化架构 详细的四冲程闭环、事件总线、门禁文档 Claude 未公开自进化架构
专家生命周期管理 8 态状态机、A/B 测试、自动隔离恢复 Claude 无对应概念
知识图谱 NetworkX 统一图谱、Feature Flags、迁移指南 Claude 未公开图谱实现
CLI 工具体系 47 模块 330+ 子命令,完整自测框架 Claude CLI 文档较少
运维自动化 Prometheus + Grafana + 灾备 + 自动维护 Claude 未公开运维细节
行业深度方案 法律、金融、营销的深度行业文档 Claude 仅有通用 use case

五、实施建议

阶段一:P0 文档补齐(1-2 周)

  1. 统一 Getting Started:整合现有 QUICK_START,写一个 5 分钟上手教程
  2. API Reference 完善:为核心 API 补充请求/响应 Schema、错误码、curl 示例

阶段二:P1 文档建设(2-4 周)

  1. Prompt 工程指南:MBE 场景的 Prompt 最佳实践
  2. 评估方法论:从工具文档转化为方法论文档
  3. Glossary 术语表:MBE 核心概念定义

阶段三:P2 商业化文档(4-8 周)

  1. MBE 系统卡:正式的能力白皮书
  2. 安全合规文档:体系化整合
  3. 定价文档:面向客户的计费说明

阶段四:P3 生态建设(持续)

  1. Agent 框架文档:随 Level 6 开发同步编写
  2. 国际化:核心文档英文版
  3. llms.txt + Cookbook:AI 可读索引 + 可复现示例

文档版本: v1.0
更新日期: 2026-02-11
参考: Claude Platform Docs | Claude llms.txt