MBE 对标 Claude 参考文档差距分析

分析日期: 2026-02-11
对标对象: Claude Platform Docs（英文 547 页，12 种语言）
MBE 现状: 约 700+ 文档，覆盖 4 个子项目

一、分析背景

Claude 平台文档（platform.claude.com）是当前 AI 平台文档的标杆之一，其文档体系包含：

板块	页数	说明
Developer Guide	100+	SDK、Agent、工具、Prompt 工程、构建指南
API Reference	400+	多语言 SDK 的完整 API 文档
Test & Evaluate	10+	测试方法论、安全护栏
Resources	20+	模型卡、课程、Cookbook、术语表、Prompt 库
Use Case Guides	10+	行业用例生产级指南

MBE 在内部架构文档和运维文档方面非常完善，但在面向外部开发者/用户的文档方面存在显著差距。核心问题是：MBE 的文档更偏"工程内参"，而 Claude 的文档是"开发者产品文档"——需要一个从内部视角到外部视角的转变。

二、差距详细分析

差距 1：SDK 文档与多语言 SDK 参考 — 严重缺失

Claude 有：Python / TypeScript / Go / Java / Kotlin / Ruby 六种语言的完整 SDK 文档，每个 API 端点都有多语言代码示例。

MBE 现状：

mises-behavior-engine/docs/developer/SDK_EXAMPLES.md 仅为示例片段
mbe-monorepo/docs/SDK_GUIDE.md 存在但不完整
无多语言 SDK 封装（Python SDK、JS SDK 等独立包）
API 端点仅有表格式列表，缺少请求/响应 Schema、错误码、代码示例

建议：为 MBE 核心 API 编写正式的 SDK 参考文档，至少覆盖 Python 和 TypeScript，包含完整的请求/响应 JSON Schema。

差距 2：开发者入门（Getting Started / Quickstart）— 分散且不统一

Claude 有：统一的 get-started.md（快速开始）+ intro.md（Claude 简介），从零到第一次 API 调用只需 5 分钟。

MBE 现状：

有 QUICK_START.md、DEVELOPER_QUICKSTART.md、CURSOR_QUICKSTART.md 等多个入口，分散在不同目录
无统一的"从零到 Hello World"教程
缺少在线可交互的 Playground / Console

建议：编写一个统一的 MBE Getting Started 文档，5 分钟内让开发者完成第一次专家调用。

差距 3：Prompt 工程 / 最佳实践指南 — 基本空白

Claude 有：完整的 Prompt Engineering 体系（14+ 篇文档）：

链式思维 (Chain of Thought)
多轮示例 (Multishot Prompting)
XML 标签结构化
System Prompt 设计
长上下文提示技巧
Prompt 模板与变量
Prompt Generator / Prompt Improver 工具

MBE 现状：

有小智的 Prompt 指南（XIAOZHI-PROMPT-GUIDE.md）但仅限小智场景
无通用的 MBE Prompt 最佳实践
无 Prompt 模板库

建议：创建 docs/guides/PROMPT_ENGINEERING.md，针对 MBE 的专家系统场景编写 Prompt 最佳实践，包含专家定义、知识库问答、Self-Critique 触发等场景的模板。

差距 4：测试与评估指南 — 有工具无方法论

Claude 有：

定义成功标准 (define-success.md)
开发测试用例 (develop-tests.md)
评估工具使用 (eval-tool.md)
安全护栏系列（7 篇）：减少幻觉、防止越狱、保持角色、减少 Prompt 泄漏、降低延迟等

MBE 现状：

有评估 API（/api/evaluation/*）和自动测试框架
有 Self-Critique 11 模块和可靠性门禁
但缺少：如何设计测试用例的方法论文档、如何定义成功标准的指南、针对幻觉/越狱/角色偏移的防护指南

建议：编写面向用户/开发者的评估方法论指南，而非仅有内部实现文档。

差距 5：Agent / Tool Use 框架文档 — 缺乏系统性

Claude 有：

Agent SDK（概述、Python/TS SDK、子代理、Hook、权限、会话管理等 20+ 篇）
Agent Skills（概述、快速开始、最佳实践、企业版）
Tool Use 体系（概述、Bash Tool、Code Execution、Computer Use、Memory Tool、Web Search/Fetch 等 10+ 篇）
MCP Connector / Remote MCP Servers

MBE 现状：

有 MCP 设计（MBE_MCP_DESIGN.md）和 mcps/ 目录下的工具定义
有专家市场设计（EXPERT_MARKETPLACE_DESIGN.md）
无完整的 Agent 框架文档和 Tool Use 体系文档

建议：随着 MBE 向 Agent 方向发展（Level 6 多智能体），需要系统性的 Agent/Tool 文档体系。

差距 6：模型卡 / 系统卡 — 完全缺失

Claude 有：每个模型版本都有正式的 System Card（性能、安全、能力边界等）。

MBE 现状：

有 MBE_CAPABILITIES.md 和 MBE_VS_GEMINI.md 做能力对比
有 MBE_POSITIONING_AND_EVALUATION.md
无正式的 System Card：不含基准测试数据、安全评估、能力边界说明

建议：为 MBE 引擎编写正式的系统卡 / 能力白皮书，对标 Claude 的 System Card 格式，包含基准测试、安全评估、已知局限。

差距 7：定价与商业文档 — 面向外部不足

Claude 有：清晰的 pricing.md，按模型/Token 定价，公开透明。

MBE 现状：

有 BUSINESS_MODEL.md、BUSINESS_MODEL_V2.md、EQUITY_STRUCTURE.md 等商业文档
有写作到出版系统商业计划书
但缺少面向外部的定价页面、订阅计划说明、Token/调用量计费文档

建议：编写面向客户/开发者的定价与计费文档。

差距 8：国际化 / 多语言支持 — 起步阶段

Claude 有：文档支持 12 种语言（英、德、西、法、意、日、韩、葡、俄、中简、中繁、印尼），有专门的 multilingual-support.md。

MBE 现状：

mbe-monorepo 有 I18N_MAINTENANCE_GUIDE.md、I18N_QUICK_REFERENCE.md、MULTILINGUAL_IMPLEMENTATION_PLAN.md
文档全部为中文，无英文版

建议：如需拓展国际市场，至少需要核心文档（Getting Started、API Reference、SDK Guide）的英文版。

差距 9：安全与隐私合规文档 — 不够体系化

Claude 有：

数据驻留 (data-residency.md)
零数据保留 (zero-data-retention.md)
安全部署 (secure-deployment.md)
越狱防护 (mitigate-jailbreaks.md)

MBE 现状：

有 legal/PRIVACY_POLICY.md、TERMS_OF_SERVICE.md
有 DATA_SAFETY_STRATEGY.md、SECURITY_OPTIMIZATION.md
缺少：数据驻留策略、零数据保留选项、安全部署指南的系统化文档

建议：整合为统一的安全与合规文档中心。

差距 10：学习资源与 AI 可读文档 — 未覆盖

Claude 有：

Cookbook（可复现的代码示例）
Courses（在线课程）
Glossary（术语表）
Prompt Library（分类 Prompt 模板库）
Use Case Guides（行业用例生产级指南）
llms.txt / llms-full.txt（AI 可读的文档索引）
API Primer for Claude ingestion

MBE 现状：

有行业方案（法律、金融、营销）但多为规划阶段
有教程（tutorials/PSYCHOTHERAPY_EXPERT_FULL_WORKFLOW.md）但仅 1 篇
无 Glossary、Cookbook、在线课程
无 llms.txt 或 AI 可读格式
无 Prompt 模板库

建议：

编写 MBE Glossary（术语表：专家、HOPE、TITANS、MIRAS、Self-Critique 等）
创建 llms.txt 让 AI 助手能高效读取 MBE 文档
积累 Cookbook 示例（专家创建、KB 上传、评估闭环等场景）

三、差距优先级总结

优先级	差距领域	影响	难度	建议产出
P0	SDK 文档 + API Reference 完善	开发者体验核心瓶颈	中	`docs/developer/API_COMPLETE_REFERENCE.md`
P0	统一 Getting Started	新用户上手第一关	低	`docs/guides/GETTING_STARTED.md`
P1	Prompt 工程最佳实践	用户使用效果	中	`docs/guides/PROMPT_ENGINEERING.md`
P1	评估方法论指南	质量保障可复制性	中	`docs/guides/EVALUATION_METHODOLOGY.md`
P1	术语表 (Glossary)	理解门槛	低	`docs/reference/GLOSSARY.md`
P2	系统卡 / 能力白皮书	商业可信度	高	`docs/product/MBE_SYSTEM_CARD.md`
P2	安全合规文档体系化	企业客户准入	中	`docs/guides/SECURITY_COMPLIANCE.md`
P2	定价与计费文档	商业化必需	低	`docs/business/PRICING.md`
P3	Agent/Tool 框架文档	未来方向	高	`docs/developer/AGENT_FRAMEWORK.md`
P3	国际化 (英文文档)	国际市场	高	`docs/en/` 目录
P3	llms.txt + Cookbook	生态建设	中	`llms.txt` + `docs/cookbook/`

四、MBE 的优势领域（Claude 文档未重点覆盖）

MBE 在以下方面的文档反而优于 Claude 的公开文档：

领域	MBE 文档	Claude 对比
闭环自进化架构	详细的四冲程闭环、事件总线、门禁文档	Claude 未公开自进化架构
专家生命周期管理	8 态状态机、A/B 测试、自动隔离恢复	Claude 无对应概念
知识图谱	NetworkX 统一图谱、Feature Flags、迁移指南	Claude 未公开图谱实现
CLI 工具体系	47 模块 330+ 子命令，完整自测框架	Claude CLI 文档较少
运维自动化	Prometheus + Grafana + 灾备 + 自动维护	Claude 未公开运维细节
行业深度方案	法律、金融、营销的深度行业文档	Claude 仅有通用 use case

五、实施建议

阶段一：P0 文档补齐（1-2 周）

统一 Getting Started：整合现有 QUICK_START，写一个 5 分钟上手教程
API Reference 完善：为核心 API 补充请求/响应 Schema、错误码、curl 示例

阶段二：P1 文档建设（2-4 周）

Prompt 工程指南：MBE 场景的 Prompt 最佳实践
评估方法论：从工具文档转化为方法论文档
Glossary 术语表：MBE 核心概念定义

阶段三：P2 商业化文档（4-8 周）

MBE 系统卡：正式的能力白皮书
安全合规文档：体系化整合
定价文档：面向客户的计费说明

阶段四：P3 生态建设（持续）

Agent 框架文档：随 Level 6 开发同步编写
国际化：核心文档英文版
llms.txt + Cookbook：AI 可读索引 + 可复现示例

文档版本: v1.0
更新日期: 2026-02-11
参考: Claude Platform Docs | Claude llms.txt