MBE 对标 Claude 参考文档差距分析
分析日期: 2026-02-11
对标对象: Claude Platform Docs(英文 547 页,12 种语言)
MBE 现状: 约 700+ 文档,覆盖 4 个子项目
一、分析背景
Claude 平台文档(platform.claude.com)是当前 AI 平台文档的标杆之一,其文档体系包含:
| 板块 | 页数 | 说明 |
|---|---|---|
| Developer Guide | 100+ | SDK、Agent、工具、Prompt 工程、构建指南 |
| API Reference | 400+ | 多语言 SDK 的完整 API 文档 |
| Test & Evaluate | 10+ | 测试方法论、安全护栏 |
| Resources | 20+ | 模型卡、课程、Cookbook、术语表、Prompt 库 |
| Use Case Guides | 10+ | 行业用例生产级指南 |
MBE 在内部架构文档和运维文档方面非常完善,但在面向外部开发者/用户的文档方面存在显著差距。核心问题是:MBE 的文档更偏"工程内参",而 Claude 的文档是"开发者产品文档"——需要一个从内部视角到外部视角的转变。
二、差距详细分析
差距 1:SDK 文档与多语言 SDK 参考 — 严重缺失
Claude 有:Python / TypeScript / Go / Java / Kotlin / Ruby 六种语言的完整 SDK 文档,每个 API 端点都有多语言代码示例。
MBE 现状:
mises-behavior-engine/docs/developer/SDK_EXAMPLES.md仅为示例片段mbe-monorepo/docs/SDK_GUIDE.md存在但不完整- 无多语言 SDK 封装(Python SDK、JS SDK 等独立包)
- API 端点仅有表格式列表,缺少请求/响应 Schema、错误码、代码示例
建议:为 MBE 核心 API 编写正式的 SDK 参考文档,至少覆盖 Python 和 TypeScript,包含完整的请求/响应 JSON Schema。
差距 2:开发者入门(Getting Started / Quickstart)— 分散且不统一
Claude 有:统一的 get-started.md(快速开始)+ intro.md(Claude 简介),从零到第一次 API 调用只需 5 分钟。
MBE 现状:
- 有
QUICK_START.md、DEVELOPER_QUICKSTART.md、CURSOR_QUICKSTART.md等多个入口,分散在不同目录 - 无统一的"从零到 Hello World"教程
- 缺少在线可交互的 Playground / Console
建议:编写一个统一的 MBE Getting Started 文档,5 分钟内让开发者完成第一次专家调用。
差距 3:Prompt 工程 / 最佳实践指南 — 基本空白
Claude 有:完整的 Prompt Engineering 体系(14+ 篇文档):
- 链式思维 (Chain of Thought)
- 多轮示例 (Multishot Prompting)
- XML 标签结构化
- System Prompt 设计
- 长上下文提示技巧
- Prompt 模板与变量
- Prompt Generator / Prompt Improver 工具
MBE 现状:
- 有小智的 Prompt 指南(
XIAOZHI-PROMPT-GUIDE.md)但仅限小智场景 - 无通用的 MBE Prompt 最佳实践
- 无 Prompt 模板库
建议:创建 docs/guides/PROMPT_ENGINEERING.md,针对 MBE 的专家系统场景编写 Prompt 最佳实践,包含专家定义、知识库问答、Self-Critique 触发等场景的模板。
差距 4:测试与评估指南 — 有工具无方法论
Claude 有:
- 定义成功标准 (
define-success.md) - 开发测试用例 (
develop-tests.md) - 评估工具使用 (
eval-tool.md) - 安全护栏系列(7 篇):减少幻觉、防止越狱、保持角色、减少 Prompt 泄漏、降低延迟等
MBE 现状:
- 有评估 API(
/api/evaluation/*)和自动测试框架 - 有 Self-Critique 11 模块和可靠性门禁
- 但缺少:如何设计测试用例的方法论文档、如何定义成功标准的指南、针对幻觉/越狱/角色偏移的防护指南
建议:编写面向用户/开发者的评估方法论指南,而非仅有内部实现文档。
差距 5:Agent / Tool Use 框架文档 — 缺乏系统性
Claude 有:
- Agent SDK(概述、Python/TS SDK、子代理、Hook、权限、会话管理等 20+ 篇)
- Agent Skills(概述、快速开始、最佳实践、企业版)
- Tool Use 体系(概述、Bash Tool、Code Execution、Computer Use、Memory Tool、Web Search/Fetch 等 10+ 篇)
- MCP Connector / Remote MCP Servers
MBE 现状:
- 有 MCP 设计(
MBE_MCP_DESIGN.md)和mcps/目录下的工具定义 - 有专家市场设计(
EXPERT_MARKETPLACE_DESIGN.md) - 无完整的 Agent 框架文档和 Tool Use 体系文档
建议:随着 MBE 向 Agent 方向发展(Level 6 多智能体),需要系统性的 Agent/Tool 文档体系。
差距 6:模型卡 / 系统卡 — 完全缺失
Claude 有:每个模型版本都有正式的 System Card(性能、安全、能力边界等)。
MBE 现状:
- 有
MBE_CAPABILITIES.md和MBE_VS_GEMINI.md做能力对比 - 有
MBE_POSITIONING_AND_EVALUATION.md - 无正式的 System Card:不含基准测试数据、安全评估、能力边界说明
建议:为 MBE 引擎编写正式的系统卡 / 能力白皮书,对标 Claude 的 System Card 格式,包含基准测试、安全评估、已知局限。
差距 7:定价与商业文档 — 面向外部不足
Claude 有:清晰的 pricing.md,按模型/Token 定价,公开透明。
MBE 现状:
- 有
BUSINESS_MODEL.md、BUSINESS_MODEL_V2.md、EQUITY_STRUCTURE.md等商业文档 - 有写作到出版系统商业计划书
- 但缺少面向外部的定价页面、订阅计划说明、Token/调用量计费文档
建议:编写面向客户/开发者的定价与计费文档。
差距 8:国际化 / 多语言支持 — 起步阶段
Claude 有:文档支持 12 种语言(英、德、西、法、意、日、韩、葡、俄、中简、中繁、印尼),有专门的 multilingual-support.md。
MBE 现状:
mbe-monorepo有I18N_MAINTENANCE_GUIDE.md、I18N_QUICK_REFERENCE.md、MULTILINGUAL_IMPLEMENTATION_PLAN.md- 文档全部为中文,无英文版
建议:如需拓展国际市场,至少需要核心文档(Getting Started、API Reference、SDK Guide)的英文版。
差距 9:安全与隐私合规文档 — 不够体系化
Claude 有:
- 数据驻留 (
data-residency.md) - 零数据保留 (
zero-data-retention.md) - 安全部署 (
secure-deployment.md) - 越狱防护 (
mitigate-jailbreaks.md)
MBE 现状:
- 有
legal/PRIVACY_POLICY.md、TERMS_OF_SERVICE.md - 有
DATA_SAFETY_STRATEGY.md、SECURITY_OPTIMIZATION.md - 缺少:数据驻留策略、零数据保留选项、安全部署指南的系统化文档
建议:整合为统一的安全与合规文档中心。
差距 10:学习资源与 AI 可读文档 — 未覆盖
Claude 有:
- Cookbook(可复现的代码示例)
- Courses(在线课程)
- Glossary(术语表)
- Prompt Library(分类 Prompt 模板库)
- Use Case Guides(行业用例生产级指南)
- llms.txt / llms-full.txt(AI 可读的文档索引)
- API Primer for Claude ingestion
MBE 现状:
- 有行业方案(法律、金融、营销)但多为规划阶段
- 有教程(
tutorials/PSYCHOTHERAPY_EXPERT_FULL_WORKFLOW.md)但仅 1 篇 - 无 Glossary、Cookbook、在线课程
- 无 llms.txt 或 AI 可读格式
- 无 Prompt 模板库
建议:
- 编写 MBE Glossary(术语表:专家、HOPE、TITANS、MIRAS、Self-Critique 等)
- 创建 llms.txt 让 AI 助手能高效读取 MBE 文档
- 积累 Cookbook 示例(专家创建、KB 上传、评估闭环等场景)
三、差距优先级总结
| 优先级 | 差距领域 | 影响 | 难度 | 建议产出 |
|---|---|---|---|---|
| P0 | SDK 文档 + API Reference 完善 | 开发者体验核心瓶颈 | 中 | docs/developer/API_COMPLETE_REFERENCE.md |
| P0 | 统一 Getting Started | 新用户上手第一关 | 低 | docs/guides/GETTING_STARTED.md |
| P1 | Prompt 工程最佳实践 | 用户使用效果 | 中 | docs/guides/PROMPT_ENGINEERING.md |
| P1 | 评估方法论指南 | 质量保障可复制性 | 中 | docs/guides/EVALUATION_METHODOLOGY.md |
| P1 | 术语表 (Glossary) | 理解门槛 | 低 | docs/reference/GLOSSARY.md |
| P2 | 系统卡 / 能力白皮书 | 商业可信度 | 高 | docs/product/MBE_SYSTEM_CARD.md |
| P2 | 安全合规文档体系化 | 企业客户准入 | 中 | docs/guides/SECURITY_COMPLIANCE.md |
| P2 | 定价与计费文档 | 商业化必需 | 低 | docs/business/PRICING.md |
| P3 | Agent/Tool 框架文档 | 未来方向 | 高 | docs/developer/AGENT_FRAMEWORK.md |
| P3 | 国际化 (英文文档) | 国际市场 | 高 | docs/en/ 目录 |
| P3 | llms.txt + Cookbook | 生态建设 | 中 | llms.txt + docs/cookbook/ |
四、MBE 的优势领域(Claude 文档未重点覆盖)
MBE 在以下方面的文档反而优于 Claude 的公开文档:
| 领域 | MBE 文档 | Claude 对比 |
|---|---|---|
| 闭环自进化架构 | 详细的四冲程闭环、事件总线、门禁文档 | Claude 未公开自进化架构 |
| 专家生命周期管理 | 8 态状态机、A/B 测试、自动隔离恢复 | Claude 无对应概念 |
| 知识图谱 | NetworkX 统一图谱、Feature Flags、迁移指南 | Claude 未公开图谱实现 |
| CLI 工具体系 | 47 模块 330+ 子命令,完整自测框架 | Claude CLI 文档较少 |
| 运维自动化 | Prometheus + Grafana + 灾备 + 自动维护 | Claude 未公开运维细节 |
| 行业深度方案 | 法律、金融、营销的深度行业文档 | Claude 仅有通用 use case |
五、实施建议
阶段一:P0 文档补齐(1-2 周)
- 统一 Getting Started:整合现有 QUICK_START,写一个 5 分钟上手教程
- API Reference 完善:为核心 API 补充请求/响应 Schema、错误码、curl 示例
阶段二:P1 文档建设(2-4 周)
- Prompt 工程指南:MBE 场景的 Prompt 最佳实践
- 评估方法论:从工具文档转化为方法论文档
- Glossary 术语表:MBE 核心概念定义
阶段三:P2 商业化文档(4-8 周)
- MBE 系统卡:正式的能力白皮书
- 安全合规文档:体系化整合
- 定价文档:面向客户的计费说明
阶段四:P3 生态建设(持续)
- Agent 框架文档:随 Level 6 开发同步编写
- 国际化:核心文档英文版
- llms.txt + Cookbook:AI 可读索引 + 可复现示例
文档版本: v1.0
更新日期: 2026-02-11
参考: Claude Platform Docs | Claude llms.txt