不改用户现有系统，通过 API 调用 MBE 实现 Self-Critical Sequence 应用

本文档说明如何不修改用户现有系统，通过 HTTP API 调用 MBE，实现 Self-Critical Sequence 在业务流程（如客服系统）中的应用。

一、集成架构：外部调用模式

用户的客服系统（不改动）
        │
        │  HTTP 请求
        ▼
┌─────────────────────────────────────┐
│  MBE API 服务（独立部署）              │
│  - 专家路由 + RAG + Self-Critique     │
│  - 知识检索                           │
│  - 反馈记录                           │
└─────────────────────────────────────┘
        │
        │  JSON 响应
        ▼
用户的客服系统（只做 HTTP 调用）

原则：用户系统仅通过 HTTP 调用 MBE，不引入 MBE 代码、不改变原有业务逻辑。

二、MBE 现有可用的 API 端点

2.1 对话/问答（含 Self-Critique）

用途	端点	说明
专家问答（试用）	`POST /api/experts/market/{expert_id}/trial`	指定专家回答，内部调用 `route_and_answer`（含 Self-Critique）
法律咨询	`POST /api/civil-lawyer/consult`	法律咨询，内部调用 `route_and_answer`
专家列表	`GET /api/experts/available`、`GET /api/experts/all`	获取可用专家列表，用于选择 `expert_id`

说明：专家试用接口需先通过 GET /api/experts/available 获取 expert_id，再调用 trial 接口。

请求示例（专家试用，等价于指定专家问答）：

POST /api/experts/market/{expert_id}/trial
{
  "user_input": "客户的退款问题如何解决？",
  "user_id": "cs_agent_001",
  "device_id": "cs_system"
}

响应：包含 answer、expert_name、remaining_trials 等，答案已通过 Self-Critique 验证。

请求示例（法律咨询，通用问答入口，自动路由）：

POST /api/civil-lawyer/consult
{
  "question": "客户的退款问题如何解决？",
  "context": []
}

响应：包含 answer、expert、confidence、references 等，答案已通过 Self-Critique 验证。

2.2 专家匹配（路由验证）

用途	端点	说明
测试匹配	`POST /admin/knowledge/expert/test-match`	输入问题，返回匹配的专家列表及分数

请求示例：

POST /admin/knowledge/expert/test-match
{
  "question": "客户投诉物流延迟"
}

响应：matches 列表（expert_id、score、keywords），可用于客服系统的工单路由决策。

2.3 知识检索（RAG 上下文）

用途	端点	说明
知识搜索	`POST /admin/knowledge/search`	按问题检索知识库
专家上下文	`GET /admin/knowledge/search/context?query=...&kb_ids=...`	获取用于 LLM 的上下文

请求示例：

POST /admin/knowledge/search
{
  "query": "退款政策",
  "kb_ids": ["kb_cs_policy"],
  "top_k": 5
}

2.4 反馈与学习

用途	端点	说明
答案反馈	`POST /api/feedback/answer`	记录用户对答案的评分（1-5），含 FeedbackCritique 校验
专家匹配反馈	`POST /api/feedback/expert`	记录匹配正确/错误（switch/positive/negative）
交互记录	`POST /api/trust/interaction`	记录 critique_pass/critique_fail 等

请求示例（答案反馈）：

POST /api/feedback/answer
{
  "query": "退款流程",
  "expert_id": "dynamic_kb_cs",
  "rating": 5,
  "has_hallucination": false  // 若有 QA 检测结果可传入
}

2.5 Critique 状态

用途	端点	说明
状态查询	`GET /api/health/critique`	查看 Self-Critique 是否启用及配置

三、客服系统集成流程示例

3.1 模式 A：MBE 作为问答引擎（推荐）

用户系统把 MBE 当「黑盒问答服务」：

客服收到客户问题
    → 调用 MBE POST /api/civil-lawyer/consult（通用问答）
        或 POST /api/experts/market/{expert_id}/trial（指定专家）
    → 获取答案（已含 Self-Critique、RAG 验证）
    → 展示给客服/客户

无需改动用户系统结构，仅增加一个 HTTP 调用。

3.2 模式 B：MBE 作为路由建议

用户系统保留自己的回答逻辑，用 MBE 做路由建议：

工单/问题进入
    → 调用 MBE POST /admin/knowledge/expert/test-match
    → 获取推荐专家/队列
    → 用户系统按建议路由工单

3.3 模式 C：MBE 作为检索 + 自建生成

用户系统自己调 LLM 生成回答，用 MBE 做知识检索：

客户问题
    → 调用 MBE POST /admin/knowledge/search
    → 获取 top-k 知识块
    → 用户系统将知识块拼成 prompt 给自有 LLM
    → 生成回答

检索结果已由 MBE 侧处理，用户系统只需按需使用。

3.4 模式 D：反馈闭环

用户系统在交互结束后，把反馈回传 MBE：

会话结束
    → 调用 MBE POST /api/feedback/answer
    → 传入 query、expert_id、rating、has_hallucination（若有）
    → MBE 记录并做 FeedbackCritique，用于学习

四、实现要点：不改用户系统

4.1 认证方式

API Key：Authorization: Bearer {API_KEY} 或 X-API-Key: {API_KEY}
Token：用户登录后获取的 JWT

具体以 MBE 部署的认证配置为准。

4.2 调用方式

同步：普通 HTTP 请求
异步：在用户系统内用异步 HTTP 客户端（如 aiohttp、fetch）调用，不阻塞主流程

4.3 错误与超时

设置合理超时（如 10–30 秒）
失败时回退到原有逻辑（如默认客服、预设话术）

4.4 数据映射

用户系统只需做简单映射：

问题 → query / user_input
专家/队列 → expert_id（若 MBE 侧有对应专家）
分数 → rating（1–5）

五、可扩展的 MBE 端 API（可选）

若需要更细粒度的 Self-Critique 能力，可在 MBE 侧增加独立 API，供外部系统按需调用：

建议 API	用途	输入	输出
`POST /api/critique/validate-answer`	答案质量校验	question, answer, context	is_grounded, has_hallucination, suggestion
`POST /api/critique/validate-route`	路由校验	question, selected_expert, alternatives	is_best_match, better_alternatives
`POST /api/critique/validate-retrieval`	检索结果校验	query, chunks	coverage_ok, suggested_top_k

当前 MBE 已将这些能力集成在 route_and_answer、知识检索等流程中。通过对话/检索/反馈等现有 API，即可使用 Self-Critique 能力，而无需新增独立 API。

六、总结

维度	方案
集成方式	仅 HTTP API，不修改用户系统
认证	API Key / Token
主要入口	对话、专家匹配、知识检索、反馈等现有 API
Self-Critique	已在对话、检索、反馈流程中内置
扩展	可选增加独立 Critique API

用户系统只需按上述方式调用 MBE API，即可利用 Self-Critical Sequence 能力，实现客服等业务流程的优化与校验。