不改用户现有系统,通过 API 调用 MBE 实现 Self-Critical Sequence 应用

本文档说明如何不修改用户现有系统,通过 HTTP API 调用 MBE,实现 Self-Critical Sequence 在业务流程(如客服系统)中的应用。


一、集成架构:外部调用模式

用户的客服系统(不改动)
        │
        │  HTTP 请求
        ▼
┌─────────────────────────────────────┐
│  MBE API 服务(独立部署)              │
│  - 专家路由 + RAG + Self-Critique     │
│  - 知识检索                           │
│  - 反馈记录                           │
└─────────────────────────────────────┘
        │
        │  JSON 响应
        ▼
用户的客服系统(只做 HTTP 调用)

原则:用户系统仅通过 HTTP 调用 MBE,不引入 MBE 代码、不改变原有业务逻辑。


二、MBE 现有可用的 API 端点

2.1 对话/问答(含 Self-Critique)

用途 端点 说明
专家问答(试用) POST /api/experts/market/{expert_id}/trial 指定专家回答,内部调用 route_and_answer(含 Self-Critique)
法律咨询 POST /api/civil-lawyer/consult 法律咨询,内部调用 route_and_answer
专家列表 GET /api/experts/availableGET /api/experts/all 获取可用专家列表,用于选择 expert_id

说明:专家试用接口需先通过 GET /api/experts/available 获取 expert_id,再调用 trial 接口。

请求示例(专家试用,等价于指定专家问答):

POST /api/experts/market/{expert_id}/trial
{
  "user_input": "客户的退款问题如何解决?",
  "user_id": "cs_agent_001",
  "device_id": "cs_system"
}

响应:包含 answerexpert_nameremaining_trials 等,答案已通过 Self-Critique 验证。

请求示例(法律咨询,通用问答入口,自动路由):

POST /api/civil-lawyer/consult
{
  "question": "客户的退款问题如何解决?",
  "context": []
}

响应:包含 answerexpertconfidencereferences 等,答案已通过 Self-Critique 验证。

2.2 专家匹配(路由验证)

用途 端点 说明
测试匹配 POST /admin/knowledge/expert/test-match 输入问题,返回匹配的专家列表及分数

请求示例

POST /admin/knowledge/expert/test-match
{
  "question": "客户投诉物流延迟"
}

响应matches 列表(expert_id、score、keywords),可用于客服系统的工单路由决策。

2.3 知识检索(RAG 上下文)

用途 端点 说明
知识搜索 POST /admin/knowledge/search 按问题检索知识库
专家上下文 GET /admin/knowledge/search/context?query=...&kb_ids=... 获取用于 LLM 的上下文

请求示例

POST /admin/knowledge/search
{
  "query": "退款政策",
  "kb_ids": ["kb_cs_policy"],
  "top_k": 5
}

2.4 反馈与学习

用途 端点 说明
答案反馈 POST /api/feedback/answer 记录用户对答案的评分(1-5),含 FeedbackCritique 校验
专家匹配反馈 POST /api/feedback/expert 记录匹配正确/错误(switch/positive/negative)
交互记录 POST /api/trust/interaction 记录 critique_pass/critique_fail 等

请求示例(答案反馈):

POST /api/feedback/answer
{
  "query": "退款流程",
  "expert_id": "dynamic_kb_cs",
  "rating": 5,
  "has_hallucination": false  // 若有 QA 检测结果可传入
}

2.5 Critique 状态

用途 端点 说明
状态查询 GET /api/health/critique 查看 Self-Critique 是否启用及配置

三、客服系统集成流程示例

3.1 模式 A:MBE 作为问答引擎(推荐)

用户系统把 MBE 当「黑盒问答服务」:

客服收到客户问题
    → 调用 MBE POST /api/civil-lawyer/consult(通用问答)
        或 POST /api/experts/market/{expert_id}/trial(指定专家)
    → 获取答案(已含 Self-Critique、RAG 验证)
    → 展示给客服/客户

无需改动用户系统结构,仅增加一个 HTTP 调用。

3.2 模式 B:MBE 作为路由建议

用户系统保留自己的回答逻辑,用 MBE 做路由建议:

工单/问题进入
    → 调用 MBE POST /admin/knowledge/expert/test-match
    → 获取推荐专家/队列
    → 用户系统按建议路由工单

3.3 模式 C:MBE 作为检索 + 自建生成

用户系统自己调 LLM 生成回答,用 MBE 做知识检索:

客户问题
    → 调用 MBE POST /admin/knowledge/search
    → 获取 top-k 知识块
    → 用户系统将知识块拼成 prompt 给自有 LLM
    → 生成回答

检索结果已由 MBE 侧处理,用户系统只需按需使用。

3.4 模式 D:反馈闭环

用户系统在交互结束后,把反馈回传 MBE:

会话结束
    → 调用 MBE POST /api/feedback/answer
    → 传入 query、expert_id、rating、has_hallucination(若有)
    → MBE 记录并做 FeedbackCritique,用于学习

四、实现要点:不改用户系统

4.1 认证方式

  • API KeyAuthorization: Bearer {API_KEY}X-API-Key: {API_KEY}
  • Token:用户登录后获取的 JWT

具体以 MBE 部署的认证配置为准。

4.2 调用方式

  • 同步:普通 HTTP 请求
  • 异步:在用户系统内用异步 HTTP 客户端(如 aiohttpfetch)调用,不阻塞主流程

4.3 错误与超时

  • 设置合理超时(如 10–30 秒)
  • 失败时回退到原有逻辑(如默认客服、预设话术)

4.4 数据映射

用户系统只需做简单映射:

  • 问题 → query / user_input
  • 专家/队列 → expert_id(若 MBE 侧有对应专家)
  • 分数 → rating(1–5)

五、可扩展的 MBE 端 API(可选)

若需要更细粒度的 Self-Critique 能力,可在 MBE 侧增加独立 API,供外部系统按需调用:

建议 API 用途 输入 输出
POST /api/critique/validate-answer 答案质量校验 question, answer, context is_grounded, has_hallucination, suggestion
POST /api/critique/validate-route 路由校验 question, selected_expert, alternatives is_best_match, better_alternatives
POST /api/critique/validate-retrieval 检索结果校验 query, chunks coverage_ok, suggested_top_k

当前 MBE 已将这些能力集成在 route_and_answer、知识检索等流程中。通过对话/检索/反馈等现有 API,即可使用 Self-Critique 能力,而无需新增独立 API。


六、总结

维度 方案
集成方式 仅 HTTP API,不修改用户系统
认证 API Key / Token
主要入口 对话、专家匹配、知识检索、反馈等现有 API
Self-Critique 已在对话、检索、反馈流程中内置
扩展 可选增加独立 Critique API

用户系统只需按上述方式调用 MBE API,即可利用 Self-Critical Sequence 能力,实现客服等业务流程的优化与校验。