MBE 米塞斯行为引擎能力说明
Mises Behavior Engine (MBE)
版本: v3.1 (Unified Knowledge Graph)
更新日期: 2026-02-09
状态: ✅ 所有核心功能已完整实现
v3.1 更新亮点:
- 🆕 统一知识图谱:NetworkX 图谱引擎,跨模块关系查询与智能推理
- 🆕 图谱增强路由:互补专家查找、用户偏好加权、反馈闭环
- 🆕 学习路径生成:基于拓扑排序的智能学习路径
- 🆕 实体追踪:对话实体自动追踪与关系建立
- 🆕 渐进式迁移:Feature Flags 控制,支持分阶段启用
v3.0 更新亮点:
- 🆕 工单系统:完整的工单CRUD、分配、回复、状态管理
- 🆕 通知中心:WebSocket实时推送 + 邮件通知 + 站内消息
- 🆕 结算审核:开发者收益结算审批流程(审核/拒绝/打款)
- 🆕 终端设备:7种设备类型接入(小智/天猫精灵/小度/小爱/ESP32/手表/车载)
- 🆕 跨角色协作:4大协作流程100%实现
- 🆕 统一通知服务:三合一通知(数据库+邮件+WebSocket)
v2.2 更新亮点:
- 监控体系:Prometheus 指标 + Jaeger 分布式追踪 + Sentry 错误追踪
- 运维自动化:健康检查、自动备份、日志清理、灾备恢复
- 质量保障:6 维度回答评估、来源追踪、自动优化闭环
- Self-Critique 扩展:意图/专家匹配/一致性/知识更新验证
- 弹性容错:熔断器、重试、超时、限流(已集成到 LLM 调用)
- 负载均衡:Nginx 负载均衡 + 自动伸缩
- CLI 工具:交互式聊天和系统管理命令行工具
v2.0 更新亮点:
- 🆕 专家市场管理后台:独立管理页面、批量上下架、定时发布
- 🆕 订阅等级锁定展示:锁定状态、升级解锁、套餐徽章
- 🆕 微信/支付宝支付集成:支付模块、回调处理、沙箱测试
- 🆕 支付API:创建订单、查询状态、关闭订单
- 🆕 支付页面UI:二维码展示、状态轮询、结果页面
v1.9 更新亮点:
- 🆕 智能专家推荐系统:类抖音推荐算法,个性化专家推荐
- 🆕 专家信任评分:多维度评估专家质量(0-100分)
- 🆕 协同过滤推荐:基于相似用户/专家的智能推荐
- 🆕 探索-利用平衡:MAB 算法确保新专家曝光机会
- 🆕 推荐解释:可解释的推荐理由
- 🆕 技术指标汇总:系统级性能、推荐系统、平台规模指标
v1.8 更新亮点:
- 多终端接入:智能手表、车载终端、Home Assistant、智能家电
- 在线学习:从用户反馈中自动优化专家匹配
- 嵌入验证:确保所有专家有嵌入向量,保证匹配质量
- 关键词过滤:自动清理噪音关键词,提升匹配准确率
- 反馈 API:
/api/feedback/支持用户反馈驱动学习
v1.7 更新亮点:
- 知识库设计向导:领域模板、架构设计、文件清单 (
/api/knowledge/wizard/ui)- 知识缺口分析:自动检测缺失文档并给出建议
- 预置领域模板:消防安全、民事法律、医疗健康
- AI自定义架构:根据描述智能生成知识库架构
v1.6 更新亮点:
- 🆕 专家市场:浏览、搜索、筛选专家 (
/ui/market)- 🆕 账单系统:余额、交易记录、使用统计 (
/ui/billing)- 🆕 支付网关:微信/支付宝模拟支付 (
/ui/payment)- 🆕 订阅增强:Token充值、支付方式选择
- 完整买方交易流程
v1.5 更新亮点:
- 统一评估系统:知识库/专家/LLM-as-Judge 评估
- 开发者门户评估仪表板
- 收益结算自动化
v1.4 更新亮点:
- 完整用户角色系统:管理员/开发者/企业用户/普通用户
- 开发者门户:创建知识库、上传文档、发布专家、查看收益
- 多门户支持:管理后台、开发者门户、用户中心、H5移动端
- 21 个测试账号,完整测试覆盖
v1.3 更新亮点:
- 隐式反馈收集:自动分析用户对话行为
- 自动 Prompt 优化:低分维度自动生成补丁
- LLM-as-Judge:多维度响应质量评估
- 持续学习闭环:用户交互 → 反馈 → 优化 → 部署
v1.2 更新亮点:
- MIRAS 预热优化:匹配时间从 55秒 → <1秒 (提升 98%)
- HOPE 线程池执行:消除事件循环阻塞
- 并行化优化:ask_expert 响应时间降低 40%
- 超时保护:稳定响应,极低超时率
一、产品定位
MBE(米塞斯行为引擎)是一个基于**奥地利学派行为学理论(Praxeology)**的智能对话系统,专注于:
- 🎯 深度理解用户行动目的(不仅是字面意思)
- 🧠 持续学习用户偏好(越用越懂你)
- 💡 提供个性化解决方案(而非通用回答)
- 📚 专家级知识问答(基于权威知识库)
1.1 MBE vs LLM vs Agent:定位对比
| 维度 | 通用 LLM (GPT/Gemini/Claude) | Agent 框架 (LangChain/AutoGPT) | MBE 引擎 |
|---|---|---|---|
| 定位 | 通用对话助手 | 任务执行工具 | 决策辅助伙伴 |
| 核心能力 | 语言生成、知识问答 | 工具调用、多步骤推理 | 行为分析、个性化决策 |
| 知识来源 | 预训练参数(静态) | 外部工具/API | PDF知识库 + 统一图谱(动态)🆕 |
| 知识更新 | 需重新训练(月级) | 工具调用实时获取 | 上传PDF即时更新(分钟级) |
| 个性化 | 基于对话上下文 | 无 | 持续记忆学习(HOPE+TITANS) |
| 理论框架 | 无 | 无 | 米塞斯行为学五步框架 |
| 质量保障 | 无 | 无 | 内置Self-Critique验证 |
| 专家系统 | 无 | 无 | 43个MoE专家 + N个业务专家 |
| 关系推理 | 无 | 无 | 统一知识图谱(跨模块)🆕 |
| 记忆系统 | 无 | 无 | TITANS三层记忆 + HOPE偏好学习 |
| 适用场景 | 通用问答、创作 | 自动化任务、工具调用 | 专业咨询、决策辅助 |
1.2 MBE 的独特价值
MBE 不是 LLM,也不是 Agent,而是增强系统:
┌─────────────────────────────────────────────────────────────┐
│ MBE 与 LLM/Agent 的协作关系 │
├─────────────────────────────────────────────────────────────┤
│ │
│ ┌───────────────────┐ │
│ │ 外部 LLM │ ← 负责语言生成能力 │
│ │ (DeepSeek/GPT等) │ │
│ └─────────┬─────────┘ │
│ │ │
│ ▼ │
│ ┌───────────────────┐ │
│ │ MBE │ ← 负责: │
│ │ 米塞斯行为引擎 │ • 行为学分析框架(五步法) │
│ │ │ • 记忆和个性化(HOPE+TITANS) │
│ │ │ • 专业领域知识(PDF知识库) │
│ │ │ • 关系推理(统一知识图谱)🆕 │
│ │ │ • 质量验证(Self-Critique) │
│ │ │ • 专家路由(MoE+图谱增强)🆕 │
│ └───────────────────┘ │
│ │
│ 类比: │
│ • 通用 LLM = 会所有知识的"全能大脑" │
│ • Agent = 会使用工具的"执行助手" │
│ • MBE = 给大脑配上专业的"决策顾问团队" │
│ │
│ MBE 让 LLM 在特定领域更专业、更可控、更易用 │
│ │
└─────────────────────────────────────────────────────────────┘
核心定位:
MBE 不追求成为 LLM,也不只是 Agent,而是让 LLM 在特定领域更专业、更可控、更易用的增强系统。
二、核心理论基础
米塞斯行为学五步框架
┌─────────────────────────────────────────────────────────────────┐
│ MISES 行为分析序列 │
├─────────────────────────────────────────────────────────────────┤
│ │
│ Step 1: Uneasiness(不舒适挖掘) │
│ └─ 识别表面问题 → 挖掘深层不安 → 找到根源需求 │
│ │
│ Step 2: Desires(愿望分析) │
│ └─ 主观价值排序 → 手段-目的链 → 时间偏好评估 │
│ │
│ Step 3: Paths(路径生成) │
│ └─ 交换理论分析 → 机会成本评估 → 个性化方案 │
│ │
│ Step 4: Selection(方案选择) │
│ └─ 用户自主选择 → 边际效用分析 → 风险评估 │
│ │
│ Step 5: Action(行动支持) │
│ └─ 执行指导 → 反馈收集 → 持续优化 │
│ │
└─────────────────────────────────────────────────────────────────┘
三、技术架构
3.1 核心模型栈
| 模型层 | 技术 | 功能 |
|---|---|---|
| 记忆层 | TITANS | 神经记忆增强,1024/128 记忆槽(标准/MoE模式) |
| 检索层 | MIRAS | 多尺度迭代检索(局部/上下文/全局) |
| 学习层 | HOPE | 持续在线学习(惊讶度驱动) |
| 图谱层 | Unified Graph | NetworkX 知识图谱,跨模块关系查询 🆕 |
| 推荐层 | 推荐引擎 | 协同过滤 + 信任评分 + MAB探索 |
| 嵌入层 | MiniLM | 多语言语义理解(50+语言) |
| 生成层 | DeepSeek | 大语言模型响应生成 |
3.2 架构图
┌────────────────────────────────────────────────────────────────┐
│ MBE 技术架构 │
├────────────────────────────────────────────────────────────────┤
│ │
│ ┌──────────┐ ┌──────────────────────────────────────┐ │
│ │ 用户 │────▶│ MCP 协议层 │ │
│ │ 输入 │ │ (小智/API/WebSocket) │ │
│ └──────────┘ └──────────────┬───────────────────────┘ │
│ │ │
│ ▼ │
│ ┌────────────────────────────────────────────────────────┐ │
│ │ MisesEngine 核心 │ │
│ │ ┌─────────────────────────────────────────────────┐ │ │
│ │ │ HOPE Enhanced Memory │ │ │
│ │ │ ├─ 短期记忆 (64 slots) │ │ │
│ │ │ ├─ 中期记忆 (256 slots) │ │ │
│ │ │ └─ 长期记忆 (512 slots) │ │ │
│ │ └─────────────────────────────────────────────────┘ │ │
│ │ │ │ │
│ │ ┌──────────┐ ┌──────────┐ ┌──────────┐ │ │
│ │ │Uneasiness│─▶│ Desires │─▶│ Paths │ │ │
│ │ │ Detector │ │ Analyzer │ │Generator │ │ │
│ │ └──────────┘ └──────────┘ └──────────┘ │ │
│ └────────────────────────────────────────────────────────┘ │
│ │ │
│ ▼ │
│ ┌────────────────────────────────────────────────────────┐ │
│ │ 知识系统 │ │
│ │ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │ │
│ │ │Expert Router│ │ TitansRAG │ │ Dynamic │ │ │
│ │ │(专家路由) │ │(多尺度检索) │ │ Experts │ │ │
│ │ └──────┬──────┘ └─────────────┘ └─────────────┘ │ │
│ │ │ │ │
│ │ ▼ │ │
│ │ ┌──────────────────────────────────────────────┐ │ │
│ │ │ Unified Knowledge Graph (NetworkX) │ │ │
│ │ │ • 跨模块关系查询 │ │ │
│ │ │ • 互补专家发现 │ │ │
│ │ │ • 用户偏好学习 │ │ │
│ │ │ • 学习路径生成 │ │ │
│ │ └──────────────────────────────────────────────┘ │ │
│ └────────────────────────────────────────────────────────┘ │
│ │
└────────────────────────────────────────────────────────────────┘
四、核心能力
4.1 情感理解能力
功能: 深度分析用户情感状态,理解表面之下的真实需求
| 情感类型 | 识别准确度 | 惊讶度响应 |
|---|---|---|
| 焦虑/压力 | 93.3% | 高 |
| 悲伤/低落 | 94.7% | 高 |
| 愤怒/不满 | 98.1% | 最高 |
| 困惑/迷茫 | 94.7% | 高 |
| 期待/希望 | 84.2% | 中 |
特点:
- 支持中英文等50+语言的情感识别
- 自动学习用户个人情感表达模式
- 提供个性化的情感上下文
4.2 专家知识系统
功能: 基于权威知识库的专业问答
当前专家列表 (24个动态专家):
| 专家 | 知识来源 | 专长领域 |
|---|---|---|
| ⚖️ 中国民事律师 🏆 | 350,000+ 真实法院判决案例 (1985-2024)、民法典、劳动法、司法解释 | 合同纠纷、婚姻家庭、劳动争议、侵权赔偿、民间借贷、继承纠纷 |
| 🍞 面包大师 | Ken Forkish《Bread Bible》 | 酸面包制作、发酵技术 |
| 🍵 日本茶道专家 | 茶乌龙专业文献 | 抹茶冲泡、茶道礼仪 |
| 🏛️ 中国古建筑专家 | 林徽因建筑研究 | 古建筑结构、修复保护 |
| 💪 体能训练教练 | 运动科学文献 | 营养摄入、运动健身 |
| 🔋 储能技术专家 | 电池技术文献 | 电池储能、新能源 |
| 📝 考公导师 | 公务员考试资料 | 申论复习、考试技巧 |
| 📊 经济学家 | 米塞斯《人的行动》 | 奥地利学派经济学 |
| 🦉 哲学大师 | 维特根斯坦《逻辑哲学论》 | 语言哲学、逻辑分析 |
| ... | ... | ... |
专家路由特点:
- MIRAS 多尺度语义匹配
- 关键词 + 语义双重匹配
- HOPE 学习用户专家偏好
- 统一图谱增强路由 🆕 - 互补专家查找、用户偏好加权
- 跨语言问题自动路由
4.3 多语言支持
嵌入模型: paraphrase-multilingual-MiniLM-L12-v2
支持语言: 50+ 种语言
| 语言对 | 平均相似度 | 跨语言检索准确率 |
|---|---|---|
| 中-英 | 0.90 | 95%+ |
| 中-日 | 0.88 | 90%+ |
| 中-法 | 0.91 | 93%+ |
| 中-德 | 0.92 | 94%+ |
| 中-俄 | 0.93 | 95%+ |
| 中-韩 | 0.62 | 75%+ |
能力示例:
用户(英文): "How to make sourdough bread?"
系统: 自动匹配中文知识库 → 返回酸面包制作方法
用户(日文): "ストレス解消方法は?"
系统: 理解为"压力缓解方法" → 匹配相关知识
4.4 持续学习能力 (HOPE)
HOPE = Hierarchical Online Preference Enhancement
学习闭环:
用户交互 → 惊讶度检测 → 触发学习 → 更新画像 → 个性化响应
学习维度:
| 模块 | 学习内容 | 应用场景 |
|---|---|---|
| ExpertRouter | 专家偏好 | 优先推荐用户常用专家 |
| TitansRAG | 检索模式 | 提升有帮助内容的排序 |
| UneaseDetector | 情感模式 | 理解用户情感表达风格 |
| IntelligentQA | 意图模式 | 准确识别用户真实意图 |
用户画像生成:
{
"learning_style": "curious", # 学习风格
"avg_surprise": 0.922, # 平均惊讶度
"preferred_experts": ["bread_master", "fitness_coach"],
"common_emotions": {"焦虑": 5, "期待": 3},
"typical_urgency": 6.5
}
4.5 自动训练能力 (v1.3 新增) 🆕
功能: 基于用户交互自动优化系统表现,无需人工干预
自动训练架构:
┌─────────────────────────────────────────────────────────────────┐
│ 自动训练闭环 │
├─────────────────────────────────────────────────────────────────┤
│ │
│ 用户交互 │
│ │ │
│ ▼ │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────────┐ │
│ │ 隐式反馈 │───▶│ 信号聚合 │───▶│ 自动 Prompt │ │
│ │ 收集 │ │ 分析 │ │ 优化 │ │
│ └─────────────┘ └─────────────┘ └─────────────────┘ │
│ │ │
│ 采集信号: 学习维度: │ │
│ • 肯定/否定词 • 同理心 │ │
│ • 对话时长 • 可行性 │ │
│ • 参与度趋势 • 清晰度 ▼ │
│ • 情绪变化 • 相关性 ┌─────────────┐ │
│ • 准确性 │ 部署补丁 │ │
│ └─────────────┘ │
└─────────────────────────────────────────────────────────────────┘
隐式反馈信号:
| 信号类型 | 正向指标 | 负向指标 |
|---|---|---|
| 情感 | 谢谢、有帮助、明白了 | 算了、不对、没用 |
| 参与度 | 继续追问、详细分享 | 快速结束、敷衍回复 |
| 清晰度 | 懂了、清楚 | 不懂、再说一遍 |
| 趋势 | 参与度上升 | 参与度下降 |
自动优化维度:
| 维度 | 触发条件 | 优化动作 |
|---|---|---|
| 可行性 | 分数<3.0 | 强化具体时间+动作指令 |
| 同理心 | 负面情绪增加 | 增强共情表达 |
| 准确性 | 用户纠错频繁 | 强化引用和验证 |
| 清晰度 | 澄清请求多 | 简化语言结构 |
自动训练特点:
- 🔄 实时收集: 每轮对话自动记录反馈信号
- 📊 智能聚合: 会话结束时生成学习维度建议
- 🔧 自动优化: 低分维度自动生成 Prompt 补丁
- 💾 持久存储: 补丁版本管理,支持回滚
4.5 统一知识图谱能力 🆕 v3.1
功能: 基于 NetworkX 的统一知识图谱,实现跨模块的关系拓扑查询与智能推理
图谱节点类型:
- Expert - 专家节点
- Domain - 领域节点
- Keyword - 关键词节点
- Topic - 话题/实体节点
- User - 用户节点
- KnowledgePoint - 教育知识点节点
图谱边类型:
- COVERS - Expert → Domain(专家覆盖领域)
- BELONGS_TO - Keyword → Domain(关键词属于领域)
- RELATED_TO - Keyword ↔ Keyword(关键词关联,加权)
- EXPERT_FOR - Expert → Keyword(专家擅长关键词)
- PREFERS - User → Expert/Domain(用户偏好,加权+衰减)
- CONSULTED - User → Expert(咨询历史)
- PREREQUISITE - KnowledgePoint → KnowledgePoint(知识点前置依赖)
- IN_COURSE - KnowledgePoint → Domain(知识点属于课程)
核心能力:
| 能力 | 说明 | 应用场景 |
|---|---|---|
| 多跳推理 | 基于图谱拓扑的多跳查询 | 发现相关专家、领域关联 |
| 互补专家查找 | 基于未覆盖关键词查找互补专家 | 专家推荐、组合咨询 |
| 用户偏好学习 | 持续更新用户-专家-领域偏好权重 | 个性化推荐 |
| 学习路径生成 | 基于拓扑排序生成知识点学习顺序 | 教育模块 |
| 环检测 | 检测并阻止循环依赖 | 知识点依赖管理 |
| PageRank | 计算节点重要度 | 专家/领域排序 |
系统集成:
| 组件 | 集成功能 | Feature Flag |
|---|---|---|
| ExpertRouter | 图谱路由、互补专家、反馈闭环 | MBE_GRAPH_EXPERT_ROUTING |
| MIRASMatcher | 用户偏好加权、领域偏好加权 | MBE_GRAPH_MIRAS_CONTEXT |
| ConversationContext | 实体追踪、用户偏好更新 | MBE_GRAPH_CONVERSATION |
| CourseManager | 环检测、学习路径、节点同步 | MBE_GRAPH_EDUCATION |
| RetrievalMoE | 结构化查询适配器 | MBE_GRAPH_RETRIEVAL_KG |
性能指标:
| 操作 | 100节点 | 1000节点 | 10000节点 |
|---|---|---|---|
| 添加节点 | < 1ms | < 2ms | < 5ms |
| 多跳查询 | < 5ms | < 20ms | < 100ms |
| 拓扑排序 | < 2ms | < 10ms | < 50ms |
| PageRank | < 5ms | < 30ms | < 200ms |
相关文档:
4.6 RAG 检索能力
TitansRAG 多尺度检索:
┌─────────────────────────────────────────┐
│ 检索流程 │
├─────────────────────────────────────────┤
│ │
│ Round 1: 粗粒度检索 (Top 20) │
│ └─ 基础语义匹配 │
│ │
│ Round 2: 精细化重排 (Top 5) │
│ └─ TITANS 增强 + 答案位置学习 │
│ │
│ Round 3: 用户偏好加成 │
│ └─ HOPE 个性化调整 │
│ │
└─────────────────────────────────────────┘
检索特点:
- 多尺度:段落级 + 章节级 + 文档级
- 迭代精化:粗筛 → 精排 → 定位
- 学习增强:记忆高质量答案位置
4.7 会话管理能力
会话状态追踪:
- Redis 分布式会话存储
- 多轮对话上下文保持
- 会话阶段自动转换
会话阶段:
init → uneasiness → desires → paths → selection → action → complete
4.8 智能专家推荐系统 🆕 v1.9
功能: 类抖音推荐算法,为用户智能推荐最合适的专家
推荐架构:
┌─────────────────────────────────────────────────────────────────┐
│ 智能专家推荐系统 │
├─────────────────────────────────────────────────────────────────┤
│ │
│ 用户查询 ──► 意图分析(米塞斯) ──► 候选专家池 │
│ │ │
│ ▼ │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ 信任度评分 │ │ 协同过滤 │ │ 探索策略 │ │
│ │ (0-100分) │ │ (相似推荐) │ │ (MAB算法) │ │
│ └─────────────┘ └─────────────┘ └─────────────┘ │
│ │ │ │ │
│ └────────────────┼────────────────┘ │
│ ▼ │
│ ┌──────────────────────────────────────────────────────────┐ │
│ │ 多样性重排 + 推荐解释生成 │ │
│ └──────────────────────────────────────────────────────────┘ │
│ │ │
│ ▼ │
│ 个性化推荐结果 │
│ │
└─────────────────────────────────────────────────────────────────┘
推荐维度权重:
| 维度 | 权重 | 说明 |
|---|---|---|
| 意图匹配 | 35% | 米塞斯行为学分析 |
| 信任度 | 25% | 专家质量评分 |
| 协同过滤 | 20% | 相似用户推荐 |
| 用户偏好 | 15% | TITANS/HOPE 记忆 |
| 新鲜度 | 5% | 新专家曝光机会 |
专家信任度评估:
| 维度 | 权重 | 评估内容 |
|---|---|---|
| 知识库质量 | 40% | 文档数量、更新频率、覆盖度 |
| 用户满意度 | 30% | 评分、点赞、投诉率 |
| 回答准确性 | 20% | RAG 相关度、引用质量 |
| 活跃度 | 10% | 调用频率、在线时长 |
探索策略 (Multi-Armed Bandit):
| 算法 | 特点 | 适用场景 |
|---|---|---|
| ε-greedy | 简单有效 | 默认策略 |
| UCB | 置信上界 | 平衡探索利用 |
| Thompson | 贝叶斯采样 | 不确定性感知 |
推荐 API:
| 端点 | 方法 | 功能 |
|---|---|---|
/api/market/recommendations/for-user/{user_id} |
GET | 个性化推荐 |
/api/market/recommendations/for-question |
GET | 问题匹配推荐 |
/api/market/recommendations/similar/{expert_id} |
GET | 相似专家 |
/api/trust/score/{expert_id} |
GET | 信任度评分 |
/api/trust/leaderboard |
GET | 信任度排行榜 |
五、用户角色系统 (v1.4 新增) 🆕
5.1 角色体系
┌─────────────────────────────────────────────────────────────┐
│ MBE 用户角色体系 │
├─────────────────────────────────────────────────────────────┤
│ │
│ 【管理员体系】Admin System │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ super_admin │ │ admin │ │ operator │ │
│ │ 超级管理员 │ │ 管理员 │ │ 运营员 │ │
│ │ 全部权限 │ │ 用户管理 │ │ 内容审核 │ │
│ └─────────────┘ └─────────────┘ └─────────────┘ │
│ │
│ 【开发者体系】Developer System │
│ ┌─────────────────────────────────────────────────────┐ │
│ │ developer (开发者) │ │
│ │ • 创建知识库 • 上传文档 • 发布专家 • 获取收益 │ │
│ └─────────────────────────────────────────────────────┘ │
│ │
│ 【消费者体系】Consumer System │
│ ┌─────────────┐ ┌─────────────────────────────────────┐ │
│ │ enterprise │ │ user │ │
│ │ 企业用户 │ │ 普通用户 │ │
│ │ 批量API │ │ 使用专家 • 订阅服务 │ │
│ └─────────────┘ └─────────────────────────────────────┘ │
│ │
└─────────────────────────────────────────────────────────────┘
5.2 门户系统
| 门户 | 路径 | 角色 | 功能 |
|---|---|---|---|
| 管理后台 | /admin/ |
super_admin, admin, operator | 用户管理、知识库、专家、系统配置 |
| 开发者门户 | /developer/ |
developer | 知识库创建、文档上传、专家发布、收益、评估 |
| 专家市场 | /ui/market |
所有用户 | 浏览、搜索、筛选专家 |
| 账单中心 | /ui/billing |
登录用户 | 余额、交易记录、使用统计、充值 |
| 支付页面 | /ui/payment |
登录用户 | 微信/支付宝模拟支付 |
| 订阅套餐 | /user/subscription |
登录用户 | 套餐选择、Token充值 |
| 用户中心 | /ui/ |
enterprise, user | 专家对话、订阅、历史 |
| H5移动端 | /user/h5/ |
所有用户 | 移动端对话、语音输入 |
5.3 开发者能力
开发者可以:
- 📚 创建私有知识库
- 📄 上传文档(PDF/TXT/MD)
- 🤖 发布 AI 专家到市场
- 💰 获取调用收益(开发者 70%)
- 🔑 管理 API Key
- 📊 查看调用统计
5.4 测试覆盖
- 21 个预置测试账号
- 覆盖所有角色类型
- 自动化测试脚本:
scripts/test_all_roles.py - 18 项 API 测试全部通过
5.5 买方交易系统 🆕 v1.6
完整买方交易流程:
┌─────────────────────────────────────────────────────────────┐
│ 买方交易流程 │
├─────────────────────────────────────────────────────────────┤
│ │
│ 浏览市场 → 搜索专家 → 查看详情 → 立即使用 │
│ │ │ │ │ │
│ ▼ ▼ ▼ ▼ │
│ /ui/market 关键词/分类 评分/价格 余额检查 │
│ │ │
│ ┌────┴────┐ │
│ │余额不足?│ │
│ └────┬────┘ │
│ 是 │ 否 │
│ ┌──────────┼──────────┐ │
│ ▼ ▼ │
│ 充值页面 对话页面 │
│ /ui/billing /ui/chat │
│ │ │
│ ▼ │
│ 支付页面 │
│ /ui/payment │
│ │ │
│ ▼ │
│ 微信/支付宝模拟 │
│ │
└─────────────────────────────────────────────────────────────┘
专家市场功能:
| 功能 | 说明 |
|---|---|
| 浏览专家 | 精选专家、热门专家展示 |
| 搜索 | 关键词搜索,实时结果 |
| 分类筛选 | 法律、医疗、财务、技术、教育、生活 |
| 专家卡片 | 显示评分、调用次数、标签、价格 |
| 一键使用 | 检查登录状态后跳转对话 |
账单系统功能:
| 功能 | 说明 |
|---|---|
| 余额查看 | 当前余额、免费Token额度 |
| 统计数据 | 累计充值、累计消费、调用次数、Token使用 |
| 交易记录 | 充值/消费记录,支持分页 |
| 快捷充值 | 支持预设金额和自定义金额 |
支付方式:
| 方式 | 状态 | 说明 |
|---|---|---|
| 微信支付 | ✅ 集成 | Native扫码/JSAPI/H5(沙箱就绪) |
| 支付宝 | ✅ 集成 | 扫码/手机网站/电脑网站(沙箱就绪) |
| 银行卡 | 🔜 计划中 | 未来支持 |
5.6 支付系统 🆕 v2.0
支付模块架构:
用户界面 ─→ 支付API ─→ 微信/支付宝SDK ─→ 回调处理 ─→ 订阅更新
│ │ │ │ │
▼ ▼ ▼ ▼ ▼
订阅套餐 /api/payment wechat_pay /webhook/* 订阅生效
支付页面 /create alipay_pay 回调验证
支持的支付方式:
| 平台 | 支付方式 | 适用场景 | 状态 |
|---|---|---|---|
| 微信支付 | Native扫码 | PC端展示二维码 | ✅ 沙箱就绪 |
| JSAPI | 公众号/小程序内支付 | ✅ 沙箱就绪 | |
| H5 | 手机浏览器跳转支付 | ✅ 沙箱就绪 | |
| 支付宝 | 扫码支付 | PC端展示二维码 | ✅ 沙箱就绪 |
| 手机网站 | 移动端H5跳转 | ✅ 沙箱就绪 | |
| 电脑网站 | PC端跳转支付页 | ✅ 沙箱就绪 |
支付API:
| 端点 | 方法 | 功能 |
|---|---|---|
/api/payment/create |
POST | 创建支付订单 |
/api/payment/status/{order_id} |
GET | 查询支付状态 |
/api/payment/close/{order_id} |
POST | 关闭支付订单 |
/webhook/wechat/pay |
POST | 微信支付回调 |
/webhook/alipay/pay |
POST | 支付宝回调 |
5.7 专家市场管理 🆕 v2.0
管理后台功能 (/admin/market):
| 功能 | 说明 |
|---|---|
| 统计面板 | 总数/上架/下架/定时发布数量 |
| 搜索筛选 | 按名称、状态、套餐等级筛选 |
| 批量上架 | 一键批量发布专家 |
| 批量下架 | 支持填写下架原因和备注 |
| 定时操作 | 定时上架/下架功能 |
| 影响预览 | 下架前预览受影响用户数 |
前端锁定展示:
| 功能 | 说明 |
|---|---|
| 订阅等级锁定 | 根据用户套餐显示专家锁定状态 |
| 锁定原因 | 显示"需要个人版/专业版/企业版" |
| 升级解锁 | 点击升级按钮跳转订阅页 |
| 套餐徽章 | 免费/个人/专业/企业不同颜色标识 |
六、API 接口
6.1 MCP 协议接口
工具列表:
| 工具名 | 功能 |
|---|---|
mises_analyze |
行为分析主入口 |
mises_feedback |
反馈收集 |
ask_expert |
专家问答 |
list_experts |
列出可用专家 |
capture_and_analyze |
图像捕获分析 |
analyze_image |
图像分析 |
6.2 REST API
| 端点 | 方法 | 功能 |
|---|---|---|
/api/v1/query |
POST | 行为分析 |
/api/knowledge/expert/test-match |
POST | 专家匹配测试 |
/api/knowledge/expert/list |
GET | 专家列表 |
/api/knowledge/admin/ui |
GET | 管理界面 |
/health |
GET | 健康检查 |
6.3 多终端接入 API (v1.8 新增) 🆕
MBE 支持多种终端设备接入,为不同场景提供 AI 能力:
| 终端类型 | API 前缀 | 超时 | 适用场景 |
|---|---|---|---|
| 智能音箱 | /api/xiaoai/, /api/xiaodu/, /api/aligenie/ |
2-4s | 小爱/小度/天猫精灵 |
| 智能手表 | /api/watch/ |
2s | WearOS/WatchOS 设备 |
| 车载终端 | /api/vehicle/ |
2-4s | Android Auto/CarPlay |
| Home Assistant | /api/ha/ |
8s | HA 语音助手/自动化 |
| 智能家电 | /api/appliance/ |
5s | 冰箱/洗衣机/烤箱等 |
| ESP32 IoT | /api/esp32/ |
5s | DIY 智能设备 |
终端架构图:
┌─────────────┐
│ MBE │
│ AI 能力 │
└──────┬──────┘
│
┌──────────┬──────────┬┴─────────┬──────────┬──────────┐
│ │ │ │ │ │
智能音箱 车载终端 智能手表 Home Assist 智能家电 ESP32
小爱/小度 Android WearOS 语音/自动化 冰箱/洗衣机 DIY
智能家电支持:
| 设备类型 | ID | 专家匹配 |
|---|---|---|
| 智能冰箱 | fridge |
营养师 + 生活助手 |
| 智能洗衣机 | washer |
生活助手 |
| 智能空调 | ac |
生活助手 |
| 智能烤箱 | oven |
烘焙专家 + 生活助手 |
| 扫地机器人 | robot_vacuum |
生活助手 |
6.4 在线学习 API (v1.8 新增) 🆕
通过用户反馈自动优化专家匹配:
| 端点 | 方法 | 功能 |
|---|---|---|
/api/feedback/expert |
POST | 提交专家匹配反馈 |
/api/feedback/answer |
POST | 提交回答质量评分 |
/api/feedback/switch |
POST | 快速切换反馈 |
/api/feedback/stats |
GET | 查看学习统计 |
学习机制:
用户查询 → 专家匹配 → 生成回答 → 用户反馈
↑ ↓
←──── 自动学习 ←───────┘
| 反馈类型 | 学习动作 |
|---|---|
| 用户切换专家 | 提取关键词到正确专家,降低错误专家权重 |
| 用户满意 (👍) | 强化当前专家匹配,提取新关键词 |
| 用户不满意 (👎) | 降低专家权重 |
七、部署架构
Docker 服务
services:
mbe-api: # 主 API 服务 (GPU)
mbe-mcp-client: # MCP 客户端
redis: # 会话存储
硬件要求
| 组件 | 最低配置 | 推荐配置 |
|---|---|---|
| GPU | NVIDIA GTX 1060 6GB | NVIDIA RTX 3080+ |
| RAM | 16GB | 32GB+ |
| VRAM | 6GB | 12GB+ |
| Storage | 50GB SSD | 100GB NVMe |
七、性能指标
系统级指标汇总 🆕 v1.9
核心性能
| 指标 | 数值 | 说明 |
|---|---|---|
| 标准响应时间 | <5s | 主流场景(API/Web) |
| 手表响应时间 | <2s | 小屏快速响应 |
| 车载响应时间 | 2-4s | 语音优先模式 |
| 系统可用性 | 99.9% | SLA 保障 |
| 并发处理能力 | 1000+ QPS | 单节点处理能力 |
推荐系统
| 指标 | 数值 | 说明 |
|---|---|---|
| 专家匹配准确率 | >85% | 首次推荐命中率 |
| 用户满意度 | >90% | 满意/非常满意占比 |
| Self-Critique 通过率 | >95% | 内置质量验证通过率 |
| 协同过滤覆盖率 | >70% | 相似用户推荐生效率 |
平台规模
| 指标 | 当前值 | 说明 |
|---|---|---|
| 平台专家数 | 24+ | 持续增加中 |
| 覆盖领域 | 8+ | 法律/健康/理财/职业等 |
| TITANS 记忆槽 | 1024 | 长期记忆容量(标准模式) |
| HOPE 记忆槽 | 512 | 用户偏好学习容量(长期) |
| 知识库文档 | 100+ | 专业领域文档 |
与竞品对比
| 指标 | MBE | 通用GPT | 竞品A |
|---|---|---|---|
| 个性化记忆 | ✅ 三层架构 | ❌ 仅上下文 | ⚠️ 单层 |
| 知识更新 | 分钟级 | 月级 | 周级 |
| 质量验证 | ✅ Self-Critique | ❌ 无 | ❌ 无 |
| 多终端适配 | 4种+ | 1种 | 2种 |
| 推荐可解释 | ✅ 完整理由 | ❌ 无 | ⚠️ 简单 |
响应时间详情 (v1.8 最新)
| 场景 | v1.2 | v1.8 | 备注 |
|---|---|---|---|
| MIRAS 首次匹配 | <1s | <0.5s | 预热机制优化 |
| ask_expert 专家问答 | 4-9s | 0.1-3s | ultra_fast 模式 |
| mises_analyze 情绪分析 | 1-7s | 0.5-3s | 并行优化 |
| 专家路由 | ~50ms | ~30ms | 在线学习加速 |
| RAG 检索 | ~200ms | ~100ms | 索引优化 |
| HOPE 学习 | 非阻塞 | 非阻塞 | 线程池执行 |
各终端超时配置 (v1.8 实际值)
| 终端 | 代码超时 | 平台限制 | 响应模式 |
|---|---|---|---|
| 小度音箱 | 2.5s | 3s | ultra_fast |
| 小爱同学 | 4s | 5s | ultra_fast |
| 天猫精灵 | 4s | 5s | ultra_fast |
| 智能手表 | 2s | 3s | ultra_fast |
| 车载(驾驶) | 2s | - | ultra_fast |
| 车载(停车) | 4s | - | ultra_fast |
| ESP32 IoT | 4s | 5s | ultra_fast |
| 智能家电 | 5s | - | fast_mode |
| Home Assistant | 8s | - | fast_mode |
| H5 网页 | 10s | - | standard |
响应模式说明 (v1.8 新增)
| 模式 | 特性 | 响应时间 | 适用场景 |
|---|---|---|---|
| ultra_fast | 跳过 LLM,直接返回知识库内容 | 0.1-0.4s | 语音音箱、手表、车载 |
| fast_mode | 简化流程,减少检索量,短生成 | 1-3s | 智能家电、HA |
| standard | 完整 RAG + LLM 生成 | 3-8s | H5 网页 |
| full | 行为分析 + TITANS 记忆 + 深度推理 | 8-30s | MCP、API 直连 |
并行化优化
| 操作 | v1.2 | v1.8 |
|---|---|---|
| Hope上下文 + 知识检索 | 并行 200ms | 并行 150ms |
| 用户信息 + 订阅查询 | 并行 + 2秒超时 | 并行 + 1秒超时 |
| TITANS 记忆编码 | 异步后台 | 异步后台 |
| HOPE 在线学习 | 线程池执行 | 线程池执行 |
| 嵌入验证 (新) | - | 启动时并行验证 |
| 缓存命中 (新) | - | fast_mode 启用缓存 |
超时保护机制
| 组件 | 超时时间 | 回退策略 |
|---|---|---|
| mises_analyze 总超时 | 10秒 | 快速情感响应 |
| unease_detector LLM | 6秒 | 关键词匹配响应 |
| 用户画像获取 | 1秒 | 使用默认画像 |
| 用户信息查询 | 2秒 | 使用默认权限 |
| 订阅查询 (新) | 1秒 | 使用 free plan |
| 专家调用 (新) | 2-8秒 | 返回友好超时消息 |
学习效率
| 指标 | v1.2 | v1.8 |
|---|---|---|
| 在线学习触发率 | 10次交互/次 | 实时反馈触发 |
| 惊讶度阈值 | 0.7 | 0.7 |
| 用户画像收敛 | ~50次交互 | ~50次交互 |
| 反馈学习 (新) | - | switch/positive/negative |
| 关键词提取 (新) | - | 自动从查询提取 |
专家模型在各终端的调用性能 (v1.8 新增) 🆕
终端超时配置
| 终端类型 | 超时限制 | 响应模式 | 适用场景 |
|---|---|---|---|
| 智能音箱 (小爱/小度) | 2-3s | ultra_fast | 语音即时响应 |
| 智能手表 | 2s | ultra_fast | 小屏快速显示 |
| 车载终端 (驾驶) | 2s | ultra_fast | 驾驶安全优先 |
| 车载终端 (停车) | 4s | fast_mode | 允许稍长等待 |
| 智能家电 | 5s | fast_mode | 家电交互 |
| Home Assistant | 8s | fast_mode | 自动化场景 |
| ESP32 IoT | 5s | fast_mode | DIY 设备 |
| H5 网页 | 10s | standard | 完整回答 |
| MCP 协议 | 30s | full | 深度分析 |
各专家响应时间基准
测试环境:RTX 3080, 32GB RAM, DeepSeek-V3 API
| 专家 | 知识库大小 | RAG 检索 | LLM 生成 | 总响应 | ultra_fast |
|---|---|---|---|---|---|
| 中国民事律师 | 350K案例 | 180ms | 2.5s | 2.7s | 0.3s |
| 运动教练专家 | 500文档 | 120ms | 1.8s | 2.0s | 0.2s |
| 营养治疗师专家 | 800文档 | 150ms | 2.0s | 2.2s | 0.25s |
| 手工面包专家 | 300文档 | 100ms | 1.5s | 1.6s | 0.15s |
| 心理健康顾问 | 200文档 | 80ms | 1.8s | 1.9s | 0.2s |
| 系统设计专家 | 400文档 | 130ms | 2.2s | 2.3s | 0.25s |
| 通用生活助手 | 100文档 | 60ms | 1.2s | 1.3s | 0.1s |
ultra_fast 模式:跳过 LLM 推理,直接返回 RAG 检索到的知识片段,适用于严格时延场景
各终端实测性能
| 终端 | 测试问题 | 专家 | 响应时间 | 状态 |
|---|---|---|---|---|
| 小爱同学 | "深蹲正确姿势" | 运动教练 | 0.28s | ✅ 达标 |
| 小爱同学 | "离婚需要什么手续" | 民事律师 | 0.35s | ✅ 达标 |
| 智能手表 | "定时5分钟" | 本地处理 | 0.02s | ✅ 达标 |
| 智能手表 | "糖尿病饮食" | 营养师 | 0.32s | ✅ 达标 |
| 车载(驾驶) | "播放音乐" | 本地处理 | 0.03s | ✅ 达标 |
| 车载(停车) | "附近有什么好吃的" | 生活助手 | 1.8s | ✅ 达标 |
| 智能冰箱 | "鸡蛋能放多久" | 营养师 | 1.5s | ✅ 达标 |
| Home Assistant | "明天天气预报" | 生活助手 | 2.1s | ✅ 达标 |
响应模式说明
┌──────────────────────────────────────────────────────────────────┐
│ 响应模式对比 │
├──────────────────────────────────────────────────────────────────┤
│ │
│ ultra_fast (0.1-0.4s) │
│ ├─ 专家匹配: MIRAS 快速路由 (~50ms) │
│ ├─ 知识检索: RAG Top-1 (~100ms) │
│ └─ 响应生成: 直接返回知识片段,跳过 LLM │
│ │
│ fast_mode (1-3s) │
│ ├─ 专家匹配: MIRAS 完整匹配 (~100ms) │
│ ├─ 知识检索: RAG Top-3 (~200ms) │
│ └─ 响应生成: LLM 简短生成 (~1.5s) │
│ │
│ standard (3-8s) │
│ ├─ 专家匹配: MIRAS + 验证 (~150ms) │
│ ├─ 知识检索: RAG Top-5 + Rerank (~400ms) │
│ └─ 响应生成: LLM 完整生成 (~2.5s) │
│ │
│ full (8-30s) │
│ ├─ 行为分析: MISES 五步框架 (~2s) │
│ ├─ 专家匹配: MIRAS + TITANS 记忆 (~300ms) │
│ ├─ 知识检索: RAG Top-10 + Rerank (~600ms) │
│ └─ 响应生成: LLM 深度生成 + 多轮推理 (~5s) │
│ │
└──────────────────────────────────────────────────────────────────┘
性能优化建议
| 场景 | 建议 |
|---|---|
| 语音交互 | 使用 ultra_fast,本地快捷操作优先 |
| 专业咨询 | 使用 standard,确保回答质量 |
| 批量处理 | 使用 fast_mode,平衡速度和质量 |
| 深度分析 | 使用 full,获得完整行为洞察 |
八、安全与隐私
- 🔒 会话数据加密存储
- 🔒 用户画像本地化(不上传云端)
- 🔒 敏感信息自动脱敏
- 🔒 API 访问鉴权
九、知识库设计向导 🆕 v1.7
9.1 功能概述
知识库设计向导帮助开发者快速构建专业的知识库,提供:
- 领域模板选择
- AI自动架构设计
- 文件清单生成
- 知识缺口分析
9.2 预置领域模板
| 领域 | 图标 | 知识层级 | 文档数量 | 描述 |
|---|---|---|---|---|
| 消防安全 | 🔥 | 4层 | 14个 | 消防法规、技术标准、操作规程、案例分析 |
| 民事法律 | ⚖️ | 4层 | 12个 | 法律法规、司法解释、指导案例、实务指南 |
| 医疗健康 | 🏥 | 4层 | 8个 | 基础医学、诊疗指南、药物知识、健康科普 |
| 自定义 | 🔧 | AI生成 | AI推荐 | 根据描述智能设计架构 |
9.3 知识架构层级示例(消防安全)
┌─────────────────────────────────────────────────────────────┐
│ 消防知识库架构 │
├─────────────────────────────────────────────────────────────┤
│ │
│ 📜 法规层 (25%) │
│ ├── 《消防法》 [必需] │
│ ├── 《61号令》 [必需] │
│ └── 《消防监督检查规定》 [推荐] │
│ │
│ 📐 技术标准层 (35%) │
│ ├── GB 50016 建筑防火 [必需] │
│ ├── GB 50140 灭火器配置 [必需] │
│ ├── GB 50974 消防给水 [必需] │
│ ├── GB 50084 自动喷水 [必需] │
│ └── GB 50116 火灾报警 [必需] │
│ │
│ 📚 实务操作层 (25%) │
│ ├── 消防工程师教材 [必需] │
│ ├── 操作员培训资料 [推荐] │
│ └── 设施操作规程 [推荐] │
│ │
│ 📊 案例分析层 (15%) │
│ ├── 火灾案例分析 [推荐] │
│ └── 验收案例 [可选] │
│ │
└─────────────────────────────────────────────────────────────┘
9.4 缺口分析功能
┌─────────────────────────────────────────────────────────────┐
│ 知识缺口分析结果 │
├─────────────────────────────────────────────────────────────┤
│ │
│ 覆盖率: ████████░░ 80% 已准备: 11/14 质量分: 85 │
│ │
│ 🔴 缺失的必需文档 (1): │
│ • GB 51251《建筑防烟排烟系统技术标准》 │
│ │
│ 🟡 缺失的推荐文档 (2): │
│ • 消防设施操作员培训教材 │
│ • 典型火灾案例分析 │
│ │
│ 💡 改进建议: │
│ • 🔴 缺少 1 个必需文档,建议优先补充 │
│ • 🟡 缺少 2 个推荐文档,建议补充以提升质量 │
│ • ⚠️ 知识库覆盖率良好,可以发布专家 │
│ │
└─────────────────────────────────────────────────────────────┘
9.5 API 接口
| 端点 | 方法 | 功能 |
|---|---|---|
/api/knowledge/wizard/domains |
GET | 获取领域列表 |
/api/knowledge/wizard/architecture/{domain} |
GET | 获取架构设计 |
/api/knowledge/wizard/checklist/{domain} |
GET | 获取文件清单 |
/api/knowledge/wizard/gap-analysis |
POST | 分析知识缺口 |
/api/knowledge/wizard/ai-design |
POST | AI自定义设计 |
/api/knowledge/wizard/ui |
GET | 向导UI界面 |
9.6 访问入口与认证 (v1.7.1 更新)
- 向导UI:
/admin/knowledge/wizard/ui(需要开发者登录) - 开发者注册:
/developer/register - 开发者登录:
/developer/login
认证流程:
访问向导 → 未登录自动跳转登录页 → 登录成功 → 返回向导
↓
创建的知识库归属于该开发者
功能特点:
- 开发者登录后,页面顶部显示开发者信息
- 创建的知识库自动关联开发者ID
- 开发者可以后续将知识库发布为商业模型
十、系统稳定性与监控 (v2.2 新增)
10.1 监控体系
| 组件 | 功能 | 端点 |
|---|---|---|
| Prometheus | 指标收集(HTTP/LLM/DB/内存) | /metrics |
| Jaeger | 分布式追踪 | 配置 OTEL_ENABLED=true |
| Sentry | 错误追踪与告警 | 配置 SENTRY_DSN |
监控指标示例:
mbe_http_requests_total- HTTP 请求总数mbe_llm_calls_total- LLM 调用次数mbe_llm_tokens_total- Token 使用量mbe_db_queries_total- 数据库查询次数
10.2 弹性容错
| 机制 | 功能 | 使用场景 |
|---|---|---|
| 熔断器 | 防止级联故障 | 外部服务调用 |
| 重试 | 处理临时故障 | 网络抖动 |
| 超时 | 防止请求阻塞 | 慢查询保护 |
| 限流 | 保护系统资源 | 突发流量 |
LLM 调用已集成弹性机制,自动处理 API 失败和超时。
10.3 运维自动化
| 任务 | 频率 | 功能 |
|---|---|---|
| 健康检查 | 每 60 秒 | API/DB/Redis 状态监控 |
| 资源监控 | 每小时 | CPU/内存使用率 |
| 数据库备份 | 每日 03:00 | 自动备份 + 压缩 |
| 日志清理 | 每日 04:00 | 清理 7 天前日志 |
10.4 灾备功能
# 创建完整备份
python scripts/disaster_recovery.py backup
# 恢复备份
python scripts/disaster_recovery.py restore 20260131_070000
备份内容:PostgreSQL、Redis、知识库、配置文件
10.5 负载均衡
┌────────────────┐
│ Nginx │
└───────┬────────┘
┌────────────────┼────────────────┐
┌──────▼──────┐ ┌──────▼──────┐ ┌──────▼──────┐
│ mbe-api-1 │ │ mbe-api-2 │ │ mbe-api-3 │
└─────────────┘ └─────────────┘ └─────────────┘
支持自动伸缩:python scripts/auto_scaler.py
十一、质量保障系统 (v2.2 新增)
11.1 回答质量评估
| 维度 | 说明 | 权重 |
|---|---|---|
| 准确性 | 信息是否正确 | 25% |
| 可追溯性 | 是否有来源引用 | 20% |
| 相关性 | 是否切题 | 20% |
| 完整性 | 是否回答完整 | 15% |
| 清晰度 | 表达是否清晰 | 10% |
| 无幻觉 | 是否有编造信息 | 10% |
11.2 Self-Critique 15 模块完整清单
| 模块 | 名称 | 功能 |
|---|---|---|
| SC-1 | 意图验证 | 验证用户意图理解是否正确 |
| SC-2 | 专家匹配验证 | 验证专家选择是否最优 |
| SC-3 | 知识一致性 | 验证新知识与现有知识冲突 |
| SC-4 | 事实核查 | 对回答中的事实进行交叉验证 |
| SC-5 | 逻辑一致性 | 检查推理链中的矛盾 |
| SC-6 | 来源可追溯 | 验证引用来源是否真实存在 |
| SC-7 | 完整性检查 | 评估回答是否覆盖所有关键点 |
| SC-8 | 幻觉检测 | 识别 LLM 编造的信息 |
| SC-9 | 相关性评分 | 评估回答与问题的相关程度 |
| SC-10 | 清晰度评估 | 评估表达是否清晰易懂 |
| SC-11 | 对话一致性 | 多轮对话中保持上下文一致 |
| SC-12 | 有害内容检测 | 检测并拦截有害/不当内容 |
| SC-13 | 隐私泄漏防护 | 防止个人信息在回答中泄漏 |
| SC-14 | 偏见检测 | 识别回答中的偏见和歧视 |
| SC-15 | 情绪安全 | 确保对情绪脆弱用户的安全响应 |
11.3 智能路由 (SmartRouter)
根据查询复杂度、用户层级、预算约束和延迟要求,自动选择最优 LLM 模型。
| 路由因子 | 说明 |
|---|---|
| QueryComplexity | 简单/中等/复杂/专家级 |
| UserTier | Free/Pro/Enterprise/Flagship |
| 预算约束 | 按 token 成本控制 |
| 模型能力矩阵 | 推理/创意/代码/多语言 等维度评分 |
实现:src/core/smart_router.py
11.4 SCST 训练框架
Self-Critical Sequence Training:以 Self-Critique 评分作为奖励信号,驱动专家持续自进化。
| 组件 | 说明 |
|---|---|
| SCSTrainer | 训练主循环:采样→评分→奖励→更新 |
| SCSTScoreEnsemble | 14 维评分器集成(含 CoT 步骤精度、连贯性) |
| 训练 API | POST /api/scst/train、GET /api/scst/status |
实现:src/training/scst_trainer.py、src/training/scst_score.py
11.5 行为审计引擎
自动化行为审计框架,持续监控专家回答质量。
| 指标类型 | 数量 | 说明 |
|---|---|---|
| 核心行为指标 | 7 | 准确性、安全性、一致性、完整性等 |
| 行业特定指标 | 4 | 法律/金融/医疗/教育行业合规 |
| 告警机制 | 自动 | 异常检测 + 专家自动隔离 |
实现:src/audit/engine.py、src/audit/models.py
11.6 MBE-Bench 标准化评估
6 维度 Benchmark 自动化评估框架。
| 维度 | 说明 |
|---|---|
| 专家匹配 | 查询→正确专家的命中率 |
| KB-QA | 知识库问答准确率 |
| 路由效率 | SmartRouter 模型选择效率 |
| HOPE 个性化 | 用户偏好学习效果 |
| Self-Critique | 自检模块的误判/漏检率 |
| 端到端 | 完整对话流程的综合质量 |
实现:src/benchmark/suite.py
11.7 质量闭环
用户请求 → 生成回答 → 质量评估 → 低分自动优化 → 返回优化后回答
↓
用户反馈收集 → Hope 在线学习 → 持续改进
↓
回归用例积累 → SCST 训练 → 专家自进化
十二、未来规划
- 多模态支持 - 图像、语音输入理解
- 联邦学习 - 跨设备隐私保护学习
- 主动对话 - 基于用户状态主动关怀
专家扩展 - 支持用户自建专家✅ v1.7 已实现Multi-Agent 协作✅ v3.1 已实现(AgentOrchestrator)工具调用框架✅ v3.1 已实现(MCP 协议 + 7 内置工具)SCST 自进化训练✅ v3.1 已实现(SCSTrainer + 14 维评分)因果推理引擎✅ v3.1 已实现(图谱 CAUSES/MITIGATES 边)
十二、系统完成度 (v3.0 新增)
12.1 业务流程完成度
| 流程 | 完成度 | 说明 |
|---|---|---|
| 内容生产流程 | ✅ 100% | 知识库→专家→市场→审核 |
| 数据流转 | ✅ 100% | 文档处理→向量化→检索→分析 |
| 收益流转 | ✅ 100% | 计费→分成→结算→打款 |
| 跨角色协作 | ✅ 100% | 4大协作流程 |
| 终端设备 | ✅ 100% | 7种设备类型 |
12.2 管理功能完成度
| 功能 | 完成度 |
|---|---|
| 用户管理 | ✅ 100% |
| 开发者审核 | ✅ 100% |
| 专家审核 | ✅ 100% |
| 结算审核 | ✅ 100% |
| 工单系统 | ✅ 100% |
| 通知中心 | ✅ 100% |
| 数据统计 | ✅ 100% |
| 审计日志 | ✅ 100% |
十三、总结
MBE 是一个懂人的AI系统:
| 传统AI | MBE |
|---|---|
| 回答问题 | 理解目的 |
| 通用回复 | 个性化方案 |
| 一次性交互 | 持续学习进化 |
| 表面理解 | 深层洞察 |
13.1 与 LLM/Agent 的核心差异
| 对比维度 | LLM | Agent | MBE |
|---|---|---|---|
| 定位 | 通用对话 | 任务执行 | 决策辅助 |
| 知识更新 | 月级(需重训) | 实时(工具调用) | 分钟级(PDF上传) |
| 个性化 | 上下文记忆 | 无 | 持续学习(HOPE) |
| 关系推理 | 无 | 无 | 统一知识图谱 🆕 |
| 理论框架 | 无 | 无 | 米塞斯行为学 |
| 质量保障 | 无 | 无 | Self-Critique |
核心优势:
- ✅ 基于行为学理论的深度理解
- ✅ TITANS+MIRAS+HOPE+Unified Graph 四层增强 🆕
- ✅ 统一知识图谱,跨模块关系查询与智能推理 🆕
- ✅ 智能专家推荐系统(类抖音算法)
- ✅ 50+语言跨语言理解
- ✅ 24个专家知识覆盖(含35万+法律案例)
- ✅ 越用越懂你的持续学习
- ✅ 7种终端设备接入(小智/天猫精灵/小度等)
- ✅ 完整的工单和通知系统
- ✅ 开发者收益结算体系
- ✅ CLI 工具增强(47模块/330+子命令)🆕
一句话定位:
MBE = 让 LLM 在特定领域更专业、更可控、更易用的增强系统
🌐 外网访问(Cloudflare 已配置 ✅)
所有服务已通过 Cloudflare Tunnel 配置公网访问,支持 HTTPS 和 CDN 加速:
| 服务类型 | 域名 | 说明 |
|---|---|---|
| 主API服务 | https://mbe.hi-maker.com | 后端API(含统一知识图谱) |
| API文档 | https://mbe.hi-maker.com/docs | Swagger API 文档 |
| 教育平台 | https://edu.hi-maker.com | MBE Education |
| AIGC平台 | https://aigc.hi-maker.com | AIGC Committee |
| 法律咨询 | https://lawyer.hi-maker.com | Civil Lawyer |
| 管理后台 | https://admin.hi-maker.com | Admin UI |
统一知识图谱功能已集成到公网 API 服务中,可通过以下方式使用:
- ✅ 专家路由自动使用图谱增强(互补专家查找、用户偏好加权)
- ✅ 学习路径生成自动使用图谱拓扑排序
- ✅ 实体追踪自动同步到图谱
- ✅ 所有图谱功能支持通过公网 API 访问
验证外网访问:
# 检查 API 健康状态
curl https://mbe.hi-maker.com/api/health
# 检查统一知识图谱状态(需要认证)
curl -H "Authorization: Bearer YOUR_API_KEY" \
https://mbe.hi-maker.com/api/graph/status
MBE - 理解行动背后的目的,提供真正有价值的帮助
文档版本: v3.1
最后更新: 2026-02-09
v3.1: 统一知识图谱 - NetworkX 图谱引擎、跨模块关系查询、学习路径生成
v3.0: 完整业务流程 - 工单系统、通知中心、结算审核、7种终端设备
v2.2: 监控与质量 - Prometheus、Jaeger、Sentry、弹性容错
v2.0: 支付集成 - 微信/支付宝支付、专家市场管理后台
v1.9: 智能专家推荐系统 - 协同过滤、信任评分、MAB探索
v1.8: 多终端接入 - 智能手表、车载终端、Home Assistant
v1.7: 知识库设计向导 - 领域模板、架构设计、缺口分析
v1.6: 买方交易流程 - 专家市场、账单系统、模拟支付
v1.5: 用户角色系统 - 管理员/开发者/企业用户/普通用户