MBE (Mises Behavior Engine) 使用手册
版本: 2.6
更新日期: 2026-01-27
📋 更新记录
| 版本 | 日期 | 更新内容 |
|---|---|---|
| 2.6 | 2026-01-27 | 新增:智能专家推荐系统、信任度评分、推荐解释 |
| 2.5 | 2026-01-25 | 新增:多终端接入(智能手表/车载/HA/智能家电)、在线学习 |
| 2.4 | 2026-01-25 | 新增:知识库设计向导、开发者认证、KB归属开发者 |
| 2.3 | 2026-01-24 | 新增:专家市场、账单系统、支付功能 |
| 2.2 | 2026-01-24 | 新增:完整用户角色系统(管理员/开发者/企业/用户)、开发者门户 |
| 2.1 | 2026-01-24 | 新增:中国民事律师专家升级(350,000+案例) |
| 2.0 | 2026-01-19 | 新增:权威性评估、批量上传、TITANS模型训练说明 |
| 1.1 | 2026-01-15 | 新增:统一Token管理、任务队列 |
| 1.0 | 2026-01-03 | 初始版本 |
目录
- 系统概述
- 用户角色系统 🆕 v2.2
- 管理员指南
- 开发者指南 🆕 v2.2
- 用户指南
- 专家市场与交易 🆕 v2.3
- 智能专家推荐 🆕 v2.6
- 多终端接入 🆕 v2.5
- 在线学习 🆕 v2.5
- 知识库设计向导 🆕 v2.4
- 专家系统
- 小智集成
- API参考
- 最佳实践
- 模型训练
1. 系统概述
1.1 什么是MBE
MBE(Mises Behavior Engine,米塞斯行为引擎)是一个智能专家系统平台,支持:
- 📚 知识库管理:上传PDF/TXT/MD文档创建知识库
- 🧠 动态专家:基于知识库创建AI专家
- 🔗 MCP协议:与小智等智能设备无缝集成
- 👥 多用户支持:用户隔离的专家和Token管理
1.2 核心概念
| 概念 | 说明 |
|---|---|
| 知识库 | 存储上传文档的容器,支持向量检索 |
| 动态专家 | 基于知识库创建的AI专家,可回答专业问题 |
| Token | 小智设备的连接凭证 |
| MCP | Model Context Protocol,AI模型交互协议 |
1.3 系统架构
用户问题 → 小智终端 → MCP协议 → MBE → 专家路由 → 动态专家 → 知识库检索 → LLM生成 → 回答
2. 用户角色系统 🆕 v2.2
2.1 角色体系
MBE 采用三层角色体系,支持不同类型用户的差异化需求:
┌─────────────────────────────────────────────────────────────┐
│ MBE 用户角色体系 │
├─────────────────────────────────────────────────────────────┤
│ │
│ 【管理员体系】 │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ super_admin │ │ admin │ │ operator │ │
│ │ 超级管理员 │ │ 管理员 │ │ 运营员 │ │
│ └─────────────┘ └─────────────┘ └─────────────┘ │
│ │
│ 【开发者体系】 │
│ ┌─────────────────────────────────────────────────────┐ │
│ │ developer (开发者) │ │
│ └─────────────────────────────────────────────────────┘ │
│ │
│ 【消费者体系】 │
│ ┌─────────────┐ ┌─────────────────────────────────────┐ │
│ │ enterprise │ │ user │ │
│ │ 企业用户 │ │ 普通用户 │ │
│ └─────────────┘ └─────────────────────────────────────┘ │
│ │
└─────────────────────────────────────────────────────────────┘
2.2 角色权限对比
| 角色 | 访问管理后台 | 创建知识库 | 发布专家 | 使用专家 | API调用 |
|---|---|---|---|---|---|
| super_admin | ✅ 完全 | ✅ | ✅ | ✅ | ✅ 无限制 |
| admin | ✅ 用户/专家 | ✅ | ✅ | ✅ | ✅ 无限制 |
| operator | ✅ 内容审核 | ❌ | ❌ | ✅ | ✅ 有限 |
| developer | ❌ | ✅ | ✅ | ✅ | ✅ 按套餐 |
| enterprise | ❌ | ❌ | ❌ | ✅ | ✅ 批量 |
| user | ❌ | ❌ | ❌ | ✅ | ✅ 基础 |
2.3 访问入口
| 角色 | 入口URL | 功能 |
|---|---|---|
| 管理员 | /admin/ |
管理后台(用户、专家、系统) |
| 开发者 | /developer/ |
开发者门户(知识库、专家、收益) |
| 所有用户 | /ui/ |
用户中心(对话、订阅、历史) |
| 所有用户 | /user/h5/ |
H5移动端(语音对话) |
2.4 测试账号
系统预置了 21 个测试账号,密码统一为 Test@123:
管理员体系:
admin@test.local(super_admin)manager@test.local(admin)operator@test.local(operator)
开发者体系:
dev1@test.local~dev3@test.local(developer)
企业用户:
enterprise1@test.local~enterprise3@test.local(enterprise)
普通用户:
user1@test.local~user10@test.local(user)
3. 管理员指南
2.1 访问管理后台
URL: https://your-domain.com/api/knowledge/admin/ui
登录方式:
- 首次访问需输入管理员密码
- 密码在环境变量
MBE_ADMIN_PASSWORD中配置 - 登录后Cookie有效期24小时
2.2 知识库管理
创建知识库
- 点击 "创建知识库" 按钮
- 填写知识库名称和描述
- 点击确认创建
上传文档
单文件上传:
- 选择目标知识库
- 点击 "上传文件" 或拖拽文件到上传区
- 支持格式:PDF、TXT、MD
- 文件大小限制:单文件 50MB
批量上传 🆕:
- 点击 "选择文件夹" 或拖拽整个文件夹
- 一次可上传多个文件
- 后台异步处理,不阻塞操作
断点续传 🆕(>100MB文件):
- 大文件自动分块上传(5MB/块)
- 上传中断后可恢复
- 实时显示上传进度
上传流程:
上传文件 → 文本提取 → 权威性评估 🆕 → 智能分块 → TITANS向量嵌入 → 存储索引
文档处理详情
系统会自动:
- 提取PDF文本(保留页码信息)
- 权威性评估(A/B/C/D级)🆕
- 智能分块(按段落/章节)
- 生成向量嵌入(TITANS增强)
- 构建检索索引
PDF权威性评估 🆕
上传PDF时,系统自动评估内容可信度:
评估维度:
| 维度 | 权重 | 评估内容 |
|---|---|---|
| 元数据权威性 | 40分 | 出版社、作者、ISBN、版次 |
| 内容专业性 | 40分 | 学术结构、参考文献、术语密度 |
| 来源类型 | 20分 | 论文>书籍>教材>手册>文档 |
权威性等级:
| 等级 | 评分 | 含义 | 显示 |
|---|---|---|---|
| 🏆 A | ≥80 | 权威级:来自权威出版社/知名专家 | 推荐使用 |
| ✅ B | 60-79 | 可信级:正规出版物,内容规范 | 可以使用 |
| ⚠️ C | 40-59 | 一般级:来源一般,建议交叉验证 | 谨慎使用 |
| ❓ D | <40 | 待验证:来源不明确 | 不建议 |
识别的权威来源:
- 国际学术出版社:Springer、Wiley、Cambridge、Oxford、MIT Press
- 中文权威出版社:商务印书馆、中华书局、三联书店、北大/清华出版社
- 技术出版社:O'Reilly、机械工业、人民邮电
- 知名专家:系统内置专家名录
2.3 专家管理
发布专家
- 在知识库详情页点击 "发布为专家"
- 填写专家信息:
| 字段 | 说明 | 示例 |
|---|---|---|
| 名称 | 专家显示名称 | 咖啡风味专家 |
| 描述 | 专家能力描述 | 精通咖啡化学成分和风味特征 |
| 关键词 | 匹配触发词(自动生成+手动补充) | 咖啡,风味,烘焙,萃取 |
| 领域 | 专家领域标签 | food,beverage,chemistry |
- 点击 "发布"
专家匹配原理
用户问题匹配专家的算法:
- 关键词匹配:问题中包含专家关键词
- 语义相似度:问题与专家描述的向量相似度
- 领域权重:同领域专家优先
2.4 统一Token管理
MBE v1.1+ 使用统一的Token管理服务,集中管理所有类型的Token。
Token类型
| 类型 | 说明 | 示例 |
|---|---|---|
| xiaozhi_mcp | 小智MCP连接Token | wss://api.xiaozhi.me/mcp/?token=xxx |
| llm_api | LLM API密钥 | sk-xxx |
| cloudflare | Cloudflare Tunnel | eyJhxxx |
| payment | 支付渠道 | stripe/alipay密钥 |
| user_api_key | 用户API密钥 | 第三方集成 |
添加Token
- 进入 "Token管理" 标签
- 点击 "添加Token"
- 输入:
- Token ID(唯一标识)
- 名称(显示用)
- Token类型
- Token值(会被加密存储)
- 过期天数(可选)
Token安全特性
- 加密存储:所有Token使用Fernet加密存储
- 审计日志:记录所有Token操作
- 过期管理:支持设置过期时间和自动提醒
- 轮换支持:支持无缝Token轮换
小智Token获取方式
- 登录 小智控制台
- 进入设备管理
- 选择设备 → MCP配置
- 复制显示的MCP端点URL
2.5 系统监控
审计日志
位置:knowledge_bases/audit_logs/qa_log_YYYY-MM-DD.jsonl
记录内容:
{
"timestamp": "2026-01-15T10:30:00Z",
"expert_id": "xxx",
"question": "用户问题",
"chunks_retrieved": 5,
"relevance_scores": [0.85, 0.72, ...],
"answer_length": 500,
"confidence": "high",
"response_time_ms": 1200
}
查看用户统计
# 查看注册用户数
docker exec mbe-postgres psql -U mbe -d mbe -c "SELECT COUNT(*) FROM users;"
# 查看活跃用户
docker exec mbe-postgres psql -U mbe -d mbe -c "SELECT email, created_at FROM users ORDER BY created_at DESC LIMIT 10;"
4. 开发者指南 🆕 v2.2
4.1 开发者门户访问
URL: https://your-domain.com/developer/
功能概览:
- 📚 创建和管理知识库
- 📄 上传文档到知识库
- 🤖 发布 AI 专家
- 💰 查看收益和调用统计
- 🔑 管理 API Key
4.2 开发者工作流程
注册账号 → 申请开发者 → 创建知识库 → 上传文档 → 发布专家 → 获取收益
4.3 创建知识库
- 登录开发者门户
- 点击 "创建知识库"
- 填写:
- 知识库名称
- 描述(用于匹配用户问题)
- 语言(自动检测/中文/英文)
4.4 上传文档
支持格式:PDF、TXT、MD
上传方式:
- 单文件上传:拖拽或点击选择
- 批量上传:选择文件夹
处理流程:
上传 → 文本提取 → 权威性评估 → 智能分块 → 向量嵌入 → 存储
4.5 发布专家
知识库准备好后,可发布为 AI 专家:
- 在知识库详情页点击 "发布为专家"
- 系统自动生成:
- 专家名称
- 专家描述
- 关键词(可手动补充)
- 确认发布
4.6 收益说明
开发者可通过以下方式获得收益:
| 收益类型 | 说明 | 分成比例 |
|---|---|---|
| 调用收益 | 用户调用专家时按 Token 计费 | 开发者 70% |
| 订阅收益 | 用户订阅专家时的订阅费 | 开发者 60% |
4.7 API 接入
开发者可获取 API Key 用于程序化访问:
import requests
API_KEY = "your_api_key"
response = requests.post(
"https://mbe.hi-maker.com/api/expert/ask",
headers={"Authorization": f"Bearer {API_KEY}"},
json={
"expert_id": "your_expert_id",
"question": "用户问题"
}
)
print(response.json())
5. 用户指南
3.1 访问用户中心
URL: https://your-domain.com/api/portal/ui
3.2 用户注册
- 访问用户中心页面
- 切换到 "注册" 标签
- 填写:
- 邮箱(必填)
- 密码(必填)
- 昵称(可选)
- 点击 "注册"
3.3 用户登录
邮箱登录:
- 输入邮箱和密码
- 点击 "登录"
设备登录(小智用户):
- 输入设备ID
- 系统自动关联或创建用户
3.4 我的Token
登录后可以:
- 查看已添加的Token列表
- 添加新Token关联设备
- 测试Token连接状态
3.5 我的专家(高级用户)
Premium用户可以:
- 上传自己的PDF创建私有知识库
- 发布私有专家(仅自己可用)
- 管理专家关键词和描述
文件限制
| 用户等级 | 文件大小限制 | 知识库数量 | PDF权威性要求 |
|---|---|---|---|
| Free | 10MB | 1个 | B级以上 |
| Premium | 50MB | 10个 | C级以上 |
| Admin | 无限制 | 无限制 | 无限制 |
6. 专家市场与交易 🆕 v2.3
6.1 访问专家市场
URL: https://your-domain.com/ui/market
专家市场是用户发现和使用AI专家的入口。
6.2 浏览专家
市场首页展示:
- 精选专家 - 平台推荐的高质量专家
- 热门专家 - 调用次数最多的专家
6.3 搜索与筛选
搜索方式:
- 关键词搜索:在搜索框输入关键词,回车或点击搜索
- 分类筛选:点击分类按钮(法律、医疗、财务、技术、教育、生活)
专家卡片信息:
- 专家名称和描述
- 评分(⭐)和调用次数
- 标签(领域关键词)
- 价格(每千Token费用)
6.4 使用专家
- 在专家卡片点击 "立即使用"
- 如未登录,系统提示前往登录
- 登录后跳转到对话页面
/ui/chat?expert={id}
6.5 账单管理
URL: https://your-domain.com/ui/billing
账单页面功能:
| 功能 | 说明 |
|---|---|
| 余额查看 | 当前账户余额、今日免费Token额度 |
| 统计数据 | 累计充值、累计消费、总调用次数、总Token使用 |
| 交易记录 | 按时间倒序显示所有充值和消费记录 |
| 快捷充值 | 点击"充值"按钮打开充值弹窗 |
6.6 充值与支付
充值流程:
点击充值 → 选择金额 → 选择支付方式 → 扫码支付 → 充值成功
支持金额:
- 预设金额:¥10、¥50、¥100、¥200、¥500、¥1000
- 自定义金额:输入任意金额
支付方式:
- 💚 微信支付
- 💙 支付宝
支付页面:
- 显示支付金额和二维码
- 5分钟倒计时
- 支付成功后自动跳转账单页面
6.7 订阅套餐
URL: https://your-domain.com/user/subscription
套餐类型:
| 套餐 | 价格 | 功能 |
|---|---|---|
| FREE | ¥0 | 每日5次分析、基础功能 |
| PERSONAL | ¥29/月 | 每日50次分析、完整功能 |
| PRO | ¥99/月 | 无限分析、API访问、1对1支持 |
| ENTERPRISE | 定制 | 私有部署、定制开发 |
Token充值(按需付费):
| 档位 | 价格 | Token量 |
|---|---|---|
| 小额 | ¥10 | ~10万Token |
| 推荐 | ¥100 | ~100万Token |
| 大额 | ¥500 | ~500万Token |
7. 智能专家推荐 🆕 v2.6
7.1 推荐系统简介
MBE v1.9 引入了类抖音的智能专家推荐系统,为用户提供个性化的专家推荐。
核心特点:
- 🎯 个性化推荐:基于用户历史和偏好
- 📊 信任度评分:专家质量透明可见
- 🔄 探索与利用:既推荐熟悉专家,也发现新专家
- 💬 推荐解释:了解为什么推荐这个专家
7.2 专家信任度
每个专家都有一个 0-100 的信任度评分,基于以下维度:
| 维度 | 占比 | 说明 |
|---|---|---|
| 知识库质量 | 40% | 文档数量、更新频率 |
| 用户满意度 | 30% | 评分、点赞、投诉 |
| 回答准确性 | 20% | 引用质量、相关度 |
| 活跃度 | 10% | 调用频率 |
信任等级:
| 等级 | 分数 | 显示 |
|---|---|---|
| 🏆 优秀 | ≥85 | 金色标识 |
| ✅ 良好 | 70-84 | 绿色标识 |
| ⚠️ 一般 | 50-69 | 黄色标识 |
| ❓ 较低 | <50 | 灰色标识 |
7.3 个性化推荐
系统会根据以下因素为您推荐专家:
- 意图匹配:您的问题与专家领域的匹配度
- 历史偏好:您之前使用过的专家类型
- 相似用户:与您相似的用户喜欢的专家
- 新专家发现:偶尔推荐新上线的优质专家
7.4 推荐 API
获取个性化推荐:
GET /api/market/recommendations/for-user/{user_id}
基于问题推荐:
GET /api/market/recommendations/for-question?q=您的问题
查看专家信任度:
GET /api/trust/score/{expert_id}
信任度排行榜:
GET /api/trust/leaderboard
7.5 推荐解释
每个推荐都会附带解释,说明推荐理由:
{
"expert_id": "民事律师",
"trust_score": 92,
"recommendation_reasons": [
"与您的问题高度相关 (法律咨询)",
"该专家信任度评分 92 分,属于优秀级别",
"相似用户对该专家满意度达 95%"
]
}
8. 多终端接入 🆕 v2.5
8.1 智能手表 API
URL: /api/watch/
支持 WearOS/WatchOS 设备接入,针对小屏幕优化。
| 特性 | 说明 |
|---|---|
| 响应超时 | 2秒,适配手表小屏 |
| 快速动作 | 定时、测心率、查天气 |
| 简洁回复 | 自动截断长文本 |
示例请求:
{
"text": "帮我设定明天早上7点的闹钟",
"device_type": "watch"
}
8.2 车载终端 API
URL: /api/vehicle/
支持 Android Auto/CarPlay 系统集成。
| 特性 | 说明 |
|---|---|
| 自适应超时 | 驾驶中2秒 / 停车4秒 |
| 安全模式 | 驾驶中只提供语音回复 |
| 车载命令 | 导航、音乐、空调控制 |
8.3 Home Assistant API
URL: /api/ha/
支持 Home Assistant 语音助手和自动化调用。
配置示例(configuration.yaml):
rest_command:
mbe_ask:
url: "http://mbe-server:8000/api/ha/ask"
method: POST
headers:
Content-Type: application/json
payload: '{"question": "{{ question }}"}'
8.4 智能家电 API
URL: /api/appliance/
支持 10+ 种智能家电类型:
| 家电类型 | 支持功能 |
|---|---|
| 冰箱 | 食材管理、菜谱推荐 |
| 洗衣机 | 程序选择、面料建议 |
| 空调 | 温度调节、节能模式 |
| 烤箱 | 烹饪指导、时间提醒 |
| 扫地机 | 清扫计划、区域设置 |
9. 在线学习 🆕 v2.5
9.1 反馈 API
URL: /api/feedback/
系统通过用户反馈持续优化专家匹配。
8.2 反馈类型
| 类型 | 触发方式 | 学习内容 |
|---|---|---|
| 专家切换 | 用户主动切换专家 | 记录更合适的专家 |
| 满意度评分 | 对话后评分 | 调整专家权重 |
| 关键词学习 | 对话内容分析 | 提取新关键词 |
9.3 学习效果
- 专家匹配准确率持续提升
- 新关键词自动添加到专家配置
- 低质量匹配自动降权
10. 知识库设计向导 🆕 v2.4
10.1 访问向导
URL: /admin/knowledge/wizard/ui
需要开发者登录:向导需要开发者身份认证。
10.2 向导功能
| 功能 | 说明 |
|---|---|
| 领域模板 | 预置消防、法律、医疗、教育模板 |
| AI设计 | 自定义领域智能生成架构 |
| 缺口分析 | 对比上传文件与模板要求 |
| 一键创建 | 创建知识库并跳转上传 |
10.3 开发者认证流程
访问向导 → 未登录跳转登录 → 登录成功 → 返回向导
↓
创建的知识库归属于该开发者
10.4 向导使用步骤
- 选择领域模板 或 AI智能设计
- 查看推荐的文档清单
- 上传已有文件进行缺口分析
- 点击"创建知识库"
- 跳转到上传页面,上传剩余文档
11. 专家系统
11.1 专家类型
| 类型 | 说明 | 创建方式 |
|---|---|---|
| 公共专家 | 所有用户可用 | 管理员创建 |
| 私有专家 | 仅创建者可用 | 用户自建 |
4.2 专家问答流程
1. 用户提问
↓
2. 专家路由(关键词+语义匹配)
↓
3. 选择最佳专家
↓
4. 知识库检索(RAG)
↓
5. 构建提示词(问题+上下文+来源)
↓
6. LLM生成回答
↓
7. 添加置信度和来源引用
↓
8. 返回用户
4.3 回答质量指标
置信度等级
| 等级 | 说明 | 显示 |
|---|---|---|
| high | 高相关性检索结果 | 正常显示 |
| medium | 中等相关性 | 显示提示 |
| low | 低相关性 | 显示警告 |
来源引用
回答会包含:
- 来源文档名称
- 具体页码
- 相关度评分
示例:
根据《咖啡风味化学》第23页的内容,咖啡因含量与烘焙程度...
[来源: coffee_chemistry.pdf, 页码: 23, 相关度: 85%]
4.4 专家关键词优化
为提高匹配准确性:
好的关键词示例:
咖啡风味专家: 咖啡,风味,烘焙,萃取,酸度,苦味,香气,咖啡豆,手冲,意式
避免的问题:
- ❌ 关键词太少(<10个)
- ❌ 关键词太通用(如"问题","方法")
- ❌ 与其他专家重叠严重
12. 小智集成
12.1 配置流程
1. 在小智控制台创建设备
↓
2. 获取MCP Token
↓
3. 在MBE添加Token
↓
4. 测试连接
↓
5. 配置小智System Prompt
12.2 小智System Prompt配置
推荐配置:
你是一个智能助手,可以调用专家系统来回答专业问题。
可用工具:
- ask_expert: 咨询专家,请直接显示专家的回答
- get_expert_list: 获取可用专家列表
使用规则:
1. 收到专业问题时,先调用ask_expert
2. 将专家的回答完整展示给用户
3. 如果专家系统不可用,使用自己的知识回答
4. 不要说"正在连接专家",直接展示结果
5.3 MCP工具说明
ask_expert
咨询专家获取专业回答。
参数:
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
| question | string | 是 | 用户问题 |
| preferred_expert | string | 否 | 指定专家名称 |
| user_id | string | 否 | 用户标识 |
返回:
{
"answer": "专家回答内容...",
"expert_name": "咖啡风味专家",
"confidence": "high",
"sources": ["coffee.pdf:p23"]
}
get_expert_list
获取可用专家列表。
返回:
{
"experts": [
{
"name": "咖啡风味专家",
"description": "精通咖啡化学和风味",
"domains": ["food", "beverage"]
}
]
}
12.4 连接状态检查
在小智控制台查看:
- ✅ 绿色:已连接
- 🔴 红色:未连接
未连接排查:
- 检查Token是否正确
- 检查MBE服务是否运行
- 查看xiaozhi-bridge日志
13. API参考
13.1 公开API
健康检查
GET /health
响应:
{"status": "healthy", "timestamp": "2026-01-15T12:00:00Z"}
用户注册
POST /api/portal/register
Content-Type: application/x-www-form-urlencoded
email=user@example.com&password=secret&nickname=用户名
用户登录
POST /api/portal/login
Content-Type: application/x-www-form-urlencoded
email=user@example.com&password=secret
6.2 MCP API
MCP工具调用
POST /mcp
Content-Type: application/json
{
"jsonrpc": "2.0",
"method": "tools/call",
"params": {
"name": "ask_expert",
"arguments": {
"question": "咖啡的主要化学成分是什么?"
}
},
"id": 1
}
13.3 Token管理API
需要管理员密码认证。
获取Token统计
GET /api/tokens/stats
Cookie: mbe_admin_auth=xxx
响应:
{
"stats": {
"total": 5,
"by_type": {"xiaozhi_mcp": 3, "llm_api": 1, "cloudflare": 1},
"by_status": {"active": 4, "expired": 1},
"expiring_soon": 1
},
"expiring_soon": [
{"id": "xiaozhi_xxx", "name": "测试设备", "days_left": 5}
]
}
存储Token
POST /api/tokens/store
Cookie: mbe_admin_auth=xxx
Content-Type: application/json
{
"token_id": "xiaozhi_device1",
"name": "我的小智设备",
"token_type": "xiaozhi_mcp",
"value": "wss://api.xiaozhi.me/mcp/?token=xxx",
"expires_in_days": 365
}
轮换Token
POST /api/tokens/{token_id}/rotate
Cookie: mbe_admin_auth=xxx
Content-Type: application/json
{
"new_value": "new-token-value"
}
撤销Token
POST /api/tokens/{token_id}/revoke
Cookie: mbe_admin_auth=xxx
获取审计日志
GET /api/tokens/audit?token_id=xxx&limit=100
Cookie: mbe_admin_auth=xxx
13.4 知识库管理API
需要管理员密码认证。
创建知识库
POST /api/knowledge/create
Cookie: mbe_admin_auth=xxx
{
"name": "咖啡知识库",
"description": "关于咖啡的专业知识"
}
上传文件
POST /api/knowledge/{kb_id}/upload
Cookie: mbe_admin_auth=xxx
Content-Type: multipart/form-data
file: (binary)
发布专家
POST /api/knowledge/{kb_id}/publish
Cookie: mbe_admin_auth=xxx
{
"expert_name": "咖啡专家",
"description": "咖啡领域专家",
"keywords": ["咖啡", "烘焙", "萃取"],
"domains": ["food", "beverage"]
}
14. 最佳实践
14.1 知识库建设
文档选择
✅ 推荐:
- 权威教材、专业书籍
- 官方文档、技术手册
- 学术论文、研究报告
❌ 避免:
- 网络文章、博客
- 未经验证的内容
- 过时的资料
文档准备
- PDF质量:确保文字可复制(非扫描件)
- 结构清晰:有章节标题和目录
- 内容聚焦:一个知识库专注一个领域
14.2 专家配置
关键词设置
原则:
1. 核心词汇:领域最重要的10个词
2. 同义词:常见的替代表达
3. 长尾词:具体的专业术语
4. 区分词:与其他专家区分的独特词
示例(咖啡专家):
核心:咖啡,咖啡豆,烘焙,萃取,风味
同义词:咖啡因,黑咖啡,美式
长尾:手冲咖啡,意式浓缩,拿铁艺术
区分:(不用"饮料","健康"等通用词)
描述撰写
好的描述:
"精通咖啡化学成分、烘焙工艺和萃取技术,
能够解答关于咖啡风味特征、冲泡方法和品鉴技巧的专业问题。"
避免:
"一个关于咖啡的专家。"(太简单)
"无所不知的咖啡大师。"(太夸张)
14.3 小智使用
提问技巧
✅ 有效提问:
- "咖啡的主要化学成分有哪些?"
- "请咨询咖啡专家,如何选择咖啡豆?"
❌ 无效提问:
- "咖啡"(太短)
- "跟我聊聊咖啡吧"(太模糊)
问题定向
如果有多个相似专家,可以指定:
- "请问运动教练,如何制定健身计划?"
- "咨询医疗销售专家,产品定价策略"
14.4 性能优化
知识库大小
| 文档数量 | 预期响应时间 |
|---|---|
| 1-5个 | <2秒 |
| 5-20个 | 2-5秒 |
| 20+个 | 5-10秒 |
优化建议
- 每个知识库保持5-10个文档
- 删除冗余或过时文档
- 使用具体关键词提高匹配速度
附录
A. 术语表
| 术语 | 英文 | 说明 |
|---|---|---|
| 知识库 | Knowledge Base | 存储文档的容器 |
| 动态专家 | Dynamic Expert | 基于知识库的AI专家 |
| 向量嵌入 | Vector Embedding | 文本的数值表示 |
| RAG | Retrieval-Augmented Generation | 检索增强生成 |
| MCP | Model Context Protocol | AI模型交互协议 |
| Token管理 | Token Manager | 统一的凭证管理服务 |
| 任务队列 | Task Queue | Redis异步任务处理 |
| 权威性评估 | Authority Evaluation | PDF内容可信度评分 |
B. 文件格式支持
| 格式 | 支持 | 说明 |
|---|---|---|
| ✅ | 主要格式,支持页码追踪 | |
| TXT | ✅ | 纯文本 |
| MD | ✅ | Markdown |
| DOCX | ❌ | 暂不支持 |
| HTML | ❌ | 暂不支持 |
C. 常见问题
Q: 专家总是匹配错误怎么办? A: 检查并优化专家关键词,确保独特性。
Q: 回答不够准确怎么办? A: 上传更多高质量文档,或调整提问方式。
Q: 小智显示"专家系统无法连接"? A: 检查MBE服务状态和Token配置。
Q: 如何提高回答的可信度? A: 上传权威来源的PDF,系统会显示来源引用。
11. 模型训练
8.1 模型架构概述
MBE使用多层模型架构:
| 模型类型 | 用途 | 训练方式 | 更新频率 |
|---|---|---|---|
| 核心TITANS+MIRAS | 记忆编码、惊喜检测 | 全量训练 | 功能升级时 |
| 专家特定模型 | 领域深度优化 | 微调 | 知识更新时 |
| 动态专家 | 用户自建知识库 | 向量索引 | 上传时自动 |
15.2 核心模型训练
当需要重新训练核心TITANS+MIRAS模型时:
# 使用GPU训练(推荐)
cd mises-behavior-engine
python scripts/retrain_titans_model.py
# 训练参数优化(防止OOM)
# - batch_size: 8
# - memory_dim: 256
# - num_memory_slots: 128
# - max_samples: 500
# - use_fp16: True(混合精度)
训练数据来源:
training/datasets/*.json- 合成数据training/experts/*.json- 专家配置- 用户交互历史(匿名化)
训练时间参考:
| 硬件 | 时间 |
|---|---|
| GPU (RTX 3060 8GB) | ~2分钟 |
| CPU (多核) | ~2小时 |
8.3 专家模型训练
训练特定领域的专家模型:
# 检查并训练专家模型
python scripts/check_and_train_experts.py
# 训练特定专家
python scripts/check_and_train_experts.py --expert civil_lawyer
已训练的专家模型:
- 中国民事律师专家 🏆 — 350,000+ 真实法院判决案例 (1985-2024)
- 中国证券律师专家
- 系统设计面试专家
15.4 模型质量评估
# 评估训练质量
python scripts/evaluate_training.py
# 功能测试
python scripts/test_titans_model.py
质量指标:
| 指标 | 优秀 | 良好 | 及格 |
|---|---|---|---|
| Loss收敛 | <15 | <20 | <30 |
| 嵌入一致性 | >0.95 | >0.90 | >0.85 |
| 输入区分度 | <0.90 | <0.95 | <0.98 |
15.5 模型文件位置
| 文件 | 说明 |
|---|---|
training/checkpoints/titans_miras_inference.pt |
核心推理模型 |
training/checkpoints/titans_miras_YYYYMMDD_HHMMSS.pt |
带时间戳的训练模型 |
training/checkpoints/{expert}_titans.pt |
专家特定模型 |
knowledge_bases/{kb_id}_embeddings.pkl |
知识库向量 |
15.6 何时需要重新训练
需要重新训练核心模型:
- 模型架构变更
- 新增核心功能
- 训练数据大幅更新
需要重新训练专家模型:
- 专家知识库更新
- 领域知识扩展
- 回答质量下降
不需要重新训练:
- 新增动态专家(自动处理)
- 上传新PDF到现有知识库
- 调整专家关键词
附录
A. 术语表
| 术语 | 英文 | 说明 |
|---|---|---|
| 知识库 | Knowledge Base | 存储文档的容器 |
| 动态专家 | Dynamic Expert | 基于知识库的AI专家 |
| 向量嵌入 | Vector Embedding | 文本的数值表示 |
| RAG | Retrieval-Augmented Generation | 检索增强生成 |
| MCP | Model Context Protocol | AI模型交互协议 |
| Token管理 | Token Manager | 统一的凭证管理服务 |
| 任务队列 | Task Queue | Redis异步任务处理 |
| 权威性评估 | Authority Evaluation | PDF内容可信度评分 🆕 |
| TITANS | Training at Test Time | 测试时训练记忆系统 🆕 |
| MIRAS | Multi-scale Retrieval | 多尺度检索系统 🆕 |
B. 文件格式支持
| 格式 | 支持 | 说明 |
|---|---|---|
| ✅ | 主要格式,支持页码追踪 | |
| TXT | ✅ | 纯文本 |
| MD | ✅ | Markdown |
| DOCX | ❌ | 暂不支持 |
| HTML | ❌ | 暂不支持 |
C. 常见问题
Q: 专家总是匹配错误怎么办? A: 检查并优化专家关键词,确保独特性。
Q: 回答不够准确怎么办? A: 上传更多高质量文档(A/B级权威性),或调整提问方式。
Q: 小智显示"专家系统无法连接"? A: 检查MBE服务状态和Token配置。
Q: 如何提高回答的可信度? A: 上传权威来源的PDF,系统会显示来源引用。
Q: 上传大文件失败怎么办? 🆕 A: 使用断点续传功能,或将文件分割后批量上传。
Q: 权威性评估为D级怎么办? 🆕 A: 建议更换来源更可靠的文档,或在使用时注明内容待验证。
文档版本: 2.6
最后更新: 2026-01-27
v2.6: 智能专家推荐系统、信任度评分、推荐解释
v2.5: 多终端接入(智能手表/车载/HA/智能家电)、在线学习
v2.4: 知识库设计向导、开发者认证、KB归属开发者
v2.3: 新增专家市场、账单系统、支付功能
v2.2: 用户角色系统、开发者门户
v2.0: 权威性评估、批量上传、TITANS模型训练说明