米塞斯行为引擎 - 模型架构文档

📦 模型概览

🧠 核心模型(TITANS+MIRAS)

模型文件 大小 用途 状态
titans_miras_inference.pt 61M 推理用主模型 ✅ 在用
titans_miras_final.pt 137M 完整训练模型 备份
titans_miras_epoch_50.pt 137M 第50轮checkpoint 备份

核心模型配置(目标)

input_dim: 384        # 匹配 sentence-transformers 输出
memory_dim: 512       # 记忆向量维度
num_memory_slots: 1024 # 记忆槽数量
num_retrieval_steps: 3 # MIRAS 检索步数

👨‍💼 专家特定模型(完整架构)

模型 大小 参数量 专家名称
civil_lawyer_dynamic_civil_lawyer.pt 161M 4,200万 中国民事律师
securities_lawyer_dynamic_62837b8c038e.pt 161M 4,200万 中国证券律师
sdi_expert_dynamic_520adb076e77.pt 161M 4,200万 系统设计面试专家
bread_master_best.pt 9.7M - 手工面包大师

🤖 动态创建的专家(轻量级架构)

ID 专家名称 来源 模型大小 参数量
dynamic_f7cdefb77b24 茶乌龙专家 日本茶道入门PDF 5.1M 130万
dynamic_9eed8609b814 林徽因专家 中国建筑常识PDF 5.1M 130万
dynamic_e9ba75495a9c 运动教练专家 Sports Training PDF 5.1M 130万
dynamic_f21c2aed7d7b 营养治疗师专家 Williams' Nutrition PDF 5.1M 130万
+ 8个其他动态专家 5.1M 130万

📚 内置专家(无需独立模型)

使用核心 TITANS 模型 + 内置知识库:

  • 手工面包大师
  • 美国饮食文化专家
  • 日本饮食文化专家
  • 现代主义烹饪专家
  • 味觉鉴赏专家
  • 健身教练
  • 逻辑导师
  • 英语口语教练
  • 体检诊断顾问
  • 维特根斯坦哲学
  • 老年医学顾问

🔄 模型类型对比

专家特定模型 vs 动态专家

特性 专家特定模型 动态专家
模型大小 161 MB 5.1 MB
参数量 4,200万 130万
架构 完整 TITANS+MIRAS 轻量级适配层
训练样本 500-1000+ ~460
训练时间 数小时 几分钟
创建方式 手动运行脚本 上传PDF自动生成
适用场景 深度推理、复杂领域 快速部署、知识检索

为什么动态专家使用轻量级架构?

1. 速度考虑

完整模型训练:数小时(CPU)
轻量级训练:几分钟

用户上传 PDF 后希望快速使用,而非等待数小时。

2. 资源考虑

完整模型:161MB × 12 = 1.9GB
轻量级:5.1MB × 12 = 61MB

3. 实际效果

  • 动态专家主要依靠 RAG 检索(从 PDF 找答案)
  • 轻量级模型足以做 查询增强相关性排序
  • 完整模型更适合需要 深度推理 的复杂领域

🔧 模型训练与更新

何时需要重新训练?

操作 需要重新训练核心模型? 需要重新训练专家模型?
添加新专家 ❌ 不需要 ❌ 不需要
上传 PDF 文档 ❌ 不需要 ❌ 不需要
更新专家知识库 ❌ 不需要 ❌ 不需要
优化核心能力 ✅ 需要 ⚠️ 视架构变化而定
改变核心模型架构 ✅ 需要 ✅ 需要

核心模型架构变化时的更新流程

1. 重新训练核心 TITANS+MIRAS 模型
   ↓
2. 重新生成内置专家的嵌入缓存(自动,几分钟)
   ↓
3. 重新训练专家特定模型(每个约30-60分钟)
   ↓
4. 重新训练动态专家(可选,批量处理)

日常操作流程

添加新专家或上传 PDF

上传 PDF → 文本提取 → 分块 → 生成嵌入 → TITANS增强(自动) → 保存缓存

这个过程是自动的,不需要重新训练模型。


📊 模型存储位置

training/checkpoints/
├── titans_miras_inference.pt      # 核心推理模型
├── titans_miras_final.pt          # 核心完整模型
├── titans_miras_epoch_50.pt       # 核心检查点
├── civil_lawyer_*.pt              # 民事律师专家模型
├── securities_lawyer_*.pt         # 证券律师专家模型
├── sdi_expert_*.pt                # 系统设计专家模型
└── experts/
    ├── bread_master_*.pt          # 面包大师
    └── expert_dynamic_*_trained.pt # 动态专家模型

🚀 升级动态专家为完整模型

如果某个动态专家使用频繁、需要更高质量,可以升级:

# 将动态专家升级为完整训练
python scripts/upgrade_expert.py --expert-id dynamic_f7cdefb77b24 --full-training

升级过程:

  1. 使用 PDF 生成更多合成数据
  2. 使用完整 TITANS+MIRAS 架构训练
  3. 产出 161MB 的专家特定模型

📈 模型统计

类别 数量 总大小
核心模型 1个(推理用) 61MB
专家特定模型 3个 ~500MB
动态专家模型 12个 ~61MB
内置专家 11个 共享核心模型

总计:27个专家能力,模型总大小约 620MB


文档更新时间:2026-01-18