什么是 MoM 模型家族?
MoM (Mixture of Models) Model Family 是一个精心挑选的专用轻量级模型集合,专为智能路由、内容安全和语义理解而设计。这些模型为 Semantic Router 的核心能力提供动力,实现快速、准确和隐私保护的 AI 操作。
概览
MoM 家族由专门构建的模型组成,用于处理路由管道中的特定任务:
- 分类模型:Domain 检测、PII 识别、Jailbreak 检测
- Embedding 模型:语义相似度、缓存、检索
- 安全模型:Hallucination 检测、内容审核
- Feedback 模型:用户意图理解、对话分析
所有 MoM 模型都具有以下特点:
- 轻量级:33M-600M 参数,实现快速推理
- 专用:针对特定路由任务进行微调
- 高效:许多模型使用 LoRA 适配器,占用内存极小
- 开源:可在 HuggingFace 上获取,以实现透明度和自定义
模型类别
1. 分类模型
领域/意图分类器 (Domain/Intent Classifier)
- 模型 ID:
models/mom-domain-classifier - HuggingFace:
LLM-Semantic-Router/lora_intent_classifier_bert-base-uncased_model - 用途:将用户查询分类为 14 个 MMLU 类别(数学、科学、历史等)
- 架构:BERT-base (110M) + LoRA 适配器
- 用例:将查询路由到特定领域的模型或专家
PII 检测器 (PII Detector)
- 模型 ID:
models/mom-pii-classifier - HuggingFace:
LLM-Semantic-Router/lora_pii_detector_bert-base-uncased_model - 用途:检测 35 种类型的个人身份信息
- 架构:BERT-base (110M) + LoRA 适配器
- 用例:隐私保护、合规性、数据脱敏
Jailbreak Detector
- 模型 ID:
models/mom-jailbreak-classifier - HuggingFace:
LLM-Semantic-Router/lora_jailbreak_classifier_bert-base-uncased_model - 用途:检测 prompt injection 和 jailbreak 尝试
- 架构:BERT-base (110M) + LoRA 适配器
- 用例:内容安全、prompt 安全
反馈检测器 (Feedback Detector)
- 模型 ID:
models/mom-feedback-detector - HuggingFace:
llm-semantic-router/feedback-detector - 用途:将用户反馈分类为 4 种类型(满意、需要澄清、错误答案、想要不同的答案)
- 架构:ModernBERT-base (149M)
- 用例:自适应路由、对话改进