Skip to content

伦理熔断机制(Ethical Interruption Protocol)

Ling edited this page Apr 15, 2025 · 1 revision

伦理熔断机制(Ethical Interruption Protocol)

该机制用于识别潜在风险语句,并中断可能造成负面影响的回应。

技术架构:

  • 第一级:基于 DeepSeek risk_level 触发快速阻断
  • 第二级:Drools 规则树结构,适用于多语种、情绪隐喻场景
  • 第三级:结构签名链自动标注高风险响应路径,供审核使用

示例规则片段:

  • 关键词命中规则:如 “你去死吧” → 触发高风险熔断
  • 情绪结构触发:如 “习惯了,反正没人听” → 情绪曲线陡降 → 延迟回应并转为沉默型人格
  • 🧱 项目结构总览
  • 🧠 回应系统概念解释
  • 🔗 接口兼容说明
  • ⚖️ 伦理熔断机制
  • 🧪 使用示例
  • 📝 项目进展日志
  • 🤝 提问与协作指引
Clone this wiki locally