AI安全实战案例库

💉 高危

通过客服对话接口，利用分层注入技术诱导AI泄露内部配置与客户数据，拆解四层防护方案。

Prompt注入RAG安全输入隔离

🔓 严重

LLM在推理时输出训练数据中的API密钥及内部文档，从Extraction Attack到差分隐私的完整防线。

数据泄露训练安全差分隐私

🤖 高危

代码审查Agent被诱导执行恶意命令，服务器遭远程控制。拆解工具沙箱与审批机制设计。

Agent安全沙箱隔离权限控制

🔗 高危

MCP Server缺乏认证机制，任意Agent可调用所有Tool，攻击者通过Agent劫持链批量窃取数据。

MCP安全认证授权通信安全

📦 严重

第三方微调权重中植入后门，特定触发词导致模型执行恶意行为。覆盖模型签名校验与供应链审计。

供应链安全模型投毒签名校验

☠️ 中危

攻击者在公开文档库中混入恶意文档，RAG系统检索后执行嵌入指令，导致客服系统被操控。

RAG投毒数据清洗检索安全

🧪 实战案例分析