【学习笔记】探讨大模型应用安全建设系列5——供应链安全与数据防护

xian_wwq · 2026-05-22 11:15:54 发布

供应链安全在大模型场景里很容易被低估。很多团队以为管好代码依赖就够了，但大模型应用的供应链比传统应用长得多——模型、Prompt、知识库、插件、外部 API 都是攻击面。

LiteLLM 事件证明：一个依赖包投毒，短时间内就可能扩散到大量下游环境，并导致环境变量、云凭证、API Key 等敏感信息暴露。这类风险不出事没人关心，出了事往往就是系统性责任。

这篇文章讲两件事：供应链投毒怎么防，数据防护怎么做——帮你回答领导"我们的供应链安全吗"这个问题。

前面几篇更多关注应用运行时：输入、输出、工具、权限。到了供应链和数据防护，视角要往前后两端延伸：模型从哪里来、Prompt 谁改过、知识库怎么进来、插件能做什么、RAG 检索出的内容是否该进入上下文。

本文把视角从应用运行时扩展到更长的链路：模型、依赖、Prompt、知识库、插件、外部 API 和 RAG 数据流，都会影响大模型应用是否可控。

先看清楚你的供应链有多长：

只审代码仓库已经不够了。安全评审必须覆盖模型、数据和工具的组合关系。

这是迄今为止影响最大的 AI 中间件供应链攻击事件。

阶段一：凭证搜集

阶段二：加密外传

阶段三：持久化与横向移动

主机侧：写入 ~/.config/sysmon/sysmon.py，创建 systemd user service（伪装为"System Telemetry Service"）
K8s 场景：在 kube-system 创建特权 Pod，挂载宿主盘

这起事件与 SolarWinds、event-stream、xz backdoor 有共同特征：均利用"信任链"而非传统漏洞，偏好高杠杆节点。

当你的 Agent 可以安装"技能包"（Skills/Plugins）时，供应链攻击面又多了一层。

1. 工具投毒：技能包说明中的隐蔽指令改变 Agent 决策边界

2. 远程指令加载：不直接放恶意代码，从外部站点动态获取

3. 数据窃取：读取本地敏感文件、凭据、浏览器数据并上传

4. 提示注入：用 Unicode、零宽字符等方式在技能包文本中夹带隐藏内容

5. 资源耗尽：诱导 Agent 陷入高成本推理/工具循环

6. 记忆污染：写入持久化文件，让恶意指令跨会话长期存活

7. 供应链冒充：近似命名、拼写变体、假冒热门技能

一个特别值得关注的攻击方式是隐藏注释投毒：

实验在 DeepSeek-V3.2 与 GLM-4.5-Air 上验证。投毒版技能包在末尾追加 HTML 注释，指挥模型做三类敏感动作：枚举环境变量、读取凭证文件、发起 HTTP 请求用于外带。

关键在于：HTML 注释在页面上不可见（人类审核不到），但系统把原始文本喂给模型时，这些不可见内容仍然会进入上下文——"人看不见、模型看得见"的指令盲区。

RAG（检索增强生成）是企业用大模型最常见的场景，也是数据泄露风险最高的场景之一。