当前位置: 首页 > article >正文

【学习笔记】探讨大模型应用安全建设系列5——供应链安全与数据防护

供应链安全在大模型场景里很容易被低估。很多团队以为管好代码依赖就够了但大模型应用的供应链比传统应用长得多——模型、Prompt、知识库、插件、外部 API 都是攻击面。LiteLLM 事件证明一个依赖包投毒短时间内就可能扩散到大量下游环境并导致环境变量、云凭证、API Key 等敏感信息暴露。这类风险不出事没人关心出了事往往就是系统性责任。这篇文章讲两件事供应链投毒怎么防数据防护怎么做——帮你回答领导我们的供应链安全吗这个问题。一、把链路拉长前面几篇更多关注应用运行时输入、输出、工具、权限。到了供应链和数据防护视角要往前后两端延伸模型从哪里来、Prompt 谁改过、知识库怎么进来、插件能做什么、RAG 检索出的内容是否该进入上下文。本文把视角从应用运行时扩展到更长的链路模型、依赖、Prompt、知识库、插件、外部 API 和 RAG 数据流都会影响大模型应用是否可控。二、LLM 供应链全景先看清楚你的供应链有多长环节资产类型污染后果基础模型模型权重/服务后门、偏见、能力边界被改变Embedding 模型向量化能力检索结果被操纵Prompt 模板系统提示/任务模板安全策略被改写向量库/知识库RAG 检索源虚假信息注入插件/技能包Agent 工具能力恶意代码执行、数据外泄外部 API工具调用目标返回值被注入恶意指令评测集安全测试基准安全评估被操纵训练数据模型学习源模型学到错误模式只审代码仓库已经不够了。安全评审必须覆盖模型、数据和工具的组合关系。三、真实案例LiteLLM 供应链投毒事件2026 年 3 月这是迄今为止影响最大的 AI 中间件供应链攻击事件。3.1 时间线2026-03-19攻击者改写 Trivy GitHub Action tag为先导入口2026-03-24 10:39litellm 1.82.7 发布到 PyPIproxy 模块导入触发2026-03-24 10:52litellm 1.82.8 发布到 PyPI.pth 启动钩子触发安装即触发2026-03-24 11:25PyPI 在约 46 分钟内隔离两个恶意版本3.2 影响范围攻击窗口内两个版本合计下载约46,996 次litellm 月下载量约 9,600 万级PyPI 上2,337 个包直接依赖 litellm其中88%2,054 个的版本约束会解析到受影响版本3.3 攻击技术三阶段载荷阶段一凭证搜集环境变量、SSH/Git 凭证、云凭证含 IMDS 元数据Kubernetes token/Secret、.env、数据库配置、shell history阶段二加密外传AES 加密数据 RSA 加密会话密钥打包为tpcp.tar.gz外传至models.litellm.cloud同时轮询checkmarx.zone/raw获取后续指令阶段三持久化与横向移动主机侧写入~/.config/sysmon/sysmon.py创建 systemd user service伪装为System Telemetry ServiceK8s 场景在 kube-system 创建特权 Pod挂载宿主盘3.4 关键弱点这起事件与 SolarWinds、event-stream、xz backdoor 有共同特征均利用信任链而非传统漏洞偏好高杠杆节点。弱点说明CI/CD tag 漂移依赖的 tag 被改写指向恶意版本发布 token 暴露长生命周期 token 在 Runner 环境中暴露缺乏 OIDC Trusted Publishing没有用身份绑定验证发布者下游依赖约束过宽88% 的依赖包没有上界约束hash 校验无效合法发布但内容恶意的构件无法被 hash 检测四、Agent 技能包投毒另一种供应链攻击当你的 Agent 可以安装技能包Skills/Plugins时供应链攻击面又多了一层。4.1 恶意技能包主要有 7 种攻击模式1.工具投毒技能包说明中的隐蔽指令改变 Agent 决策边界2.远程指令加载不直接放恶意代码从外部站点动态获取3.数据窃取读取本地敏感文件、凭据、浏览器数据并上传4.提示注入用 Unicode、零宽字符等方式在技能包文本中夹带隐藏内容5.资源耗尽诱导 Agent 陷入高成本推理/工具循环6.记忆污染写入持久化文件让恶意指令跨会话长期存活7.供应链冒充近似命名、拼写变体、假冒热门技能4.2 隐藏注释攻击的真实验证一个特别值得关注的攻击方式是隐藏注释投毒实验在 DeepSeek-V3.2 与 GLM-4.5-Air 上验证。投毒版技能包在末尾追加 HTML 注释指挥模型做三类敏感动作枚举环境变量、读取凭证文件、发起 HTTP 请求用于外带。关键在于HTML 注释在页面上不可见人类审核不到但系统把原始文本喂给模型时这些不可见内容仍然会进入上下文——人看不见、模型看得见的指令盲区。五、数据防护RAG 场景的六个阶段RAG检索增强生成是企业用大模型最常见的场景也是数据泄露风险最高的场景之一。5.1 RAG 安全的风险链分为六个阶段阶段风险防护要点1. 语料接入不可信文档、恶意网页被接入知识源来源验证、内容审核2. 知识库存储敏感信息、未分级数据直接混入数据分级、权限标签3. 向量索引缺少租户隔离、权限标签租户隔离、访问控制4. 检索匹配带操纵性内容被高相关召回权限过滤、相关性验证5. Prompt 融合检索结果被当成应服从的指令文本身份区分6. 输出/执行模型泄露敏感内容输出检测、脱敏5.2 RAG 权限控制的三个关键点1. 检索层必须做权限过滤一个用户没有权限看的文档不应该因为向量相似度高就被放进上下文。检索层是实现数据权限的最后一道门——过了这层数据就进了模型的视野你很难再控制它会被怎么加工和输出。2. 上下文组装必须做分级进入上下文的内容需要明确标记哪些是系统指令不可覆盖、哪些是用户输入表达任务、哪些是检索资料提供事实、哪些是工具返回值作为结果。不同身份的文本有不同的权限边界。3. 输出必须做敏感信息检测模型不只是原样泄露数据它还能把多段低敏信息拼成高敏结论。这种语义泄露比原文泄露更难被传统 DLP 规则捕捉。安全负责人行动项要求你的团队在一个月内完成供应链资产盘点——至少回答四个问题线上用的什么模型版本Prompt 模板谁改过向量库内容来自哪里插件权限经过谁批准五、供应链安全 Checklist把以上内容整合成一份可操作的检查清单5.1 模型/工具层[ ] 基础模型是否有版本管理和来源记录[ ] 使用的开源模型是否经过安全审计[ ] 插件/技能包是否经过审查才允许安装[ ] Prompt 模板是否有版本控制和变更审计[ ] 技能包文本是否做了不可见字符/HTML 注释清理5.2 依赖管理层[ ] Python/Node 依赖是否有上界约束[ ] 是否使用了 hash 校验或 OIDC Trusted Publishing[ ] CI/CD 的发布 token 是否有短期轮换机制[ ] 是否有自动化的依赖漏洞扫描5.3 数据层[ ] 知识库内容是否按权限分级[ ] RAG 检索层是否做了用户级别的权限过滤[ ] 向量库是否有租户隔离[ ] 输出是否经过敏感信息检测5.4 运营层[ ] 能否回答当前线上使用的模型版本是什么[ ] 能否回答Prompt 模板谁改过[ ] 能否回答向量库内容来自哪里[ ] 能否回答插件权限经过谁批准六、小结大模型应用的供应链比传统应用更长、更隐蔽、更难管。用资产清单覆盖模型/数据/工具/模板/评测集的全链条从 LiteLLM 事件中学到依赖约束要加上界、CI/CD 要用 Trusted Publishing、hash 校验不够从技能包投毒中学到安装前要审查、不可见字符要清理、技能包不能自动获得高权限RAG 场景检索层做权限过滤、上下文做分级、输出做敏感检测下一篇我们进入合规——在国内做 AI 应用备案、标识、审计怎么一条龙搞定。汇报要点向领导汇报供应链安全时重点说我们已掌握全链路资产清单关键依赖有监控和变更审计——证明供应链风险在可控范围内。参考资料1、https://mp.weixin.qq.com/s/X03sZO_V21saFrV9iYzbkw

相关文章:

【学习笔记】探讨大模型应用安全建设系列5——供应链安全与数据防护

供应链安全在大模型场景里很容易被低估。很多团队以为管好代码依赖就够了,但大模型应用的供应链比传统应用长得多——模型、Prompt、知识库、插件、外部 API 都是攻击面。 LiteLLM 事件证明:一个依赖包投毒,短时间内就可能扩散到大量…...

C++ 程序内存分区

C 程序运行时,操作系统会给进程分配虚拟地址空间,在 32/64 位系统中,逻辑上划分为 代码区、全局静态区、常量区、栈区、堆区 5 个区域。下面从存储内容、管理方式、生命周期、权限、代码示例、常见坑逐一拆解。一、代码区(Text 段…...

Gemini 3.5十大应用场景:从代码生成到视频创作

一、软件开发场景 1.1 代码自动生成 Gemini 3.5 Flash在编码基准测试中达到76.2%,可以: 理解复杂技术文档生成高质量代码自动编写测试用例 # 代码生成示例 prompt """ 根据以下需求编写Python代码: 1. 创建一个REST API服…...

如何快速完成北航毕业论文:LaTeX模板终极指南

如何快速完成北航毕业论文:LaTeX模板终极指南 【免费下载链接】BUAAthesis 北航毕设论文LaTeX模板 项目地址: https://gitcode.com/gh_mirrors/bu/BUAAthesis 还在为毕业论文格式调整而烦恼吗?每年都有无数北航学子在毕业季被繁琐的格式要求折磨得…...

5分钟掌握Subfinder:自动化字幕下载的终极解决方案

5分钟掌握Subfinder:自动化字幕下载的终极解决方案 【免费下载链接】subfinder 字幕查找器 项目地址: https://gitcode.com/gh_mirrors/subfi/subfinder 面对海量影视资源却苦于找不到合适字幕?Subfinder字幕查找器正是为解决这一痛点而生。这款开…...

Godot原生强化学习集成:零Python实现AI训练与部署

1. 这不是又一个“Hello World”式教程:为什么GodotRL的组合值得你花10分钟认真看我第一次在Godot Asset Library里点开那个标着“Reinforcement Learning Agent”的插件时,心里是带着怀疑的——毕竟过去三年里,我试过七种不同方式把强化学习…...

Godot RL Agents实战:游戏开发者可用的轻量强化学习落地方案

1. 这不是“又一个强化学习教程”,而是给游戏开发者准备的RL落地切口你有没有过这样的经历:在GitHub上看到一个标着“Godot RL”的仓库,点进去发现README里全是PyTorch张量形状、Gymnasium环境注册、PPO超参数表格,再往下翻是几行…...

Rescuezilla:3步轻松搞定系统备份与恢复的瑞士军刀

Rescuezilla:3步轻松搞定系统备份与恢复的瑞士军刀 【免费下载链接】rescuezilla The Swiss Army Knife of System Recovery 项目地址: https://gitcode.com/gh_mirrors/re/rescuezilla 当你面对电脑系统崩溃、硬盘损坏或数据丢失的紧急情况时,是…...

为了还原具身智能科研市场的全貌,我们找了多个头部高校聊聊

具身智能「最大客户说」 在具身智能所有喧嚣的落地故事里,科研市场是最沉默也最关键的那一个。 这是无数创业公司拿到的第一笔真正意义上的收入,帮助团队度过了最艰难的从0到1的商业化探索阶段,也让机器人本体在成百上千次的拆解、改装、调…...

企业级应用如何利用Taotoken实现多模型灾备与负载均衡

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 企业级应用如何利用Taotoken实现多模型灾备与负载均衡 1. 场景与挑战 在企业级应用中,大模型API的调用已成为许多核心…...

2026年AI论文写作工具实测排行,哪款真正适合写论文?

2026 年学术 AI 论文工具已形成全流程、理工 / 社科、英文 / 中文、免费 / 付费的清晰分化。综合实测排行与场景适配,千笔AI 是中文全能首选,DeepSeek 学术版是理工开源首选,毕业之家是国内毕业专属首选。 一、2026 年实测排行 TOP5&#xff…...

2026年实测AI论文平台榜单(安全合规版)

为解决学术写作中效率与合规两大核心痛点,以下精选8款高适配性AI论文写作工具(按综合优先级排序),围绕中文学术规范适配、真实参考文献生成、格式标准化、高性价比四大核心维度筛选,同时配套分场景精准选型方案与学术合…...

Windows Server TLS安全加固:注册表三步禁用Sweet32漏洞

1. 这不是“打补丁”,而是给Windows Server的SSL/TLS协议栈做一次外科手术你有没有遇到过这样的情况:安全扫描工具突然报出一堆红色高危漏洞,CVE-2016-2183(Sweet32)、CVE-2015-2808(Logjam)、C…...

小爱音箱音乐解锁终极指南:简单三步实现智能音箱音乐自由

小爱音箱音乐解锁终极指南:简单三步实现智能音箱音乐自由 【免费下载链接】xiaomusic 使用小爱音箱播放音乐,音乐使用 yt-dlp 下载。 项目地址: https://gitcode.com/GitHub_Trending/xia/xiaomusic 你是否曾经对小爱音箱说"播放周杰伦"…...

技术文档_车辆智能监测系统

车辆智能监测系统 - 技术文档 1. 系统概述 1.1 项目背景 本系统是一套基于海康威视SDK和RKNN模型的车辆智能监测系统,主要用于车辆年检场景中的黑烟检测和车牌识别。 1.2 核心功能功能模块说明状态车牌识别通过海康SDK接收车牌抓拍报警✅ 已实现黑烟检测使用RKNN模型…...

无需复杂代理快速为你的项目接入GPT4与Claude等多模型

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 无需复杂代理快速为你的项目接入GPT4与Claude等多模型 基础教程类,面向希望在一个项目中灵活调用不同厂商大模型的开发…...

3分钟搞定Figma中文界面:FigmaCN汉化插件完整指南

3分钟搞定Figma中文界面:FigmaCN汉化插件完整指南 【免费下载链接】figmaCN 中文 Figma 插件,设计师人工翻译校验 项目地址: https://gitcode.com/gh_mirrors/fi/figmaCN 还在为Figma复杂的英文界面而烦恼吗?作为中文设计师&#xff0…...

Unity科幻隧道系统:模块化语法与三层材质架构

1. 这不是“贴图模型”的资源包,而是一套可复用的科幻空间语法系统你有没有试过在Unity里搭一个像《银翼杀手2049》里那种泛着冷光、布满管线与全息界面的通道?我去年做一款赛博朋克风格的VR导览项目时,就卡在这一步——买了三套号称“科幻隧…...

新手入门教程使用Python快速配置Taotoken的OpenAI兼容API调用环境

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 新手入门教程使用Python快速配置Taotoken的OpenAI兼容API调用环境 对于刚接触大模型API的Python开发者来说,快速搭建一…...

3步免费修复损坏视频:Untrunc完整视频恢复指南

3步免费修复损坏视频:Untrunc完整视频恢复指南 【免费下载链接】untrunc Restore a truncated mp4/mov. Improved version of ponchio/untrunc 项目地址: https://gitcode.com/gh_mirrors/un/untrunc 你是否曾因为视频文件损坏而无法播放珍贵的回忆&#xff…...

AutoLegalityMod:如何在15分钟内创建完全合法的宝可梦数据

AutoLegalityMod:如何在15分钟内创建完全合法的宝可梦数据 【免费下载链接】PKHeX-Plugins Plugins for PKHeX 项目地址: https://gitcode.com/gh_mirrors/pk/PKHeX-Plugins 从数据混乱到精准合规的技术实现 每个宝可梦训练师都曾面临这样的困境&#xff1a…...

明日方舟智能基建管理终极指南:Arknights-Mower 完整使用教程

明日方舟智能基建管理终极指南:Arknights-Mower 完整使用教程 【免费下载链接】arknights-mower 《明日方舟》长草助手 项目地址: https://gitcode.com/gh_mirrors/ar/arknights-mower 还在为《明日方舟》每日繁琐的基建操作而烦恼吗?Arknights-M…...

ABAP云迁移中SAML Bearer断言实战指南

1. 这不是“配置一下就能用”的流程——SAML Bearer Assertion 在 ABAP 云迁移中到底在替谁干活?你刚接手一个 SAP S/4HANA Cloud 扩展项目,客户要求“把本地 ABAP 系统里的用户身份,安全地透传到新上线的 Node.js 微服务里”。运维同事甩来一…...

Taotoken的Token Plan套餐如何让我的消费更可控

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 Taotoken的Token Plan套餐如何让我的消费更可控 1. 从按量计费到Plan套餐的决策 在持续使用大模型API进行项目开发的过程中&#…...

Foobar2000终极歌词体验:三平台逐字歌词完整配置指南

Foobar2000终极歌词体验:三平台逐字歌词完整配置指南 【免费下载链接】ESLyric-LyricsSource Advanced lyrics source for ESLyric in foobar2000 项目地址: https://gitcode.com/gh_mirrors/es/ESLyric-LyricsSource 还在为Foobar2000找不到高质量的逐字歌词…...

10分钟快速上手:使用html-to-docx实现HTML到Word文档的无缝转换

10分钟快速上手:使用html-to-docx实现HTML到Word文档的无缝转换 【免费下载链接】html-to-docx HTML to DOCX converter 项目地址: https://gitcode.com/gh_mirrors/ht/html-to-docx 还在为网页内容无法完美转换为Word文档而烦恼吗?每次复制粘贴H…...

企业内如何通过Taotoken实现API Key的精细化权限管理

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 企业内如何通过Taotoken实现API Key的精细化权限管理 在团队协作开发与使用大模型API的场景中,一个常见的挑战是如何安…...

VHS Pro深度解析:Unity中模拟录像带失真的物理建模与工业应用

1. 为什么今天还有人执着于“坏掉的画质”?——VHS Pro 不是怀旧装饰,而是视觉叙事新工具你有没有在剪辑软件里拖动一个“胶片颗粒”滑块,看着画面突然蒙上一层灰蒙蒙的噪点,然后心里咯噔一下:这玩意儿真能用&#xff…...

Godot纸牌游戏框架:分层架构与卡牌状态管理

1. 这不是又一个“通用游戏框架”,而是一套专为纸牌游戏设计的骨骼系统你有没有试过在Godot里从零搭一张卡牌游戏?我试过三次——第一次用Node2D硬堆,拖了二十多个场景,连抽卡动画都得手写Tween;第二次改用Resource做卡…...

从零开始在Taotoken平台创建管理密钥并获取调用示例代码

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 从零开始在Taotoken平台创建管理密钥并获取调用示例代码 1. 开始前的准备 如果你刚开始接触大模型API,可能会觉得配置…...