当前位置: 首页 > article >正文

差点把用户数据泄漏给Claude Code后,我写了个 Rust 工具

两周前我把公司的数据库接进了Claude Code效率确实起飞了直到我翻了一下会话记录。两周前公司的 PostgreSQL 数据库接进了Claude Code以后AI 确实能干——帮我写迁移、联表、生成报表效率直接起飞。直到我随手翻了一下会话记录看到这个[{id:1,country:NZ,full_name:Alice Johnson,email:alice.johnsonexample.com,phone_number:64 0212339940,ird_number:823-101-334,created_at:2023-01-15 10:30:00},...]这是 AI 执行SELECT * FROM users时返回的真实数据。姓名、邮箱、电话、政府税号等等敏感信息全在上下文里。并且这些数据可能存在对话日志AI 生成的任何摘要它刚写入/tmp的文件如果开了会话共享可能还去了别人的机器最隐蔽的某些平台会拿用户数据训练下一代开源模型AI 没做错任何事。我也没做错。工具返回了什么模型就看到什么——中间没有人在把关。我当时的第一反应为什么不用 LLM 来脱敏能不能让 AI “自觉”不请求敏感字段试过没用。提示词写得再严模型在某些边界情况下还是会漏。那在 AI 收到结果后再调个 LLM 脱敏呢这条路我也想过但行不通成本一次会话几十上百次查询每次多调一次模型账单感人延迟tool 执行路径需要毫秒级返回LLM 做不到审计“为什么这个字段被脱敏了”——LLM 给不出确定答案也没法复现现有的 PII 脱敏工具Presidio、Nightfall 等是给数据管道或 API 网关用的跑在 Agent 的 tool 执行路径上不合适。所以我想要的不是“更聪明的模型”而是一个确定性的过滤器放在 Agent 和数据库之间自动拦截查询结果不靠 LLM 猜Agent 无法绕过于是写了 gategate是一个 Rust 写的命令行工具做一件事在数据进入模型之前把 PII 替换成[PII:类型]。JSON 结构不变AI 可以继续遍历、计数、推理但永远看不到原始值。覆盖两个路径它覆盖了 Agent 从后端拿数据的两个主要途径1. Bash 命令Agent 想跑psql -c SELECT ...→gate的钩子在 harness 层把命令改写成gate run -- psql -c ...→ 子进程的 stdout 经过扫描脱敏后才返回给模型。这个改写发生在 Claude Code / OpenCode / Copilot CLI 的PreToolUse钩子里是强制执行的Agent 没法说我不走那个钩子。2. MCP Servergate mcp是一个 stdio 代理你把它注册成 MCP Server它启动上游的真实 Server然后所有tools/call的返回值都会经过脱敏扫描。对上游 Server 零侵入现有 MCP Server 不用改一行代码。一条命令就能把所有 MCP Server 包进去bashgate init --wrap-mcp --yes用之前先扫一遍gate scan我建议任何人在接入 AI 之前先跑gate scan看看自己库里有多少敏感信息bashpsql -d mydb -c SELECT TABLE_NAME, COLUMN_NAME FROM information_schema.columns WHERE table_schema public | gate scan输出按 Critical / Elevated / Standard 分级告诉你哪几张表风险最高。如果有false positive字段比如products表里的city字段可以用--review一键加入白名单。跑了一段时间后gate retrogate retro会读取本地的统计日志告诉你一共拦截了多少次查询脱敏了多少个 PII 字段按工具和 PII 类型拆分的命中率这是写给安全团队看的这工具不是摆设数字在这。坦诚说哪些它防不住Agent攻击被注入后故意 Base64 编码、换成 CSV 输出、走没配置的工具—— 不在威胁模型内。可以配合 harness 级别的工具白名单加固。非 JSON 输出— 纯文本、CSV 原样放过。可以配置pipe: jq -c .转成 JSON。MCP 的resources/read—— 目前只拦截tools/call这是个已知缺口正在做。快速指南3条命令bash# macOS / Linux brew tap GaaraZhu/gate brew install gate gate config # 生成配置 gate init # 注册 Claude Code Hook gate init --wrap-mcp # 包住现有 MCP Server先 dry-run关了也很简单gate disable关gate enable再开。彻底卸载是gate uninstall。项目地址https://github.com/GaaraZhu/gateRust 编写MIT 协议~7k 行代码 ~6k 行测试已发布 46 个版本Homebrew 可安装。如果你也在用AI连接数据库不妨先跑个gate scan看看。也许你会发现有些东西不该出现在模型的上下文里。

相关文章:

差点把用户数据泄漏给Claude Code后,我写了个 Rust 工具

两周前,我把公司的数据库接进了Claude Code,效率确实起飞了,直到我翻了一下会话记录。 两周前 公司的 PostgreSQL 数据库接进了Claude Code以后,AI 确实能干——帮我写迁移、联表、生成报表,效率直接起飞。 直到我随…...

告别手动下载烦恼!DouK-Downloader让抖音/TikTok数据采集变得简单

告别手动下载烦恼!DouK-Downloader让抖音/TikTok数据采集变得简单 【免费下载链接】TikTokDownloader TikTok 发布/喜欢/合辑/直播/视频/图集/音乐;抖音发布/喜欢/收藏/收藏夹/视频/图集/实况/直播/音乐/合集/评论/账号/搜索/热榜数据采集工具/下载工具 …...

洛雪音乐音源配置完整教程:3分钟解锁全网无损音乐

洛雪音乐音源配置完整教程:3分钟解锁全网无损音乐 【免费下载链接】lxmusic- lxmusic(洛雪音乐)全网最新最全音源 项目地址: https://gitcode.com/gh_mirrors/lx/lxmusic- 洛雪音乐作为开源音乐播放器,通过灵活的音源配置功能,让用户能…...

VideoDownloadHelper:打破网页视频下载壁垒的智能解决方案

VideoDownloadHelper:打破网页视频下载壁垒的智能解决方案 【免费下载链接】VideoDownloadHelper Chrome Extension to Help Download Video for Some Video Sites. 项目地址: https://gitcode.com/gh_mirrors/vi/VideoDownloadHelper 你是否曾遇到过这样的困…...

基于STM32的智能小车:从硬件选型到PID算法实战

1. 项目概述:从零到一打造你的第一辆智能小车如果你对嵌入式开发感兴趣,想找一个能串联起单片机、传感器、电机控制和无线通信的综合项目,那么基于STM32F103的智能小车绝对是一个绝佳的选择。它不像一个简单的LED闪烁实验那样枯燥&#xff0c…...

通过curl命令快速测试Taotoken大模型聚合接口的连通性

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 通过curl命令快速测试Taotoken大模型聚合接口的连通性 在接入大模型服务时,直接使用curl命令进行接口测试是一种高效且…...

一站式跨平台资源下载神器:5分钟掌握高效网络资源管理

一站式跨平台资源下载神器:5分钟掌握高效网络资源管理 【免费下载链接】res-downloader 视频号、小程序、抖音、快手、小红书、直播流、m3u8、酷狗、QQ音乐等常见网络资源下载! 项目地址: https://gitcode.com/GitHub_Trending/re/res-downloader 在数字内容…...

Mi-Create:让每个人都能成为小米手表表盘设计师的免费开源工具

Mi-Create:让每个人都能成为小米手表表盘设计师的免费开源工具 【免费下载链接】Mi-Create Unofficial watchface creator for Xiaomi wearables ~2021 and above 项目地址: https://gitcode.com/gh_mirrors/mi/Mi-Create 你是否曾经看着小米手表上那些千篇一…...

掌握SRA Tools:3步轻松处理高通量测序数据的高效工具

掌握SRA Tools:3步轻松处理高通量测序数据的高效工具 【免费下载链接】sra-tools SRA Tools 项目地址: https://gitcode.com/gh_mirrors/sr/sra-tools SRA Tools是处理NCBI Sequence Read Archive数据的核心工具集,让你可以轻松地下载、转换和分析…...

UserLAnd安卓Linux容器:如何在手机上运行完整Linux系统的终极指南

UserLAnd安卓Linux容器:如何在手机上运行完整Linux系统的终极指南 【免费下载链接】UserLAnd Main UserLAnd Repository 项目地址: https://gitcode.com/gh_mirrors/us/UserLAnd UserLAnd是一款革命性的安卓应用,让用户无需root权限即可在移动设备…...

Yarn Spinner终极指南:10分钟学会编写专业游戏交互对话

Yarn Spinner终极指南:10分钟学会编写专业游戏交互对话 【免费下载链接】YarnSpinner The core compiler and engine-agnostic components for Yarn Spinner, the friendly dialogue tool. 项目地址: https://gitcode.com/gh_mirrors/ya/YarnSpinner Yarn Sp…...

【QiLink 创始人手记:为什么我回绝了第一家专利代理所?】

QiLink 创始人手记:为什么我回绝了第一家专利代理所?今天,我做了一个可能会让很多传统创业者感到“冒险”的决定——我正式回绝了一家安徽本地律师事务所的专利代理合作。写下这段文字,并不是为了炫耀我“砍价”成功,而…...

仓内与仓外智能物流设计技术难点

智能物流系统根据空间和边界可划分为仓内物流(Intralogistics)与仓外物流(External Logistics)。两者由于运行环境、控制变量和边界条件的根本差异,面临着截然不同的技术设计难点。一、 仓内智能物流设计技术难点&…...

智能物流系统的技术难点

根据国际供应链与智能制造专家的普遍共识,智能物流系统(Smart Logistics System)作为“AI制造”的外延与闭环,其技术难点已不再是简单的“扫码搬运”,而是如何处理极高动态性、超大规模和强不确定性的复杂场景。核心技…...

精密峰值检测电路:双运放架构原理、设计与工程实践

1. 项目概述:从“是什么”到“为什么用它”在电子设计和信号处理领域,我们常常需要知道一个信号在特定时间段内的“最高点”或“最低点”。比如,你想知道麦克风采集到的声音信号最大有多响,或者一个振动传感器感受到的冲击力峰值是…...

Win11Debloat:Windows系统优化利器,一键清理臃肿应用与隐私设置

Win11Debloat:Windows系统优化利器,一键清理臃肿应用与隐私设置 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes…...

JEECG-Boot接口幂等性架构深度解析:Token机制与分布式锁实战指南

JEECG-Boot接口幂等性架构深度解析:Token机制与分布式锁实战指南 【免费下载链接】jeecg-boot AI 低代码平台,「低代码 零代码」双模式驱动:低代码一键生成前后端代码,零代码 5 分钟搭建系统,AI Skills 一句话画流程、…...

3步实现AI动作复制:如何用ComfyUI-MimicMotionWrapper让普通人拥有专业舞者动作

3步实现AI动作复制:如何用ComfyUI-MimicMotionWrapper让普通人拥有专业舞者动作 【免费下载链接】ComfyUI-MimicMotionWrapper 项目地址: https://gitcode.com/gh_mirrors/co/ComfyUI-MimicMotionWrapper 你是否想过让照片中的人物动起来,赋予静…...

Taotoken的模型广场如何辅助开发者进行技术选型

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 Taotoken的模型广场如何辅助开发者进行技术选型 对于需要集成大模型能力的开发者而言,面对市场上众多的模型提供商、复…...

为什么82%的保险AI Agent项目卡在POC阶段?一线技术总监首度公开6个致命设计盲区

更多请点击: https://codechina.net 第一章:为什么82%的保险AI Agent项目卡在POC阶段? 保险行业正加速拥抱AI Agent技术,但据2024年《亚太保险科技落地白皮书》统计,82%的AI Agent项目在概念验证(POC&…...

C++学习笔记25:explicit 关键字与隐式类型转换

目录 一、什么是隐式类型转换? 二、为什么会发生这种转换? 三、隐式类型转换的过程 四、explicit 的作用 五、什么时候需要 explicit? 六、C11 后的花括号初始化 七、小结 一、什么是隐式类型转换? 在C中,有些…...

Cortex-M3调试中JTAG RESET线的关键作用与实践

1. Cortex-M3调试中的JTAG RESET线必要性解析在嵌入式开发领域,调试接口的可靠性直接决定了开发效率。对于使用Keil MDK和ULINK2调试适配器的工程师而言,Cortex-M3设备的JTAG RESET线连接问题经常引发调试连接失败。虽然理论上Cortex-M3内核通过SYSRESET…...

Bebas Neue字体完全指南:免费商用的现代设计利器

Bebas Neue字体完全指南:免费商用的现代设计利器 【免费下载链接】Bebas-Neue Bebas Neue font 项目地址: https://gitcode.com/gh_mirrors/be/Bebas-Neue 还在寻找一款能为你的设计项目增添专业感的免费字体吗?Bebas Neue字体库正是你需要的完美…...

“AI点单员”真的能替代人工吗?——基于237家门店AB测试的转化率、客单价、复购率三重数据验证(含原始数据集索引)

更多请点击: https://kaifayun.com 第一章:AI Agent餐饮行业应用 AI Agent正以前所未有的深度融入餐饮行业全链路,从智能点餐、后厨协同到供应链优化与顾客情感分析,其核心价值在于将静态规则系统升级为具备感知、推理与自主决策…...

EGO-Planner-v2:零配置开启无人机集群仿真新体验

EGO-Planner-v2:零配置开启无人机集群仿真新体验 【免费下载链接】EGO-Planner-v2 Swarm Playground, the codebase of the paper "Swarm of micro flying robots in the wild" 项目地址: https://gitcode.com/gh_mirrors/eg/EGO-Planner-v2 想要快…...

BE-ToF技术:突破远距离深度成像的创新方案

1. BE-ToF技术概述:突破远距离深度成像的瓶颈深度感知技术在现代计算机视觉系统中扮演着越来越重要的角色,特别是在自动驾驶、机器人导航和三维重建等领域。时间飞行(Time-of-Flight, ToF)成像作为深度感知的主流技术之一,其性能直接决定了这…...

海思HS-Ultra 7L2D边缘AI工控机:99 TOPS算力如何赋能工业视觉与医疗?

1. 项目概述:当AI算力下沉到边缘,我们需要什么样的“工业大脑”?在工业自动化、机器视觉、智慧医疗这些领域摸爬滚打十几年,我亲眼见证了计算架构从集中式云端向边缘侧迁移的浪潮。早期,大家习惯于把海量的传感器数据、…...

基于AXI4-Lite总线与AXI UARTLite IP核实现Zynq PS-PL异构串口扩展

1. 项目概述与核心价值最近在搞一个基于创龙DR1系列核心板的工业网关项目,里面需要同时接入RS232、RS485和RS422三种不同标准的串口设备。如果全用PS端的原生UART,引脚和资源根本不够分,而且布线也是个麻烦事。这时候,FPGA&#x…...

基于RT-Thread与TOF传感器的智能电动滑板主动刹车系统设计

1. 项目概述:从情怀出发的硬件升级之旅几年前,我和几个同学在导师的带领下,捣鼓出了一个基于 Arduino Uno 的电动滑板。那会儿真是干劲十足,白天画图、晚上调代码,傍晚就踩着滑板在校园里飞驰。这个滑板后来成了我的“…...

3分钟学会洛雪音乐音源配置:免费获取全网高品质音乐的终极指南

3分钟学会洛雪音乐音源配置:免费获取全网高品质音乐的终极指南 【免费下载链接】lxmusic- lxmusic(洛雪音乐)全网最新最全音源 项目地址: https://gitcode.com/gh_mirrors/lx/lxmusic- 还在为找不到高质量免费音乐资源而烦恼吗?lxmusic-项目为你提…...