当前位置: 首页 > article >正文

看了Claude Code泄露的源码,发现4个意想不到的秘密......

这两天Claude Code的源码在网上传得飞起。谁都没想到程序员的一次疏漏就把核心商业资产暴露在了全世界的面前。在好奇心驱使下我也忍不住去看了看你别说发现了几个小秘密还真有点意思。01用户情绪失控 赶紧用正则判断一下你以为一个顶级 AI 产品是怎么理解用户情绪的大模型情感分析多模态推理不。是一行正则表达式在userPromptKeywords.ts 中有这么一段export function matchesNegativeKeyword(input: string): boolean { const lowerInput input.toLowerCase() const negativePattern /\b(wtf|wth|ffs|omfg|shit(ty|tiest)?|dumbass|horrible|awful|piss(ed|ing)? off|piece of (shit|crap|junk)|what the (fuck|hell)|fucking? (broken|useless|terrible|awful|horrible)|fuck you|screw (this|you)|so frustrating|this sucks|damn it)\b/ return negativePattern.test(lowerInput)}看到其中的正则表达式没有也就是说如果你骂它“This shit is broken again.”“Wtf”它是能“听懂”的但你要是来一句“这破玩意怎么又坏了”不好意思它一脸懵。用中文它可听不懂“英语好得学啊”不过更有意思的是它检测到你情绪崩溃之后并不会“哄你”不会变温柔不会道歉三连也不会进入什么“安抚模式”。它只是默默地把这件事记下来“嗯这个用户刚刚骂人了。”然后用于内部统计比如有多少用户在使用过程中爆粗口哪些场景最容易让人抓狂。既然是这样就不需要那么精确了一行正则就行了。这段代码背后的故事可能是这样的经理老板想统计下用户在使用Cluade Code时心情沮丧的占多大比例能做不实习生可以做。经理今天下午能上线不实习生可以我用一行正则表达式搞定。02长达5594行的文件我在IBM的时候遇到了一个神奇的项目Web界面很漂亮打开代码一看 一个历史悠久长达5000行的JSP。那一刻我就觉得这已经是“屎山艺术”的巅峰了。没想到啊这次在 Claude Code 里又看到了熟悉的感觉一个 5594 行的 TypeScript 文件。用Claude Code分析一下这个Claude Code文件结果如下其中一个行数就长达3170行占了整个文件的57%。当然公平地说一句代码本身不差注释挺清晰类型也很规范。问题不在“写得烂”而在结构已经开始失控了。它很可能是快速迭代下的产物你几乎可以还原它的成长路径1.一开始结构清晰、模块优雅2. 然后加一个 subtype3. 再加一个subtype4. 时间来不及了再加一个subtype吧……往一个现成的函数里加逻辑永远是最省事的没有程序员能抵抗这种诱惑。03有人想“蒸馏”我 给丫投毒在 claude.ts 文件的 301–313 行有一个叫 ANTI_DISTILLATION_CC 的开关。一旦打开Claude Code 在调用 API 时会带上一个字段anti_distillation: [fake_tools]// Anti-distillation: send fake_tools opt-in for 1P CLI only if ( feature(ANTI_DISTILLATION_CC) ? process.env.CLAUDE_CODE_ENTRYPOINT cli shouldIncludeFirstPartyOnlyBetas() getFeatureValue_CACHED_MAY_BE_STALE( tengu_anti_distill_fake_tool_injection, false, ) : false ) { result.anti_distillation [fake_tools] }这个字段的作用是告诉服务器在系统提示词system prompt中偷偷加入一些假的工具fake tools定义。如果有人在抓 API 流量做数据蒸馏训练这些假工具会混进训练数据模型会学到一堆“并不存在的能力”最终效果肯定是越学越歪。更狠的是在betas.ts中还有一套机制服务端文本压缩 签名验证。Claude会把对话压缩成摘要签名后传给客户端下一轮对话时客户端把签名回传服务端再恢复原文。结果就是你抓到了API响应但只是摘要关键内容拿不到。这样做有两个好处一是节省Token其次还是防止蒸馏。04嘿嘿我是卧底这个卧底功能仅对Anthropic的员工。在内部项目里白名单那种Claude Code非常“坦诚”commit message 里会写上Co-Authored-By: Claude Opus 4.6 noreplyanthropic.comPR 描述中会带 Generated with Claude Code (93% 3-shotted by claude-opus-4-5)大家一看就知道哦这是我们家AI写的。但员工一旦切到外部开源项目画风突变直接进入“卧底模式”。所有 commit、PR 标题、描述都要严格遵守一套规则不能提任何内部模型代号不能出现未发布版本号不能暴露内部仓库信息甚至连 “Claude Code” 这几个字都不能出现更不用说 Co-Authored-By 这种 AI 署名了简单说就是一句话不允许留下任何“这是 AI 写的”痕迹。于是就出现了一个很微妙的画面一个 Anthropic 员工用Claude Code在 GitHub 上提交代码写 PR、改 bug、过 review看起来完全就是一个普通人类开发者。如果只是担心模型细节泄露这其实很好理解。但现在是连“AI参与过”这件事本身也被一起抹掉了这就不只是“保护机密”了而更像是让 AI 安静地混在人群里干活。05一点儿感想翻完这堆代码我最大的感受就是不管是任何产品不管外表看起来有多么光鲜亮丽内部都有可能混乱不堪啊。不管底层模型多牛到了应用层该用正则还是用正则该有屎山还是有屎山。AI产品本质上还是软件工程。

相关文章:

看了Claude Code泄露的源码,发现4个意想不到的秘密......

这两天,Claude Code的源码在网上传得飞起。谁都没想到,程序员的一次疏漏,就把核心商业资产暴露在了全世界的面前。在好奇心驱使下,我也忍不住去看了看,你别说,发现了几个小秘密,还真有点意思。0…...

告别热键劫持:Hotkey Detective让Windows快捷键回归掌控

告别热键劫持:Hotkey Detective让Windows快捷键回归掌控 【免费下载链接】hotkey-detective A small program for investigating stolen key combinations under Windows 7 and later. 项目地址: https://gitcode.com/gh_mirrors/ho/hotkey-detective 在数字…...

ComfyUI-VideoHelperSuite:构建高性能视频处理管道的异步架构设计

ComfyUI-VideoHelperSuite:构建高性能视频处理管道的异步架构设计 【免费下载链接】ComfyUI-VideoHelperSuite Nodes related to video workflows 项目地址: https://gitcode.com/gh_mirrors/co/ComfyUI-VideoHelperSuite ComfyUI-VideoHelperSuite是一个专门…...

Qwen2.5-VL底座+lychee-rerank-mm效果惊艳:批量图片智能打分可视化展示

Qwen2.5-VL底座lychee-rerank-mm效果惊艳:批量图片智能打分可视化展示 1. 项目简介 这是一个专门为RTX 4090显卡(24G显存)打造的智能图片排序系统。核心基于阿里通义千问Qwen2.5-VL多模态大模型,结合Lychee-rerank-mm专业重排序…...

CosyVoice语音生成效果对比:原声vs克隆声,几乎听不出区别

CosyVoice语音生成效果对比:原声vs克隆声,几乎听不出区别 1. 语音克隆技术的新高度 最近测试了CosyVoice语音克隆模型的效果,结果让我大吃一惊。这个由阿里巴巴通义实验室开发的语音生成模型,仅需3-10秒的参考音频就能克隆出几乎…...

软件测试实战:忍者像素绘卷API接口自动化测试用例设计

软件测试实战:忍者像素绘卷API接口自动化测试用例设计 1. 项目背景与测试目标 忍者像素绘卷:天界画坊是一款基于AI技术的像素艺术生成工具,其API接口为开发者提供了丰富的图像生成能力。作为软件测试工程师,我们需要确保API在各…...

Bidili Generator企业应用:广告公司客户提案阶段快速生成视觉概念稿

Bidili Generator企业应用:广告公司客户提案阶段快速生成视觉概念稿 1. 引言:提案阶段的视觉痛点与解决方案 在广告公司的日常工作中,客户提案阶段往往是最紧张、最考验创意执行效率的环节。传统的视觉概念稿制作流程通常是这样的&#xff…...

如何判断 SEO 排名推广的投资是否值得

SEO 排名推广的投资是否值得:深入分析与实用建议 在当今数字化时代,SEO(搜索引擎优化)排名推广已成为许多企业获取在线流量和潜在客户的重要手段。面对高昂的SEO推广费用,企业往往会纠结于“这笔投资是否值得”这一问…...

Asian Beauty Z-Image Turbo商业应用:快速生成品牌宣传东方形象照

Asian Beauty Z-Image Turbo商业应用:快速生成品牌宣传东方形象照 大家好,今天我们来聊一个对品牌方、市场人员和内容创作者特别有吸引力的工具——Asian Beauty Z-Image Turbo。如果你正在为品牌宣传、社交媒体内容或营销活动寻找高质量的东方形象照&a…...

智能监控新选择:基于实时口罩检测-通用模型的自动告警系统搭建

智能监控新选择:基于实时口罩检测-通用模型的自动告警系统搭建 1. 引言:智能防疫监控的迫切需求 在公共场所管理中,确保人员佩戴口罩是防疫工作的重要环节。传统的人工检查方式存在效率低、成本高、易遗漏等问题。基于计算机视觉的智能监控…...

NVIDIA Profile Inspector深度调校指南:释放专业显卡潜能的非游戏应用方案

NVIDIA Profile Inspector深度调校指南:释放专业显卡潜能的非游戏应用方案 【免费下载链接】nvidiaProfileInspector 项目地址: https://gitcode.com/gh_mirrors/nv/nvidiaProfileInspector 在专业计算领域,NVIDIA Profile Inspector不仅是游戏玩…...

OFA-Image-Caption模型解析:从卷积神经网络到跨模态理解的架构揭秘

OFA-Image-Caption模型解析:从卷积神经网络到跨模态理解的架构揭秘 最近几年,AI在“看图说话”这件事上进步飞快。你可能见过一些工具,上传一张照片,它就能自动生成一段描述。这背后,图像描述生成技术是关键。今天咱们…...

8GB显存跑大模型?Qwen3-0.6B-FP8部署与效果实测全记录

8GB显存跑大模型?Qwen3-0.6B-FP8部署与效果实测全记录 1. 引言:轻量级大模型的新选择 在AI模型日益庞大的今天,如何在有限硬件资源上运行高效的大语言模型成为开发者关注的焦点。Qwen3-0.6B-FP8作为阿里达摩院最新推出的轻量级模型&#xff0…...

RMBG-2.0(BiRefNet)开源抠图工具落地实操:Streamlit双列界面零门槛上手

RMBG-2.0(BiRefNet)开源抠图工具落地实操:Streamlit双列界面零门槛上手 想给产品换个背景,却不会用复杂的PS?想快速处理一批图片素材,又担心在线工具泄露隐私?今天,我们就来聊聊一个…...

如何将你的小爱音箱改造成智能AI语音助手:MiGPT终极教程

如何将你的小爱音箱改造成智能AI语音助手:MiGPT终极教程 【免费下载链接】mi-gpt 🏠 将小爱音箱接入 ChatGPT 和豆包,改造成你的专属语音助手。 项目地址: https://gitcode.com/GitHub_Trending/mi/mi-gpt 想让家里的智能音箱从"…...

5个强力步骤实现旧Mac升级:开源工具OpenCore Legacy Patcher全攻略

5个强力步骤实现旧Mac升级:开源工具OpenCore Legacy Patcher全攻略 【免费下载链接】OpenCore-Legacy-Patcher Experience macOS just like before 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher 当你的Mac提示"此Mac不支…...

OpenSpeedy:开源游戏速度调节工具提升玩家效率指南

OpenSpeedy:开源游戏速度调节工具提升玩家效率指南 【免费下载链接】OpenSpeedy 🎮 An open-source game speed modifier. 项目地址: https://gitcode.com/gh_mirrors/op/OpenSpeedy 在游戏世界中,时间掌控往往决定着体验质量。当你面…...

AirPodsDesktop完整指南:在Windows和Linux上提升AirPods使用体验的终极方案

AirPodsDesktop完整指南:在Windows和Linux上提升AirPods使用体验的终极方案 【免费下载链接】AirPodsDesktop ☄️ AirPods desktop user experience enhancement program, for Windows and Linux (WIP) 项目地址: https://gitcode.com/gh_mirrors/ai/AirPodsDesk…...

TranslucentTB高效配置指南:场景化方案实现Windows任务栏个性化

TranslucentTB高效配置指南:场景化方案实现Windows任务栏个性化 【免费下载链接】TranslucentTB A lightweight utility that makes the Windows taskbar translucent/transparent. 项目地址: https://gitcode.com/gh_mirrors/tr/TranslucentTB 作为一款开源…...

Z-Image-Turbo-辉夜巫女效果实测:LoRA微调模型在Gradio界面的高清出图表现

Z-Image-Turbo-辉夜巫女效果实测:LoRA微调模型在Gradio界面的高清出图表现 1. 模型简介与部署 Z-Image-Turbo-辉夜巫女是基于Z-Image-Turbo模型进行LoRA微调后的特殊版本,专门针对生成"辉夜巫女"风格图片进行了优化。该模型通过Xinference框…...

all-MiniLM-L6-v2效果展示:22.7MB小模型在语义相似度任务中的惊艳表现

all-MiniLM-L6-v2效果展示:22.7MB小模型在语义相似度任务中的惊艳表现 在自然语言处理领域,语义相似度计算是一个基础而重要的任务,它直接影响着搜索、推荐、问答等系统的效果。传统的大模型虽然效果出色,但庞大的体积和计算需求…...

告别手动转换!用Python脚本一键将Labelme关键点标注转为YOLO格式(附完整代码)

告别手动转换!用Python脚本一键将Labelme关键点标注转为YOLO格式(附完整代码) 在计算机视觉项目中,数据标注的格式转换往往是开发者最头疼的环节之一。特别是当项目涉及人体姿态估计、面部关键点检测等复杂任务时,标注…...

如何快速解密网易云音乐NCM文件:5分钟掌握完整转换指南

如何快速解密网易云音乐NCM文件:5分钟掌握完整转换指南 【免费下载链接】ncmdump ncmdump - 网易云音乐NCM转换 项目地址: https://gitcode.com/gh_mirrors/ncmdu/ncmdump 还在为网易云音乐下载的加密NCM文件无法在其他播放器上播放而烦恼吗?ncmd…...

Llama-3.2V-11B-cot效果展示:低光照/模糊图像下的鲁棒推理案例

Llama-3.2V-11B-cot效果展示:低光照/模糊图像下的鲁棒推理案例 1. 项目概述 Llama-3.2V-11B-cot是基于Meta Llama-3.2V-11B-cot多模态大模型开发的高性能视觉推理工具,专为双卡4090环境深度优化。该工具不仅修复了视觉权重加载的关键Bug,还…...

4个高效步骤实现HMCL启动器数据无忧迁移全攻略

4个高效步骤实现HMCL启动器数据无忧迁移全攻略 【免费下载链接】HMCL A Minecraft Launcher which is multi-functional, cross-platform and popular 项目地址: https://gitcode.com/gh_mirrors/hm/HMCL 当你终于升级了新电脑,兴冲冲地安装好HMCL启动器准备…...

Python玩转微信自动化:除了监控聊天,uiautomation还能帮你自动保存文件、整理聊天记录

Python实现微信自动化管理:从文件归档到聊天记录整理 微信已经成为现代办公不可或缺的沟通工具,但随之而来的是海量文件管理和聊天记录整理的烦恼。每天手动保存图片、文档,再按日期分类,不仅耗时耗力,还容易遗漏重要…...

QMCDecode终极指南:解锁QQ音乐加密格式的完整解决方案

QMCDecode终极指南:解锁QQ音乐加密格式的完整解决方案 【免费下载链接】QMCDecode QQ音乐QMC格式转换为普通格式(qmcflac转flac,qmc0,qmc3转mp3, mflac,mflac0等转flac),仅支持macOS,可自动识别到QQ音乐下载目录,默认转…...

你的杜邦线和PCB走线,可能正在‘谋杀’J-Link SWD的高速信号

你的杜邦线和PCB走线,可能正在‘谋杀’J-Link SWD的高速信号 在嵌入式开发中,我们常常会遇到一个令人头疼的问题:昨天还能正常工作的调试接口,今天突然就无法识别芯片了。更令人困惑的是,降低SWD时钟速率后&#xff0…...

华为云CCE内网部署Nacos集群实战:不用Helm,纯页面操作搞定镜像上传与配置

华为云CCE内网部署Nacos集群实战:纯控制台操作指南 在企业级容器化部署场景中,内网环境下的服务部署往往面临特殊挑战。当安全合规要求严格限制外网访问时,传统依赖公网镜像仓库和Helm工具的部署方案便不再适用。本文将详细介绍如何在华为云…...

OFDM802.11a的FPGA实现(八)二级交织:子载波交织优化策略(附Verilog与Matlab对比)

1. 二级交织在802.11a中的核心作用 在无线通信系统中,突发错误是导致数据传输失败的主要原因之一。802.11a标准采用二级交织技术来解决这个问题,它通过重新排列数据比特的顺序,使得原本连续的突发错误在接收端被分散开来。这种技术就像是洗牌…...