当前位置: 首页 > article >正文

别再给Claude送钱了!7个硬核技巧让Token消耗爆降80%,我亲测有效

文章目录前言1. 杀鸡不用牛刀根据任务复杂度切换模型别用导弹打蚊子2. 把CLAUDE.md当“项目宪法”别当“信息垃圾场”3. 把脏活累活交给Subagent但别滥用4. 精准打击明确指定文件和行号别让Claude大海捞针5. 定期保养主动用/compact别等上下文炸了才想起6. 先诊断再优化用/context找到真正的吞金兽7. 工具链要克制集成不是越多越好小结P.S. 目前国内还是很缺AI人才的希望更多人能真正加入到AI行业共同促进行业进步增强我国的AI竞争力。想要系统学习AI知识的朋友可以看看我精心打磨的教程 http://blog.csdn.net/jiangjunshow教程通俗易懂高中生都能看懂还有各种段子风趣幽默从深度学习基础原理到各领域实战应用都有讲解我22年的AI积累全在里面了。注意教程仅限真正想入门AI的朋友否则看看零散的博文就够了。前言你是不是最近用Claude Code写代码写得飞起结果月底一看API账单直接原地心梗明明没写几个功能Token却像开了水龙头一样哗哗没了很多人一遇到这个问题第一反应就是“我Prompt写得太啰嗦了”然后开始抠字眼把一句话拆成半句话结果代码质量下降了Token也没省多少。我跟你们说这根本就是找错了方向真正烧Token的从来不是你输入的那几句Prompt而是Claude背后偷偷带着的那一大坨臃肿的上下文什么之前的聊天记录啊、读过的几十上百个代码文件啊、工具调用输出的大段日志啊、还有你塞进去的各种乱七八糟的记忆文件啊……这些东西才是真正的吞金兽今天我就把我亲测有效的7个硬核技巧分享给你们不用牺牲效率就能让你的Token消耗直接砍到原来的20%再也不用给Claude当冤大头1. 杀鸡不用牛刀根据任务复杂度切换模型别用导弹打蚊子这一点最简单但90%的人都在犯这个错你想想你写个单元测试、改个变量名、格式化一下代码这种小学生都能干的活你非要用最贵的Opus 4.5 Thinking模式这不就是用导弹打蚊子吗钱烧得能不心疼吗正确的做法是给任务分个级什么活用什么模型轻量任务查找、重命名、格式化、重复性操作用Haiku 4.5或者DeepSeek-Coder成本低到可以忽略不计日常任务写测试、简单改代码、解释逻辑、常规重构用Sonnet 4.5或者GLM-4.7性价比拉满复杂任务多文件架构设计、棘手bug排查、跨系统分析再上Opus 4.5或者Kimi K2好钢用在刀刃上还有个很多人不知道的神器/effort命令对于一些特别简单的问题把effort level调到low直接减少模型的“思考预算”输出Token立马降一大截。一句话总结模型能力要和任务复杂度匹配别让高性能模型去干搬砖的活2. 把CLAUDE.md当“项目宪法”别当“信息垃圾场”很多人知道CLAUDE.md好用就什么东西都往里面塞会议纪要、设计演进历史、冗长的业务文档、甚至昨天吃了什么都写进去……我跟你们说这简直是在给自己挖坑CLAUDE.md会在整个会话过程中一直驻留在上下文里而且不会被轻易挤出去。也就是说你的CLAUDE.md有5000Token那每一轮对话你都要为这5000Token付费不管你聊2轮还是200轮那CLAUDE.md里到底该放什么只放那些长期稳定、反复要用的规则✅ 项目怎么运行测试✅ 使用哪个包管理器✅ 代码格式要求✅ 关键架构约束✅ 哪些目录不要碰✅ 团队通用开发约定❌ 会议纪要❌ 设计演进历史❌ 冗长的实现说明❌ 临时性的任务背景❌ 长篇大论的业务文档记住CLAUDE.md是速查手册不是垃圾桶写得越精炼长期省的钱越多3. 把脏活累活交给Subagent但别滥用Subagent绝对是省Token的大杀器但很多人都用错了Subagent本质上就是一个独立上下文窗口的Claude实例。你让它去干那些输出长、过程杂、但结果短的活比如分析大段日志、检索整个仓库的代码、跑一堆测试用例……它产生的所有过程性噪音都不会污染主会话最后只给你返回一个总结结果。但是Subagent不是万能的它有启动成本如果你只是让它执行个简单的git commit、或者查个ls命令那用Subagent反而更费钱因为启动它本身就要花不少Token。所以正确的使用原则是只有当它节省下来的主上下文污染足以覆盖启动成本时再用它适合交给Subagent的任务✅ 输出会很长✅ 检索范围较广✅ 过程信息多但结果摘要短✅ 不需要主线程保留完整过程细节不适合的❌ 简单shell操作❌ 快速git命令❌ 一两句话就能解决的问题4. 精准打击明确指定文件和行号别让Claude大海捞针我见过太多人这么写Prompt“你帮我看看auth相关的代码哪里有问题。”兄弟你这不是在让Claude帮你找bug你是在让它在整个仓库里大海捞针啊它得先搜一圈所有带auth的文件一个个打开看然后猜你到底关心什么这中间浪费的Token能绕地球三圈如果问题实际上只在1-2个文件里这种探索就是纯纯的浪费更好的写法是“请对比src/auth/session.ts第3090行和src/api/login.ts第1060行说明两者之间的逻辑不一致在哪里。”直接缩小搜索范围减少无意义的文件读取不仅省Token还能得到更准确的答案还有个神技巧先用Plan ModeShiftTab在执行可能成本高的操作前先让Claude出个分步骤计划你把明显没必要的步骤删掉再让它执行。要知道最浪费Token的就是试错式执行Claude试一个方案失败了再试第二个又报错……每一次尝试都是在烧你的钱提前规划能帮你砍掉80%的无效来回5. 定期保养主动用/compact别等上下文炸了才想起很多人知道/compact命令但都是等到Claude开始遗忘前文、弹出上下文告警、回答质量变差的时候才用。兄弟这时候已经晚了这时候你的上下文已经脏得不行了生成的摘要也会乱七八糟关键信息都丢了。/compact的正确用法不是“亡羊补牢”而是“定期保养”什么时候用最合适**当关键结论已经出来而中间过程开始变多的时候**比如你已经找到了bug的原因或者已经写完了一个功能这时候就可以执行一次/compact把那些没用的中间过程、报错信息、试错记录全部清理掉只保留关键结论。这样不仅能让后续每一步都更轻量还能保证摘要的质量一举两得6. 先诊断再优化用/context找到真正的吞金兽很多人一发现Token消耗快就开始瞎优化改Prompt、缩短提问、减少对话轮次……结果忙活半天Token一点没少。为什么因为你根本没找到真正的问题所在真正烧Token的可能不是你当前的Prompt而是之前读入的一个超大文件、或者工具调用留下的大段输出、或者某个你早就忘了的过重的记忆文件这时候你需要的是/context命令它就是你的上下文体检报告能清清楚楚地告诉你每一类内容占了多少Token谁才是真正的吞金兽。我之前就遇到过Token消耗特别快查了半天发现是我之前不小心读入了一个10M的日志文件它一直在每一轮对话里默默消耗Token删掉之后Token消耗直接降了一半所以记住**先诊断再优化**先看/context找到臃肿的来源再有针对性地删减别瞎忙活7. 工具链要克制集成不是越多越好Claude Code可以接很多工具、插件、技能这确实很强大。但很多人有个毛病只要是能接的全部都接上什么代码审查、自动测试、git辅助、文档生成……恨不得把整个IDE都塞进去。结果呢任务很小但系统开销很大每一个工具的定义、调用协议、上下文桥接信息都会占用宝贵的Token。你只是想改个变量名结果Claude先加载了几十个工具的定义这能不费钱吗正确的策略是**只保留真正高频、刚需的工具集成**只接那些能持续解决重复问题的能力不要因为“可以接”就全部接上精简的工具链永远比“全家桶式”的集成更高效、更省钱小结兄弟们今天讲了这么多其实核心就一句话降低Claude Code Token成本的关键不是对每条Prompt精打细算而是设计好你的上下文架构真正能帮你省大钱的从来不是“把一句话少写20个字”而是这些更本质的动作控制自动注入的上下文缩小任务搜索范围及时压缩会话把高噪音工作隔离出去避免不必要的工具链负担别再当冤大头给Claude送钱了把这些技巧用起来下个月的账单绝对能让你惊喜P.S. 目前国内还是很缺AI人才的希望更多人能真正加入到AI行业共同促进行业进步增强我国的AI竞争力。想要系统学习AI知识的朋友可以看看我精心打磨的教程 http://blog.csdn.net/jiangjunshow教程通俗易懂高中生都能看懂还有各种段子风趣幽默从深度学习基础原理到各领域实战应用都有讲解我22年的AI积累全在里面了。注意教程仅限真正想入门AI的朋友否则看看零散的博文就够了。

相关文章:

别再给Claude送钱了!7个硬核技巧让Token消耗爆降80%,我亲测有效

文章目录前言1. 杀鸡不用牛刀:根据任务复杂度切换模型,别用导弹打蚊子2. 把CLAUDE.md当“项目宪法”,别当“信息垃圾场”3. 把脏活累活交给Subagent,但别滥用4. 精准打击!明确指定文件和行号,别让Claude大海…...

2026本地视频怎么去水印?5款免费去水印软件对比和实用方法指南

很多人都遇到过这个问题:辛辛苦苦保存下来的视频、素材库里的片段,上面都贴了水印,想要二次编辑或重新发布时,这些水印就成了"眼中钉"。本地视频怎么去水印?2026年有哪些靠谱的免费去水印方法?今…...

【NotebookLM语言润色功能深度解密】:20年AI写作工具实战者亲授5大未公开润色技巧,92%用户忽略的语义校准开关在哪?

更多请点击: https://intelliparadigm.com 第一章:NotebookLM语言润色功能全景认知 NotebookLM 是 Google 推出的基于用户自有文档的 AI 助手,其语言润色(Language Refinement)功能并非简单替换同义词,而是…...

Claude Code Skill 最佳实践:5 分钟封一个,6 条要点 + 团队共享

👉 这是一个或许对你有用的社群🐱 一对一交流/面试小册/简历优化/求职解惑,欢迎加入「芋道快速开发平台」知识星球。下面是星球提供的部分资料: 《项目实战(视频)》:从书中学,往事上…...

别再被Nginx的rewrite循环搞懵了!一个真实Vue项目部署的500错误排查实录

从Nginx重定向死循环到优雅解决:Vue项目部署的深度排错指南 凌晨三点,服务器监控突然告警——刚上线的Vue企业门户网站出现大面积500错误。查看日志时,那个令人窒息的rewrite or internal redirection cycle错误信息让整个运维团队陷入沉思。…...

5G 网络优化工程师是骗局吗?从业15年资深老工程师实话实说

01 5G 网优岗位,本身真实靠谱很多人一刷到 5G 网络优化工程师这个岗位,第一反应都是犹豫、怀疑:这到底是不是收割小白的骗局?我在通信行业深耕整整 15 年,也拿到过华为高级工程师认证,今天以业内老兵的身份…...

关于光缆,这些事儿通信人一定要知道

随着5G网络的全面铺开和持续深耕,通信工程师的工作边界正在不断拓展。过去,后台网优工程师可能更多地专注于参数调整、信令分析和性能优化;而如今,越来越多的项目要求前后台协同作业,网优人员也需要熟悉现场施工规范&a…...

5G网优路测数据分析方法:从数据采集到问题定位

路测(Drive Test)是5G网络优化最基础也是最关键的数据采集手段。本文从数据采集、分析方法、问题定位三个层面,系统讲解5G路测数据分析方法论。一、5G路测概述1.1 路测目的目的说明适用场景覆盖验证验证5G网络覆盖是否达标新站开通、优化后验…...

设计师核心能力框架:从思维策略到工程落地的系统化成长路径

1. 项目概述:一个设计师的“内功”修炼场如果你是一名设计师,或者对设计工作感兴趣,那么你一定有过这样的时刻:面对一个设计任务,脑子里有无数想法,但打开软件却不知从何下手;或者看到别人的优秀…...

华为HCSP认证备考全攻略:5G网优方向

华为HCSP(Huawei Certified Service Professional)认证是5G网优行业的重要资质认证。本文从考试内容、备考策略、真题分析三个维度,帮你一次性通过考试。一、HCSP认证体系概览1.1 认证等级等级全称定位考试难度薪资加成HCIAHuawei Certified …...

终极英雄联盟工具箱:如何用League Akari提升你的游戏效率与段位

终极英雄联盟工具箱:如何用League Akari提升你的游戏效率与段位 【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit League Akari是一款…...

STL编程中EN/ENO机制详解:从原理到仿真实践

1. 项目概述:理解STL中的EN/ENO机制在工业自动化编程领域,尤其是可编程逻辑控制器(PLC)的编程中,结构化文本(STL)是一种高级的、类似于Pascal或C的文本化编程语言。对于从梯形图(LAD…...

长期使用Taotoken Token Plan套餐的成本控制体会

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 长期使用Taotoken Token Plan套餐的成本控制体会 1. 从按需计费到套餐订阅的转变 在开始使用Taotoken平台时,我和团队…...

基于合宙Air001的交互式地球名片:从硬件焊接、Arduino编程到触摸优化

1. 项目概述与核心思路最近在创客圈子里,合宙的Air001开发板可以说是火得一塌糊涂。包装设计得挺酷,价格更是香到没朋友,最关键的是它完美支持Arduino IDE开发,对于咱们这些习惯了Arduino生态的玩家来说,上手门槛几乎为…...

企业级应用如何通过Taotoken实现API调用的审计与安全管控

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 企业级应用如何通过Taotoken实现API调用的审计与安全管控 将大模型能力集成到企业内部系统,为业务流程带来智能化的同时…...

对比直接使用官方API与通过Taotoken调用的稳定性感受

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 对比直接使用官方API与通过Taotoken调用的稳定性感受 1. 引言 在构建依赖大模型能力的应用时,服务的稳定性是开发者必…...

基于MCP协议构建安全AI支付工具:从原理到实践

1. 项目概述与核心价值最近在折腾AI智能体开发,特别是想给Claude Desktop这类工具增加点“超能力”,比如让它能直接帮我处理支付、查询订单状态,甚至自动对账。这想法听起来挺酷,但真动手去实现,发现最大的拦路虎不是写…...

Go语言秘钥管理:K8s Secret

Go语言秘钥管理:K8s Secret 1. Secret使用 import ("k8s.io/client-go/kubernetes""k8s.io/client-go/rest" )func getSecret(clientset *kubernetes.Clientset, name, namespace string) (string, error) {secret, err : clientset.CoreV1()…...

8051嵌入式开发中的数据覆盖与代码分页技术详解

1. A51汇编中的数据覆盖与代码分页技术解析在8051嵌入式开发中,内存资源往往捉襟见肘。我曾在一个烟雾报警器项目中,主控芯片只有128字节RAM和4KB Flash,却要实现复杂的烟雾浓度算法和无线通信协议。正是通过数据覆盖(Data Overlaying)和代码…...

【硬件实战】从栅极驱动芯片到H桥:MOS管驱动电路设计精要

1. 栅极驱动芯片选型与核心参数解析 第一次用IR2104做H桥驱动时,我犯了个低级错误——没仔细看芯片的驱动能力参数,结果MOS管开关速度慢得像老牛拉车,电机发热严重。这个教训让我明白,选对栅极驱动芯片是H桥设计的首要任务。 目前…...

云端IDE开发CircuitPython:VS Code EDU实战指南与工具链解析

1. 项目概述:当CircuitPython遇上云端IDE如果你玩过像Adafruit的Metro M4、Raspberry Pi Pico这类微控制器板子,对CircuitPython一定不陌生。它让硬件编程变得像写Python脚本一样简单,code.py一保存,板子上的LED立马就能闪起来。但…...

AI应用开发框架nuwax:从快速构建到生产部署全解析

1. 项目概述:一个AI驱动的开源应用框架 最近在开源社区里,我注意到一个名为 nuwax-ai/nuwax 的项目开始受到一些关注。乍一看这个标题,它像是一个GitHub仓库的地址,由 nuwax-ai 这个组织或用户创建,项目名称为 nu…...

Windows右键菜单终极清理:3个简单步骤让您的右键菜单重获新生

Windows右键菜单终极清理:3个简单步骤让您的右键菜单重获新生 【免费下载链接】ContextMenuManager 🖱️ 纯粹的Windows右键菜单管理程序 项目地址: https://gitcode.com/gh_mirrors/co/ContextMenuManager 我们都有过这样的经历:在桌…...

终极指南:BG3 Mod Manager让你的《博德之门3》模组管理变得简单高效

终极指南:BG3 Mod Manager让你的《博德之门3》模组管理变得简单高效 【免费下载链接】BG3ModManager A mod manager for Baldurs Gate 3. This is the only official source! 项目地址: https://gitcode.com/gh_mirrors/bg/BG3ModManager 你是否曾经因为《博…...

大空间中庭水平防火卷帘防火分隔技术应用探讨

摘要大空间中庭广泛应用于商业综合体、大型会展中心、高端写字楼等现代公共建筑,具备通透开阔、流线连贯、美观性强的空间优势,但多层贯通的结构特性极易造成火灾烟气快速扩散、火势纵向蔓延,大幅提升建筑消防防控难度。水平防火卷帘作为柔性…...

蓝桥杯备赛:那些教科书里没写的“潜规则”与实战优化

1. 那些容易被忽视的编译细节 参加过蓝桥杯的同学都知道,比赛中最让人崩溃的不是题目有多难,而是明明本地运行好好的代码,提交后却莫名其妙地编译失败。这些坑我在第一次参赛时几乎全踩过,现在回想起来都是血泪教训。 首先是main函…...

Go语言交互式命令行工具开发:promptui库核心原理与实战应用

1. 项目概述:一个交互式命令行提示工具如果你经常在终端里写脚本,或者开发一些需要用户交互的命令行工具,那么对“如何优雅地获取用户输入”这个问题,一定深有感触。传统的read -p或者input()函数,功能单一、界面简陋&…...

Legado-Harmony:免费开源阅读器打造个性化电子书库终极指南

Legado-Harmony:免费开源阅读器打造个性化电子书库终极指南 【免费下载链接】legado-Harmony 开源阅读鸿蒙版仓库 项目地址: https://gitcode.com/gh_mirrors/le/legado-Harmony legado-Harmony是一款专为鸿蒙系统设计的免费开源阅读应用,为用户提…...

别再手动写上传了!用Layui Upload组件+PHP后端,10分钟搞定带进度条的文件上传功能

10分钟极速集成:Layui UploadPHP打造高体验文件上传模块 每次看到项目里又需要实现文件上传功能时,你是不是已经开始头疼那些重复的代码和调试过程?从进度条显示到文件类型校验,再到后端安全处理,每个环节都可能藏着意…...

基于Minicursor理念的Node.js后端服务快速搭建与架构解析

1. 项目概述与核心价值最近在折腾一个个人项目,需要快速搭建一个轻量级的、能处理实时数据流的后端服务。在寻找合适的脚手架时,我偶然在 GitHub 上发现了forrestchang/minicursor这个项目。乍一看名字,你可能会联想到数据库的“游标”&#…...