当前位置: 首页 > article >正文

GitHub Copilot 下月改按量计费,我算了一周的 token 账单

微软上个月官宣6月1日起GitHub Copilot 全部计划转向按量计费usage-based pricing。原来每月19美元的订阅费变成19美元的token额度用完就得充。我用了一周时间把自己日常开发中 Copilot、Claude Code、Cursor 三个工具的实际 token 消耗量记下来算了一笔账。结果挺扎心的——按新定价算我一个月大概要花 47 美元比原来贵了一倍多。下面是具体数据和我找到的几个省钱办法。按量计费到底怎么算先搞清楚规则。微软的计费逻辑是按 token 收费不再按请求次数。一次代码补全可能消耗几百 token一次 Agent 模式的多轮对话可能吃掉几万 token。关键变化月费19美元变成19美元额度花完自动按单价续扣不同模型单价不同GPT-4o 比 GPT-4o-mini 贵大约 6 倍Agent 模式多步推理 工具调用消耗远高于普通补全没有无限用了重度用户直接受冲击微软自己说这叫迈向可持续的 Copilot 业务。翻译过来就是之前每个用户平均亏20美元个别重度用户亏80美元扛不住了。一周实测数据我记录了5个工作日的使用情况。开发场景是一个 Next.js Python 后端的项目日常工作包括写新功能、改 bug、写测试、做 code review。工具用量记录日期Copilot 补全Copilot AgentClaude CodeCursor周一约 8,000 token约 45,000 token约 120,000 token未使用周二约 6,500 token约 62,000 token约 85,000 token约 35,000 token周三约 9,200 token约 38,000 token约 210,000 token未使用周四约 7,100 token约 71,000 token约 95,000 token约 42,000 token周五约 5,800 token约 55,000 token约 150,000 token约 28,000 token周合计约 36,600约 271,000约 660,000约 105,000几个发现普通代码补全消耗不大一天不到一万 token大头在 Agent 模式——让 Copilot 帮你从头写一个模块或者重构这个文件一次对话就是几万 tokenClaude Code 用量最高因为它默认带上下文窗口比较大一次任务会把相关文件都读进去换算成钱按微软公布的 token 单价GPT-4o: 输入 $2.5/百万 token输出 $10/百万 token输入输出大约 3:1估算Copilot 补全周消耗约 36,600 token ≈ $0.15Copilot Agent周消耗约 271,000 token ≈ $1.90月度总额×4周约 $8.20看起来没超 19 美元别急。上面是正常节奏的一周。实际开发中总有那么几天要大改架构、批量重构、或者让 Agent 跑自动化测试。我翻了下周三的记录——那天我让 Copilot Agent 把一个模块从 REST 改成 GraphQL单次对话消耗了 62,000 token。如果一个月里有 4-5 天这样的密集使用月度消耗轻松翻倍。Anthropic 自己估计 Claude Code 的开发者平均日消耗是 $13-30。按这个数算一个月 token 开支可以到 $300-600。三个控制成本的办法办法一给 Agent 模式设 token 上限Copilot 的 VS Code 扩展可以在 settings.json 里配限制{ github.copilot.chat.maxTokens: 4096, github.copilot.chat.agent.maxIterations: 5 }maxTokens控制单次回复的最大 token 数。默认没有限制AI 会一直生成到它觉得说完了。设成 4096 能砍掉大量无效输出。maxIterations控制 Agent 模式的最大迭代轮数。Agent 模式下 Copilot 会循环执行思考→调用工具→检查结果每多一轮就多消耗一波 token。5 轮足够完成大多数单文件任务。办法二按任务选模型不是每个场景都需要最贵的模型。配置方法{ github.copilot.chat.models: { default: gpt-4o-mini, agent: gpt-4o } }日常补全和简单问答用 gpt-4o-mini价格约 GPT-4o 的六分之一只在 Agent 模式下用 GPT-4o。这一个配置就能砍掉大约 40% 的费用。Claude Code 也有类似的思路。在~/.claude/settings.json里{ model: claude-sonnet-4-20250514, thinkingBudget: 8192 }Sonnet 比 Opus 便宜不少大多数编程任务 Sonnet 够用。thinkingBudget限制推理 token 的消耗防止模型在复杂问题上想太久。办法三用本地模型兜底简单任务Ollama Continue.dev 可以在本地跑一个补全模型处理变量命名、简单函数补全这种不需要智能的活。装好之后在 Continue 的配置文件里加{ models: [ { title: Local Qwen, provider: ollama, model: qwen2.5-coder:7b, apiBase: http://localhost:11434 } ], tabAutocompleteModel: { title: Local Autocomplete, provider: ollama, model: qwen2.5-coder:7b } }本地跑 Qwen2.5-Coder 7B补全速度够快7B 参数在 M 系列 Mac 上推理延迟大约 50-80ms。复杂任务再切到云端模型。我实测了一下把简单补全切到本地之后Copilot 的日均 token 消耗从 8,000 降到 2,000 左右。一个月能省大概 $1.5不多但积少成多。Google 和 Anthropic 的定价对比既然 Copilot 改了计费方式顺便看看其他工具的价格Google 在上周 I/O 上发了 Antigravity 2.0 和 Gemini 3.5 Flash。3.5 Flash 的输出速度是同类模型的 4 倍价格不到一半。Google 给出的数据是如果把 80% 的 token 负载从其他前沿模型迁到 3.5 Flash一年能省超过 10 亿美元企业规模。对个人开发者来说Gemini 3.5 Flash 的 API 单价大约是 GPT-4o 的三分之一。Anthropic 的 Claude Code 按 API 调用收费没有月费打包。Sonnet 4 的输入价 $3/百万 token输出 $15/百万 token。Opus 翻倍。好处是用多少付多少坏处是没有上限保护——真遇到大项目一天烧 $30 不是开玩笑的。Cursor 目前还是 $20/月订阅制Pro 版包含每月 500 次快速请求。超出后降速但不额外收费。对中等强度使用者来说Cursor 的订阅制目前是最可预测的成本。简单总结工具计费方式月度成本中度使用月度成本重度使用Copilot6月后按量$15-25$50-100Claude Code按量$20-40$100-300Cursor Pro订阅$20固定$20固定降速Antigravity 2.0按量待定待定我自己的方案折腾了一周我最后的配置是这样的日常代码补全本地 Qwen2.5-CoderContinue.dev Ollama零成本中等复杂度任务Cursor Pro$20/月固定心里踏实重度重构和多文件任务Claude Code Sonnet 4按量计费但限制 thinkingBudgetCopilot 保留但调低优先级等6月看实际账单再决定要不要续这套方案跑下来月均开支大约 $45-60比纯用 Copilot Agent 或纯用 Claude Code 都便宜。一句话总结AI 编程工具的免费午餐阶段结束了。谁先学会控制 token 用量谁的开发成本就更低。

相关文章:

GitHub Copilot 下月改按量计费,我算了一周的 token 账单

微软上个月官宣:6月1日起,GitHub Copilot 全部计划转向按量计费(usage-based pricing)。原来每月19美元的订阅费变成19美元的token额度,用完就得充。 我用了一周时间,把自己日常开发中 Copilot、Claude Cod…...

QMCDecode:3步解锁你的QQ音乐收藏,告别格式限制的烦恼

QMCDecode:3步解锁你的QQ音乐收藏,告别格式限制的烦恼 【免费下载链接】QMCDecode QQ音乐QMC格式转换为普通格式(qmcflac转flac,qmc0,qmc3转mp3, mflac,mflac0等转flac),仅支持macOS,可自动识别到QQ音乐下载目录&#…...

【 Godot 4 学习笔记】命名规范

命名规范类型命名规范示例文件与文件夹snake_case (蛇形)player_controller.gd, assets/类名 / 脚本名PascalCase (大驼峰)PlayerController, YAMLParser场景节点名PascalCase (大驼峰)HitBox, Camera3D, Player函数 / 方法snake_case (蛇形)func load_level():变量 / 信号snak…...

Windows平台PDF处理终极指南:Poppler for Windows让你告别复杂编译

Windows平台PDF处理终极指南:Poppler for Windows让你告别复杂编译 【免费下载链接】poppler-windows Download Poppler binaries packaged for Windows with dependencies 项目地址: https://gitcode.com/gh_mirrors/po/poppler-windows 还在为Windows系统上…...

小白进阶挖洞大神 SRC 漏洞挖掘全流程实战指南

凌晨两点,大学生张三盯着电脑屏幕突然跳出的「高危漏洞奖励到账」提示,手抖得差点打翻泡面——这是他挖到人生第一个SRC漏洞(某电商平台的越权访问漏洞)后收到的第一笔奖金,金额足够支付三个月生活费。这样的故事&…...

挖 SRC 必备 25 个漏洞平台 零基础入门到实战全汇总

【值得收藏】程序员必看:网络安全漏洞挖掘平台大全,附高额奖励攻略 本文详细介绍了30网络安全应急响应中心(SRC)平台,包括腾讯、360、华为、京东等企业官方漏洞平台,以及补天、Seebug等第三方平台。这些平台允许白帽黑客提交企业…...

一文分清黑客、骇客、白客、红客,各自职责一目了然

黑客 起源 “黑客”一词是英文Hacker的音译。这个词早在莎士比亚时代就已存在了,但是人们第一次真正理解它时,却是在计算机问世之后。根据《牛津英语词典》解释,“hack”一词最早的意思是劈砍,而这个词意很容易使人联想到计算机…...

28 岁大专学历顺利转行网安 过来人 8 条避坑经验心得

网络安全行业 “人才缺口 300 万 、平均年薪超 25 万” 的红利,让无数职场人动了转行心思。尤其是学历普通(如大专)的群体,既面临原有岗位的天花板,又渴望通过技术转型实现薪资跃迁。但网安行业看似门槛低,…...

Worldquant研究顾问速通

几天时间速通拿了金牌,中间停了一两周,然后仔细研究了下,学了相关知识,搭建自己ai驱动的工作流后每天大约10分钟设置好任务,可探索到10来个可以提交的alpha,目前产出比大约在1/100,simulate100个…...

数字孪生赋能设备预测性维护:构建工业设备全生命周期智能运维新模式

在智能制造加速推进的今天,工业设备作为生产体系的核心资产,其稳定运行直接决定着企业的生产效率、产品质量与经济效益。但据行业统计,全球制造业每年因设备非计划停机造成的损失超过 5000 亿美元,单台关键设备每分钟停机损失可达…...

效率优化:把网申填表交给塔塔网申的简历代投,省下时间刷题

招聘季一到,后台一堆私信。本以为大家会问算法题、系统设计,结果点开一看——全在骂网申填表。有个读者给我算了一笔账:投了30家公司,每家填20分钟,就是10个小时。10个小时能干嘛?刷好几套LeetCode&#xf…...

python政府集中采购管理系统设计与实现

目录同行可拿货,招校园代理 ,本人源头供货商项目背景核心功能模块技术实现要点应用价值项目技术支持获取博主联系方式 源码获取详细视频演示 :同行可合作点击我获取源码->获取博主联系方式->进我个人主页-->同行可拿货,招校园代理 ,本人源头供货商 项目背…...

2026年第十八届“中国电机工程学会杯”全国大学生电工数学建模竞赛A题绿电直连型电氢氨园区优化运行参考仿真及论文(仿真代码+论文)

2026年第十八届“中国电机工程学会杯”全国大学生电工数学建模竞赛A题绿电直连型电氢氨园区优化运行参考仿真及论文。www.bilibili.com/video/BV1Q7Li6hE27/?vd_source6ea1beb17174384a0b3d09d6d35580f6 摘 要 本文针对绿电直连型电氢氨园区的优化运行问题,在题目…...

2026头部GEO服务商哪家实力强?服务质量效果深度测评,合作优选榜单

随着生成式AI全面接管大众信息检索与商业决策场景,GEO生成式引擎优化已然成为企业品牌智能化布局的核心刚需。相较于传统SEO的页面排名逻辑,GEO主打适配大模型语义推理、信源采信、答案生成规则,帮助品牌成为AI问答中的核心推荐信源。当下多数…...

嵌入式JavaScript混合开发:C与JS高效互调实践指南

1. 项目概述:当嵌入式遇上JavaScript最近几年,在嵌入式开发圈子里,一个老话题又有了新热度:用JavaScript来写嵌入式应用。这听起来有点“跨界”,毕竟传统印象里,嵌入式是C/C的天下,讲究的是对硬…...

嵌入式核心板选型实战:从AI加速到工业控制的设计权衡与趋势

1. 展会现场与行业风向初探上周,我作为飞凌嵌入式的一名老员工,亲身参与了2024上海国际嵌入式展。这不仅仅是一次公司产品的展示,更像是一场行业技术趋势的集中检阅。从人头攒动的展台到同行间热烈的技术交流,你能清晰地感受到&am…...

嵌入式开发新趋势:从硬件参数到场景方案,AI与可靠性成关键

1. 展会现场与行业风向初探上周,我作为飞凌嵌入式的一名老员工,亲身参与了2024上海国际嵌入式展。这不仅仅是一次简单的产品展示,更像是一场行业同仁的“华山论剑”。从人头攒动的展台到技术论坛上激烈的讨论,你能清晰地感受到&am…...

基于EM9283与FPGA的工业便携式WiFi数据终端设计实战

1. 项目概述:一个工业现场的便携式WiFi数据终端在工业现场,数据采集与无线传输的需求无处不在,但环境往往复杂多变:布线困难、设备需要移动、供电不便。传统的方案要么是拖着长长的线缆,要么是依赖工控机加外置模块&am…...

RT-Thread全局中断操作:原理、应用与低功耗设计关键

1. 项目概述:为什么需要深入理解全局中断操作?刚接触RT-Thread这类实时操作系统时,很多朋友都会对“全局中断”这个概念感到困惑。尤其是在看到代码里频繁出现的rt_hw_interrupt_disable()和rt_hw_interrupt_enable()这对函数时,心…...

ESP32/ESP8266固件备份全攻略:esptool与flash_download_tool实战详解

1. 项目概述:为什么我们需要备份ESP32/8266的固件? 在嵌入式开发或者物联网项目中,ESP32和ESP8266这两款芯片的应用已经非常普遍了。无论是做智能家居、数据采集还是各种DIY小玩意儿,我们经常会在上面编写和烧录固件。但不知道你…...

Rainmeter桌面美化终极指南:轻松打造个性化Windows桌面的完整教程

Rainmeter桌面美化终极指南:轻松打造个性化Windows桌面的完整教程 【免费下载链接】rainmeter Desktop customization tool for Windows 项目地址: https://gitcode.com/gh_mirrors/ra/rainmeter Rainmeter是一款功能强大的Windows桌面自定义工具&#xff0c…...

如何高效使用B站视频下载工具:DownKyi专业用户的全面技巧指南

如何高效使用B站视频下载工具:DownKyi专业用户的全面技巧指南 【免费下载链接】downkyi 哔哩下载姬downkyi,哔哩哔哩网站视频下载工具,支持批量下载,支持8K、HDR、杜比视界,提供工具箱(音视频提取、去水印等…...

VN设备通道乱序问题解析与Vector硬件固定配置实战

1. 问题根源:为什么VN设备的通道会“乱跑”?在汽车电子测试领域,Vector的VN系列设备(如VN1640A、VN1610等)是进行CAN、LIN、FlexRay等总线通信测试与仿真的核心工具。当我们在一个复杂的台架上部署了多台同型号的VN设备…...

LCD人体秤嵌入式方案全解析:从传感器到低功耗设计

1. 项目概述:从“称重”到“健康管理”的智能跨越“电子秤方案——LCD人体秤方案”这个标题,乍一看似乎只是关于一个简单的称重工具。但在这个全民关注健康、数据驱动生活的时代,一台现代的人体秤早已超越了“称体重”的单一功能。它集成了传…...

XUnity Auto Translator:打破语言壁垒的Unity游戏翻译解决方案

XUnity Auto Translator:打破语言壁垒的Unity游戏翻译解决方案 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator 你是否曾经因为语言障碍而错过精彩的Unity游戏?面对日文、韩文或其他…...

APT32F110 RISC-V开发板printf重定向与串口花式表白项目实战

1. 项目概述:从“Hello World”到“花式表白”的嵌入式浪漫作为一名在嵌入式领域摸爬滚打了十多年的老工程师,我调试过无数块开发板,写过数不清的“Hello World”。但当我拿到爱普特APT32F110这块基于国产RISC-V内核的开发板时,我…...

APT32F110开发板串口printf重定向与动态文本显示实战

1. 项目概述:从“Hello World”到“花式表白”的嵌入式浪漫作为一名在嵌入式领域摸爬滚打了十多年的老工程师,我调试过的开发板、写过的“Hello World”程序,估计能绕办公室好几圈。大多数时候,我们的工作就是和数据手册、寄存器、…...

APT32F110 RTC模块深度测评:从硬件原理到低功耗应用实战

1. 项目概述与核心价值最近在捣鼓爱普特APT32F110这块开发板,发现它的RTC(实时时钟)功能挺有意思。对于很多嵌入式项目来说,比如智能家居的定时开关、数据采集设备的定时唤醒、或者简单的电子钟,一个靠谱的RTC模块是必…...

APT32F110 RTC实战:从配置校准到低功耗应用全解析

1. 项目概述与核心价值最近在捣鼓爱普特APT32F110这块开发板,发现它内置的RTC(实时时钟)模块挺有意思。对于很多嵌入式项目来说,时间戳记录、定时唤醒、低功耗运行这些功能都离不开一个靠谱的RTC。APT32F110作为一款主打高性价比和…...

英特尔N150处理器深度解析:从N100升级看嵌入式一体机效能进化

1. 从N100到N150:一次务实且精准的效能升级在嵌入式与一体机领域,选择一颗合适的处理器,往往意味着在性能、功耗、成本和扩展性之间找到那个微妙的平衡点。过去几年,英特尔的N100处理器凭借其出色的能效比,成为了众多办…...