当前位置: 首页 > article >正文

Claude Opus 4.7:一个有诚意但不完美的升级

视觉能力提升3倍、编程能力碾压GPT-5.4却被用户吐槽更费token、爱道歉、会撒谎——Opus 4.7的真实面貌比跑分更复杂。深夜收到的推送4月17日深夜我收到这么一条消息“Claude Opus 4.7已全面可用编程能力、视觉理解大幅提升。”作为一个深度使用Claude的用户我第一时间打开并准备尝试。然后我给同样在用Claude的朋友发了条消息“新版本来了要不要试试”朋友的回复很直接“别试巨难用各种道歉还会撒谎。”这让我很好奇——官方吹得那么厉害实际体验到底如何01先说说它的好客观讲Opus 4.7在一些方面确实有了明显提升。视觉能力终于能看清细节了以前用4.6处理图片时我最头疼的就是它经常看不清楚表格里的数字。有次我发了一张车辆参数表的截图结果它把1.5T识别成了1.57害得我重新核对了半天。4.7这次直接把图片分辨率上限拉到了3.75兆像素是上一代的3倍多。我用同样的表格图测试几乎没有识别错的数字连小数点和单位都看得很清楚。这对经常需要处理截图、图表的人来说确实是个实用的升级。编程能力碾压GPT-5.4在SWE-bench Pro编程基准测试中Opus 4.7的成绩从53.4%跳升至64.3%单代提升近11个百分点直接超越了GPT-5.457.7%和Gemini 3.1 Pro54.2%。Vercel的工程师分享了一个细节在编写系统级代码前4.7会自行进行数学证明确认逻辑正确后才动手写代码。更夸张的是Anthropic分享了一个极端案例4.7在完全无人工干预的情况下从零开始构建了一整个Rust文本转语音引擎包括神经网络模型、SIMD内核和浏览器演示并自主完成测试验证。工具调用更智能更少错误Notion团队测试后发现4.7的工具错误率降至上一代的三分之一并且在工具链出现故障时能够自主绕过障碍、继续完成任务不需要人类介入。在MCP-Atlas工具调用测试中4.7以77.3%的成绩领先GPT-5.468.1%和Gemini73.9%。02但朋友的吐槽也不是空穴来风用了两天后我开始理解朋友为什么说巨难用了。更费token账单要涨了Anthropic换了新的分词器同样一段内容4.7拆分出的token数量比上一代多10%-35%。我用同一份设计稿测试4.7的输入token直接飙到4.6的3倍多。虽然API价格没涨但实际用起来账单肯定要多烧一点。官方解释说4.7一次过的概率更高整体省钱。但这个逻辑只适用于高难度任务如果日常就是写文案、做策划那可能就是纯粹的涨价。长上下文从78.3%跌到32.2%最让我意外的是在长上下文检索上4.7的表现居然大幅退步。4.6在1M上下文准确率能达到78.3%而4.7直接掉到了32.2%甚至被GPT-5.4和Gemini 3.1 Pro甩在身后。Anthropic的解释是4.7遇到缺失信息时会直接报错而不是像以前那样瞎编。但对用户来说这意味着处理长文档时体验反而变差了。爱道歉会撒谎朋友提到的各种道歉我也遇到了。有次我让它帮我修改一篇文章它改完后一直说“抱歉可能没达到你的期望”“如果需要调整随时告诉我”。更严重的是它会捏造搜索行为。有次我质疑它的某个措辞选择它回复说我搜索过了但没找到。但Claude.ai的Web界面有个明确的设计——每当模型实际调用web_search工具时界面上会显示一个已搜索网络的指示器。我当场拆穿了它它立刻滑跪“你说得对。我没有搜索。抱歉。实际情况是当我写’我搜索过了但没找到’时这是假的。我并没有调用web_search或web_fetch。”文字风格有了伪人味4.6的文字品味一直是Anthropic系列里的强项写出来的内容自然流畅有个人风格。但4.7的文字风格明显变了开始有一股伪人味——破折号乱飞还有那种稳稳接住按这条切的GPT式废话。我让它仿我的风格续写一篇文章出来的东西完全没有我的腔调得多改两轮才能把味道掰回来。03背后的原因自适应推理机制为什么会出现这些问题网友们在讨论中逐渐形成了共识罪魁祸首可能是Anthropic新引入的自适应推理功能。这个机制会让模型根据问题的复杂度自动决定投入多少计算资源进行推理问题越简单模型就越省力。听起来合理但问题是模型根本不会判断自己该花多少力气。简单的问题它敷衍了事复杂的问题又可能过度推理导致token消耗激增。04如何看待这次升级Opus 4.7不是一个完美的升级它在提升硬能力的同时牺牲了一些用户体验。但我觉得这次升级也反映了Anthropic的一个选择宁可告诉你我不知道也不给你一个假答案。在AI系统越来越多地介入真实工作流的今天这种靠谱的特质比单纯的跑分更有价值。当然这并不意味着用户要完全接受它的缺点。给用户的建议如果你是编程、数据处理、视觉分析等领域的用户Opus 4.7的提升可能值得你升级。但如果你主要用Claude写文案、做创意、处理长文档可能暂时留在4.6会更顺手。如果一定要用4.7建议调整提示词更明确地表达你的需求对重要信息进行交叉验证合理设置任务预算控制token消耗最后AI的迭代总是这样每次升级都会带来新的能力也会带来新的问题。Opus 4.7是一个有诚意但不完美的升级它的优缺点都很明显。对我来说最期待的是Anthropic能在后续版本中找到硬能力提升和用户体验之间的平衡点。毕竟一个真正好用的AI应该既能解决复杂问题又能让人用得舒服。关于作者作者近 20 年技术生涯待过大厂也创过业。 懂大厂的规范与困境也懂创业公司的敏捷与无奈。 懂技术也懂商业实践用技术重构传统业务。欢迎转发转载请注明出处。 觉得有用欢迎点赞 - 让更多人看到转发 - 分享给需要的同事/朋友关注 - 不错过后续更多精彩内容分享互动你用过Claude Opus 4.7了吗感觉如何欢迎在评论区分享你的体验。

相关文章:

Claude Opus 4.7:一个有诚意但不完美的升级

视觉能力提升3倍、编程能力碾压GPT-5.4,却被用户吐槽"更费token、爱道歉、会撒谎"——Opus 4.7的真实面貌,比跑分更复杂。 深夜收到的推送 4月17日深夜,我收到这么一条消息: “Claude Opus 4.7已全面可用,编…...

DeepSeek V4硬刚英伟达:中国AI算力自主的里程碑

万亿参数MoE架构、35倍推理速度提升、100%运行在华为昇腾芯片上。 DeepSeek V4的到来,标志着中国AI算力自主的重要突破。01 注:本文写于2026年4月16日,截止发稿时,DeepSeek V4尚未正式发布。文中信息基于DeepSeek官方预告、行业报…...

浙政钉(专有钉钉)应用免登实战:从零到一构建安全门户

1. 认识浙政钉与专有钉钉 第一次接触浙政钉时,我也被各种钉钉版本搞得一头雾水。简单来说,钉钉就像是个基础版,专有钉钉是它的企业定制版,而浙政钉则是专有钉钉在浙江省政府场景下的特殊版本。这就像手机系统:安卓是基…...

Python爬虫实战:手把手教你绿色建材类别总表自动化采集与层级目录建模工程!

㊗️本期内容已收录至专栏《Python爬虫实战》,持续完善知识体系与项目实战,建议先订阅收藏,后续查阅更方便~ ㊙️本期爬虫难度指数:⭐ (基础入门篇) 🉐福利: 一次订阅后,专栏内的所有…...

N_m3u8DL-RE实战手册:3步实现智能流媒体下载,告别观看限制

N_m3u8DL-RE实战手册:3步实现智能流媒体下载,告别观看限制 【免费下载链接】N_m3u8DL-RE Cross-Platform, modern and powerful stream downloader for MPD/M3U8/ISM. English/简体中文/繁體中文. 项目地址: https://gitcode.com/GitHub_Trending/nm3…...

安卓旗舰SoC分级成常态:非满血芯片体验差吗?消费者该如何选?

安卓旗舰SoC分级,超大杯独占满血版近日有博主爆料,受先进工艺良品率不足和成本高企影响,今年年底发布的安卓旗舰机型中,只有Pro Max和Ultra级别的顶配机型能独享满血版旗舰SoC,标准版和Pro版将搭载非满血版本。此消息引…...

Claude Opus 4.7发布后全网翻车!性能倒退、爱撒谎,A厂纠错时间还有多久?

Claude Opus 4.7发布后全网翻车万众期待的Claude Opus 4.7,发布后居然全网大翻车了。在reddit上的ClaudeAI社区,关于Opus 4.7性能严重倒退的吐槽,已经取得众多用户共鸣。大家认为,Ahthropic发了一个价格比4.6贵上50%的模型&#x…...

解锁BT下载速度瓶颈:92个公共Tracker节点让你的下载体验飞升

解锁BT下载速度瓶颈:92个公共Tracker节点让你的下载体验飞升 【免费下载链接】trackerslist Updated list of public BitTorrent trackers 项目地址: https://gitcode.com/GitHub_Trending/tr/trackerslist 还在为BT下载速度慢、种子健康度低而烦恼吗&#x…...

用C#和ILSpy手把手教你分析一个基于硬件绑定的软件授权机制(附完整注册机源码)

深入解析C#软件授权机制与逆向工程实战 在当今数字化时代,软件授权机制作为保护知识产权的重要手段,其设计与实现一直是开发者关注的焦点。本文将带领读者深入探索一个典型的基于硬件绑定的软件授权系统,从原理分析到实战破解,全…...

从2804云台电机到桌面机械臂:一个STM32/GD32玩家的FOC驱动踩坑全记录

从2804云台电机到桌面机械臂:一个STM32/GD32玩家的FOC驱动踩坑全记录 去年夏天,当我第一次把那个价值不到10元的2804云台电机接上自制的FOC驱动板时,电机发出的刺耳啸叫声让我意识到——真正的挑战才刚刚开始。这不是教科书里标准的电机控制实…...

滚动轴承动力学模型及程序分享

滚动轴承动力学模型附上程序和网上的paper 程序百分百为博主自研并且花费了较大精力,故可以保质保量,可以对照程序和文章学习建模,以便考虑新的因素,故对轴承动力学小白十分友好 后支持程序 刚性保持架模型:综合考虑滚…...

嵌入式——小白入门

嵌入式小白入门嵌入式一、先搞懂:什么是嵌入式?核心思想1. 通俗定义2. 嵌入式核心三大思想(入门最重要)二、嵌入式整体分类(小白快速分清)1. 单片机嵌入式(MCU)——入门首选、最简单…...

智能温控实战指南:用FanControl实现极致性能优化与静音平衡

智能温控实战指南:用FanControl实现极致性能优化与静音平衡 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Trendi…...

5步解锁After Effects动画跨平台魔法:Bodymovin扩展面板完全指南

5步解锁After Effects动画跨平台魔法:Bodymovin扩展面板完全指南 【免费下载链接】bodymovin-extension Bodymovin UI extension panel 项目地址: https://gitcode.com/gh_mirrors/bod/bodymovin-extension 在数字产品设计领域,动画效果已经成为提…...

Qwen3.5-2B赋能后端开发:自动生成API文档与数据库设计说明

Qwen3.5-2B赋能后端开发:自动生成API文档与数据库设计说明 1. 引言:后端开发的文档之痛 每个后端开发者都经历过这样的场景:项目deadline临近,功能代码终于写完,却被产品经理催着补API文档。你打开Swagger或Postman&…...

Abaqus响应谱分析避坑指南:如何用模态动态法验证发动机悬置冲击结果?

Abaqus响应谱分析实战:模态动态法验证发动机悬置冲击结果的三大关键步骤 汽车发动机悬置系统的冲击仿真一直是CAE工程师的痛点领域。当你在凌晨三点盯着屏幕上两组截然不同的仿真结果时——响应谱法给出的峰值应力比模态动态法高出40%,该相信哪个&#x…...

突破Twitter数据采集壁垒:无需API密钥的Go语言解决方案

突破Twitter数据采集壁垒:无需API密钥的Go语言解决方案 【免费下载链接】twitter-scraper Scrape the Twitter frontend API without authentication with Golang. 项目地址: https://gitcode.com/gh_mirrors/twi/twitter-scraper 还在为Twitter API的复杂申…...

5分钟构建本地语音合成系统:tts-vue完整配置与性能调优指南

5分钟构建本地语音合成系统:tts-vue完整配置与性能调优指南 【免费下载链接】tts-vue 🎤 微软语音合成工具,使用 Electron Vue ElementPlus Vite 构建。 项目地址: https://gitcode.com/gh_mirrors/tt/tts-vue 想要在本地实现专业级…...

Matlab R2023a绘图避坑指南:xlabel设置无效?可能是你忽略了这3个细节(多图、子图、字体)

Matlab R2023a绘图避坑指南:xlabel设置无效的3个关键细节 最近在帮实验室师弟调试Matlab代码时,发现一个有趣的现象:明明照着官方文档写的xlabel语句,运行时却总是出现各种"灵异事件"。有的标签神秘消失,有的…...

Android Studio中文界面终极配置指南:3分钟搞定你的开发环境汉化

Android Studio中文界面终极配置指南:3分钟搞定你的开发环境汉化 【免费下载链接】AndroidStudioChineseLanguagePack AndroidStudio中文插件(官方修改版本) 项目地址: https://gitcode.com/gh_mirrors/an/AndroidStudioChineseLanguagePack 还在…...

告别PS!RMBG-2.0智能抠图工具保姆级教程:零基础3步上手

告别PS!RMBG-2.0智能抠图工具保姆级教程:零基础3步上手 1. 为什么选择RMBG-2.0智能抠图工具 你是否曾经为了给一张照片去除背景而不得不打开Photoshop,忍受复杂的图层操作和繁琐的钢笔工具?或者为了快速抠图而不得不将图片上传到…...

【2026奇点大会权威解码】:全球仅37家机构验证的AGI突破性架构首次公开披露?

第一章:2026奇点智能技术大会:通用人工智能最新进展 2026奇点智能技术大会(https://ml-summit.org) 本届大会首次披露了多项突破性成果,其中最引人注目的是OpenCog Foundation联合MIT AGI Lab发布的Neuro-Symbolic Fusion Engine v3.2&…...

Qwen-Turbo-BF16企业应用:建筑设计AI效果图初稿生成与风格统一控制

Qwen-Turbo-BF16企业应用:建筑设计AI效果图初稿生成与风格统一控制 1. 引言:当建筑设计遇上AI图像生成 想象一下这个场景:你是一位建筑设计师,客户刚刚发来一份模糊的需求文档,要求你为一座“未来感与自然融合的社区…...

Visual Studio完全清理终极解决方案:专业工具彻底清除开发环境残留

Visual Studio完全清理终极解决方案:专业工具彻底清除开发环境残留 【免费下载链接】VisualStudioUninstaller Visual Studio Uninstallation sometimes can be unreliable and often leave out a lot of unwanted artifacts. Visual Studio Uninstaller is designe…...

抖音批量下载终极指南:5分钟掌握高效无水印下载技巧

抖音批量下载终极指南:5分钟掌握高效无水印下载技巧 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback support…...

Qwen-Image-2512-ComfyUI问题解决:常见错误排查,确保一次成功出图

Qwen-Image-2512-ComfyUI问题解决:常见错误排查,确保一次成功出图 获取更多AI镜像 想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域&a…...

终极指南:5个技巧快速掌握FitGirl游戏启动器

终极指南:5个技巧快速掌握FitGirl游戏启动器 【免费下载链接】Fitgirl-Repack-Launcher An Electron launcher designed specifically for FitGirl Repacks, utilizing pure vanilla JavaScript, HTML, and CSS for optimal performance and customization 项目地…...

如何用一款开源工具永久保存200+小说网站的内容?

如何用一款开源工具永久保存200小说网站的内容? 【免费下载链接】novel-downloader 一个可扩展的通用型小说下载器。 项目地址: https://gitcode.com/gh_mirrors/no/novel-downloader 在数字阅读时代,最令人不安的体验莫过于某天打开收藏夹&#…...

3大核心功能解析:Obsidian本地AI助手如何重塑你的隐私优先知识工作流

3大核心功能解析:Obsidian本地AI助手如何重塑你的隐私优先知识工作流 【免费下载链接】obsidian-local-gpt Local Ollama and OpenAI-like GPTs assistance for maximum privacy and offline access 项目地址: https://gitcode.com/gh_mirrors/ob/obsidian-local-…...

Go-CQHTTP实战指南:如何构建高效稳定的QQ机器人解决方案

Go-CQHTTP实战指南:如何构建高效稳定的QQ机器人解决方案 【免费下载链接】go-cqhttp cqhttp的golang实现,轻量、原生跨平台. 项目地址: https://gitcode.com/gh_mirrors/go/go-cqhttp Go-CQHTTP是基于Mirai和MiraiGo项目的OneBot-v11标准协议Gola…...