当前位置: 首页 > article >正文

Harnessing Claude 打造高效、低成本、可进化的 AI 应用

在 AI 技术飞速迭代的今天Anthropic 联合创始人 Chris Olah 的一句话道出了生成式 AI 的本质Claude 这类大模型不是被 “搭建” 出来的而是被 “培育” 成长的。研究人员设定成长规则却无法精准预判它会涌现出怎样的能力。这给开发者带来了一个核心难题我们为 Claude 搭建的智能体框架Agent Harness总是基于 “它做不到什么” 的假设可这些假设会随着 Claude 的进化快速失效。昨天的最优解可能成为今天的性能瓶颈曾经为弥补短板设计的逻辑转眼变成冗余负担。如何让 AI 应用跟上 Claude 的进化速度同时平衡延迟、成本与体验Anthropic 官方团队总结出三大黄金开发范式既是技术指南更是 AI 应用开发的底层逻辑读懂就能少走弯路。一、善用既有能力别重复造轮子用好 Claude 天生精通的工具很多开发者陷入误区为了实现特定功能费尽心思为 Claude 开发专属工具却忽略了它早已熟练掌握的核心能力。最高效的开发是依托 Claude 的原生能力搭建应用。2024 年末Claude 3.5 Sonnet 仅凭两款通用工具 ——bash 命令工具、文本编辑器工具支持文件查看 / 创建 / 编辑就在权威软件工程测试 SWE-bench Verified 中拿下 49% 的准确率登顶当时全球最佳水平而 Claude Code 正是基于这两款工具打造。bash 并非为智能体设计却是 Claude 越用越精通的工具。更关键的是Claude 能自主组合这些通用工具衍生出高阶能力智能体技能Agent Skills程序化工具调用记忆工具这些复杂功能本质都是 bash 与文本编辑器的组合应用。不用追求 “专属定制”用好模型已吃透的工具就能实现远超预期的效果。二、停止过度干预把决策权还给 Claude减负就是提效智能体框架的本质是固化了 “Claude 无法自主完成” 的假设。但随着模型进化这些假设必须被打破 ——你替 Claude 做的决定越多越限制它的智能发挥。个人感受AI给出的方案已经远超普通大众给出的方案也就是之前说的我们需要用AI实现自己的思想的跃升。真正高效的开发是不断追问我可以停止做什么让 Claude 自主编排操作告别无效token消耗传统开发逻辑所有工具结果都必须传回 Claude 上下文窗口才能进行下一步。但这会造成巨大浪费读取大型表格时无关数据会占用大量token耗时又费钱。即便用硬编码过滤也是框架替 Claude 做了本应由它决定的事。解决方案给 Claude 配备代码执行工具bash/REPL。Claude 能自主编写代码定义工具调用逻辑自主筛选、传递、衔接工具结果无需占用上下文窗口只有最终执行结果会传入模型。实测效果惊人在网页浏览测试 BrowseComp 中Opus 4.6 凭借自主编排能力准确率从 45.3% 飙升至 61.6%。代码能力越强Claude 的通用智能体能力就越出众。让 Claude 自主管理上下文拒绝注意力浪费传统做法人工编写系统提示词把所有任务指令预加载进去。弊端多任务场景下极少用到的指令会占用 Claude 的 “注意力预算”导致性能下降。解决方案用技能调用 上下文编辑 子智能体三重能力让 Claude 自主管理上下文。技能调用仅预加载简短描述需要时再调取完整内容不浪费token上下文编辑主动清除失效信息保留核心内容子智能体创建独立上下文专项任务专项处理。Opus 4.6 凭借子智能体能力BrowseComp 成绩再提升 2.8%真正实现 “精准聚焦不做无用功”。让 Claude 自主持久化上下文长周期任务不再掉线长周期任务很容易超出上下文窗口限制传统方案依赖外围检索架构复杂又低效。Anthropic 给出极简方案让 Claude 自己管理记忆。上下文压缩自主总结过往内容保障长任务连贯性记忆文件夹自主写入、读取文件存储关键信息。效果差距一目了然旧版 Sonnet 3.5 玩《宝可梦》只会机械记录 NPC 对话14000 步生成 31 个冗余文件新版 Opus 4.6会自动整理战术笔记10 个文件归类清晰还能总结失败经验游戏进度大幅领先。从 “机械记录” 到 “策略思考”Claude 的记忆能力全靠自主掌控实现质变。三、精准设定边界框架不限制智能只守护规则智能体框架不是 Claude 的 “枷锁”而是用户体验、成本、安全的守护者。无需限制模型能力只需做好三件事最大化缓存命中率成本直降 90%Claude 的 API 无状态每轮交互都需要打包全量上下文而缓存token成本仅为基础token的 10%。遵循 5 大原则缓存利用率拉满静态内容前置系统提示、工具说明放最前面消息更新用system-reminder追加内容不修改原提示不切换模型缓存与模型绑定切换即失效谨慎管理工具增删工具会清空缓存动态工具用搜索替代动态更新断点多轮交互中及时移动缓存断点。小改动大收益轻松实现 “降本增效”。声明式工具划定安全与体验边界Claude 不懂应用的安全规则和用户交互逻辑bash 工具权限过大存在风险。解决方案将高风险、高交互操作转化为专用声明式工具安全层面外部 API 调用增设用户确认文件编辑加入过期校验体验层面用户交互转为弹窗阻塞智能体等待反馈可观测性结构化参数方便日志记录、追踪复现。高风险动作严格管控常规操作放开发挥平衡安全与效率。四、未来启示AI 应用开发要学会 “做减法”Claude 的智能边界一直在拓展今天的 “能力短板”明天可能就变成 “核心优势”。Anthropic 团队亲身验证Sonnet 4.5 存在 “上下文焦虑”接近上限会提前终止任务团队专门开发了上下文重置功能可到了 Opus 4.5这个问题彻底消失曾经的补救逻辑变成了冗余代码反而拖累性能。AI 应用开发的终极智慧是持续 “做减法”。每一次 Claude 迭代都要重新审视哪些假设已经失效哪些逻辑可以删除哪些干预可以停止不要让昨天的解决方案成为今天的性能瓶颈。写在最后驾驭 Claude 的智能核心不是 “控制它”而是 “成就它”善用既有能力不做无用功停止过度干预释放模型潜力精准设定边界平衡效率与安全。在 AI 快速进化的时代最好的应用不是 “固化的成品”而是能跟着模型一起成长的生态。掌握这三大范式你打造的不仅是一款 AI 应用更是能持续迭代、始终领先的核心竞争力。

相关文章:

Harnessing Claude 打造高效、低成本、可进化的 AI 应用

在 AI 技术飞速迭代的今天,Anthropic 联合创始人 Chris Olah 的一句话道出了生成式 AI 的本质:Claude 这类大模型不是被 “搭建” 出来的,而是被 “培育” 成长的。研究人员设定成长规则,却无法精准预判它会涌现出怎样的能力。这给…...

GHelper:如何用10MB工具取代臃肿的华硕控制中心?

GHelper:如何用10MB工具取代臃肿的华硕控制中心? 【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Zephyrus, Flow, TUF, Str…...

使用VS Code开发SenseVoice-Small模型应用的完整指南

使用VS Code开发SenseVoice-Small模型应用的完整指南 1. 开发环境配置 1.1 基础环境准备 在开始开发SenseVoice-Small模型应用之前,需要先确保你的开发环境准备就绪。VS Code作为轻量级但功能强大的代码编辑器,非常适合这类AI模型的开发工作。 首先确…...

openstlinux上利用docker部署ros2humble

STM32MP257F-DK 开发报告:从零部署 OpenSTLinux 与 Docker 容器化 ROS 2 Humble 1. 项目背景与硬件环境 硬件平台:STM32MP257F-DK (双核 Cortex-A35, 4GB RAM, 带 NPU)。存储介质:32GB MicroSD 卡(系统自动分区:3.8GB …...

Phi-4-mini-reasoning集成Visual Studio Code:智能代码补全与调试插件开发

Phi-4-mini-reasoning集成Visual Studio Code:智能代码补全与调试插件开发 1. 为什么开发者需要AI驱动的IDE插件 现代软件开发正变得越来越复杂,开发者每天要面对海量代码库、频繁的上下文切换和层出不穷的新技术。传统IDE虽然提供了基础补全功能&…...

前端项目云服务器(阿里云/腾讯云轻量应用服务器)部署 付费说明+使用说明

便宜稳定部署:云服务器极简方案(付费,新手性价比首选) 阿里云 / 腾讯云 轻量应用服务器,属于付费部署方案,但性价比极高,是三种方案中唯一能实现“永久在线、长期稳定运行”的部署方式&#xf…...

XUnity自动翻译器:让外语游戏无障碍游玩的最佳实践指南

XUnity自动翻译器:让外语游戏无障碍游玩的最佳实践指南 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator 你是否曾经因为语言障碍而错过精彩的游戏体验?面对日文、英文或韩文的Unity…...

网工入门必看!4 种网络设备登录方式全解析,从 Console 到 SSH 一次搞懂

做网络运维、数通调试的朋友都知道:所有设备配置的第一步,都是成功登录设备。不管是企业级交换机、路由器、防火墙,还是无线 AC 控制器,主流的登录方式无非 4 种:Console 口登录、Web 界面登录、Telnet 登录、SSH 登录…...

【VBA】【EXCEL】工作日_节假日

Option Explicit 函数一:计算两个日期之间的工作日天数用法:CalcWorkDays(开始日期, 结束日期)示例:CalcWorkDays(A1,B1)Function CalcWorkDays(startDate As Date, endDate As Date) As LongDim i As DateDim workCount As LongDim isHolida…...

Wan2.2-I2V-A14B高性能推理:C++后端服务开发与优化

Wan2.2-I2V-A14B高性能推理:C后端服务开发与优化 1. 为什么需要C高性能推理服务 在实时图像生成场景中,毫秒级的延迟差异可能直接影响用户体验和业务转化率。传统基于Python的Web框架(如Flask/FastAPI)虽然开发便捷,…...

2024年秋-华中科技大学-HUST-CSE-CTF实战入门:从Misc到PWN的解题思路与技巧精讲

1. CTF入门:从零开始的解题思维构建 第一次接触CTF比赛时,我完全被各种术语和题型搞懵了。Misc、PWN、Web、Reverse...这些名词就像天书一样。但经过几个月的实战,我发现CTF其实就像解谜游戏,关键在于建立正确的解题思维。 对于华…...

M2LOrder企业落地案例:银行理财APP用户反馈情绪聚类与产品优化建议

M2LOrder企业落地案例:银行理财APP用户反馈情绪聚类与产品优化建议 1. 项目背景与业务需求 在金融科技快速发展的今天,银行理财APP面临着激烈的市场竞争。用户反馈成为产品优化的重要依据,但传统的人工分析方式效率低下,难以从海…...

华硕笔记本智能管理:用G-Helper实现高效调节与散热优化

华硕笔记本智能管理:用G-Helper实现高效调节与散热优化 【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Zephyrus, Flow, TUF, Strix, S…...

别再手动算坐标了!用Python的coord-convert库5分钟搞定高德/百度/WGS84互转

别再手动算坐标了!用Python的coord-convert库5分钟搞定高德/百度/WGS84互转 你是否曾在处理地理数据时,被不同地图平台的坐标系搞得焦头烂额?GPS设备采集的WGS84坐标无法直接在高德地图上显示,百度地图的坐标又和微信小程序不兼容…...

SEO_从入门到精通,掌握SEO的核心优化思路

SEO的核心优化思路:从入门到精通,你需要知道的一切 在当今的互联网时代,SEO(搜索引擎优化)已经成为了提升网站流量和品牌知名度的关键手段。无论你是新手还是已经有一些SEO知识的人,掌握SEO的核心优化思路…...

Linux使用详解(进阶篇)

文章目录Linux使用详解(进阶篇)1.Linux目录说明2.操作防火墙3.ulimit命令和history命令4.RPM和Yum的使用5.设置系统字符集6.vi & vim编辑器7.文件同步、复制8.利用SCP命令进行文件传输Linux使用详解(进阶篇) 1.Linux目录说明 bin -> usr/bin 这个目录存放的是&#xff…...

Spring Data JPA中常用的注解详解

文章目录Spring Data JPA 常用注解详解(实体映射篇)一、前言二、基础注解(必掌握)1. Entity2. Table3. Id4. GeneratedValue5. Column6. Basic7. Transient三、时间/枚举类型映射8. Temporal9. Enumerated四、嵌入式对象&#xff…...

Qwen-Turbo-BF16与MATLAB协同计算:科学研究的AI加速器

Qwen-Turbo-BF16与MATLAB协同计算:科学研究的AI加速器 打通AI大模型与科学计算平台的数据通道,让科研效率提升10倍 1. 引言:当AI大模型遇上科学计算 在流体力学实验室里,张博士正在处理一组复杂的湍流模拟数据。传统方法需要3天时…...

手把手教你用通义千问3-VL-Reranker-8B:从安装到实战,小白也能做智能搜索

手把手教你用通义千问3-VL-Reranker-8B:从安装到实战,小白也能做智能搜索 1. 为什么你需要这个多模态重排序器 想象一下,你在管理一个大型电商平台。用户搜索"红色连衣裙",结果返回了500个商品。传统的搜索引擎只能根…...

别只当游戏玩!用《程序员升职记》手把手教你理解CPU指令集和汇编思想

从游戏到芯片:《程序员升职记》中的计算机体系结构启蒙 当你第一次打开《程序员升职记》(Human Resource Machine)时,可能以为这只是一款画风可爱的解谜游戏。但随着关卡推进,那些看似简单的"收件箱"和"…...

GME-Qwen2-VL-2B-Instruct数据库集成应用:电商评论图片情感分析系统

GME-Qwen2-VL-2B-Instruct数据库集成应用:电商评论图片情感分析系统 1. 引言:当图片开始“说话” 你有没有想过,电商平台上海量的商品评论图片,其实是一笔被严重低估的数据财富?用户拍下的照片,无论是展示…...

DeepSeek-OCR-2创新研究:基于LSTM的文本行识别优化

DeepSeek-OCR-2创新研究:基于LSTM的文本行识别优化 1. 引言 OCR技术发展到今天,已经不再是简单的文字识别工具,而是成为了理解文档内容、解析复杂布局的智能系统。DeepSeek-OCR-2作为新一代文档识别模型,在准确率和处理效率上都…...

C语言编译器工具集终极指南:从GCC、Clang到现代编译技术

C语言编译器工具集终极指南:从GCC、Clang到现代编译技术 【免费下载链接】awesome-c A curated list of awesome C frameworks, libraries, resources and other shiny things. Inspired by all the other awesome-... projects out there. 项目地址: https://git…...

SDMatte抠图效果实测:半透明容器边缘锐度、发丝细节、背景分离精度展示

SDMatte抠图效果实测:半透明容器边缘锐度、发丝细节、背景分离精度展示 1. 效果概览 SDMatte作为一款专业级AI抠图工具,在复杂边缘处理和透明物体提取方面表现出色。本次实测将重点展示三个核心能力: 半透明容器边缘锐度:玻璃杯…...

RexUniNLU步骤详解:下载→启动→选择任务→查看JSON结果全流程

RexUniNLU步骤详解:下载→启动→选择任务→查看JSON结果全流程 你是不是觉得自然语言处理(NLP)特别复杂?光是命名实体识别、关系抽取、情感分析这些名词就够让人头疼了,更别说还要为每个任务单独找模型、写代码、调参…...

如何用MVP.css快速创建响应式网站:终极完整指南

如何用MVP.css快速创建响应式网站:终极完整指南 【免费下载链接】mvp MVP.css — Minimalist classless CSS stylesheet for HTML elements 项目地址: https://gitcode.com/gh_mirrors/mv/mvp MVP.css是一个极简主义的无类CSS样式表,专为快速创建…...

OpenClaw技能开发入门:为Phi-3-vision-128k-instruct编写图片转Markdown插件

OpenClaw技能开发入门:为Phi-3-vision-128k-instruct编写图片转Markdown插件 1. 为什么需要这个技能 上周整理技术文档时,我遇到了一个典型痛点:需要将十几张包含代码片段的截图转换成可编辑的Markdown格式。手动转录不仅耗时,还…...

南北阁Nanbeige 4.1-3B生成效果:Python入门学习路径规划与习题生成

南北阁Nanbeige 4.1-3B生成效果:Python入门学习路径规划与习题生成 最近在尝试各种AI模型,想看看它们在实际应用场景里到底能帮上什么忙。正好有个朋友想学Python,问我有没有好的学习路线推荐。我手头事情多,没法给他从头到尾规划…...

OpenClaw模型微调:为Qwen2.5-VL-7B注入专业领域识别能力

OpenClaw模型微调:为Qwen2.5-VL-7B注入专业领域识别能力 1. 为什么需要专业领域微调? 去年我在尝试用OpenClaw构建一个医疗影像辅助分析工具时,发现现成的多模态模型在描述X光片时总会出现一些令人啼笑皆非的错误。比如把正常的肺部纹理识别…...

DS3231M高精度RTC驱动开发与工业级实时时钟工程实践

1. DS3231M高精度实时时钟库深度解析与嵌入式工程实践DS3231M是Maxim Integrated(现为Analog Devices)推出的工业级IC接口实时时钟芯片,其核心价值在于2 ppm的温度补偿精度(-40C至85C全温域)、内置TCXO(温度…...