当前位置: 首页 > article >正文

2026 年我作为资深工程师如何使用 LLM Agent:从副驾到主驾的真实工作流转变

从副驾到主驾2026 年资深工程师的 LLM Agent 实战工作流哪些交给 Agent哪些必须自己做。原文链接AI 小老六一年之差Agent 从「勉强能用」变成了「几乎离不开」2025 年初行业里最强的推理模型还是 OpenAI o1​Agent 大多数时候只能跑两步就被上下文压垮​。一年多过去我使用 LLM 的方式已经发生了根本性的变化。去年我还主要用 LLM 做「智能补全」、「一次性研究脚本」、「陌生领域的小修小补」今年我几乎每一次代码改动都会先从 Agent 起手​PR 也经常由 Agent 起草、人工把关一遍后再提交​。这个转变不是「工具更顺手了」那么简单它意味着工程师的工作位置被推向了上游 —— 从写代码的人变成了判断、调度与验收 Agent 的人。下面这张表是我对自己使用边界变化的整理它比任何宏大叙事都更能说明 2026 年 ​Agent 的实际渗透程度​工作类型2025 年的做法2026 年的做法熟悉领域的完整 PR不交给 LLM自己写全部由 Agent 起草编辑一遍后提交跨仓库改动多个 VSCode 窗口手动协调Copilot CLI / Copilot App 同时跑多个 Agent 会话Bug 排查偶尔丢给 LLM 试一试每个 Bug 都先开 Agent 会话约 80% 能直接定位大型代码库的研究自己读代码、问同事Agent 跨仓库检索错了也容易看出来测试 / 本地环境配置让 LLM 写 curl 脚本自己跑直接交给 Agent 跑看日志PR 描述 / ADR / Slack自己写仍然自己写极琐碎 PR 除外博客文章自己写LLM 校对自己写LLM 校对UI 测试自己测仍然自己测Agent 对视觉细节不敏感图从副驾到主驾 —— 写代码这件事不再是工程师亲自完成而是由我来判断、调度和验收 AgentAgent 真正变好的几个信号这种「变好」具体体现在三件事上​失败后能自我恢复​早期 Agent 一旦走偏就需要人工随时干预、暂停、重新引导现在的 Agent 推进速度过快其实很难、也没必要逐步盯着因为它大多数时候能自己把方向修正回来。​跨仓库视野带来的诊断能力​当 Agent 能同时看到多个仓库时它在排查 Bug 上的「信息半径」远远超过人类点开 IDE 一个窗口能覆盖的范围。​试错成本变得很低​我经常会让 Agent 跑 56 次全部拒绝再让它重来平均每次只需要 30 秒判断「这是不是我要的方向」。这种「高频拒绝 偶尔接受」的工作模式是 2025 年完全不可能的。但我也不会把 Agent 抬上神坛。最近我遇到一个棘手 Bug前后跑了十几次 Agent 会话才最终定位。期间真正起作用的不只是 Agent 本身还有我不断补充上下文和收窄搜索空间的过程从日志、Slack 中收集额外上下文再喂给 Agent在脑子里建立自己的故障模型自己搭一个独立的复现环境看到 Agent 的猜测不对明确告诉它「你的假设不成立因为 X」或者直接终止、带着新提示重启。最终虽然是 Agent 找出了 Bug但这次「破案」我仍然会算作自己的工作成果 —— 因为正是我把搜索空间收窄到了 Agent 能够解决的范围。这也是我现在越来越确定的一点​人类的专业判断依然是 Agent 调试体系里的真正稀缺资源​。图30 秒拒绝 持续收窄搜索空间是工程师在 Agent 时代真正稀缺的能力一个清晰的「交还是不交」分配原则我现在会用一个简单的决策流程来判断一项工作该不该交给 Agent图Agent 工作分配决策流程 —— 哪些工作可以放心交给 Agent哪些必须自己来这套流程背后的真正信号是​工程师对外的「署名性产物」必须自己写​。亲手写 PR 描述是在向 Reviewer 传递一个信号「我已经认真审过这次改动你不是第一个看 diff 的人。」把测试和琐事尽量塞给 Agent另一个很重要的变化是​测试代码现在是廉价的​。只要能避免 flaky我都会顺手让 Agent 把测试补上单测可以让 Agent 先写我做的是「挑明显错误」的快速复审集成测试也可以主动让 Agent 加跑通一次手动验证curl / 接口调用可以直接交给 Agent自己看日志即可。类似地本地环境出问题 —— 比如 nvm 切不过去 Node 版本 —— 我也不会再第一时间去 Google而是直接打开命令行 Agent让它自己运行命令排查、修好。这件事的本质是​Agent 已经替代了「在终端里查文档 试错」这一类高频低价值劳动​。图把跑测试、查日志、捣鼓本地环境这类高频低价值劳动尽量交给 Agent真正的新核心技能找到「不过度也不欠用」的那个平衡如果要用一句话概括当下最重要的 ​AI 使用能力​我会这样说把尽可能多的工作转交给 Agent但不要走过头。我观察到很多团队成员其实处于两种失衡状态之一​欠使用​不让 Agent 调 Bug、不让它跑测试、连最琐碎的脚手架任务也要自己写​过度使用​把对外沟通、需要细致评审的大改动也整段交给 Agent事实上把判断责任也外包了。这两种失衡都在浪费 Agent 时代真正的杠杆。今天的工程师价值正在从「我能不能写出来」转向「我知不知道哪些工作必须自己做、哪些可以稳妥地交出去」。换句话说​Agent 让「会判断」比「会写代码」更值钱​。给国内工程师的几点直接借鉴把这套经验落到日常研发场景里至少有几条是可以马上试的​每个 Bug 都先开一次 Agent 会话​哪怕只是为了快速排除最常见的 80% 问题也比直接埋头读栈要划算得多。​跨仓库探索优先用 Agent​让它在多个仓库里「读一遍」再告诉你某个调用链是怎么打通的比自己点开五六个 IDE 窗口高效太多。​测试覆盖率不再是奢侈品​既然 Agent 写测试几乎零成本那「要不要补这条测试」的犹豫就没必要再有。​PR 描述、设计文档、群里的关键沟通仍然要自己写​这是你在团队里建立信任和判断力的方式不要把这部分外包。​训练自己「30 秒拒绝」的肌肉​看 Agent 输出第一眼就要判断方向对不对错了立刻拒掉重来不要被它的流畅度带着走。Agent 已经从一个值得「试一试」的玩具变成了每天要打开几十次的主战工具。但工具越强越要警惕一件事 —— ​真正稀缺的不是会用 Agent 的人而是能在 Agent 面前保持判断力的人​。

相关文章:

2026 年我作为资深工程师如何使用 LLM Agent:从副驾到主驾的真实工作流转变

从副驾到主驾,2026 年资深工程师的 LLM Agent 实战工作流:哪些交给 Agent,哪些必须自己做。 原文链接:AI 小老六 一年之差:Agent 从「勉强能用」变成了「几乎离不开」 2025 年初,行业里最强的推理模型还是…...

UniApp跨端开发实战:一套代码给TabBar同时穿上iOS和Material Design的“毛玻璃”外衣

UniApp跨端毛玻璃TabBar实战:融合iOS与Material Design的设计语言 在移动应用开发中,底部导航栏(TabBar)作为核心交互组件,其设计直接影响用户体验。随着iOS毛玻璃(Blur Effect)和Android Mater…...

Agent Runtime 九个关键设计:状态外化、上下文压缩与多智能体协同

把 Agent 从能跑到可靠,关键不在模型神准,而在状态、上下文和协作工程。 原文链接:AI 小老六 聊 Agent 时,很多讨论容易落到模型能力上:模型会不会推理,代码写得准不准,能不能理解复杂需求。这些…...

计算机视觉:YOLOv12安装环境

YOLOv12安装环境 一、工具软件准备 1、yolov12 1)下载yolov12主体部分 推荐官方地址:https://github.com/sunsmarterjie/yolov12 2)下载训练模型 地址: https://github.com/sunsmarterjie/yolov12 3)安装命令和p…...

AMD Ryzen嵌入式COM Express模块:工业边缘计算的高性能解决方案

1. 项目概述:当工业计算遇上“锐龙”芯在工业自动化、边缘计算和高端嵌入式领域,COM Express(Computer-On-Module Express)模块一直是构建紧凑、高性能、高可靠性系统的基石。它就像一台浓缩的、标准化的“电脑主板核心”&#xf…...

前端工程化实战:代码规范、兼容性、调试与项目整合

前言学完 HTML 和 CSS 的核心知识后,如何写出规范、可维护、兼容性好的代码,并高效地调试和构建项目,是很多初学者的薄弱环节。本篇整合 代码书写规范、浏览器兼容性处理、Chrome DevTools 调试技巧、项目目录结构 以及 前端学习路径 等实用技…...

LabVIEW字符串处理保姆级教程:从长度计算到日期格式化,13个实例带你玩转

LabVIEW字符串处理实战指南:从基础操作到高级应用 在工业自动化、测试测量和仪器控制领域,LabVIEW作为图形化编程的标杆工具,其字符串处理能力直接影响着数据解析、通信协议实现等核心功能。本文将通过13个典型场景,系统讲解如何高…...

VisualCppRedist AIO:一站式解决Windows C++运行库依赖问题

VisualCppRedist AIO:一站式解决Windows C运行库依赖问题 【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist Visual C运行库是Windows系统中许多应用程序…...

告别Resources和AssetBundle!用Unity Addressable重构你的资源管理(附迁移实战)

Unity Addressable系统深度重构:从传统资源管理到现代化架构的平滑迁移 在Unity项目开发中,资源管理一直是困扰开发者的核心难题之一。随着项目规模扩大,传统的Resources加载和AssetBundle管理方案逐渐暴露出性能瓶颈、热更新困难、依赖管理复…...

一键永久保存:B站缓存视频转换终极方案,让珍贵内容不再消失

一键永久保存:B站缓存视频转换终极方案,让珍贵内容不再消失 【免费下载链接】m4s-converter 一个跨平台小工具,将bilibili缓存的m4s格式音视频文件合并成mp4 项目地址: https://gitcode.com/gh_mirrors/m4/m4s-converter 你是否曾有过…...

新手也能看懂的CTF靶场通关笔记:从.htaccess上传到SUID提权,手把手复现BUUCTF Week5

新手也能看懂的CTF靶场通关笔记:从.htaccess上传到SUID提权,手把手复现BUUCTF Week5 第一次接触CTF比赛时,看到那些复杂的漏洞利用链总有种"看天书"的感觉。直到自己动手在虚拟机里复现了整个攻击流程,才真正理解每个技…...

WebSocket 库存实时监控实战(Java 服务端 + 前端)

目录 一、技术选型 二、搭建 Spring Boot 服务端 1. 创建项目 & 引入依赖 2. WebSocket 配置类 3. 库存实体类(库存 预警规则) 4. WebSocket 服务端核心代码 5. 提供接口:手动修改库存并推送 6. 启动类 三、前端页面&#xff0…...

别再问客服了!手把手教你用VNC在AutoDL GPU服务器上跑起你的第一个GUI程序

云端GPU服务器VNC实战:从零部署GUI开发环境全指南 租用云GPU服务器进行深度学习训练已成为算法工程师的常态,但当代码涉及图形界面时,许多开发者会在cv2.imshow()或PyQt窗口弹出的环节卡壳。本文将基于AutoDL平台,详解如何通过Tur…...

C++学习笔记17:析构函数

目录 一、什么是析构函数? 二、析构函数写法 三、析构函数的特点 四、析构函数什么时候调用? 五、析构函数不是销毁对象本身 六、为什么需要析构函数? 七、用析构函数释放动态内存 八、析构函数的调用顺序 九、析构函数和构造函数的…...

不止于解题:聊聊猪圈密码、圣堂武士密码和标准银河字母背后的历史与趣闻

不止于解题:猪圈密码、圣堂武士密码与标准银河字母的文化考古 当你在CTF竞赛中第一次遇到那些神秘的几何符号时,是否曾好奇过这些图形背后的故事?从共济会的秘密集会到《我的世界》游戏中的彩蛋,图形密码早已超越了单纯的加密工具…...

RimWorld模组管理终极指南:3步掌握RimSort智能排序,告别游戏崩溃烦恼

RimWorld模组管理终极指南:3步掌握RimSort智能排序,告别游戏崩溃烦恼 【免费下载链接】RimSort RimSort is an open source mod manager for the video game RimWorld. There is support for Linux, Mac, and Windows, built from the ground up to be a…...

AI Agent到底是什么

AI Agent 到底是什么?看完我悟了 今天看了几个产品,跟 AI 聊了聊,突然对 AI Agent 有了个很朴素的理解。AI Agent 不神秘 很多人觉得 AI Agent 是什么高深的东西,只有大厂才能搞。 但我现在的理解就一句话:❝ 「AI Age…...

告别手动填表!用Python脚本5分钟搞定DSSAT模型批量模拟(附源码)

Python自动化DSSAT模型:从Excel到批量模拟的高效科研实践 在农业科研和气候情景分析中,DSSAT模型作为全球主流的作物生长模拟工具,其价值早已被广泛认可。但真正使用过它的研究者都深有体会:当面对数十种管理方案、上百个气象场景…...

集成测试实战

软件测试理论:https://blog.csdn.net/2402_88266590/article/details/160966638?spm1011.2415.3001.5331 单元测试实战:https://blog.csdn.net/2402_88266590/article/details/161017518?spm1001.2014.3001.5502 下面就开始进入集成测试的学习吧&…...

从“让大模型回答问题“到智能决策:LangGraph 构建 AI Agent 的核心奥秘

本文深入解析了 AI Agent 的核心价值在于判断与决策,而非简单回答问题。LangGraph 作为图式工作流框架,通过 State(共享状态)、Node(处理节点)、Router(决策分支)的设计,…...

Android Studio中文界面汉化教程:3步实现母语开发环境

Android Studio中文界面汉化教程:3步实现母语开发环境 【免费下载链接】AndroidStudioChineseLanguagePack AndroidStudio中文插件(官方修改版本) 项目地址: https://gitcode.com/gh_mirrors/an/AndroidStudioChineseLanguagePack 还在为Android …...

在Hermes Agent中自定义Provider接入Taotoken服务

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 在Hermes Agent中自定义Provider接入Taotoken服务 对于使用Hermes Agent进行AI应用开发的团队而言,能够灵活接入不同的…...

工业控制新方案:电容HMI与字符LCD组合应用实战

1. 项目概述:当经典LCD遇上电容触控,工业控制的新解法最近在做一个产线设备升级的项目,客户对操作界面的要求突然拔高了不少:既要能看清复杂的工艺参数,又要求操作像手机一样流畅,还得扛得住车间里的油污、…...

Flowframes:AI视频插帧工具让你的视频流畅度翻倍

Flowframes:AI视频插帧工具让你的视频流畅度翻倍 【免费下载链接】flowframes Flowframes Windows GUI for video interpolation using DAIN (NCNN) or RIFE (CUDA/NCNN) 项目地址: https://gitcode.com/gh_mirrors/fl/flowframes 你是否曾因视频卡顿而烦恼&…...

基于ARM核心板的T-BOX系统设计:从硬件选型到软件实现

1. 项目概述与核心价值最近几年,车联网的概念已经从实验室和展会,实实在在地走进了我们的日常生活。作为一名在嵌入式领域摸爬滚打了十几年的工程师,我亲眼见证了从简单的GPS定位模块,到如今功能高度集成的车载T-BOX(T…...

2026 论文双检突围:9 款查重降重降 AIGC 工具硬核横评,Paperxie 领跑全场景通关

paperxie-免费查重复率aigc检测/开题报告/毕业论文/智能排版/文献综述/AI PPThttps://www.paperxie.cn/weight?type1https://www.paperxie.cn/weight?type1 毕业季论文查重飘红、AIGC 率爆表,已成为无数本科生与研究生的 “双重噩梦”。2026 年知网、维普全面升级…...

手把手教你搞定Windows下的NAMD和VMD安装(附最新版下载与注册避坑指南)

Windows平台NAMD与VMD安装全攻略:从零开始玩转分子动力学模拟 当第一次接触分子动力学模拟时,软件安装往往是新手面临的第一个挑战。NAMD和VMD作为该领域最常用的工具组合,它们的安装过程看似简单,实则暗藏诸多细节。本文将带你从…...

怎么将5v电升到12v?

开关电源BOOST升压原理首先,12v降到5v,我们可以通过串联一个电阻或者电感,利用串联分压定理,就能实现。那如何把5v升到12v呢?交流电我们可以通过变压器实现。那直流电呢?(开关电源BOOST升压原理…...

从查重到降 AIGC,2026 年 9 款论文工具横评:Paperxie 领衔,谁才是本科生的 “熬夜救星”?

paperxie-免费查重复率aigc检测/开题报告/毕业论文/智能排版/文献综述/AI PPThttps://www.paperxie.cn/weight?type1https://www.paperxie.cn/weight?type1 每到毕业季,论文查重飘红、AIGC 检测亮红灯,几乎是所有本科生的共同噩梦。从初稿到定稿&#…...

从老式万用表到精密测量:双积分ADC如何用‘慢’换来‘准’?选型避坑指南

从老式万用表到精密测量:双积分ADC如何用‘慢’换来‘准’?选型避坑指南 在仪器仪表和传感器信号调理领域,精度与速度的权衡一直是硬件工程师面临的核心挑战。当我们处理温度、压力或称重传感器等低频高精度信号时,传统的SAR和Σ…...