当前位置：首页 > article >正文

对26年LLM发展的一些思考与展望

article 2026/3/13 21:45:56

01对于 LLM 发展的一些思考还是打算努力维持一下过年期间对于自己的思考的一些总结。说起来 25 年过年的时候想着接下来的一年要多写点结果反向突破快要变成年更账号了。到目前这个时间节点个人感觉 LLM 的应用方向越来越明确了最大的价值就是作为生产力变革的工具3 年淘汰 50% 的白领不是危言耸听反而可能是比较保守的预测了至于生活场景感觉让 AI 帮我点奶茶之类的东西似乎吸引力有限。这个判断主要是基于过去两三个月自己在工作中使用 AI 的体验已经看到团队同事业界中各种牛人能用 AI 做的事情。其实直到 25 年七八月份AI 对于我的生产力提效大概是百分之二三十的感觉但最近两三个月会有奇点到来的感觉。所以我其实最近并不是非常关注模型层面的进展了ds 春节出不出新模型我觉得也都不是那么重要现有模型的智能程度已经足够具备生产力爆发的潜力要说关注的话也主要关注推理成本而不是跑分。我会更关注下列问题的技术进展第一是 agent 持续进化的能力有很多方向的技术在为了这个目标而努力。Memorycontinue learningtest-time training 都是为了这个目标服务。现实生产环境中的任务常有各自的复杂特性模型很难从模型厂商发布的那一刻就足够强大。第二是 agent 的 test-time scaling 的能力也就是把更多算力转化为生产力的能力。agent 实现的很多技术比如最常被提到的 context engineering说到底也是为了 test-time scaling 服务。而 test-scaling 的潜能还远远没有被充分挖掘虽然说目前越来越多产品开始使用 parallel thinking但还是一种原始粗暴的逻辑应该还有非常大的提升空间。第三是推理成本大概是去年 6 月这样一些朋友会来问我未来 tokens 消耗量的增长速度能维持吗我就一直说当 agent 成熟之后这东西燃烧 tokens 的速度非常疯狂。应该是说 25 年大家对于推理成本其实还不算特别的敏感但进入 26 年这个敏感程度可能会提升很多。具体来说目前大家的思路整体还是在不影响模型性能的前提下降本比如上量化的前提是对数据集的跑分没有显著影响而随着降本需求的增强大家可能会在产品中尝试更激进的方式。比如上小模型然后想办法用 test-time scaling 把模型掉的能力补回来。test-time scaling 与推理的降本看起来是方向相反的两件事但实际上是互相促进相辅相成的。上面是对于 LLM 怎么发展的一些思考但最近思考很多的其实是对于 LLM 如何影响程序员工作的问题。02LLM 如何影响程序员的工作一个比较确定的前提是LLM 与 agent 对于编程效率的提升是指数级的。最近也发现也不仅是编程这个环节环境部署性能分析bug fixing 也都能有非常大的效率提升。这就让我们需要重新去思考很多问题。首先是工程思路的迭代。很多过去不可能的事都在变得可能。24 年我还在太初的时候和团队同学聊天说也许我们现在做的各种降低 SDAA就是太初的 CUDA开发难度的工作都不重要以后把 CUDA 代码丢给 LLMLLM 就能直接转成 SDAA。当时大家还觉得这个思路挺天方夜谭的现在已经非常可行了做没做我就不知道了。又比如前两天和做硬件设计的朋友聊现在 LLM 写算子很快了我们就想到也许以后硬件设计团队完成一版设计AI 很快就能写出一版新硬件上的算子集可以端到端跑模型那种然后丢给模拟器看瓶颈。第二是软件架构的重构。当代码变成主要由 AI 来写很多软件工程的理念就需要重新思考了。比如测试驱动研发的理念大多数团队应该都是说说而已但让 agent 写代码测试与各种工具就极其重要了未来测试代码与工具代码的占比会比现在高得多。又比如我们需要在不封装与过度封装中找到平衡点而人类与 agent 想要的平衡点是不一样的agent 没那么害怕代码冗余与膨胀但可能会被封装带来的语义模糊而困扰。第三是团队分工的调整。这个比较好理解未来的每个人都是一个小团队了如果只具备某个方面的能力比如只擅长代码实现那生产力就会很受限了。最后感慨一下程序员毫无疑问将成为接下来要首先被 AI 冲击的行业了这当然是挑战但从好处来说程序员也最有可能成为率先充分掌握 AI 工具的一些人。对于不是这个行业的读者可能现在感受还不太强烈但我有两个建议供参考第一是尽早拥抱像 openclaw 这样的可个人定制的 agent。第二是掌握 vibe coding 的能力这其实不难甚至都不用学编程然后能够自己开发一些对自己有用的小工具。祝大家马年能够驾着 AI 起飞。假如你从2026年开始学大模型按这个步骤走准能稳步进阶。接下来告诉你一条最快的邪修路线3个月即可成为模型大师薪资直接起飞。阶段1:大模型基础阶段2:RAG应用开发工程阶段3:大模型Agent应用架构阶段4:大模型微调与私有化部署配套文档资源全套AI 大模型学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】配套文档资源全套AI 大模型学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】ert/b08fb7bf908d3faa4310503cd1bae6a2.jpeg)配套文档资源全套AI 大模型学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】

对26年LLM发展的一些思考与展望

相关文章：

对26年LLM发展的一些思考与展望

飞书+OpenClaw保姆级教程：从0到1搭建，看完直接上手

Wan2.1-umt5与Node.js全栈开发：打造实时AI聊天应用

实战应用：用TranslateGemma处理外文资料，提升学习和工作效率

【官方未公开的GC调优参数】：PHP 8.9新增gc_max_depth与gc_cycle_root_buffer_size实战指南

【ZYNQ】EBAZ4205矿板低成本改造实战：从硬件调试到Hello World

[C/C++开发工具]：RedPanda-CPP调试功能的架构设计与实现解析

Clawdbot+Qwen3-32B在STM32开发中的应用：嵌入式AI实践指南

Linux中高效清空日志文件的终极指南

StructBERT WebUI部署教程：容器化entrypoint.sh启动逻辑与容错机制解析

Piskel：从零开始制作2D游戏像素素材的完整指南

大数据技术的热门微博数据可视化分析爬虫可视化

3大进阶：TuxGuitar音乐创作全攻略

Z-Image-Turbo快速入门：VSCode环境配置全攻略

零基础入门AI开发：在快马平台轻松玩转OpenClaw Qwen模型

LPUART与SPI寄存器级控制、错误处理及低功耗协同设计

Ollama部署本地大模型：DeepSeek-R1-Distill-Qwen-7B模型安全沙箱隔离部署方案

STM32H7 Flash安全机制详解：PCROP、WRP与Securable Memory实战

为什么你的Dify异步节点在生产环境总超时？揭秘Event Loop阻塞、线程池饥饿与Redis连接泄漏三大元凶

93%存储节省：CompressO让229MB视频瘦身为14MB的本地压缩方案

BMP180气压传感器在天空星GD32F407开发板上的I2C驱动移植与海拔测量实战

3步掌握faster-whisper-GUI模型管理：效率提升实战指南

GTE模型多任务学习实践：同时优化检索与分类性能

STM32 FSMC控制器深度解析：同步/异步模式、PSRAM/NAND驱动与硬件时序设计

YOLO12五档模型怎么选？从nano到xlarge，实测对比帮你决策

SPIRAN ART SUMMONER创意应用：QT桌面应用集成开发

LDBlockShow：从理论到实践的连锁不平衡可视化工具全指南

InsightFace buffalo_l在Face Analysis WebUI中的多维度人脸属性解析案例

实时口罩检测-通用模型体验：无需代码，上传图片秒出检测结果

DAMO-YOLO模型转换全攻略：从PyTorch到TensorRT部署