当前位置: 首页 > article >正文

对26年LLM发展的一些思考与展望

01对于 LLM 发展的一些思考还是打算努力维持一下过年期间对于自己的思考的一些总结。说起来 25 年过年的时候想着接下来的一年要多写点结果反向突破快要变成年更账号了。到目前这个时间节点个人感觉 LLM 的应用方向越来越明确了最大的价值就是作为生产力变革的工具3 年淘汰 50% 的白领不是危言耸听反而可能是比较保守的预测了至于生活场景感觉让 AI 帮我点奶茶之类的东西似乎吸引力有限。这个判断主要是基于过去两三个月自己在工作中使用 AI 的体验已经看到团队同事业界中各种牛人能用 AI 做的事情。其实直到 25 年七八月份AI 对于我的生产力提效大概是百分之二三十的感觉但最近两三个月会有奇点到来的感觉。所以我其实最近并不是非常关注模型层面的进展了ds 春节出不出新模型我觉得也都不是那么重要现有模型的智能程度已经足够具备生产力爆发的潜力要说关注的话也主要关注推理成本而不是跑分。我会更关注下列问题的技术进展第一是 agent 持续进化的能力有很多方向的技术在为了这个目标而努力。Memorycontinue learningtest-time training 都是为了这个目标服务。现实生产环境中的任务常有各自的复杂特性模型很难从模型厂商发布的那一刻就足够强大。第二是 agent 的 test-time scaling 的能力也就是把更多算力转化为生产力的能力。agent 实现的很多技术比如最常被提到的 context engineering说到底也是为了 test-time scaling 服务。而 test-scaling 的潜能还远远没有被充分挖掘虽然说目前越来越多产品开始使用 parallel thinking但还是一种原始粗暴的逻辑应该还有非常大的提升空间。第三是推理成本大概是去年 6 月这样一些朋友会来问我未来 tokens 消耗量的增长速度能维持吗我就一直说当 agent 成熟之后这东西燃烧 tokens 的速度非常疯狂。应该是说 25 年大家对于推理成本其实还不算特别的敏感但进入 26 年这个敏感程度可能会提升很多。具体来说目前大家的思路整体还是在不影响模型性能的前提下降本比如上量化的前提是对数据集的跑分没有显著影响而随着降本需求的增强大家可能会在产品中尝试更激进的方式。比如上小模型然后想办法用 test-time scaling 把模型掉的能力补回来。test-time scaling 与推理的降本看起来是方向相反的两件事但实际上是互相促进相辅相成的。上面是对于 LLM 怎么发展的一些思考但最近思考很多的其实是对于 LLM 如何影响程序员工作的问题。02LLM 如何影响程序员的工作一个比较确定的前提是LLM 与 agent 对于编程效率的提升是指数级的。最近也发现也不仅是编程这个环节环境部署性能分析bug fixing 也都能有非常大的效率提升。这就让我们需要重新去思考很多问题。首先是工程思路的迭代。很多过去不可能的事都在变得可能。24 年我还在太初的时候和团队同学聊天说也许我们现在做的各种降低 SDAA就是太初的 CUDA开发难度的工作都不重要以后把 CUDA 代码丢给 LLMLLM 就能直接转成 SDAA。当时大家还觉得这个思路挺天方夜谭的现在已经非常可行了做没做我就不知道了。又比如前两天和做硬件设计的朋友聊现在 LLM 写算子很快了我们就想到也许以后硬件设计团队完成一版设计AI 很快就能写出一版新硬件上的算子集可以端到端跑模型那种然后丢给模拟器看瓶颈。第二是软件架构的重构。当代码变成主要由 AI 来写很多软件工程的理念就需要重新思考了。比如测试驱动研发的理念大多数团队应该都是说说而已但让 agent 写代码测试与各种工具就极其重要了未来测试代码与工具代码的占比会比现在高得多。又比如我们需要在不封装与过度封装中找到平衡点而人类与 agent 想要的平衡点是不一样的agent 没那么害怕代码冗余与膨胀但可能会被封装带来的语义模糊而困扰。第三是团队分工的调整。这个比较好理解未来的每个人都是一个小团队了如果只具备某个方面的能力比如只擅长代码实现那生产力就会很受限了。最后感慨一下程序员毫无疑问将成为接下来要首先被 AI 冲击的行业了这当然是挑战但从好处来说程序员也最有可能成为率先充分掌握 AI 工具的一些人。对于不是这个行业的读者可能现在感受还不太强烈但我有两个建议供参考第一是尽早拥抱像 openclaw 这样的可个人定制的 agent。第二是掌握 vibe coding 的能力这其实不难甚至都不用学编程然后能够自己开发一些对自己有用的小工具。祝大家马年能够驾着 AI 起飞。假如你从2026年开始学大模型按这个步骤走准能稳步进阶。接下来告诉你一条最快的邪修路线3个月即可成为模型大师薪资直接起飞。阶段1:大模型基础阶段2:RAG应用开发工程阶段3:大模型Agent应用架构阶段4:大模型微调与私有化部署配套文档资源全套AI 大模型 学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】配套文档资源全套AI 大模型 学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】ert/b08fb7bf908d3faa4310503cd1bae6a2.jpeg)配套文档资源全套AI 大模型 学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】

相关文章:

对26年LLM发展的一些思考与展望

01 对于 LLM 发展的一些思考 还是打算努力维持一下过年期间对于自己的思考的一些总结。说起来 25 年过年的时候想着接下来的一年要多写点,结果反向突破快要变成年更账号了。 到目前这个时间节点,个人感觉 LLM 的应用方向越来越明确了,最大的价…...

飞书+OpenClaw保姆级教程:从0到1搭建,看完直接上手

现在越来越多人想要尝试OpenClaw,其实把它接入飞书是一个比较方便的选择。接入后,能让你直接在飞书里调用AI能力,实现自动回复、问答、总结、协助等功能。 但网上的教程要么太技术、要么太零散,今天我用最通俗、最简版的流程&…...

Wan2.1-umt5与Node.js全栈开发:打造实时AI聊天应用

Wan2.1-umt5与Node.js全栈开发:打造实时AI聊天应用 你是不是也想过,自己动手做一个像模像样的AI聊天应用?不是那种简单的问答机器人,而是能记住对话历史、能实时响应、体验流畅的现代Web应用。听起来有点复杂?别担心&…...

实战应用:用TranslateGemma处理外文资料,提升学习和工作效率

实战应用:用TranslateGemma处理外文资料,提升学习和工作效率 1. 为什么你需要一个本地翻译引擎 想象一下这个场景:你正在阅读一篇最新的英文技术论文,里面有几个关键段落你反复看了几遍,还是觉得理解得不够透彻。你打…...

【官方未公开的GC调优参数】:PHP 8.9新增gc_max_depth与gc_cycle_root_buffer_size实战指南

第一章:PHP 8.9垃圾回收机制演进与设计哲学PHP 8.9尚未正式发布(截至2024年,PHP最新稳定版为8.3),但作为假想中的前瞻性版本,其垃圾回收(GC)机制的设计体现了对内存安全、实时性与开…...

【ZYNQ】EBAZ4205矿板低成本改造实战:从硬件调试到Hello World

1. 前言:为什么选择EBAZ4205矿板? 如果你对FPGA和嵌入式系统感兴趣,但又觉得正儿八经的ZYNQ开发板价格太贵,那EBAZ4205这块“矿渣”绝对是你的菜。我最早是在二手平台上看到这玩意的,当时一块才几十块钱,简…...

[C/C++开发工具]:RedPanda-CPP调试功能的架构设计与实现解析

[C/C开发工具]:RedPanda-CPP调试功能的架构设计与实现解析 【免费下载链接】RedPanda-CPP A light-weight C/C IDE based on Qt 项目地址: https://gitcode.com/gh_mirrors/re/RedPanda-CPP RedPanda-CPP作为一款基于Qt开发的轻量级C/C集成开发环境&#xff…...

Clawdbot+Qwen3-32B在STM32开发中的应用:嵌入式AI实践指南

ClawdbotQwen3-32B在STM32开发中的应用:嵌入式AI实践指南 1. 为什么嵌入式工程师需要关注Clawdbot和Qwen3-32B 你可能已经注意到,最近很多嵌入式项目开始讨论"本地大模型"、"边缘智能"这些词。但说实话,当第一次看到Qw…...

Linux中高效清空日志文件的终极指南

监控系统状态的重要工具。然而,日志文件会不断增长,占用大量磁盘空间,甚至影响系统性能。因此,定期清理或清空日志文件是系统管理员的基本任务之一。 本文将详细介绍在Linux中清空日志文件的多种方法,包括&#xff1a…...

StructBERT WebUI部署教程:容器化entrypoint.sh启动逻辑与容错机制解析

StructBERT WebUI部署教程:容器化entrypoint.sh启动逻辑与容错机制解析 1. 项目概述 StructBERT文本相似度服务是一个基于百度开源大模型的高精度中文句子相似度计算工具。这个WebUI应用能够帮助用户快速判断两个中文句子的语义相似程度,相似度评分范围…...

Piskel:从零开始制作2D游戏像素素材的完整指南

1. 为什么我选择Piskel作为我的第一个像素画工具? 几年前,当我第一次尝试制作自己的独立小游戏时,我被“美术”这个环节卡住了。我不是美术专业出身,用Photoshop画出来的东西总感觉不对味,用Aseprite又觉得功能太多太复…...

大数据技术的热门微博数据可视化分析爬虫 可视化

目录数据爬取与清洗数据存储与管理可视化工具选择关键指标设计自动化与部署项目技术支持可定制开发之功能创新亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作数据爬取与清洗 使用Python的Scrapy或Requests库爬取微博热门话题数据&…...

3大进阶:TuxGuitar音乐创作全攻略

3大进阶:TuxGuitar音乐创作全攻略 【免费下载链接】tuxguitar Improve TuxGuitar and provide builds 项目地址: https://gitcode.com/gh_mirrors/tu/tuxguitar 一、认知:揭开TuxGuitar的技术面纱 1.1 插件化架构解密 TuxGuitar采用模块化设计&…...

Z-Image-Turbo快速入门:VSCode环境配置全攻略

Z-Image-Turbo快速入门:VSCode环境配置全攻略 为前端开发者量身打造的AI图像生成开发环境搭建指南 如果你是前端开发者,想要快速上手AI图像生成项目,但又被复杂的开发环境配置劝退,那么这篇文章就是为你准备的。我将带你一步步在V…...

零基础入门AI开发:在快马平台轻松玩转OpenClaw Qwen模型

最近想入门AI开发,但一看到那些复杂的模型部署、环境配置就头大。尤其是像OpenClaw Qwen这样的模型,虽然功能强大,但对新手来说,光是把它跑起来可能就要折腾半天。有没有一种方法,能让我们这些“小白”绕开这些技术门槛…...

LPUART与SPI寄存器级控制、错误处理及低功耗协同设计

低功耗通用异步收发器(LPUART)与串行外设接口(SPI)深度解析:寄存器级控制、错误处理与通信模式工程实践1. LPUART核心寄存器体系详解:从初始化到中断响应的全链路控制LPUART(Low-Power Universa…...

Ollama部署本地大模型:DeepSeek-R1-Distill-Qwen-7B模型安全沙箱隔离部署方案

Ollama部署本地大模型:DeepSeek-R1-Distill-Qwen-7B模型安全沙箱隔离部署方案 1. 为什么要在本地部署大模型? 最近很多朋友都在讨论大模型,但一提到使用,大家的第一反应往往是“联网调用API”。这确实方便,但你想过没…...

STM32H7 Flash安全机制详解:PCROP、WRP与Securable Memory实战

STM32 Category 4 设备嵌入式闪存安全机制深度解析:PCROP、WRP、Securable Memory 与调试控制实战指南在嵌入式系统安全设计中,Flash 存储器不仅是程序代码和常量数据的载体,更是整个信任链的物理锚点。对于 STM32 Category 4 设备&#xff0…...

为什么你的Dify异步节点在生产环境总超时?揭秘Event Loop阻塞、线程池饥饿与Redis连接泄漏三大元凶

第一章:Dify自定义节点异步处理避坑指南在 Dify v1.0 中,自定义节点(Custom Node)支持同步与异步两种执行模式。但若未显式声明异步行为或错误处理缺失,极易导致工作流阻塞、超时中断或状态不一致。以下为高频陷阱及对…...

93%存储节省:CompressO让229MB视频瘦身为14MB的本地压缩方案

93%存储节省:CompressO让229MB视频瘦身为14MB的本地压缩方案 【免费下载链接】compressO Convert any video into a tiny size. 项目地址: https://gitcode.com/gh_mirrors/co/compressO 在视频创作与分享成为日常的今天,你是否遇到过这些尴尬场景…...

BMP180气压传感器在天空星GD32F407开发板上的I2C驱动移植与海拔测量实战

BMP180气压传感器在天空星GD32F407开发板上的I2C驱动移植与海拔测量实战 最近在做一个户外气象站的项目,需要测量气压和温度来计算海拔高度,正好用上了BMP180这款传感器。很多刚开始接触嵌入式开发的朋友,一看到传感器数据手册里复杂的换算公…...

3步掌握faster-whisper-GUI模型管理:效率提升实战指南

3步掌握faster-whisper-GUI模型管理:效率提升实战指南 【免费下载链接】faster-whisper-GUI faster_whisper GUI with PySide6 项目地址: https://gitcode.com/gh_mirrors/fa/faster-whisper-GUI 在语音识别应用中,模型管理往往成为影响效率的关键…...

GTE模型多任务学习实践:同时优化检索与分类性能

GTE模型多任务学习实践:同时优化检索与分类性能 1. 引言 在实际的AI应用开发中,我们经常面临这样的困境:需要一个模型既能处理文本检索任务,又能胜任文本分类工作。传统做法是训练两个独立的模型,但这不仅增加了计算…...

STM32 FSMC控制器深度解析:同步/异步模式、PSRAM/NAND驱动与硬件时序设计

灵活静态存储控制器(FSMC)深度解析与工程实践指南1. FSMC 架构概览与核心能力定位灵活静态存储控制器(Flexible Static Memory Controller,FSMC)是意法半导体(STMicroelectronics)在高性能 Cort…...

YOLO12五档模型怎么选?从nano到xlarge,实测对比帮你决策

YOLO12五档模型怎么选?从nano到xlarge,实测对比帮你决策 面对YOLO12提供的nano、small、medium、large、xlarge五个档位,你是不是有点选择困难?每个版本都说自己好,但到底哪个最适合你的项目?是追求极致的…...

SPIRAN ART SUMMONER创意应用:QT桌面应用集成开发

SPIRAN ART SUMMONER创意应用:QT桌面应用集成开发 用代码作画,让创意在桌面端绽放 1. 开篇:当艺术创作遇上桌面应用 你有没有遇到过这样的情况:突然有了个绝妙的创意画面,但手头没有专业的设计软件,或者用…...

LDBlockShow:从理论到实践的连锁不平衡可视化工具全指南

LDBlockShow:从理论到实践的连锁不平衡可视化工具全指南 【免费下载链接】LDBlockShow LDBlockShow: a fast and convenient tool for visualizing linkage disequilibrium and haplotype blocks based on VCF files 项目地址: https://gitcode.com/gh_mirrors/ld…...

InsightFace buffalo_l在Face Analysis WebUI中的多维度人脸属性解析案例

InsightFace buffalo_l在Face Analysis WebUI中的多维度人脸属性解析案例 1. 引言:从一张照片到一份“人物档案” 你有没有想过,一张普通的照片背后,能挖掘出多少关于“人”的信息?年龄、性别、情绪、甚至头部的微小转动角度&am…...

实时口罩检测-通用模型体验:无需代码,上传图片秒出检测结果

实时口罩检测-通用模型体验:无需代码,上传图片秒出检测结果 1. 引言:让AI检测变得像拍照一样简单 想象一下,你手头有一堆活动现场的照片,需要快速统计有多少人正确佩戴了口罩。传统方法可能需要你一张张图片去数&…...

DAMO-YOLO模型转换全攻略:从PyTorch到TensorRT部署

DAMO-YOLO模型转换全攻略:从PyTorch到TensorRT部署 1. 为什么需要TensorRT部署 在实际项目中,我们经常遇到这样的情况:训练好的DAMO-YOLO模型在开发环境上运行良好,但一放到边缘设备或生产服务器上就卡顿、延迟高、显存占用大。…...