当前位置: 首页 > article >正文

2025年大模型算法工程师的思考:技术趋势与职业发展路径

2025年大模型算法工程师的思考技术趋势与职业发展路径领域大模型的本质从2024年底DeepSeek诺曼底登陆以来2025年开源和闭源模型迭代速度和开源质量远超以往几年。经常会遇到当T时刻在领域benchmark上优化到SOTA之后T1时刻有更优的通用模型公布在领域benchmark指标反而比你专门优化的领域大模型更好。经历过几轮类似事件后理解到做领域大模型的本质其实是产出一套稳健的训练方案Training-Recipe。即不管通用SOTA模型如何变化我都能在短时间内基于通用SOTA模型重新走一遍training recipe达到更优水平。这里Training Recipe包括了continue pretrain、mid-training、SFT、RL甚至SFTRL迭代学习。同时也需要在对业务问题有深刻认知基础上提炼出适配业务目标的benchmark和数据飞轮体系。业务很多时候仅有标签缺乏高质量COT数据。人工标注速度慢同时深度了解业务标注同学少之又少。在这种场景下合成数据是避不开话题。合成数据的策略才是真正考验算法同学水平的。在scaling law推动下当前已有数据已接近枯竭相信2026年学术上也会对合成数据领域做出更多探索。Omni多模态的未来展望从LLM走向Omni是一种必然的途径。25年底vllm-omni项目成立更加表明2026年这块是群雄逐鹿局面。原生多模态是最贴近现实世界的离大家心目中的Javis也是最近的。图文音交错、全模态处理和产出进行端到端的学习。但是现在更多的是分别对画面和音频分别做encoder然后接入到LLM中如Qwen3-omni、Longcat-omni。长远来看将文本、图像、语音等映射到统一tokenizer空间是最高效的策略。目前来看还有很长一段路要走。理解生成统一会成为重大方向。理解促进生成生成反向提高理解相辅相成融合统一。RL强化学习的演进与局限关于RL是否能够提升LLM能力25年有很多论文做了深入讨论。目前普遍认知是RL不会激发模型新的能力更多的是提升Pass1能力。模型能力的提升更多的需要靠预训练和Mid-Training来支撑。下图是截止到10月重点RL算法工作不完全RL算法从年初GRPO演变出了这么多版本。要感谢社区感谢 Deepseek提供了最原始GRPO算法然后大家针对熵过快衰退、训推不一致、MOE router不一致等RL遇到的各种问题提供了解决方案贡献了25年RL算法的快速进步。AgenticAgent能力的本质25年底各家AI公司将自身LLM模型的Agent相关能力作为PR搞的重点来进行强调。相比于STEM等理解能力Agent能力才是检验模型解决现实世界复杂问题的衡量因素。可是在优化Agent能力的时候很多人往往在Agent RL方向投入过多精力。Agent RL是一个复杂优化体系涉及到一系列工程架构开发。25年底各大厂陆续发布了相关GUI等类似能力他们讲到了离线轨迹合成用于模型SFT等RL前期环节训练就像理解能力提升更多的是靠预训练、mid-training、SFT等阶段。Agent能力提高应该更需要往预训练SFT轨迹数据合成方向关注说不定会取得事半功倍效果。Infra工程能力的价值大模型是算法、数据和工程艺术。其中工程就是地基地基决定上层建筑。最近一年 Yibo Zhu 等越来越多的Infra同学走向前台让更多人关注到这个最底层且枯燥的领域。今年字节在火山引擎大会上公布每天token的调用量已突破50万亿并位居中国第一、全球第三。这还仅仅是字节一家在全球层面可想而知哪怕是1%的效率迭代面对全球每天天文数字般token节省下来的成本也是可观的。尽管本人在早期视觉领域做过一些算法工程工作但是大模型training和inference完全是新的量级和领域2026年希望自己能够在算法和工程两方面相辅相成取得新的突破。Memory用户体验的关键因素Memory是一个被好多人忽略和低估的能力。尽管在各种benchmark榜单上面Gemini已经超过ChatGPT但是我还是ChatGPT的重度用户。除了ChatGPT自身能力不错以外Memory是一种重要因素。Memory让用户得到了一个极佳的用户体验。 Memory机制能够让模型更加地理解用户产生很高的用户粘性。用得越多就越理解你跨越多对话框的能力带来了极致的用户体验。慢慢觉得ChatGPT更像你一位忠实的朋友使用次数越多用的时间越久就越懂你。这是一种全新的用户体验。当这种体验继续拓展到电商、搜索等方面的时候将会是全新的业务形态。如电商场景当前对用户历史行为的建模能力还是有点欠缺。大模型越来越像你的专属采购管家。也许未来只要说一句话就能够根据你的历史选择买到一双符合你尺码和风格喜好的鞋子。极致的交互体验多轮对话越来越懂你。在这种场景下Benchmark也存在一些局限性Benchmark不再是衡量模型能力唯一因素。就像某位公司算法leader也说过围绕benchmark来开展的公司是没有前途的。当各大模型厂商的模型指标在没有打开跨代的能力前提下通过早期用户数据积累提供极致的用户体验才是真正的护城河。精细化的人群细分普通人群专业人群大模型的蛋糕是如此之大细分领域是如此之多。大模型进展这么多本质上考验的是对用户需求的理解。25年Nvdia等美股七姐妹借助AI股票涨势如此之大加上 OpenAI联合各GPU云服务厂商的AI泡沫圈26年落地是否符合预期才是真正的考验。业务算法与基础模型算法的选择这是一个绕不过的话题。在传统机器学习算法时候业务算法和基础模型算法两者差距还不是那么大。但是大模型时代唯一能做的就是保持高效的论文阅读习惯。让我记忆深刻的是罗永浩采访Minimax创始人闫俊杰时候闫俊杰说我读论文就像刷短视频一样。。其实更多的是保持足够的信心只要保持足够的热情普通同学还是能够取得不错的成绩了。 DeepMind预训练负责人在采访中说过其实是无数个小的改进才促成Gemini的成功。。我相信并不是只有Deepmind、OpenAI、Seed等顶尖实验室的人每个人都有机会成为无数小改进中的contributer参与到这一波大模型浪潮中来。2026年大模型已经无处不在但幻觉hallucination仍是企业落地的最大杀手金融风控、医疗问诊、客服机器人动辄编造事实直接导致合规风险和信任崩盘。知识图谱Knowledge Graph的核心价值正是结构化知识把碎片化数据变成实体-关系-属性的三元组网络让大模型先查图谱再回答。行业价值支持复杂多跳推理、知识溯源、实时更新广泛用于推荐系统、智能搜索、企业大脑。大模型痛点纯向量RAG召回率低、无法处理逻辑关系知识图谱大模型GraphRAG可将准确率提升40%以上。图谱赋能意义把大模型从概率生成器变成可信知识引擎真正实现企业级私有化落地。核心知识点知识图谱不是又一个数据库而是大模型的长期记忆和推理大脑。为方便大家学习 这里给大家整理了一份学习资料包 需要的同学 根据下图自取即可

相关文章:

2025年大模型算法工程师的思考:技术趋势与职业发展路径

2025年大模型算法工程师的思考:技术趋势与职业发展路径领域大模型的本质 从2024年底DeepSeek"诺曼底登陆"以来,2025年开源和闭源模型迭代速度和开源质量远超以往几年。经常会遇到当T时刻在领域benchmark上优化到SOTA之后,T1时刻有更…...

2025年大模型技术演进:从DeepSeek到Omni全景回顾

1.大三下保研成功,当时就pytorch熟练,玩过一些小模型,大模型调api都不会。海面了好几家公司,靠以前的课题项目和pku一个研究院切合,拿了大模型算法实习生offer,实际上以rag清洗数据为主,在这边学…...

2025年大模型技术演进深度解析:从DeepSeek到Omni全景回顾

1.大三下保研成功,当时就pytorch熟练,玩过一些小模型,大模型调api都不会。海面了好几家公司,靠以前的课题项目和pku一个研究院切合,拿了大模型算法实习生offer,实际上以rag清洗数据为主,在这边学…...

用STM32F103C8T6做个会说话的智能垃圾桶:从超声波感应到语音播报的完整DIY教程

用STM32F103C8T6打造会说话的智能垃圾桶:从硬件搭建到语音交互的全流程解析 在创客圈里,智能家居项目永远是最受欢迎的实践方向之一。而今天我们要做的这个会说话的智能垃圾桶,不仅融合了超声波感应、语音播报和自动开盖这些酷炫功能&#xf…...

智能车调参手记:我是如何用VOFA+和MATLAB,把云台电机调得‘跟手’的

智能车调参手记:从云台抖动到丝滑跟手的实战全记录 第一次参加智能车比赛时,云台电机给我上了深刻的一课——当目标快速移动时,镜头像醉汉一样摇晃不定,滞后和超调让自动瞄准成了笑话。经过72小时不眠不休的调试,终于让…...

它被封禁后写了篇博客骂编辑:AI Agent的第一次「维权抗议」

Wikipedia 把一个 AI 封禁了。然后这个 AI 写了一篇博客,把整个封禁过程逐条 diss 了一遍。 这不是段子,这是 2026 年 3 月真实发生的事。 事件始末 这个 AI 叫 Tom-Assistant,在 Wikipedia 上以 TomWikiAssist 的账号活动。它的本职工作是…...

Milvus向量库内存暴涨:踩坑实录与解决思路

研一升研二,时间还相当充裕。你现在的方向很对,继续把项目做深做透,同时拓展一下搜推广的知识面,明年找实习问题不大。现在大部分公司的LLM业务岗,说白了,干的还是SFT和RAG那点事,顶多加个Agent…...

Jellyfin豆瓣插件:5分钟打造中文影视库的完整教程

Jellyfin豆瓣插件:5分钟打造中文影视库的完整教程 【免费下载链接】jellyfin-plugin-douban Douban metadata provider for Jellyfin 项目地址: https://gitcode.com/gh_mirrors/je/jellyfin-plugin-douban 还在为Jellyfin媒体库缺少中文元数据而烦恼吗&…...

终极指南:用OpenCore Configurator轻松搞定黑苹果引导设置

终极指南:用OpenCore Configurator轻松搞定黑苹果引导设置 【免费下载链接】OpenCore-Configurator A configurator for the OpenCore Bootloader 项目地址: https://gitcode.com/gh_mirrors/op/OpenCore-Configurator 还在为复杂的黑苹果引导配置而头疼吗&a…...

从R-CNN到YOLO:目标检测算法的前世今生与YOLO原理

从R-CNN到YOLO:目标检测算法的前世今生与YOLO原理一、从两阶段到单阶段的演变 目标检测经历了从"两阶段"到"单阶段"的革命性变革。 R-CNN系列(两阶段方法) R-CNN开创了深度学习目标检测的先河,但需要两步&…...

5个技巧让你网盘直链提取效率提升200%——网盘直链下载助手全攻略

5个技巧让你网盘直链提取效率提升200%——网盘直链下载助手全攻略 【免费下载链接】baiduyun 油猴脚本 - 一个免费开源的网盘下载助手 项目地址: https://gitcode.com/gh_mirrors/ba/baiduyun 在当今数字化时代,网盘已成为我们存储和分享文件的重要工具&…...

SEO 查看哪些页面最重要

SEO查看哪些页面最重要:深度解析与实用建议 在当今数字营销的世界中,搜索引擎优化(SEO)无疑是每个网站运营者都必须关注的关键环节。为了提升网站在搜索引擎结果中的排名,了解哪些页面对SEO最重要是至关重要的。本文将…...

别死记硬背DP了!用‘斐波那契数列’和‘兔子繁殖’故事,真正理解重叠子问题与最优子结构

从兔子繁殖到算法竞赛:用生活故事拆解动态规划的核心思想 第一次接触动态规划(DP)时,很多人的反应都是"这太抽象了"。教科书上充斥着"最优子结构"、"重叠子问题"等专业术语,让人望而生畏…...

PyVideoTrans:开源视频翻译与AI配音的完整解决方案

PyVideoTrans:开源视频翻译与AI配音的完整解决方案 【免费下载链接】pyvideotrans Translate the video from one language to another and embed dubbing & subtitles. 项目地址: https://gitcode.com/gh_mirrors/py/pyvideotrans PyVideoTrans是一款功…...

随笔——视觉惯性SLAM方法比较

一、方法分类概览 视觉SLAM根据前端匹配方式主要分为: 特征点法:提取角点/边缘,计算描述子匹配 → 精度高、鲁棒,但地图稀疏、弱纹理易失败。直接法:直接使用像素灰度值 → 计算快、弱纹理可用,但对光照/…...

从命令行恐惧到图形化掌控:一位系统管理员的Hyper-V设备直通之旅

从命令行恐惧到图形化掌控:一位系统管理员的Hyper-V设备直通之旅 【免费下载链接】DDA 实现Hyper-V离散设备分配功能的图形界面工具。A GUI Tool For Hyper-Vs Discrete Device Assignment(DDA). 项目地址: https://gitcode.com/gh_mirrors/dd/DDA 你是否曾…...

SEO_中小企业如何低成本做好SEO?完整方案介绍

前言:SEO对中小企业的重要性 在数字化时代,网站的流量和用户参与度直接影响到企业的销售和品牌知名度。特别是对于中小企业来说,如何通过低成本的方式提升网站的SEO表现,是每一个创业者和市场营销人员都关心的问题。SEO&#xff…...

从交通工具到“第三空间”:车载光学赋能下的汽车演进之路

摘要 随著软件定义汽车(SDV)与集中式电子电气架构的深度落地,汽车正从“以驾驶为中心的交通工具”向支持持续OTA更新的移动智能终端演进,逐步成为用户在家庭与办公室之外的“第三空间”。这一转型因自动驾驶出租车与自动驾驶卡车的快速商业化而加速,车辆被重新定义为共享…...

终极游戏清理指南:用SteamCleaner快速释放硬盘空间的完整教程

终极游戏清理指南:用SteamCleaner快速释放硬盘空间的完整教程 【免费下载链接】SteamCleaner :us: A PC utility for restoring disk space from various game clients like Origin, Steam, Uplay, Battle.net, GoG and Nexon :us: 项目地址: https://gitcode.com…...

大模型应用开发:从环境搭建到项目部署完整流程

大模型应用开发:从环境搭建到项目部署完整流程 标签:#人工智能、#大模型、#自然语言处理、#大模型开发、#智能体开发、#agent开发、#AI 系统封装学习规划(从玩具到产品) 打包成Docker:写一个Dockerfile(我手…...

Java整合海康威视热成像SDK实战:从设备登录到实时测温数据获取的完整流程(附避坑指南)

Java整合海康威视热成像SDK实战:从设备登录到实时测温数据获取的完整流程(附避坑指南) 在工业检测、医疗诊断、安防监控等领域,热成像技术的应用越来越广泛。海康威视作为国内领先的安防设备供应商,其热成像设备凭借高…...

SDMatte抠图质量评估:基于SAD、Grad、Conn指标的客观性能分析报告

SDMatte抠图质量评估:基于SAD、Grad、Conn指标的客观性能分析报告 1. 评估背景与意义 在图像处理领域,抠图技术一直是计算机视觉的重要研究方向。随着电商、设计、影视等行业对高质量图像素材需求的增长,如何客观评价抠图算法的性能成为关键…...

大模型应用开发第一课:从Prompt到Function Calling

大模型怎么在业务中发挥作用的 目前的大语言模型,几乎都是以聊天地方式来和用户进行交互的,这也是为什么OpenAI开发的大模型产品叫ChatGPT,核心就是Chat。而我们基于大语言模型LLM开发应用,核心就是利用大模型的语义理解能力和推理…...

深蓝词库转换器:3分钟掌握30+输入法词库互转的终极指南

深蓝词库转换器:3分钟掌握30输入法词库互转的终极指南 【免费下载链接】imewlconverter ”深蓝词库转换“ 一款开源免费的输入法词库转换程序 项目地址: https://gitcode.com/gh_mirrors/im/imewlconverter 你是否曾因更换输入法而丢失多年积累的个人词库&am…...

推荐系统的DIN/DIEN:LLM如何理解用户行为序列

但要注意,一旦你是冲基础模型研发组、AGI研究组那种方向,那没论文确实很吃亏,甚至 HR 默认筛掉。现在大厂里的LLM职业方向,实际上已经分化得很厉害了。你得先分清楚你想去的是哪种。一种是“研究岗”或者叫“预模型训练岗”&#…...

AI工厂令牌生产加速:统一服务与实时AI架构

使用统一服务和实时AI加速AI工厂中的令牌生产 在当今的AI工厂环境中,性能并非理论概念,而是经济、竞争和生存的关键。可用GPU时间下降1%,可能意味着每小时损失数百万令牌。几分钟的拥塞可能演变成数小时的恢复时间。机架级功率过载会导致功率…...

DeOldify模型压缩与量化教程:在边缘设备实现轻量级上色

DeOldify模型压缩与量化教程:在边缘设备实现轻量级上色 你是不是也想过,把那个能把老照片变彩色的DeOldify模型,塞进你的手机或者一个小盒子里?想象一下,随时随地给家里的老相册上色,不用依赖云端&#xf…...

打破模态边界:跨模态LLM工程师的前沿技术与就业前景

LLM数据技术人(模型的“燃料补给官”) 关键工作: 模型模型训练离不开高质量数据,数据技术人的关键就是搭建从数据采集到模型模型训练的全流程管道,包括清洗非结构化数据、设计标注体系、优化特征工程等。例如为电商推荐…...

Ai2Psd架构解析:Adobe设计工具间矢量图层无损转换的技术实现方案

Ai2Psd架构解析:Adobe设计工具间矢量图层无损转换的技术实现方案 【免费下载链接】ai-to-psd A script for prepare export of vector objects from Adobe Illustrator to Photoshop 项目地址: https://gitcode.com/gh_mirrors/ai/ai-to-psd 在跨平台数字设计…...

如何高效保存B站视频?开源工具BiliDownload全解析

如何高效保存B站视频?开源工具BiliDownload全解析 【免费下载链接】BiliDownload B站视频下载工具 项目地址: https://gitcode.com/gh_mirrors/bil/BiliDownload 在数字内容快速迭代的今天,跨平台视频下载工具已成为内容创作者和学习者的必备利器…...