当前位置: 首页 > article >正文

在职前端开发,我为什么考取了“软件设计师”证书?

在职前端开发我为什么考取了“软件设计师”证书从公司要求到个人收获一次软考中级备考全记录前言作为一名前端开发工程师我的日常工作就是和 React、Vue、TypeScript 这些技术栈打交道写页面、调接口、优化性能日子过得还算充实。直到去年年底公司内部出了新政策鼓励技术人员参加软考计算机技术与软件专业技术资格考试通过者不仅报销报名费还会在晋升评优时给予加分。公司有要求那就考呗。但问题来了我一个前端去考“软件设计师”这种偏后端和理论体系的证书能行吗答案是能行而且收获远超预期。这篇文章我就以一个在职前端开发的视角分享我是如何从零准备、到顺利拿到中级软件设计师证书的全过程。希望能给同样在职备考、或者前端想拓宽技术视野的朋友一些参考。为什么是“软件设计师”软考有很多方向初级、中级、高级都有。中级里常见的包括软件设计师偏开发、设计网络工程师偏网络数据库系统工程师偏数据库系统集成项目管理工程师偏项目管理我选了“软件设计师”原因很简单最贴近开发岗位考察内容涵盖软件工程、数据结构、数据库、设计模式、面向对象等和我日常开发有交集学起来不完全是空中楼阁。含金量相对高软件设计师是中级职称考过就具备“以考代评”的工程师职称资格对国企、事业单位以及部分大型私企都有实际价值。对前端有补充价值前端开发虽然主要关注界面和交互但理解后端设计、数据库建模、系统架构能让我在团队协作中更有话语权。在职备考的三大挑战在职备考和在校学生最大的不同就是时间碎片化和精力有限。我面临的挑战也很典型白天写代码晚上累得不想动下班后能抽出的有效学习时间大约 1-2 小时周末能多些。知识跨度大前端日常基本不碰数据结构与算法的 C 语言实现也不涉及操作系统、编译原理这些底层内容而软件设计师考试偏偏会考。容易中途放弃没人监督没有同伴学到枯燥处很容易自我怀疑我一个前端学这些有用吗后来回头看正是这些挑战让我更认真地规划了备考节奏也让我意识到技术人不能只守着自己的一亩三分地。我是怎么学的—— 资源与方法1. 核心资源B站视频 官方教材我备考的第一步是在 B 站上找了一套口碑比较好的“软件设计师”系统课程。视频博主通常会按考试大纲把知识点拆成章节来讲对在职考生非常友好。推荐博主类型讲“上午题”基础知识的老师会把操作系统、网络、数据库这些零散知识串成体系。讲“下午题”应用技术的老师会手把手教数据流图、UML 类图、数据库 E-R 图、算法代码填空的答题套路。我前后刷了两遍视频第一遍 1.5 倍速过框架标记自己陌生的章节比如“面向对象设计模式”“数据库关系规范化”。第二遍重点回放结合官方教材《软件设计师教程》做笔记把视频里老师强调的考点在教材上标注出来。2. 真题 机考模拟软考从 2023 年开始全面实行机考这和我以前参加过的纸质考试完全不一样。所以我专门留出最后两周做了两件事刷近 5 年真题上午题刷选择题练速度下午题每一道都手写答案再对照标准答案看得分点。数据流图的父图与子图平衡、数据库 E-R 图转关系模式这些题型做多了就有固定套路。用官方模拟系统练机考考前一周我每天抽 1 小时在“中国计算机技术职业资格网”的模拟平台上熟悉界面。尤其下午题需要打字输入设计思路和 SQL 语句熟练度直接影响答题速度。3. 建立“前端友好型”知识转化为了让枯燥的理论能坚持下去我试着把考试内容和前端工作联系起来学设计模式时我会想React 里的高阶组件HOC不就是“装饰器模式”吗Vue 的响应式系统也可以联想到“观察者模式”。学UML 建模时我把它当作“用类图表达组件关系”的扩展画过几次之后再理解后端给的接口文档都清晰了很多。学数据库规范化时我就用公司项目的数据库表来练习分析哪些表存在数据冗余哪些可以拆成第三范式。这样一来备考就不再是纯粹为了考试而变成了一次对已有知识的“重新理解”。考试当天机考体验我参加的是上半年的考试考点在一所大学的机房。机考的好处是不用涂答题卡写作和画图都比较方便系统自带画图工具可以简单绘制数据流图和类图。两个科目连考上午题和下午题中间不休息总共 240 分钟。我的策略是上午题控制在100 分钟内完成留出 20 分钟检查。下午题 5 道大题我按“先做数据库设计、再做 UML 建模、然后算法填空、最后数据流图”的顺序把有把握的题目先搞定避免在某一道难题上卡死。考完出来说实话心里没底尤其下午题的代码填空用 C 语言写算法实现对我这个常年写 JavaScript 的人来说语法细节确实是个挑战。出成绩那天成绩出来那天我是在公司查的。上午题52 分下午题48 分——两门都过了 45 分的及格线稳了。那一刻的开心不是因为多了一张证书而是觉得原来非科班的前端也能啃下这些偏底层的知识。考后复盘一张证书之外的收获考完到现在大半年了回头看这场备考真正有价值的不是证书本身而是下面几件事1. 拓宽了技术视野从前端出发走到软件工程、数据库设计、系统架构我对“软件”的理解不再是页面和接口而是一个从需求分析到建模、从编码到测试的完整过程。2. 提升了与后端、产品沟通的能力现在和同事讨论需求时我能更自然地画出数据流图用 E-R 模型沟通数据库设计用 UML 类图描述模块关系。这些“通用语言”让我在跨角色协作中更顺畅。3. 对晋升和职业发展有实际帮助证书本身在公司的晋升评分中确实加了分但更重要的是它让我的“软实力”被更多看到——主动学习、承担跨领域任务的能力在管理者眼中往往比多会一个框架更有价值。4. 为未来留了更多可能性中级到手后如果有机会未来我可能会去尝试高级“系统架构设计师”或“系统分析师”让自己从“前端开发”向“全栈/架构”的方向走得更稳。给在职前端的几点建议如果你也是前端也在犹豫要不要考软件设计师我的建议是不要被“非科班”吓退软考虽然涉及很多后端和底层知识但大多停留在理解和应用层面认真备考完全可以攻克。善用视频资源在职时间有限视频课程比啃教材高效很多。选一个讲得清晰的博主跟着节奏走。重点抓“下午题”上午题选择题靠刷题和记忆下午题更依赖理解而且分值高、套路固定练好了就是提分项。把考试内容和工作挂钩每学一个知识点就想一想这在前端场景里怎么体现能用在什么地方这会让你坚持得更久。保持平常心软考通过率不高一次不过很正常不要因为考不过就否定自己。在职备考本身就是一种成长。写在最后回过头看从最初“公司要求考”的被动接受到最后“原来我也能行”的主动收获这次软考经历让我明白了一件事技术人的成长不一定非要沿着既定的技术栈一路往上走偶尔横向拓展反而能看到更完整的风景。如果你也在备考路上或者对软考有什么疑问欢迎留言交流。希望我的经历能给你一点点信心和方向。前端不止是页面软件设计师也不只是后端的事。# 在职前端开发我为什么考取了“软件设计师”证书从公司要求到个人收获一次软考中级备考全记录前言作为一名前端开发工程师我的日常工作就是和 React、Vue、TypeScript 这些技术栈打交道写页面、调接口、优化性能日子过得还算充实。直到去年年底公司内部出了新政策鼓励技术人员参加软考计算机技术与软件专业技术资格考试通过者不仅报销报名费还会在晋升评优时给予加分。公司有要求那就考呗。但问题来了我一个前端去考“软件设计师”这种偏后端和理论体系的证书能行吗答案是能行而且收获远超预期。这篇文章我就以一个在职前端开发的视角分享我是如何从零准备、到顺利拿到中级软件设计师证书的全过程。希望能给同样在职备考、或者前端想拓宽技术视野的朋友一些参考。为什么是“软件设计师”软考有很多方向初级、中级、高级都有。中级里常见的包括软件设计师偏开发、设计网络工程师偏网络数据库系统工程师偏数据库系统集成项目管理工程师偏项目管理我选了“软件设计师”原因很简单最贴近开发岗位考察内容涵盖软件工程、数据结构、数据库、设计模式、面向对象等和我日常开发有交集学起来不完全是空中楼阁。含金量相对高软件设计师是中级职称考过就具备“以考代评”的工程师职称资格对国企、事业单位以及部分大型私企都有实际价值。对前端有补充价值前端开发虽然主要关注界面和交互但理解后端设计、数据库建模、系统架构能让我在团队协作中更有话语权。在职备考的三大挑战在职备考和在校学生最大的不同就是时间碎片化和精力有限。我面临的挑战也很典型白天写代码晚上累得不想动下班后能抽出的有效学习时间大约 1-2 小时周末能多些。知识跨度大前端日常基本不碰数据结构与算法的 C 语言实现也不涉及操作系统、编译原理这些底层内容而软件设计师考试偏偏会考。容易中途放弃没人监督没有同伴学到枯燥处很容易自我怀疑我一个前端学这些有用吗后来回头看正是这些挑战让我更认真地规划了备考节奏也让我意识到技术人不能只守着自己的一亩三分地。我是怎么学的—— 资源与方法1. 核心资源B站视频 官方教材我备考的第一步是在 B 站上找了一套口碑比较好的“软件设计师”系统课程。视频博主通常会按考试大纲把知识点拆成章节来讲对在职考生非常友好。推荐博主类型讲“上午题”基础知识的老师会把操作系统、网络、数据库这些零散知识串成体系。讲“下午题”应用技术的老师会手把手教数据流图、UML 类图、数据库 E-R 图、算法代码填空的答题套路。我前后刷了两遍视频第一遍 1.5 倍速过框架标记自己陌生的章节比如“面向对象设计模式”“数据库关系规范化”。第二遍重点回放结合官方教材《软件设计师教程》做笔记把视频里老师强调的考点在教材上标注出来。2. 真题 机考模拟软考从 2023 年开始全面实行机考这和我以前参加过的纸质考试完全不一样。所以我专门留出最后两周做了两件事刷近 5 年真题上午题刷选择题练速度下午题每一道都手写答案再对照标准答案看得分点。数据流图的父图与子图平衡、数据库 E-R 图转关系模式这些题型做多了就有固定套路。用官方模拟系统练机考考前一周我每天抽 1 小时在“中国计算机技术职业资格网”的模拟平台上熟悉界面。尤其下午题需要打字输入设计思路和 SQL 语句熟练度直接影响答题速度。3. 建立“前端友好型”知识转化为了让枯燥的理论能坚持下去我试着把考试内容和前端工作联系起来学设计模式时我会想React 里的高阶组件HOC不就是“装饰器模式”吗Vue 的响应式系统也可以联想到“观察者模式”。学UML 建模时我把它当作“用类图表达组件关系”的扩展画过几次之后再理解后端给的接口文档都清晰了很多。学数据库规范化时我就用公司项目的数据库表来练习分析哪些表存在数据冗余哪些可以拆成第三范式。这样一来备考就不再是纯粹为了考试而变成了一次对已有知识的“重新理解”。考试当天机考体验我参加的是上半年的考试考点在一所大学的机房。机考的好处是不用涂答题卡写作和画图都比较方便系统自带画图工具可以简单绘制数据流图和类图。两个科目连考上午题和下午题中间不休息总共 240 分钟。我的策略是上午题控制在100 分钟内完成留出 20 分钟检查。下午题 5 道大题我按“先做数据库设计、再做 UML 建模、然后算法填空、最后数据流图”的顺序把有把握的题目先搞定避免在某一道难题上卡死。考完出来说实话心里没底尤其下午题的代码填空用 C 语言写算法实现对我这个常年写 JavaScript 的人来说语法细节确实是个挑战。出成绩那天成绩出来那天我是在公司查的。上午题52 分下午题48 分——两门都过了 45 分的及格线稳了。那一刻的开心不是因为多了一张证书而是觉得原来非科班的前端也能啃下这些偏底层的知识。考后复盘一张证书之外的收获考完到现在大半年了回头看这场备考真正有价值的不是证书本身而是下面几件事1. 拓宽了技术视野从前端出发走到软件工程、数据库设计、系统架构我对“软件”的理解不再是页面和接口而是一个从需求分析到建模、从编码到测试的完整过程。2. 提升了与后端、产品沟通的能力现在和同事讨论需求时我能更自然地画出数据流图用 E-R 模型沟通数据库设计用 UML 类图描述模块关系。这些“通用语言”让我在跨角色协作中更顺畅。3. 对晋升和职业发展有实际帮助证书本身在公司的晋升评分中确实加了分但更重要的是它让我的“软实力”被更多看到——主动学习、承担跨领域任务的能力在管理者眼中往往比多会一个框架更有价值。4. 为未来留了更多可能性中级到手后如果有机会未来我可能会去尝试高级“系统架构设计师”或“系统分析师”让自己从“前端开发”向“全栈/架构”的方向走得更稳。给在职前端的几点建议如果你也是前端也在犹豫要不要考软件设计师我的建议是不要被“非科班”吓退软考虽然涉及很多后端和底层知识但大多停留在理解和应用层面认真备考完全可以攻克。善用视频资源在职时间有限视频课程比啃教材高效很多。选一个讲得清晰的博主跟着节奏走。重点抓“下午题”上午题选择题靠刷题和记忆下午题更依赖理解而且分值高、套路固定练好了就是提分项。把考试内容和工作挂钩每学一个知识点就想一想这在前端场景里怎么体现能用在什么地方这会让你坚持得更久。保持平常心软考通过率不高一次不过很正常不要因为考不过就否定自己。在职备考本身就是一种成长。写在最后回过头看从最初“公司要求考”的被动接受到最后“原来我也能行”的主动收获这次软考经历让我明白了一件事技术人的成长不一定非要沿着既定的技术栈一路往上走偶尔横向拓展反而能看到更完整的风景。如果你也在备考路上或者对软考有什么疑问欢迎留言交流。希望我的经历能给你一点点信心和方向。前端不止是页面软件设计师也不只是后端的事。

相关文章:

在职前端开发,我为什么考取了“软件设计师”证书?

在职前端开发,我为什么考取了“软件设计师”证书?从公司要求到个人收获,一次软考中级备考全记录前言 作为一名前端开发工程师,我的日常工作就是和 React、Vue、TypeScript 这些技术栈打交道,写页面、调接口、优化性能&…...

如何利用Metabase快速构建企业级数据分析平台:零基础完整指南

如何利用Metabase快速构建企业级数据分析平台:零基础完整指南 【免费下载链接】metabase metabase/metabase: 是一个开源的元数据管理和分析工具,它支持多种数据库,包括 PostgreSQL、 MySQL、 SQL Server 等。适合用于数据库元数据管理和分析…...

Wan2.2-I2V-A14B惊艳案例:输入‘水墨风熊猫打太极’生成10秒国风动画

Wan2.2-I2V-A14B惊艳案例:输入"水墨风熊猫打太极"生成10秒国风动画 1. 开篇:当传统国风遇上AI视频生成 想象一下这样的场景:你输入"水墨风熊猫打太极"几个字,10秒钟后,一段充满东方韵味的动画就…...

MT5交易必备:如何用跨周期均线指标捕捉趋势转折点?

MT5交易必备:如何用跨周期均线指标捕捉趋势转折点? 对于中短线交易者而言,精准识别趋势转折点是实现盈利的关键。传统单一周期均线往往滞后于市场实际变化,而跨周期均线指标通过整合不同时间维度的价格信息,能够更早发…...

[re实战]利用010Editor逆向解析加密MP3文件

1. 逆向工程与音频加密基础 第一次接触加密MP3文件时,我完全被那些十六进制代码搞懵了。后来才发现,很多音乐平台的加密其实并不复杂,特别是那些需要VIP才能下载的歌曲。逆向工程听起来高大上,但实际操作起来,用对工具…...

零基础入门Unsloth:手把手教你快速微调DeepSeek、Qwen等大模型

零基础入门Unsloth:手把手教你快速微调DeepSeek、Qwen等大模型 1. Unsloth简介与核心优势 Unsloth是一个开源的LLM微调和强化学习框架,专门为大语言模型的高效训练而设计。它的核心使命是让人工智能训练变得更快速、更节省资源,同时保持模型…...

Umi-OCR批量OCR功能模块的参数配置问题解析

Umi-OCR批量OCR功能模块的参数配置问题解析 【免费下载链接】Umi-OCR Umi-OCR: 这是一个免费、开源、可批量处理的离线OCR软件,适用于Windows系统,支持截图OCR、批量OCR、二维码识别等功能。 项目地址: https://gitcode.com/GitHub_Trending/um/Umi-OC…...

企业会议记录福音:用ClearerVoice-Studio本地处理,数据安全又高效

企业会议记录福音:用ClearerVoice-Studio本地处理,数据安全又高效 1. 会议记录痛点与解决方案 现代企业会议记录面临三大核心挑战:音频质量差导致转写错误率高、多人发言难以区分、数据安全风险。传统解决方案往往需要将录音上传到云端处理…...

影墨·今颜模型部署排错指南:常见403 Forbidden等错误解决

影墨今颜模型部署排错指南:常见403 Forbidden等错误解决 部署AI模型,尤其是像影墨今颜这样的图像生成模型,本应是一件充满期待的事。但很多时候,我们满怀热情地配置好环境,点击运行,屏幕上却弹出一个冷冰冰…...

FUTURE POLICE语音模型Python入门实战:10行代码调用语音分析API

FUTURE POLICE语音模型Python入门实战:10行代码调用语音分析API 你是不是觉得语音AI技术听起来很酷,但一想到要学复杂的框架和写一大堆代码就头疼?别担心,今天咱们就来点不一样的。我带你用不到10行的Python代码,体验…...

Krita平板绘画终极指南:从零开始掌握数字艺术创作

Krita平板绘画终极指南:从零开始掌握数字艺术创作 【免费下载链接】krita Krita is a free and open source cross-platform application that offers an end-to-end solution for creating digital art files from scratch built on the KDE and Qt frameworks. …...

**AI仿真人剧哪家效果好?2025年推荐指南**随着科技的飞速发展,AI仿真人剧逐渐成为人们娱乐生活的一部分。那么,在众多AI仿真人剧中,哪家效果更好呢?本文将为您揭晓答案。**一、AI仿真

随着科技的飞速发展,AI仿真人剧逐渐成为人们娱乐生活的一部分。那么,在众多AI仿真人剧中,哪家效果更好呢?本文将为您揭晓答案。一、AI仿真人剧的核心价值点高度逼真的角色表现:AI仿真人剧通过先进的AI技术,…...

Jetson TX2 / Orin TensorRT部署|YOLO部署|远程调试|保证跑通

YOLOv11 在 Jetson TX2 上 TensorRT 部署失败?推理只有 1FPS?最近完成一个 YOLOv11 在 Jetson TX2 上的部署优化,从 PyTorch 推理约 1FPS 提升至 TensorRT 推理约 44FPS(提升 40 倍),同时对推理流程进行了优…...

常用命令 cat

文件的查看、创建、合并、追加看前几行的内容cat background.js | head -n 10看后几行的内容cat background.js | tail -n 5 看中间范围的内容,1000到3000行cat filename | head -n 3000 | tail -n 1000显示行尾标识cat -E background.js 在每行末尾显示$符号&#…...

G-Helper终极指南:3步解决华硕笔记本色彩配置文件丢失问题

G-Helper终极指南:3步解决华硕笔记本色彩配置文件丢失问题 【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops. Control tool for ROG Zephyrus G14, G15, G16, M16, Flow X13, Flow X16, TUF, Strix, Scar and other models 项目…...

2026国产RPA最新排名

2026年,随着大模型技术的成熟和信创环境的深化,国产RPA已全面进入“智能体驱动”的新阶段。过去单纯依靠规则引擎的自动化工具已无法满足复杂业务场景的需求,而融合AI认知与精准执行的企业级智能体正成为主流。根据最新IDC数据,金…...

保姆级教程:手把手教你为SAMA5D4开发板移植Linux串口驱动(含设备树配置)

SAMA5D4开发板Linux串口驱动移植实战指南 硬件准备与环境搭建 在开始SAMA5D4开发板的串口驱动移植前,需要做好充分的硬件和软件准备。首先确认手头的开发板型号和版本,Microchip SAMA5D4系列包含多个变种,确保你使用的是SAMA5D4-Xplained或兼…...

突破游戏定制边界:BepInEx让创意玩法触手可及

突破游戏定制边界:BepInEx让创意玩法触手可及 【免费下载链接】BepInEx Unity / XNA game patcher and plugin framework 项目地址: https://gitcode.com/GitHub_Trending/be/BepInEx 您是否曾因游戏难度过高而沮丧?是否想添加独特功能却被技术门…...

7步掌握云端3D计算:如何突破本地硬件限制?

7步掌握云端3D计算:如何突破本地硬件限制? 【免费下载链接】compute.rhino3d REST geometry server based on RhinoCommon and headless Rhino 项目地址: https://gitcode.com/gh_mirrors/co/compute.rhino3d 你是否曾因本地计算机性能不足而无法…...

论文降重工具哪个好?论文AI率检测+降AI率+论文润色全流程工具推荐(2026最新)

随着论文审核标准越来越严格,“论文降重”“论文AI率检测”“论文降AI率”“论文润色”等关键词搜索量持续上涨。 很多同学在写完论文后都会遇到这些问题:论文查重率过高,无法通过检测AI生成内容比例过高,被判定为AIGC论文论文语言…...

nli-distilroberta-base模型监控与告警:使用Prometheus与Grafana构建可观测性体系

nli-distilroberta-base模型监控与告警:使用Prometheus与Grafana构建可观测性体系 1. 为什么需要模型服务监控 当nli-distilroberta-base这类自然语言推理模型部署到生产环境后,单纯关注推理准确率远远不够。想象一下,半夜两点你的手机突然…...

使用Keil5开发嵌入式TranslateGemma-12B-it应用的入门指南

使用Keil5开发嵌入式TranslateGemma-12B-it应用的入门指南 1. 关于TranslateGemma-12B-it模型的现实认知 在开始动手之前,需要先明确一个关键事实:TranslateGemma-12B-it是一个基于Gemma 3架构的120亿参数大语言模型,专为多语言翻译任务优化…...

OpenClaw+GLM-4.7-Flash:技术面试题自动生成

OpenClawGLM-4.7-Flash:技术面试题自动生成 1. 为什么需要自动化面试题生成 去年帮朋友公司面试前端工程师时,我花了整整三个晚上手动整理不同职级的考察要点。从初级岗位的CSS盒模型到高级岗位的微前端架构设计,每个级别需要准备20-30道技…...

InstructPix2Pix体验报告:自然语言修图到底有多方便?

InstructPix2Pix体验报告:自然语言修图到底有多方便? 1. 颠覆传统的修图体验 作为一名长期与图像处理打交道的从业者,我第一次使用InstructPix2Pix时的感受可以用"震撼"来形容。这个基于自然语言指令的图像编辑工具,彻…...

Llama-Factory实战指南:从SFT到KTO,解锁大模型高效对齐全流程

1. Llama-Factory入门:为什么选择这个工具链? 如果你正在寻找一个能够一站式解决大模型训练和对齐问题的工具,Llama-Factory绝对值得放入你的技术工具箱。这个开源框架最大的优势在于,它把SFT(监督微调)、R…...

别再手动敲字了!用Python的pytesseract+OpenCV,5分钟搞定图片文字批量提取

5分钟极速OCR实战:用Python打造图片转文字自动化流水线 每天被堆积如山的扫描件、截图和PDF文档淹没?还在手工复制粘贴图片中的文字?今天我要分享一套极简OCR自动化方案,只需5行核心代码就能把图片批量转成可编辑文本。这个方案特…...

保姆级教程:用WVP+ZLMediaKit搞定海康大华摄像头NAT穿透,在家也能看监控

零基础实现家庭监控远程访问:WVPZLMediaKit实战指南 家里装了海康或大华的摄像头,却因为没公网IP在外看不了实时画面?这套组合方案能让你像用云服务一样简单访问本地设备。无需复杂网络知识,跟着做就能搞定。 1. 为什么选择WVPZ…...

终极指南:如何在Windows 7上安装Python 3.8+最新版本

终极指南:如何在Windows 7上安装Python 3.8最新版本 【免费下载链接】PythonVista Python 3.9 installers that support Windows 7 SP1 and Windows Server 2008 R2 项目地址: https://gitcode.com/gh_mirrors/py/PythonVista 还在为Windows 7系统无法安装新…...

65R099-ASEMI超结MOS管TO-263封装

编辑:LL65R099-ASEMI超结MOS管TO-263封装型号:65R099品牌:ASEMI沟道:NPN封装:TO-263漏源电流:40A漏源电压:650VRDS(on):99mΩ批号:最新引脚数量:3封装尺寸:如…...

人工智能-大模型微调(属于transformer具体实践)

文章目录概念LORA(low rank adaption,低秩适配)模型微调-简单示例模型微调-简单示例-如何使用保存的模型如何将保存的模型加到原始模型呢?1、动态挂载2、永久合并保存单模型混合训练(通过 Loss Mask 实现“匹配”)报错 ValueError: adamw_hf…...