当前位置：首页 > news >正文

SFT、RLHF、DPO、IFT —— LLM 微调的进化之路

news 2026/4/2 18:47:41

TL;DR

• SFT、RLHF 和 DPO 都是先估计 LLMs 本身的偏好，再与人类的偏好进行对齐；
• SFT 只通过 LLMs 生成的下一个单词进行估计，而 RLHF 和 DPO 通过 LLMs 生成的完整句子进行估计，显然后者的估计会更准确；
• 虽然 RLHF 和 DPO 取得比 SFT 好的结果，但代价是高昂的数据构造和计算资源开销；
• IFT 通过引入时序残差连接，仅使用多推理一步的开销，就可以融合 SFT、RLHF 和 DPO 的训练目标，摆脱对偏好数据和参考模型的依赖，保证训练目标与真实生成目标更加相近；
• IFT 建模并优化了当前生成单词对所有未来生成结果的影响，增强了模型的因果性和事实性；

引言

随着 ChatGPT 等强大模型的发布，大语言模型（Large Language Models，LLMs）的浪潮席卷而来，并逐渐走进千家万户。LLMs 可以协助文字工作者寻找创作灵感，可以为各年龄段的学生详解知识点，甚至可以帮助心情不好的人做心理疏导。可以说，LLMs 正在成为许多人日常工作与生活的必需品。

然而，现阶段的 LLMs 仍然在一些方面饱受诟病。首当其冲的就是**“幻觉”问题**，LLMs 会自信满满地生成不符合事实或常理的回答，可能对使用者造成误导。另外，LLMs 对于复杂指令的理解与遵循能力欠佳，他们可能会自动忽略指令中的某些信息，只完成用户的一部分要求。上面这些问题是 LLMs 落地应用时的硬伤，极大地限制着 LLMs 产生更大的实际价值。

那么，产生上述现象的可能原因有哪些？我们又应该如何改善这些问题？下面我们将从 LLMs 训练方法的角度出发，与大家一同寻找答案。

从监督微调到偏好优化

当下最流行的 LLMs 训练流程大概可以分为以下三步：预训练（Pre-Training，PT）、监督微调（Supervised Fine-Tuning，SFT）和偏好优化（Preference Optimization，PO）。预训练时，语言模型在超大规模的语料中进行学习，并初步掌握基本的语法规则、逻辑能力、常识知识等等。但是，用于训练的语料中难免存在偏离人类价值观的数据，使 LLMs 不足够符合人类的偏好。同时，预训练的目标仅仅是根据上文补全单词，无法使 LLMs 具备对话和问答能力。因此，为了实现更好的与人交互，进一步的训练成为必须。

监督微调

一种最简单的思路就是，照搬预训练的目标函数和损失函数进一步微调，但是改变数据的质量和格式。为了使 LLMs 对齐人类价值观，我们可以专门筛选一些符合人类价值观的数据；为了让 LLMs 适应对话和问答场景，我们可以构造一问一答或者多轮问答的数据。经过上述数据的训练，模型将拟合这部分数据的特性，从而达到我们的目的，这一过程也被称为监督微调。

LSFT=Eρ0∼DEsi∗∼Sρ0∗[−i=0∑NlogTθ(π∗(si∗),si∗)]

然而，PT 和 SFT 的训练目标与真实的生成任务目标之间存在一定的差距，这会使训练后的 LLMs 难以达到我们的预期。具体来讲，在真实的生成任务中，LLMs 将依据一个指令循环进行下述流程：

• ① 依据上文，预测下一个单词；
• ② 将自己预测的单词拼接到上文中；
• ③ 重复进行上述步骤，直至生成终止符。

然而，在进行 PT 和 SFT 时，步骤②中拼接到上文的将是 Ground Truth 单词，而不是 LLMs 自己预测的单词，使得损失函数高估 LLMs 当前的能力，得到差强人意的训练结果。同时，这种目标函数只考虑了上文对当前预测的影响，没有考虑 LLMs 当前预测对自身未来预测的影响，限制了 LLMs 的因果性和泛化性。

基于人类反馈的强化学习

为了缓解上述问题，进一步地提升 LLMs 的对话能力、以及对于人类价值观的对齐程度，偏好优化（Preference Optimization，PO）被引入到了模型微调过程中，基于人类反馈的强化学习（Reinforcement Learning from Human Feedback，RLHF）便是这类算法最早期的代表。

RLHF 的第一步是根据人类的偏好训练一个打分模型（Reward Model，RM），使其可以评估一条问答数据的质量。随后，LLMs 依据训练集中的指令生成自己偏好的回复（仅依据输入指令自主生成回复，而不是不断地依靠 Ground Truth 预测下一个Token），并使用 RM 的打分作为监督信号，不断让自己的生成结果更接近人类偏好。其中，实现上述优化过程的最常用算法被称为近端策略优化（Proximal Policy Optimization，PPO）。

LPPO=Eρ0∼DEsi∗∼Sρ0∗[−i=0∑NR(πθ(siθ),siθ)] R=πR←πminLR LR=Eρ0∼DEsi+∼Sρ0+,si−∼Sρ0−[−logσ(i=0∑NlogTR(π+(si+)∣si+)−i=0∑NlogTR(π−(si−)∣si−))]

RLHF 使用了更加贴合真实生成任务的目标函数，成为了获得强大 LLMs 的关键步骤。然而，RLHF 存在两方面的巨大开销：

• ① 数据构造：为了得到 RM，我们要针对每条指令采集多条（≥2）回复数据，再让人类依据自己的偏好对这些数据进行质量排序，这将耗费大量的人力成本；
• ② 计算资源：为了模拟真实的生成场景，在 RLHF 的训练过程中需要实时地让 LLMs 生成回复，并用 RM 进行打分。

同时，由于 RLHF 和 PT 、SFT 之间存在较大的目标函数差异，拟合 RLHF 的目标将带来不稳定的训练过程，并会产生对过往知识的灾难性遗忘。所以，RLHF 还需要一个冻结的参考模型与策略模型（也就是被训练的模型）计算 KL 散度作为约束，抑制模型的参数偏移。于是，在 RLHF 时需要 3-4 个LLMs 同时被存储在 GPU 中并参与运算，计算资源的开销可想而知。

直接偏好优化

如果不能降低 RLHF 的开销，LLMs 在更广泛场景中的应用将受到限制。于是，直接偏好优化（Direct Preference Optimization，DPO）应运而生。DPO 融合了打分模型和策略模型的训练过程，因此只需要标注过偏好的数据、参考模型和策略模型，就可以使 LLMs 直接对齐人类的偏好，极大地减轻了训练时对计算资源的消耗。但是，理想的 DPO 形态应是在线DPO（Online DPO），也就是需要实时地采样 LLMs 对指令的回复，并实时地由人类标注偏好。所以，数据构造带来的开销非但没有降低（这种开销经常被忽略），反而要比 RLHF 更高。

LDPO-online=Eρ0∼DEsi∗∼Sρ0∗,siθ∼Sρ0θ[−logσ(i=0∑NlogTθ(π∗(si∗),si∗)−i=0∑NlogTθ(πθ(siθ),siθ))] LDPO-offline=Eρ0∼DEsi+∼Sρ0+,si−∼Sρ0−[−logσ(i=0∑NlogTθ(π+(si+),si+)−i=0∑NlogTθ(π−(si−),si−))]

为此，开源社区通常使用 离线DPO（Offline DPO）微调模型。这种方法会在训练前采集模型对指令的回复，并由人类标注好不同回复之间的排序，随后用这部分数据训练模型。Offline DPO 可以看作是使用事先采集的数据估计了人类和 LLMs 的偏好，随后再通过训练对齐二者的偏好。可是，随着训练的进行，LLMs 会逐渐偏离它自己最开始的偏好，损失函数又会错误地估计 LLMs 当前的能力（和上文中的 PT 和 SFT 类似），进而导致不理想的训练结果。

直觉微调

SFT 成本低，但效果欠佳；RLHF 和 DPO 效果好，但是成本过高。那么是否存在某种方法可以兼顾两类算法的优势，在降低开销的同时保证微调效果呢？如果我们使用一个统一的视角，会发现 SFT、RLHF 和 DPO 都是先估计 LLMs 本身的偏好，再与人类的偏好进行对齐。不过，SFT 只通过 LLMs 生成的一个单词进行估计，而 RLHF 和 DPO 通过 LLMs 生成的完整句子进行估计，显然后者的估计会更准确。

或者我们可以用复习考试时的刷题进行比喻。如果我们看到一个题目后，先依照自己的理解写完整道题，然后再对答案，通常可以通过试错的方式正确地了解自己的思维漏洞，查漏补缺；相反，如果我们在完成题目时，每写一步结果就立即对答案，随后再在正确答案的基础上写下一步结果，那我们通过这道题目获得的收获显然是更少的。

那么如何才能在不依赖参考模型和偏好数据的前提下，更好地使训练目标对齐真实生成目标呢？更大程度地暴露语言模型的“思维漏洞”是一种可能的解法，也是 直觉微调（Intuitive Fine-Tuning，IFT）的核心思想。IFT 通过引入 时间维度的残差连接（Temproral Residual Connection，TRC），使模型依照自己上一步的预测结果再多预测一步，近似地构建了 LLMs 对于指令的完整回复，更准确地估计了 LLMs 的偏好，从而获得更好的训练结果。这种方式也可以使 LLMs 获得类似于人类直觉的能力，每当它看到某个指令时，就对于完整的回复产生了一个模糊的预测。同时，TRC 还间接地引入了 动态关系传播（Dynamic Relation Propagation，DRP），DRP 可以建模 LLMs 当前预测单词对所有未来生成结果的影响，增强了 LLMs 生成过程中的因果性和事实性。

LIFT=Eρ0∼DEsi∗∼Sρ0∗[−n=0∑Ni=n∑NlogTθ(ai∗,δθ(si∗))]

δθ(si∗)=(1−λ)si∗+λπθ(si−1∗)

若希望了解更详细的问题建模和算法介绍，请参考原论文：Intuitive Fine-Tuning: Towards Simplify Alignment into a Single Process[1]

其他相关方法

Scheduled Sampling

相较于 PE 和 SFT 完全依赖 Ground Truth 作为上文，这个方法在训练过程中逐渐地引入更多 LLMs 自己预测的单词作为上文，旨在让 LLMs 的训练目标更加贴合真实的生成任务。如果把 Scheduled Sampling 看作是对于 LLMs 偏好单词的硬采样，那么 IFT 则可以看作是一种软采样的进化版。IFT 的软采样可以获得模型更完整的偏好估计，并且更加利于进行梯度优化。

∃ Sρ0′⊆Sρ0∗,∀si∗∈Sρ0′,δθ(si∗)=πθ(si−1∗)

Noisy Embedding Fine-Tuning

在 LLMs 的训练和推理过程中，都会首先对输入的上文进行向量化得到 Embedding，随后再将 Embedding 传输到后续的模型中进行运算。这种方法通过在 Embedding 中加入随机噪声来增强训练的泛化性和鲁棒性。IFT 也可以看作是在对 Embedding “加噪”，不过这个噪声是具有上下文因果性的“噪声”，所以相较随机噪声可以帮助模型获得更强的因果性和事实遵从性。

δθ(si∗)∼N(si∗,σδ2)

参考文献

参考文献   [1]Daniel M Ziegler, Nisan Stiennon, Jeffrey Wu, Tom B Brown, Alec Radford, Dario Amodei, Paul Christiano, and Geoffrey Irving. Fine-tuning language models from human preferences. arXiv preprint arXiv:1909.08593,2019.   [2]Long Ouyang, Jeffrey Wu, Xu Jiang, Diogo Almeida, Carroll Wainwright, Pamela Mishkin, Chong Zhang, Sandhini Agarwal, Katarina Slama, Alex Ray, et al. Training language models to follow instructions with human feedback. Advances in neural information processing systems, 35:27730–27744, 2022.   [3]John Schulman, Filip Wolski, Prafulla Dhariwal, Alec Radford, and Oleg Klimov. Proximal policy optimization algorithms. arXiv preprint arXiv:1707.06347, 2017.   [4]Rafael Rafailov, Archit Sharma, Eric Mitchell, Christopher D Manning, Stefano Ermon, and Chelsea Finn. Direct preference optimization: Your language model is secretly a reward model. Advances in Neural Information Processing Systems, 36, 2024.   [5]Ermo Hua, Biqing Qi, Kaiyan Zhang, Yue Yu, Ning Ding, Xingtai Lv, Kai Tian, and Bowen Zhou. Intuitive fine-tuning: towards simplifying alignment into a single process. arXivpreprintarXiv:2405.11870, 2024.   [6]Samy Bengio, Oriol Vinyals, Navdeep Jaitly, and Noam Shazeer. Scheduled sampling for sequence prediction with recurrent neural networks. Advances in neural information processing systems, 28.   [7]Neel Jain, Ping-yeh Chiang, Yuxin Wen, John Kirchenbauer, Hong-Min Chu, Gowthami Somepalli, Brian R. Bartoldson, Bhavya Kailkhura, Avi Schwarzschild, Aniruddha Saha, Micah Goldblum, Jonas Geiping, and Tom Goldstein. Neftune: Noisy embeddings improve instruction finetuning. arXivpreprintarXiv:2310.05914, 2023.

引用链接

[1] Intuitive Fine-Tuning: Towards Simplify Alignment into a Single Process: https://arxiv.org/pdf/2405.11870

THE END

如何系统的去学习大模型LLM ？

作为一名热心肠的互联网老兵，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的 AI大模型资料 包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

所有资料 ⚡️ ，朋友们如果有需要全套《LLM大模型入门+进阶学习资源包》，扫码获取~

👉[CSDN大礼包🎁：全网最全《LLM大模型入门+进阶学习资源包》免费分享]👈

一、全套AGI大模型学习路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

四、AI大模型商业化落地方案

阶段1：AI大模型时代的基础理解

目标：了解AI大模型的基本概念、发展历程和核心原理。
内容：
- L1.1 人工智能简述与大模型起源
- L1.2 大模型与通用人工智能
- L1.3 GPT模型的发展历程
- L1.4 模型工程
  - L1.4.1 知识大模型
  - L1.4.2 生产大模型
  - L1.4.3 模型工程方法论
  - L1.4.4 模型工程实践
- L1.5 GPT应用案例

阶段2：AI大模型API应用开发工程

目标：掌握AI大模型API的使用和开发，以及相关的编程技能。
内容：
- L2.1 API接口
  - L2.1.1 OpenAI API接口
  - L2.1.2 Python接口接入
  - L2.1.3 BOT工具类框架
  - L2.1.4 代码示例
- L2.2 Prompt框架
  - L2.2.1 什么是Prompt
  - L2.2.2 Prompt框架应用现状
  - L2.2.3 基于GPTAS的Prompt框架
  - L2.2.4 Prompt框架与Thought
  - L2.2.5 Prompt框架与提示词
- L2.3 流水线工程
  - L2.3.1 流水线工程的概念
  - L2.3.2 流水线工程的优点
  - L2.3.3 流水线工程的应用
- L2.4 总结与展望

阶段3：AI大模型应用架构实践

目标：深入理解AI大模型的应用架构，并能够进行私有化部署。
内容：
- L3.1 Agent模型框架
  - L3.1.1 Agent模型框架的设计理念
  - L3.1.2 Agent模型框架的核心组件
  - L3.1.3 Agent模型框架的实现细节
- L3.2 MetaGPT
  - L3.2.1 MetaGPT的基本概念
  - L3.2.2 MetaGPT的工作原理
  - L3.2.3 MetaGPT的应用场景
- L3.3 ChatGLM
  - L3.3.1 ChatGLM的特点
  - L3.3.2 ChatGLM的开发环境
  - L3.3.3 ChatGLM的使用示例
- L3.4 LLAMA
  - L3.4.1 LLAMA的特点
  - L3.4.2 LLAMA的开发环境
  - L3.4.3 LLAMA的使用示例
- L3.5 其他大模型介绍

阶段4：AI大模型私有化部署

目标：掌握多种AI大模型的私有化部署，包括多模态和特定领域模型。
内容：
- L4.1 模型私有化部署概述
- L4.2 模型私有化部署的关键技术
- L4.3 模型私有化部署的实施步骤
- L4.4 模型私有化部署的应用场景

学习计划：

阶段1：1-2个月，建立AI大模型的基础知识体系。
阶段2：2-3个月，专注于API应用开发能力的提升。
阶段3：3-4个月，深入实践AI大模型的应用架构和私有化部署。
阶段4：4-5个月，专注于高级模型的应用和部署。

这份完整版的所有 ⚡️ 大模型 LLM 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

全套《LLM大模型入门+进阶学习资源包》↓↓↓ 获取~

👉[CSDN大礼包🎁：全网最全《LLM大模型入门+进阶学习资源包》免费分享👈

SFT、RLHF、DPO、IFT —— LLM 微调的进化之路

TL;DR • SFT、RLHF 和 DPO 都是先估计 LLMs 本身的偏好，再与人类的偏好进行对齐； • SFT 只通过 LLMs 生成的下一个单词进行估计，而 RLHF 和 DPO 通过 LLMs 生成的完整句子进行估计，显然后者的估计会更准确； • 虽然…...

编程日记 2024/8/5 16:44:09

【数据结构】LinkedList与链表

目录链表 1、链表的概念及结构 2、LinkedList的使用 2、1什么是LinkedList 2、2LinkedList的使用 3、LinkedList的遍历 4、LinkedList的模拟实现 5、ArrayList和LinkedList的区别上篇已经熟悉了ArrayList的使用，ArrayList底层使用数组来存储元素。由于其底层…...

编程日记 2024/8/5 16:42:06

《LeetCode热题100》---＜5.①普通数组篇五道＞

本篇博客讲解LeetCode热题100道普通数组篇中的五道题第一道：最大子数组和（中等） 第二道：合并区间（中等） 第一道：最大子数组和（中等） 法一：贪心算法 class So…...

编程日记 2024/8/5 16:41:05

根据id查找树形结构中匹配数据与上级所有数据

背后在用户管理业务开发过程中，通常需要查询出用户管理的菜单数据和当前菜单的所有上级数据。为了方便后续的cv工作，我打算把这种方法记录下来，以备不时之需. 代码实现细节 Data public class MenuDTO {Schema(description "菜单id&qu…...

编程日记 2024/8/5 16:39:03

探索亚马逊Amazon S3：无缝存储管理与极速数据传输的奥秘

亚马逊云科技中Amazon S3，因其设计简单与高度可靠，允许用户通过互联网存储和检索任意数量的数据，并能够自动扩展以满足各种规模的需求，使得Amazon S3成为了许多云计算应用和网站的核心存储基础设施之一，Amazon S3提供的…...

编程日记 2024/8/5 16:38:02

Linux_监测CPU和内存

通过TOP持续获取进程的CPU和内存消耗，并写入到表格 # 配置进程名 processvm-agent # 配置次数 number100 # 配置间隔时间 time5 # csv结果文件 filecm_$(date %s).csv echo "%CPU,%MEM">${file} pid$(ps -aux | grep ${process} | awk -F {OFS"…...

编程日记 2024/8/5 16:37:01

OpenCV经典案例：01 答题卡识别

目录透视变换矫正选项识别匹配 QT 界面设计引言：随着信息化的发展，计算机阅卷已经成为一种常规操作。在大型考试中，客观题基本不再需要人工阅卷。本项目旨在开发一个基于OpenCV的高效答题卡识别系统，通过先进的图像处理和模…...

编程日记 2024/8/5 16:31:56

进程的管理与控制详解：创建、终止、阻塞等待与非阻塞等待

目录一、进程创建 1、实例 2、fork函数详解 (1)fork函数模板 (2). fork() 函数的工作原理 (3). fork() 返回值和错误处理 3、如何理解进程创建过程二、进程终止 1、终止是在做什么？ 2、进程终止，有三种情况 3、进程如何终止？ 三…...

编程日记 2024/8/5 16:29:53

【从零开始一步步学习VSOA开发】开发环境搭建

开发环境搭建开发 VSOA 首先需要搭建开发环境，这里讲解 Windows 下 C/C 开发环境搭建方法。下载 IDE 并申请授权码 SylixOS 的开发和部署需要 RealEvo-IDE 的支持，因此您需要先获取 RealEvo-IDE 的安装包和注册码。 RealEvo-IDE 分为体验版和商业版…...

编程日记 2024/8/5 16:27:50

一篇文章让你用我的世界中的红石搞懂什么是ALU！

目录 1.一些在开始的约定 2.七大逻辑门电路 1、与门 2、或门 3、非门 5、或非门 6、异或门 7、同或门 3.半加器 4.全加器 5.ALU 1.一些在开始的约定相同的概念：相同的概念：高电平低电平逻辑真逻辑假开关的开开关的关灯的亮灯…...

编程日记 2024/8/5 16:25:47

硬盘数据恢复：所需时长、全面指南及注意事项

在数字化时代，硬盘作为我们存储重要数据的核心设备，其重要性不言而喻。然而，由于各种原因，如误删除、格式化、硬盘故障等，我们时常面临数据丢失的困境。数据恢复不仅关乎个人隐私和信息安全，更可能影响到我…...

编程日记 2024/8/5 16:23:45

基于SpringBoot+Vue的科研管理系统(带1w+文档)

基于SpringBootVue的科研管理系统(带1w文档) 基于SpringBootVue的科研管理系统(带1w文档) 科研的管理系统设计过程中采用Java开发语言,B/S结构，采取springboot框架，并以MySql为数据库进行开发。结合以上技术，对本系统的整体、数据库、功能模块…...

编程日记 2024/8/5 16:22:44

计算机组成原理 —— 五段式指令流水线

计算机组成原理 —— 五段式指令流水线五段式指令流水线运算类指令LOAD指令的执行过程STORE指令的执行过程条件转移指令执行过程无条件转移指令的执行过程我们今天来看看五段式指令流水线： 五段式指令流水线五段式指令流水线是一种常见的处理器架构设计中采用的…...

编程日记 2024/8/5 16:21:42

【Bigdata】什么是关系联机分析处理

这是我父亲日记里的文字这是他的生命留下留下来的散文诗几十年后我看着泪流不止可我的父亲已经老得像一个影子 🎵 许飞《父亲写的散文诗》关系联机分析处理（Relational Online Analytical Processing，简称 ROLA…...

编程日记 2024/8/5 16:20:41

svd在求解最小二乘中的应用

文章目录线性最小二乘的直接解法（正规方程解法）什么是伪逆？伪逆矩阵的一般形式伪逆矩阵与SVD的关系线性最小二乘的直接解法（正规方程解法） 对于 A x b \boldsymbol{A}xb Axb的线性最小二乘问题，有直解析…...

编程日记 2024/8/5 16:18:39

JVM—垃圾收集算法和HotSpot算法实现细节

参考资料：深入理解Java虚拟机：JVM高级特性与最佳实践（第3版）周志明 1、分代回收策略分代的垃圾回收策略，是基于这样一个事实：不同的对象的生命周期是不一样的。因此，不同生命周期的对象可以采取…...

编程日记 2024/8/5 16:17:38

nvidia系列教程-AGX-Orin基础环境搭建

目录前言一、Agx-Orin（32GB）介绍 1.1 GPU 1.2 CPU 1.3 NVDLA 1.4 内存 1.5 存储二、安装JetPack SDK 三、基础环境配置四、jetpack软件版本总结前言 NVIDIA Jetson AGX Orin 是一款功能强大的嵌入式AI平台，专为需要高性能和低…...

编程日记 2024/8/5 16:16:37

使用SpringAOP实现公共字段填充

文章目录概要整体架构流程技术细节小结概要在新增员工或者新增菜品分类时需要设置创建时间、创建人、修改时间、修改人等字段，在编辑员工或者编辑菜品分类时需要设置修改时间、修改人等字段。这些字段属于公共字段，也就是也就是在我们的系统中很多表…...

编程日记 2024/8/5 16:15:35

c++初阶-----适配器---priority_queue

作者前言 🎂 ✨✨✨✨✨✨🍧🍧🍧🍧🍧🍧🍧🎂 🎂 作者介绍： 🎂🎂 🎂 🎉🎉&#x1f389…...

编程日记 2024/8/5 16:13:33

VSCode上安装C#环境教程

本章教程，教你如何在vscode上，可以快速运行一些基础的c#代码。 1、下载 .NET Code SDK 下载地址：https://dotnet.microsoft.com/zh-cn/download/dotnet/sdk-for-vs-code?utm_source=vs-code&utm_medium=referral&utm_campaign=sdk-install 根据自己的操作系统，选择…...

编程日记 2024/8/5 16:12:30

CosyVoice部署实战：从零到一搭建你的AI语音合成环境

1. 环境准备：打造AI语音合成的温床第一次接触CosyVoice时，我对着官方文档发呆了半小时——那些密密麻麻的命令行像天书一样。后来才发现，搭建AI语音合成环境就像组装乐高积木，只要按步骤拼接关键部件就能成功。我们先从最基础的系…...

编程新知 2026/4/2 17:31:23

如何让任何老旧手柄在PC游戏中完美工作：3步终极解决方案

如何让任何老旧手柄在PC游戏中完美工作：3步终极解决方案【免费下载链接】ViGEmBus Windows kernel-mode driver emulating well-known USB game controllers. 项目地址: https://gitcode.com/gh_mirrors/vi/ViGEmBus 还在为心爱的游戏手柄无法在PC上使用而烦…...

编程新知 2026/4/2 17:25:17

LeetCode 删除无效的括号：python 题解

简介 AI Agent 不仅仅是一个能聊天的机器人（如普通的 ChatGPT），而是一个能够感知环境、进行推理、自主决策并调用工具来完成特定任务的智能系统，更够完成更为复杂的AI场景需求。 AI Agent 功能根据查阅的资料，agent的…...

编程新知 2026/4/2 16:58:46

自动化智能体生成+外接MCP，我用 ModelEngine Nexent 5分钟手搓了一个小红书爆款收割机

前言：别让“工作流”困住了你的想象力在 AI Agent 爆发的这一年，作为开发者，我们采用过“工作流（Workflow）”开发，提示词开发。最近体验了 ModelEngine Nexent，它打出的 Slogan 是 “Your n…...

编程新知 2026/4/2 15:55:26

AI写专著超实用攻略：精选工具推荐，提升写作效率与质量

第一次尝试写学术专著的挑战与AI写作工具介绍对于第一次尝试写学术专著的研究者来说，写作的过程就像是一场充满挑战的冒险之旅，伴随着许多不确定的困难。在选题方面常常陷入困扰，难以在“具有价值”和“可行性”之间找到合适的平衡。有时选…...

编程新知 2026/4/2 15:22:58

Koodo Reader：您的跨平台电子书阅读解决方案，让阅读无处不在

Koodo Reader：您的跨平台电子书阅读解决方案，让阅读无处不在【免费下载链接】koodo-reader A modern ebook manager and reader with sync and backup capacities for Windows, macOS, Linux, Android, iOS and Web 项目地址: https://gitcode.com/Gi…...

编程新知 2026/4/2 15:08:42

告别除法器！用BCD8421码在Nexys4 DDR FPGA上高效驱动8位数码管（附完整Vivado工程）

基于BCD8421码的FPGA数码管驱动优化设计与实现在数字系统设计中，FPGA开发者经常面临如何在有限硬件资源下实现高效数据转换的挑战。传统方法使用除法器进行二进制到十进制转换，不仅消耗大量逻辑资源，还会引入额外的时序延迟。本文将深入探讨…...

编程新知 2026/4/2 14:17:47

自动化工具赋能工作流：如何用KeymouseGo提升效率与降低错误率

自动化工具赋能工作流：如何用KeymouseGo提升效率与降低错误率【免费下载链接】KeymouseGo 类似按键精灵的鼠标键盘录制和自动化操作模拟点击和键入 | automate mouse clicks and keyboard input 项目地址: https://gitcode.com/gh_mirrors/ke/KeymouseGo 在…...

编程新知 2026/4/2 14:11:41

Proxy最佳实践：企业级C++项目中如何正确使用多态库

Proxy最佳实践：企业级C项目中如何正确使用多态库【免费下载链接】proxy Proxy: Next Generation Polymorphism in C 项目地址: https://gitcode.com/gh_mirrors/pr/proxy 在当今的企业级C开发中，运行时多态性是构建可扩展、可维护系统的关键。传…...

编程新知 2026/4/2 12:42:07

QMK Toolbox终极指南：从零开始掌握键盘固件刷写的完整教程

QMK Toolbox终极指南：从零开始掌握键盘固件刷写的完整教程【免费下载链接】qmk_toolbox A Toolbox companion for QMK Firmware 项目地址: https://gitcode.com/gh_mirrors/qm/qmk_toolbox QMK Toolbox是机械键盘爱好者的必备神器，这款开源工具集…...

编程新知 2026/4/2 12:01:26