当前位置: 首页 > news >正文

【AIGC调研系列】AI大模型结合迁移学习进行微调的应用

AI大模型结合迁移学习进行微调的应用主要体现在通过预训练模型快速适应新任务,提高模型性能和准确性。迁移学习允许我们利用在其他任务上学到的知识来加速新任务的学习过程,从而减少对大量标注数据的依赖,提高训练效率[1][2][3]。在AI领域,特别是深度学习中,迁移学习已成为一种重要的技术,它通过微调(Fine-tuning)的方式,使得预训练模型能够在特定的新任务上取得更好的效果[4][5][6]。

微调是迁移学习中的一个关键步骤,它涉及在预训练模型的基础上调整参数以适应新的任务或领域。这种方法不仅可以节省大量的时间和计算资源,还能在许多情况下显著提高模型的性能[11][15]。例如,在自然语言处理、图像识别等领域,通过微调预训练的大模型,可以有效地提升模型在特定任务上的表现[8][18]。

此外,微调策略的选择对于迁移学习的效果至关重要。根据目标任务的性质和数据集的特点,可以选择全量微调或参数高效微调(PEFT)。全量微调意味着调整预训练模型的所有参数,而参数高效微调则是在保持模型性能的同时,尽量减少需要调整的参数数量,以达到更高的效率[25][26]。

在实际应用中,选择合适的迁移学习算法和微调策略,以及合理利用预训练模型的知识,是实现高效、准确模型定制的关键[3][29]。随着人工智能技术的不断发展,迁移学习及其微调方法将在更多AI任务中发挥重要作用,帮助解决数据稀缺、计算资源有限等问题[12][27]。

迁移学习在AI大模型微调中的最新进展是什么?

迁移学习在AI大模型微调中的最新进展主要体现在以下几个方面:

  1. 技术方法的创新与优化:最新的研究提出了基于结构解耦的参数高效微调新方法,这种方法通过减少需要更新的模型参数数量,显著降低了GPU内存和时间成本的需求,使得在资源受限的情况下也能快速有效地进行模型微调[34]。此外,还有研究通过迁移源模型的模型结构和微调参数,使目标模型继承源域的先验知识,从而提高性能[32]。
  2. 应用领域的拓展:大模型微调方法已经成为多种任务中表现出强大能力的通用迁移学习方法。这包括但不限于自然语言处理、图像识别、机器翻译等领域[33][40]。特别是在大型语言模型训练中,微调是最常见的方法之一,通过使用大规模数据集对语言模型进行预训练,然后针对新任务进行特定调整,以提高模型在新任务上的性能[38]。
  3. 性能提升与效率优化:通过微调,模型可以利用预训练模型在大规模数据集上学到的通用特征,同时针对新任务进行特定的调整,这不仅提高了模型在新任务上的性能,还缩短了模型的训练时间[35][40]。例如,UNC提出的高效迁移学习法「LST」能够在GPU内存上节约69%,这对于下游任务的微调尤为重要[39]。

迁移学习在AI大模型微调中的最新进展主要包括技术创新、应用领域的拓展以及性能与效率的双重优化。这些进展不仅推动了迁移学习技术的发展,也为解决实际问题提供了更有效、更高效的解决方案。

如何评估和选择最适合特定任务的微调策略?

评估和选择最适合特定任务的微调策略,首先需要明确目标任务的性质和数据集的特点,以此为基础选择合适的预训练模型。预训练模型应与目标任务具有一定的相关性,以便在进行微调时获得更好的效果[41][42]。接下来,根据任务需求和可用资源,选择适当的微调策略,这可能包括全微调、部分微调以及微调的层级和范围[42][44]。此外,参数的选择和调整也非常关键,如学习率、批量大小等参数都会影响微调的效果[41]。

在实践中,可以采用数据增强技术和正则化技术来提高微调的效果。数据增强通过对原始数据进行一些小的变换来生成新的数据,可以在一定程度上提高模型的泛化能力。正则化则通过在损失函数中增加一些惩罚项来约束模型的复杂度,从而避免过拟合现象的发生[41]。

评估指标的选择也是至关重要的一步。评估指标是用于评估微调后的模型在特定任务上的性能的标准,通常需要针对特定任务进行选择,以便在实际应用中得到最佳的性能[48]。在执行模型微调的过程中,还需要特别关注选择的微调策略是否与模型的特定需求相匹配[46]。

总结来说,评估和选择最适合特定任务的微调策略是一个综合考虑预训练模型的选择、微调策略的设定、参数调整以及评估指标选择的过程。每一步都需要根据目标任务的具体情况来细致考量,以确保最终的微调策略能够有效地提升模型在特定任务上的表现。

在自然语言处理和图像识别领域,哪些预训练模型最适合进行微调?

在自然语言处理(NLP)和图像识别领域,适合进行微调的预训练模型包括但不限于以下几种:

  1. TensorFlow Slim:在图像识别领域,TensorFlow Slim提供了微调模型的功能,帮助调整预训练模型的参数以提高识别准确率。这涉及到模型参数调整、层间连接和网络结构调整等方面[51][53]。
  2. BERT及其变体:Google's BERT是一个在NLP领域广泛使用的预训练模型,它通过大规模无标注数据进行自监督学习预训练,然后可以通过微调方法在特定的下游任务上进行优化[54][55]。
  3. GPT-2:OpenAI的GPT-2是另一个强大的NLP预训练模型,它同样支持通过微调来适应特定的任务[54]。
  4. VGG16:在图像识别领域,VGG16是一个常用的预训练模型,可以通过微调改进来适应新的图像识别任务[56]。
  5. PyTorch-Transformers库中的模型:这个库支持多个预训练框架和模型,包括但不限于BERT、GPT等,适用于NLP领域的微调[57]。
  6. 基于ImageNet的图片分类模型:这些模型通常用于图像识别任务的微调,可以通过更新所有模型参数或仅更新最终图层权重来进行[58]。
  7. GluonCV工具包提供的计算机视觉预训练模型:如果需要更多的计算机视觉领域的预训练模型,可以使用GluonCV工具包获取[59]。

对于自然语言处理和图像识别领域的微调任务,选择合适的预训练模型是非常重要的。上述提到的模型和工具包都是当前研究和应用中广泛使用和推荐的选项。

微调过程中如何平衡模型性能与计算资源的消耗?

在微调过程中平衡模型性能与计算资源的消耗,可以通过以下几种方法实现:

  1. 使用量化技术:通过将浮点数转换为低精度数值(如INT8、FP4和NF4),可以有效减少模型的大小和计算量,提高模型的运行效率。这些技术可以在保证模型精度的同时,实现高效的模型优化[61]。
  2. 参数高效微调:仅微调部分参数,而不是全部参数,可以大大降低计算和存储成本,同时还能实现与全量微调相当的性能。这种方法适用于解决大型语言模型微调问题[65]。
  3. 采用LoRA方法:LoRA是一种新方法,可以在保持模型性能的同时大幅减少微调的参数量,从而节省大量的计算资源和时间[64]。
  4. 优化内存使用量:通过研究和实施内存高效的微调方法(如QLORA),可以提高大模型微调的效率并大幅减少内存使用量[66]。
  5. 压缩/微调方法:这种方法可以在保持模型性能的同时,减少模型的参数量和计算量,从而降低模型的大小和功耗[67]。
  6. 利用预训练模型的通用特征:微调模型可以利用预训练模型中学习到的通用特征,从而提高模型在新任务上的收敛速度和性能。由于只需要微调部分层,因此可以大大减少计算资源的消耗[68]。

通过上述方法,可以在不牺牲太多模型性能的前提下,有效地控制计算资源的消耗,实现模型性能与计算资源消耗之间的平衡。

针对数据稀缺和计算资源有限的问题,有哪些创新的迁移学习方法?

针对数据稀缺和计算资源有限的问题,创新的迁移学习方法主要包括以下几种:

  1. 使用尽量少的数据和计算资源来训练机器学习模型:通过迁移学习、主动学习、数据增强和模型压缩等技术方法,在有限的资源条件下实现高效和准确的机器学习模型训练[72]。
  2. 迁移学习与自监督学习的结合:迁移学习利用从大规模数据集(例如ImageNet)预训练中学到的知识,并将其应用于具有有限标记数据的目标任务。自监督学习则侧重于使用不需要手动注释的借口任务来训练模型,使它们能够从大量未标记的数据中学习有价值的表示,然后可以针对下游任务对这些学习到的表示进行微调,从而减少对大量标记数据的需求[73]。
  3. 深度神经算子(Deep Neural Operators)用于迁移学习问题:提出了一种新的深度神经算子用于迁移学习问题,尤其针对条件偏移下的任务。该框架可用于快速高效的特定偏微分方程(PDE)学习和不确定性量化,利用再生核希尔伯特空间(RKHS)和条件嵌入算子理论的原理,构建了一种新的混合损失函数,并用于微调目标模型[74]。
  4. 选择预训练模型、微调策略、数据预处理、模型优化:在迁移学习中,选择合适的预训练模型、采用有效的微调策略、进行适当的数据预处理以及模型优化,都是提高模型性能的重要手段。这些技巧可以帮助在有限数据集上实现强大的模型性能[77]。
  5. 结合创新方案:如图神经网络、物理信息神经网络等主题的迁移学习结合创新方案,为解决实际问题提供了新的思路[78]。
  6. 深度可分离卷积:MobileNetV1 和 MobileNetV2 的成功展示了深度可分离卷积在资源受限设备上的应用潜力,显著降低了卷积神经网络(CNN)的计算和内存需求,同时保持足够的移动部署效率[79]。

这些方法和技术展示了在数据稀缺和计算资源有限的情况下,如何有效地利用迁移学习和其他相关技术来提高机器学习模型的性能和效率。

参考资料

1. 2024-04-02 问AI:介绍一下深度学习中的“迁移学习” 原创 - CSDN博客 [2024-04-02]

2. 模型迁移学习:实现AI大语言模型的跨领域应用原创 - CSDN博客 [2024-03-17]

3. 大模型训练:迁移学习在AI中的应用 - 百度开发者中心

4. 人工智能大模型原理与应用实战:迁移学习的应用与实战- 掘金 [2023-12-27]

5. 人工智能大模型原理与应用实战:迁移学习方法优化原创 - CSDN博客 [2023-12-19]

6. 人工智能大模型原理与应用实战:迁移学习的模型设计和实践_大模型领域迁移-csdn博客

7. 人工智能大模型原理与应用实战:迁移学习实践 - 51CTO博客 [2023-12-27]

8. Ai大模型应用入门实战与进阶:大模型与小数据:迁移学习实战-csdn博客 [2024-01-07]

9. 人工智能之迁移学习 - OFweek维科网 [2018-05-07]

10. 人工智能大模型原理与应用实战:迁移学习在实际场景中的运用- 掘金 [2023-12-19]

11. 大模型微调方法详解:从入门到精通 | 数据学习者官方网站(Datalearner) [2023-10-18]

12. AI迁移学习(Transfer Learning) - 51CTO博客 [2023-12-22]

13. 什么是迁移学习(Transfer Learning)?定义,优势,方法 [2021-10-14]

14. 迁移学习(transfer learning)领域有哪些比较新的研究方向? - 知乎

15. 大模型微调:深度学习模型优化的新策略 | 数据学习者官方网站(Datalearner) [2023-10-18]

16. 一文读懂在深度学习中使用迁移学习的好处 - 腾讯云 [2018-03-05]

17. Generative AI 新世界 | 大模型参数高效微调和量化原理概述 [2023-10-18]

18. 人工智能中的迁移学习综合指南 - 元宇宙头条 [2023-06-26]

19. 大模型微调:高效定制AI模型的策略 - 百度开发者中心

20. 迁移学习(Transfer learning) - 产品经理的人工智能学习库 [2022-08-15]

21. 人工智能大语言模型微调技术:SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法 [2023-10-11]

22. 大模型LLM微调技术方法汇总! - 知乎专栏 [2023-12-25]

23. AI 大模型Fine-Tuning 精调训练(微调)图文代码实战详解 - CSDN博客 [2024-03-16]

24. 元学习在人工智能迁移学习中的作用 - 稀土掘金 [2023-12-28]

25. 大模型微调(Fine-tuning):AI领域的个性化定制技术 - 知乎专栏 [2024-03-21]

26. 带你快速了解大模型微调原理 - 腾讯云

27. 极客时间AI大模型微调训练营「完zheng」 - 稀土掘金 [2024-02-16]

28. Transfer learning 【迁移学习综述_汇总】 - 知乎 - 知乎专栏

29. 总结!大模型微调(Tuning)的常见方法 - AI魔法学院 [2024-02-16]

30. Model-based Transfer Learning 基于模型的迁移学习概述 - 知乎 [2022-05-01]

31. Fast.ai推出NLP最新迁移学习方法「微调语言模型」 - 搜狐 [2018-01-21]

32. 《异构迁移学习》2023年最新综述 - 知乎 - 知乎专栏 [2023-10-31]

33. 大模型微调:迁移学习与泛化的探索-百度开发者中心 [2023-09-12]

34. [Aaai 2024] Dtl: 基于结构解耦的参数高效微调新方法 - 知乎 [2024-02-02]

35. 迁移学习中的常见技巧:微调(fine-tuning)_模型, finetune-CSDN博客 [2023-08-23]

36. 翻译: 迁移学习和微调Transfer learning & fine-tuning 原创 - CSDN博客 [2023-04-30]

38. 迁移学习在大型语言模型训练中的应用及常用方法 - 网易伏羲 [2023-07-19]

39. NeurIPS2022 | UNC 提出高效迁移学习法「LST」,GPU内存可节约69%(含源码) - 知乎 [2022-11-02]

40. 大模型微调:有效提升迁移学习效果的方法 - 百度智能云 [2023-07-29]

41. 解读大模型的微调:从理论到实践-百度开发者中心 [2024-01-07]

42. 大模型炼丹术:大模型微调的常见方法 - 知乎 - 知乎专栏

43. LLM常见问题解析:微调策略的实践与应用 - 百度智能云 [2024-04-02]

44. 什么是大模型微调?微调的分类、方法、和步骤 - 澳鹏 [2023-10-27]

45. 预训练大语言模型的三种微调技术总结:fine-tuning、parameter-efficient fine-tuning和prompt ...

46. 大模型微调:调整策略与效果评估 - 百度智能云 [2023-07-29]

47. 深度学习大模型微调方法探讨 - 百度开发者中心

48. 深度学习的微调学习:针对特定任务进行学习 - 稀土掘金 [2023-12-15]

49. 深度学习网络微调(fine-tune)的基本原理以及应用约束条件 - 博客园 [2023-04-26]

50. 大模型微调:调整策略与效果评估 - 百度开发者中心

51. 大模型微调:打造高效图像识别解决方案 - 百度智能云

52. 2021年预训练语言模型及微调的最新进展 - Csdn博客

53. 大模型微调:利用预训练模型进行高效图像识别 - 百度开发者中心

54. 8个非常好的NLP领域的预训练模型(包含代码和论文资源) | 数据学习者官方网站(Datalearner)

55. 计算机系研究团队在大规模语言预训练模型前沿领域取得新进展 [2023-03-05]

56. 使用||微调预训练模型||迁移学习原创 - CSDN博客 [2019-05-07]

57. 最强 NLP 预训练模型库 PyTorch-Transformers 正式开源:支持 6 个预训练框架,27 个预训练模型

58. PyTorch ImageNet 基于预训练六大常用图片分类模型的实战-腾讯云开发者社区-腾讯云

59. 9.2. 微调 — 《动手学深度学习》 文档 - Gluon

60. 大模型微调:基于预训练模型的图像识别 - 百度开发者中心

61. 大模型微调实战:使用int8/Fp4/Nf4进行高效性能优化-百度开发者中心 [2024-03-06]

62. 如何进行模型微调(Finetune) - 知乎 - 知乎专栏

63. 五种资源类别,如何提高大语言模型的资源效率,超详细综述来了 - 知乎 [2024-01-14]

64. LoRA:语言模型微调的计算资源优化策略 - 稀土掘金 [2024-02-05]

65. 大模型参数高效微调技术原理综述 - InfoQ 写作社区 [2024-01-16]

66. QLORA:大模型微调的内存高效方法 - 搜狐 [2023-11-16]

67. 大模型微调:优化深度学习效率的关键方法 - 百度开发者中心 [2024-04-01]

68. 大模型微调:提升模型性能的有效方法 - 稀土掘金 [2023-07-31]

69. 大模型微调:优化代码效率,降低执行代价 - 百度智能云 [2023-07-29]

70. 每日论文速递| 当缩放遇到LLM微调:数据、模型和微调方法的影响 [2024-03-02]

71. 迁移学习的未来:如何应对数据不足和计算资源有限的挑战-csdn博客 [2023-12-31]

72. 低资源机器学习:使用尽量少的数据和计算资源来训练机器学习模型-csdn博客 [2024-01-15]

73. 迁移学习和自监督学习的比较回顾:定义、应用、优点和局限性 [2023-12-02]

74. PINN论文精读(7):Deep transfer operator learning - 知乎

75. 迁移学习技巧:如何在有限数据集中实现强大的模型性能-csdn博客 [2024-01-02]

76. 迁移学习的未来:如何应对数据不足和计算资源有限的挑战- 掘金 [2023-12-30]

77. 迁移学习的优化技巧与实践-csdn博客

78. 顶会热点!迁移学习9个结合创新思路,让审稿人眼前一亮 - CSDN博客 [2024-03-27]

79. 深度学习--使用 MobileNet 进行迁移学习 - 知乎 - 知乎专栏 [2023-12-21]

80. 迁移学习全面指南:概念、应用、优势、挑战 - 腾讯云

相关文章:

【AIGC调研系列】AI大模型结合迁移学习进行微调的应用

AI大模型结合迁移学习进行微调的应用主要体现在通过预训练模型快速适应新任务,提高模型性能和准确性。迁移学习允许我们利用在其他任务上学到的知识来加速新任务的学习过程,从而减少对大量标注数据的依赖,提高训练效率[1][2][3]。在AI领域&am…...

低代码革新:软件开发的未来潜力与创新路径探索

过去的一年,挑战与机遇并存。人们一边忧虑市场经济下行所带来的新的增长难题、裁员危机,一边惊叹于AIGC、量子技术等领域不断涌现新的创新成果。 时代发生了改变,传统“互联网”的模式已走入尾声,新一轮的科技革命与产业变革正在到…...

AI智能校色解决方案,专业级画质提升

由于拍摄环境、设备性能以及编辑经验等多种因素的影响,视频画质往往难以达到理想状态。这时,一款高效、智能的校色解决方案就显得尤为重要。美摄科技凭借深厚的图像处理技术和AI算法研发实力,推出了全新的AI智能校色解决方案,助力…...

面试算法-148-轮转数组

题目 给定一个整数数组 nums,将数组中的元素向右轮转 k 个位置,其中 k 是非负数。 示例 1: 输入: nums [1,2,3,4,5,6,7], k 3 输出: [5,6,7,1,2,3,4] 解释: 向右轮转 1 步: [7,1,2,3,4,5,6] 向右轮转 2 步: [6,7,1,2,3,4,5] 向右轮转 3 步: [5,6,7,…...

Linux——静态库 共享库

1.库文件 1).库文件 库是一组预先编译好的方法的集合; Linux系统存储库的位置一般在/lib 和 /usr/lib (64位系统/usr/lib64) 库的头文件放在/usr/include 2).库的分类 静态库:libxxx.a(命名规则) 共享库:libxxx.so(命名规则) 3).准备文件: //add.c int add(int x,int y) { re…...

基于Spring Boot+Vue的在线拍卖系统

随着社会的发展,社会的各行各业都在利用信息化时代的优势。计算机的优势和普及使得各种信息系统的开发成为必需。 在线拍卖系统,主要的模块包括管理员;首页、个人中心、用户管理、商品类型管理、拍卖商品管理、历史竞拍管理、竞拍订单管理、…...

Unity构建详解(6)——SBP的Bundle写操作生成

以下三个操作实际上是为了得到构建Bundle需要的其他参数,最关键的Bundle组装参数在上文已经说过了,至于这三个操作的具体细节不用过于追究,一般不怎么会取修改。 这些参数采用命令模式被封装起来,这是常见的参数非常多的时候的处…...

2024新版PHP在线客服系统多商户AI智能在线客服系统源码机器人自动回复即时通讯聊天系统源码PC+H5

搭建环境: 服务器 CPU 2核心 ↑ 运存 2G ↑ 宽带 5M ↑ 服务器操作系统 Linux Centos7.6-7.9 ↑ 运行环境: 宝塔面板 Nginx1.18- 1.22 PHP 7.1-7.3 MYSQL 5.6 -5.7 朵米客服系统是一款全功能的客户服务解决方案,提供多渠道支持…...

使用GPT需要注意的事项

GPT出来之后,基本就告别浏览器搜索问题答案了。将问题原封不动的copy给GPT基本可以得到解答。 但是这个也有弊端,那就是太依赖GPT了。 1,使用GPT需要更强的专业知识:除了能问对问题,还要具备识别GPT&q…...

学习人工智能:为何PyTorch深度学习框架不可或缺

在人工智能(AI)的浩瀚领域中,深度学习作为其核心分支,正以其强大的数据处理能力、模式识别能力和预测能力引领着科技的飞速发展。而在深度学习的众多工具与框架中,PyTorch无疑是一颗璀璨的明星。本文将从PyTorch的特点…...

Python基于Tkinter的加法游戏

定制魏:QTWZPW,获取更多源码等 目录 题目概述 详细设计 函数设计 总体设计 重要代码...

基于Springboot4S店车辆管理系统

采用技术 基于Springboot4S店车辆管理系统的设计与实现~ 开发语言:Java 数据库:MySQL 技术:SpringBootMyBatis 工具:IDEA/Ecilpse、Navicat、Maven 页面展示效果 管理员功能 首页 销售员管理 维修员管理 客户管理 供应…...

深入浅出 -- 系统架构之分布式架构

​​​​​​分布式架构: 根据业务功能对系统做拆分,每个业务功能模块作为独立项目开发,称为一个服务。 当垂直应用越来越多时,应用之间的交互不可避免,可将共用的基础服务或核心模块抽取出来作为独立服务&#xff0c…...

6. Z 字形变换(Java)

目录 题目描述:输入:输出:代码实现: 题目描述: 将一个给定字符串 s 根据给定的行数 numRows ,以从上往下、从左到右进行 Z 字形排列。 比如输入字符串为 “PAYPALISHIRING” 行数为 3 时,排列如…...

【Linux入门】用户的基本指令

Linux操作系统又被称之为“核心(kernel)” 。但一般的用户,不能直接使用kernel,而要通过kernel的“外壳”程序——命令行解释器shell,来与 kernel 沟通。这是因为 kernel 对于一般的用户来说太过复杂,且不让…...

3.9 Python格式化字符串

Python格式化字符串(格式化输出) 我们之前讲到过 print() 函数的用法,这只是最简单最初级的形式,print() 还有很多高级的玩法,比如格式化输出,这就是本节要讲解的内容。 熟悉C语言 printf() 函数的读者能够…...

Linux驱动学习:从Linux主机nfs共享文件到uboot

第一步:在Linux主机上开启NFS服务,使用如下命令安装NFS服务: sudo apt-get install nfs-kernel-server rpcbind 第二步:创建一个文件夹用于共享,直接以nfs命名就行: 第三步:打开nfs服务配置文…...

Linux下场景模拟--cpu、内存打满测试

Linux下场景模拟–cpu、内存打满测试 打满CPU占用 编写脚本vi /root/cpu_run_full.sh vi /root/cpu_run_full.sh填写如下内容&#xff1a; #!/bin/bash function while_run_cpu() {while true;doi2;done }function cpu_full() {for ((i0; i<$1; i));dowhile_run_cpu &am…...

Vue中watch与计算属性computed

最近&#xff0c;写vue代码&#xff0c;判断父组件传来的type来作为条件判断&#xff0c;并用v-if v-else来控制页面展示。 起初用watch监听了type&#xff0c;发现值改变了&#xff0c;但是写在data配置项的visible属性书写错误&#xff0c;未实现响应式&#xff0c;如下&…...

nginx部署前端教程

目录 一、前言二、部署三、注意四、参考 一、前言 一般来说现在的软件项目&#xff0c;都是分用户端以及管理端的&#xff0c;并且是前后端分离的&#xff0c;这里我来记录一下部署两个前端的教程。 部署前端之前需要的准备工作是部署springBoot后端程序&#xff0c;这里我do…...

Vim 调用外部命令学习笔记

Vim 外部命令集成完全指南 文章目录 Vim 外部命令集成完全指南核心概念理解命令语法解析语法对比 常用外部命令详解文本排序与去重文本筛选与搜索高级 grep 搜索技巧文本替换与编辑字符处理高级文本处理编程语言处理其他实用命令 范围操作示例指定行范围处理复合命令示例 实用技…...

[2025CVPR]DeepVideo-R1:基于难度感知回归GRPO的视频强化微调框架详解

突破视频大语言模型推理瓶颈,在多个视频基准上实现SOTA性能 一、核心问题与创新亮点 1.1 GRPO在视频任务中的两大挑战 ​安全措施依赖问题​ GRPO使用min和clip函数限制策略更新幅度,导致: 梯度抑制:当新旧策略差异过大时梯度消失收敛困难:策略无法充分优化# 传统GRPO的梯…...

(十)学生端搭建

本次旨在将之前的已完成的部分功能进行拼装到学生端&#xff0c;同时完善学生端的构建。本次工作主要包括&#xff1a; 1.学生端整体界面布局 2.模拟考场与部分个人画像流程的串联 3.整体学生端逻辑 一、学生端 在主界面可以选择自己的用户角色 选择学生则进入学生登录界面…...

YSYX学习记录(八)

C语言&#xff0c;练习0&#xff1a; 先创建一个文件夹&#xff0c;我用的是物理机&#xff1a; 安装build-essential 练习1&#xff1a; 我注释掉了 #include <stdio.h> 出现下面错误 在你的文本编辑器中打开ex1文件&#xff0c;随机修改或删除一部分&#xff0c;之后…...

家政维修平台实战20:权限设计

目录 1 获取工人信息2 搭建工人入口3 权限判断总结 目前我们已经搭建好了基础的用户体系&#xff0c;主要是分成几个表&#xff0c;用户表我们是记录用户的基础信息&#xff0c;包括手机、昵称、头像。而工人和员工各有各的表。那么就有一个问题&#xff0c;不同的角色&#xf…...

Linux云原生安全:零信任架构与机密计算

Linux云原生安全&#xff1a;零信任架构与机密计算 构建坚不可摧的云原生防御体系 引言&#xff1a;云原生安全的范式革命 随着云原生技术的普及&#xff0c;安全边界正在从传统的网络边界向工作负载内部转移。Gartner预测&#xff0c;到2025年&#xff0c;零信任架构将成为超…...

TRS收益互换:跨境资本流动的金融创新工具与系统化解决方案

一、TRS收益互换的本质与业务逻辑 &#xff08;一&#xff09;概念解析 TRS&#xff08;Total Return Swap&#xff09;收益互换是一种金融衍生工具&#xff0c;指交易双方约定在未来一定期限内&#xff0c;基于特定资产或指数的表现进行现金流交换的协议。其核心特征包括&am…...

【AI学习】三、AI算法中的向量

在人工智能&#xff08;AI&#xff09;算法中&#xff0c;向量&#xff08;Vector&#xff09;是一种将现实世界中的数据&#xff08;如图像、文本、音频等&#xff09;转化为计算机可处理的数值型特征表示的工具。它是连接人类认知&#xff08;如语义、视觉特征&#xff09;与…...

selenium学习实战【Python爬虫】

selenium学习实战【Python爬虫】 文章目录 selenium学习实战【Python爬虫】一、声明二、学习目标三、安装依赖3.1 安装selenium库3.2 安装浏览器驱动3.2.1 查看Edge版本3.2.2 驱动安装 四、代码讲解4.1 配置浏览器4.2 加载更多4.3 寻找内容4.4 完整代码 五、报告文件爬取5.1 提…...

push [特殊字符] present

push &#x1f19a; present 前言present和dismiss特点代码演示 push和pop特点代码演示 前言 在 iOS 开发中&#xff0c;push 和 present 是两种不同的视图控制器切换方式&#xff0c;它们有着显著的区别。 present和dismiss 特点 在当前控制器上方新建视图层级需要手动调用…...