当前位置：首页 > news >正文

01.大模型起源与发展

news 2026/2/11 4:37:17

知识点

注意力机制（Attention）的主要用途是什么？
1. 选择重要的信息并忽略不相关的信息
Transformer 模型是基于什么理论构建的？
1. C. 注意力机制（Attention）
GPT 和 BERT 的主要区别是什么？
1. C. GPT 使用了单向自注意力，而 BERT 使用了双向自注意力
在注意力机制中，“Q”、“K”和“V”分别代表什么？
1. 查询、密钥和值
Transformer 模型是如何解决长距离依赖问题的？
1. 通过注意力机制（Attention）
GPT 主要用于哪种类型的任务？(ChatGPT =N*Agent+chat-4)
1. 生成任务
以下哪项是 BERT 的主要创新之处
1. 使用了双向自注意力机制
在 Transformer 模型中，自注意力机制的主要作用是什么？
1. 识别输入中的关键信息
基于 Transformer 的模型，如 GPT 和 BERT，主要适用于哪些任务？
1. 自然语言处理
注意力机制最早是在哪个领域得到应用的？
1. 自然语言处理
以下哪些方法被用于处理序列数据？
1. 递归神经网络（RNN）
2. 卷积神经网络（CNN）
3. 注意力机制（Attention）
以下哪些模型使用了注意力机制？
1. BERT
2. GPT
以下哪些模型主要用于自然语言处理任务？
1. GPT
2. BERT
下列哪些说法正确描述了注意力机制的作用？
1. 它可以用来挑选出重要的信息并忽略不相关的信息
2. 它可以用来生成高质量的词嵌入
下列哪些说法正确描述了 BERT 模型？
1. BERT 模型是基于 Transformer 的
2. BERT 模型使用了双向自注意力机制
Bert 是基于编码器，GPT 是基于解码器，不是编码和解码一块用吗？
1. BERT（Bidirectional Encoder Representations from Transformers）和 GPT（Generative Pretrained Transformer）确实分别采用了基于编码器和解码器的结构，但他们的运用方式有所不同。
2. BERT 利用了 Transformer 中的编码器结构，编码器能够处理输入序列的所有元素，然后输出一个新的已经被处理过的序列。最重要的是，编码器在处理序列的时候是双向的，也就是说，在处理某个元素时，它会同时考虑到该元素的上下文，包括它前面和后面的元素。这就使得 BERT 在处理自然语言处理任务时，具有更好的上下文理解能力。
3. 而 GPT 则采用了 Transformer 中的解码器结构，这个结构通常被用于生成序列。与编码器不同的是，解码器在处理序列的时候是单向的，即在处理某个元素时，只会考虑到该元素之前的元素，不会考虑到后面的元素。这就使得 GPT 非常适合用于生成型的自然语言处理任务，如文本生成、对话系统等。
4. 编码和解码一块使用，通常出现在 seq2seq（序列到序列）模型中，例如机器翻译或者文本摘要等任务，输入序列首先通过编码器处理，然后解码器生成输出序列。这种模式并没有在 BERT 或 GPT 中直接使用，而是被一些其它的模型，如 T5 或 BART 所使用。

NLP 语言模型技术发展一览

阶段	时间	代表性成果	数据规模	技术栈
人工规则	1950年代-1990年代	基于手工设计的规则系统	少量规则集	基于专家知识和规则的系统
统计机器学习	1990年-2012年	HMM, CTF, SVM	百万级标注数据	统计机器学习算法
深度学习	2013年-2018年	Encoder-Decoder Word2vec, Attention	十亿级标注数据	深度神经网络 + 框架
预训练	2018年-2020年	Transformer. ELMo. GPT-1, BERT, GPT-2, GPT-3	数千亿未标注数据	Pre-training + Fine-tuning
大语言模型	2020年一至今	GPT-3.5,GPT-4,GPT-4o	更大规模用户数据	Instruction-tuning Prompt-tuning RLHF

预训练语言模型 (Pre-trained language models)

在这里插入图片描述

预训练语言模型的三种网络架构（2018-2020）

在这里插入图片描述

生成式预训练转换器（GPT-1） [Radford等人，2018 年]

在这里插入图片描述

半监督序列学习 context2Vec 预训练的 seq2seq

在这里插入图片描述

已公开信息 GPT 3 参数为175B参数

三个关键概念

In-Context Learning

在上下文中学习指的是大型语言模型如GPT-3的一种能力，即在给定的上

下文中使用新的输入来改善模型的输出。这种学习方式并不涉及到梯度更新或微调模型的参数，

而是通过提供一些具有特定格式或结构的示例输入，使模型能够在生成输出时利用这些信息。例

如，如果你在对话中包含一些英法翻译的例子，然后问模型一个新的翻译问题，模型可能会根据

你提供的上下文示例生成正确的翻译。

Few-Shot Learning

少样本学习是指用极少量的标注样本来训练机器学习模型的技术。在GPT- 3的案例中，少样本学习的实现方式是向模型提供少量的输入-输出对示例，这些示例作为对话的

一部分，描述了模型应该执行的任务。然后，模型会生成一个输出，该输出是对与示例类似的新

输入的响应。例如，你可以给模型提供几个英法翻译的例子，然后给出一个新的英文单词让模型

翻译，模型会尝试产生一个正确的翻译。

Prompt Engineering

提示工程是指设计和优化模型的输入提示以改善模型的输出。在大型语言

模型中，如何提问或构造输入的方式可能对模型的输出有重大影响。因此，选择正确的提示对于

获取有用的输出至关重要。例如，为了让GPT-3生成一个诗歌，你可能需要提供一个详细的、引

导性的提示，如“写一首关于春天的十四行诗”而不仅仅是“写诗”

Pre-Trained LM + Fine-Tuning 范式

在这里插入图片描述

模型预训练与微调

在 GPT 模型的演进过程中，OpenAI 采用了一系列的训练策略，这包括基础的大规模预训练，也包括后

续的指令微调等方法。这两种策略在模型的训练过程中起到了不同的作用。

• 预训练(Pre-Trained)：大规模预训练是为了使模型获取丰富的语言知识和理解能力。在预训练过程

中，模型通过大量的无标签数据来学习语言的基础知识，这一过程主要是依赖无监督学习的。

• 指令微调(Instruction-Tuning)：在预训练模型的基础上，通过针对特定任务的标注数据进行微调，

能够使模型在特定任务上的表现得到提升。同时，通过对微调数据的精心设计和选择，还能够引导模

型按照人类的预期来执行任务。这一过程主要依赖有监督学习。

在这个过程中，预训练和微调是相辅相成的。预训练为模型提供了丰富的语言知识，而微调则利用这些

知识来解决特定的任务。然而，微调的数据量通常比预训练的数据量要少得多，因此微调的主要作用并

不是为模型注入新的知识，而是激发和引导模型利用已有的知识来完成特定任务。

在GPT模型的演进过程中，OpenAI还探索了多种微调策略，例如GPT-3.5的分化技能树等。这些微调策

略能够帮助模型在不同的任务上表现得更好，同时也使模型的输出更符合人类的预期。

此外，OpenAI还注意到，模型在进行微调时可能会出现一些问题，例如数据稀疏性、灾难遗忘、资源

浪费和通用性差等。为了解决这些问题，OpenAI提出了一种新的训练策略，即提示学习。通过设计提

示信息，可以激发预训练大模型的能力，从而提高模型在具体任务上的表现。

:::info
现常见可落地方式为本地大模型+RAG、第三方大模型+RAG、微调大模型私有化部署、构建大模型

:::

ChatGPT三段训练法

在这里插入图片描述

提示工程

Prompt Learning vs In-context Learning

**Prompt learning **是一种使用预训练语言模型的方法，它不会修改模型的权重。在这种方法中，模型

被给予一个提示（prompt），这个提示是模型输入的一部分，它指导模型产生特定类型的输出。这

个过程不涉及到对模型权重的修改，而是利用了模型在预训练阶段学习到的知识和能力。

**In-context learning **是指模型在处理一系列输入时，使用前面的输入和输出作为后续输入的上下

文。这是Transformer模型（如GPT系列）的一种基本特性。例如，当模型在处理一个对话任务时，

它会使用对话中的前几轮内容作为上下文，来生成下一轮的回答。这个过程也不涉及到对模型权重的

修改。

总的来说，prompt learning和in-context learning都是利用预训练语言模型的方法，它们都不会修改模

型的权重。它们的主要区别在于，prompt learning关注的是如何通过设计有效的提示来**引导模型的输**

出，而in-context learning则关注的是如何**利用输入序列中的上下文信息**来影响模型的输出

Prompt Learning vs Prompt Tuning

Prompt learning和prompt tuning都是自然语言处理（NLP）中的概念，它们都与如何使用和优化预

训练语言模型（例如GPT-3或GPT-4）有关。

•** Prompt learning**：是一种方法，其中模型被训练以响应特定的提示（prompt）。在这种情况下，

提示是模型输入的一部分，它指导模型产生特定类型的输出。例如，如果你向模型提供了"Translate

the following English text to French: {text}"这样的提示，模型就会学习到这是一个翻译任务，并尝试

将{text}从英语翻译成法语。这种方法的关键在于找到能够引导模型正确响应的有效提示。

• Prompt tuning，又称为"prompt engineering"，是一种优化技术，它涉及到寻找或生成能够最大限

度提高模型性能的提示。这可能涉及到使用启发式方法、人工智能搜索算法，或者甚至是人工选择和

优化提示。Prompt tuning的目标是找到一种方式，使得当给定这个提示时，模型能够生成最准确、

最相关的输出。

总的来说，prompt learning和prompt tuning都与如何使用和优化模型的输入提示有关。它们的主要区

别在于，prompt learning更关注于如何训练模型以响应特定的提示，而prompt tuning则更关注于如何

找到或生成最优的提示以提高模型的性能

思维链

Chain-of-Thought Prompting

**CoT Prompting **作为一种促进语言模型推理的方法具有几个吸引人的特点：

• 首先，从原则上讲，CoT 允许模型将多步问题分解为中间步骤，这意味着可以将额外计算资源分配

给需要更多推理步骤的问题。

• 其次，CoT 提供了对模型行为的可解释窗口，提示了它可能是如何得出特定答案的，并提供了调试

推理路径错误之处的机会（尽管完全描述支持答案的模型计算仍然是一个未解决问题）。

• 第三，在数学应用题、常识推理和符号操作等任务中都可以使用思维链推理（CoT Reasoning），

并且在原则上适用于任何人类能够通过语言解决的任务。

• 最后，在足够大规模现成语言模型中很容易引发 CoT Reasoning ，只需在少样本提示示例中包含一

些连贯思路序列即可

错误
在这里插入图片描述

正确
在这里插入图片描述

在这里插入图片描述

思维链

对于小模型来说，CoT Prompting无法带来性能提升，甚至可能带来性能的下降。
对于大模型来说，CoT Prompting涌现出了性能提升。
CoT Prompting能获得更多的性能收益。3.对于复杂的问题

CoT Prompt ：Think step-by-step

在这里插入图片描述

自洽性（Self-Consistency）：多路径推理

通过思维链，我们可以看到大语言模型的强与弱：

它强在，模型规模的提高，让语义理解、符号映射、连贯文本生成等能力跃升，从而让多步骤推理的思维链成为可能，带来“智能涌现”
它弱在，即使大语言模型表现出了前所未有的能力，但思维链暴露了它，依然是鹦鹉学舌，而非真的产生了意识。

没有思维链，大模型几乎无法实现逻辑推理。

但有了思维链，大语言模型也可能出现错误推理，尤其是非常简单的计算错误。Jason Wei 等的

论文中，曾展示过在 GSM8K 的一个子集中，大语言模型出现了 8% 的计算错误，比如6 * 13 =

68（正确答案是78）

思维树（Tree-of-Thoughts, ToT）

在这里插入图片描述

ToT 工作原理解读： Step 1 思维分解

虽然CoT样本以连贯的方式呈现思维，没有明确的分解过程，但ToT利用问题属性来设计

和分解中间思维步骤。如下表所示，根据不同的问题，一个思维可以是几个词（填字游

戏），一行方程式（24点游戏），或者是整段写作计划（创意写作）。

总体而言，一个思维应该足够“小”，以便语言模型能够生成有前景且多样化的样本（例如

生成整本书通常太“大”而无法连贯），同时又足够“大”，以便语言模型能够评估其对于问

题求解的前景（例如仅生成一个标记通常太“小”无法评估）。

在这里插入图片描述

ToT 工作原理解读： Step 2 思维生成

定义思维生成器 G(pθ, s, k)：给定一个树状态 s = [x, z1···i]，我们考虑两种策略来为下一个思维步骤生成 k 个候选项：

从 CoT 提示（创意写作）中独立同分布地抽样思维：z(j) ∼ pCoT (zi+1|s) = pCoT(zi+1|x, z1···i) (j = 1 · · · k)。当思维空间丰富时（例如每个思维是一段落），独立同分布的样本能够带来多样性；
使用“提议提示”逐个提出思维（24点游戏和迷你填字游戏）：[z(1),· · ·, z(k)] ∼ppropose(z(1···k)|s)。当思维 θ i+1 空间更受限制时（例如每个思维只是一个词或一行），在相同语境中提出不同的想法可以避免重复。

ToT 工作原理解读： Step 3 状态评估

定义状态评估器V(pθ,S)：给定一组不同状态的前沿，状态评估器评估它们解决问题的进展情况，作为搜索算

法确定哪些状态继续探索以及以何种顺序进行的启发式方法。虽然启发式方法是解决搜索问题的标准方法之

一，但通常要么是编程实现（例如DeepBlue），要么是学习模型（例如AlphaGo ）。

作者提出了第三种选择，即使用语言模型有意识地推理状态。在适用时，这样一个有意识的启发式方法可以

比编程规则更灵活，并且比学习模型更节约样本。与思维生成器类似，我们考虑两种策略来独立或同时评估

状态：

独立地对每个状态进行价值评估：V(pθ,S)(s) ∼ pvalue(v|s)，其中值 θ 通过对状态 s 进行推理生成一个标量值 v（例如1-10）或分类结果（例如sure/likely/impossible），该分类结果可以被启发性地转化为一个值。这种评价推理的基础可能因问题和思考步骤而异。在这项工作中，我们通过少数向前看模拟（例如快速确认5、5、14可以通过5 + 5 + 14达到24, 或者“hot l”可以表示“inn”通过在“ ”中填充“e”）以及常识（例如1 2 3太小无法达到24，或者没有单词能以“tzxc”开头）来探索评估。虽然前者可能促进“好”的状态，但后者可以帮助消除“坏”的状态。这样的评估不需要完美，只需要近似即可。
跨多个状态进行投票：V(pθ,S)(s)=1[s=s∗]，其中一个被投票淘汰的"好"状态∗ ∼pvote(s∗|S)，是基于对 S中不同状态进行有意比较的投票提示。当问题成功更难直接价值化时（例如段落连贯性），自然而然地会转而比较不同的部分解决方案，并为最有希望的解决方案投票。这与一种"逐步"自洽策略类似，即将 “要探索哪个状态” 视为多项选择问答，并使用语言模型样本对其进行投票。

对于这两种策略，我们可以多次提示语言模型来聚合值或投票结果，以换取更忠实/稳健的启发式方法所需的

时间/资源/成本

ToT 工作原理解读： Step 4 搜索算法

最后，在ToT框架内，可以根据树结构插入和使用不同的搜索算法。作者探索了两种相对简单的搜索算法，

并将更高级的算法（例如A* 今儿MCTS）留给未来的工作：

(a) 广度优先搜索（ToT-BFS）每步维护一组最有希望的状态集合b个。这适用于24点游戏和创意写作等树深

度受限制（T ≤ 3），并且初始思考步骤可以评估和修剪为一个小集合（b ≤ 5）。

(b) 深度优先搜索（ToT-DFS）首先探索最有希望的状态，直到达到最终输出结果(t > T)，或者状态评估器认

为无法解决当前问题。在后一种情况下，从s开始的子树被修剪以进行开发与利用之间的权衡。在这两种情况

下，DFS会回溯到s的父状态以继续探索。

从概念上讲，ToT作为LM通用问题求解方法具有几个优势：

泛化性。IO、CoT、CoT-SC和自我完善都可以看作是ToT的特殊情况（即有限深度和广度的树；图1）
模块化。基本LM以及思考分解、生成、评估和搜索过程都可以独立变化。
适应性。可以适应不同的问题属性、LM能力和资源约束。
方便性。无需额外训练，只需要一个预训练好的LM就足够

01.大模型起源与发展

知识点注意力机制（Attention）的主要用途是什么？ 选择重要的信息并忽略不相关的信息 Transformer 模型是基于什么理论构建的？ C. 注意力机制（Attention） GPT 和 BERT 的主要区别是什么？ C. GPT…...

编程日记 2024/12/20 9:09:40

leetcode刷题日记03——javascript

题目3： 回文数https://leetcode.cn/problems/palindrome-number/ 给你一个整数 x ，如果 x 是一个回文整数，返回 true ；否则，返回 false 。回文数是指正序（从左向右）和倒序（从右向…...

编程日记 2024/12/20 9:08:38

vue横向滚动日期选择器组件

vue横向滚动日期选择器组件组件使用到了element-plus组件库和dayjs库，使用前先保证项目中已经下载导入主要功能：选择日期，点击日期可以让此日期滚动到视图中间，左滑右滑同理，支持跳转至任意日期，支持自…...

编程日记 2024/12/20 9:07:37

【大模型】大模型项目选择 RAGvs微调？

RAG 输入问题，在知识库匹配知识，构建提示词：基于{知识}回答{问题} 微调用知识问答对重新训练大模型权重，输入问题到调整后的大模型如何选择如果业务要求较高，RAG和微调可以一起使用 1-动态数据选择RAG 原因&a…...

编程日记 2024/12/20 9:05:35

2024年12月CCF-GESP编程能力等级认证Python编程一级真题解析

本文收录于专栏《Python等级认证CCF-GESP真题解析》，专栏总目录：点这里，订阅后可阅读专栏内所有文章。一、单选题（每题 2 分，共 30 分）第 1 题 2024年10月8日，诺贝尔物理学奖“意外地”颁给了两位计算机科学家约翰霍普菲尔德（John J. Hopfield）和杰弗里辛顿（Geof…...

编程日记 2024/12/20 9:04:34

【机器学习】元学习（Meta-learning）

云边有个稻草人-CSDN博客目录引言一、元学习的基本概念 1.1 什么是元学习？ 1.2 元学习的与少样本学习的关系二、元学习的核心问题与挑战 2.1 核心问题 2.2 挑战三、元学习的常见方法 3.1 基于优化的元学习 3.1.1 MAML（Model-Agnostic Meta…...

编程日记 2024/12/20 9:02:31

详解Redis的String类型及相关命令

目录 SET GET MGET MSET SETNX SET和SETNX和SETXX对比 INCR INCRBY DECR DECRBY INCRBYFLOAT APPEND GETRANGE SETRANGE STRLEN 内部编码 SET 将 string 类型的 value 设置到 key 中。如果 key 之前存在，则覆盖，⽆论原来的数据类型是什么…...

编程日记 2024/12/20 9:01:30

android RadioButton + ViewPager+fragment

RadioGroup viewpage fragment 组合显示导航栏 1、首先主界面的布局控件就是RadioGroup viewpage <?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"http://schemas.android.com/apk/res/android"xmlns:tools…...

编程日记 2024/12/20 8:58:25

给机器装上“脑子”—— 一文带你玩转机器学习

目录一、引言：AI浪潮中的明星——机器学习二、机器学习的定义与概念 1. 机器学习与传统编程的区别 2. 机器学习的主要任务类型 3. 机器学习的重要组成部分三、机器学习的工作原理：从数据到模型的魔法之旅 1. 数据收集与预处理——数据是机器的…...

编程日记 2024/12/20 8:56:22

论文笔记：是什么让多模态学习变得困难？

整理了What Makes Training Multi-modal Classification Networks Hard? 论文的阅读笔记背景方法OGR基于最小化OGR的多监督信号混合在实践中的应用实验背景直观上，多模态网络接收更多的信息，因此它应该匹配或优于其单峰网络。然而，最好的…...

编程日记 2024/12/20 8:55:18

ChatGPT Search开放：实时多模态搜索新体验

点击访问 chatTools 免费体验GPT最新模型，包括o1推理模型、GPT4o、Claude、Gemini等模型！ ChatGPT Search：功能亮点解析本次更新的ChatGPT Search带来了多项令人瞩目的功能，使其在搜索引擎市场中更具竞争力。 1. 高级语音模式&…...

编程日记 2024/12/20 8:54:17

实验环境： [root192 ~]# cat /etc/system-release CentOS Linux release 7.9.2009 (Core)下载二进制压缩包 a. 官网下载地址： https://download.docker.com/linux/static/stable/x86_64/b. 阿里云下载地址 https://mirrors.aliyun.com/docker-ce/lin…...

编程日记 2024/12/20 8:53:16

C语言函数在调用过程中具体是怎么和栈互动的？

从栈开始的一场C语言探险记 —— C语言函数是如何与栈"共舞"的。栈的舞步解析通过一个简单的例子来看看这支"舞蹈"： int add(int a, int b) {int result a b;return result; }int main() {int x 10;int y 20;int sum add(x, y);retur…...

编程日记 2024/12/20 8:51:13

【Java中常见的异常及其处理方式】

🌈个人主页: Aileen_0v0 🔥热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法 💫个人格言:“没有罗马,那就自己创造罗马~” 文章目录字符串修改的实现——StringBuilder和StringBuffer异常常见异常①算数异常②数组越界异常③空指针异…...

编程日记 2024/12/20 8:48:10

如何更新项目中的 npm 或 Yarn 依赖包至最新版本

要升级 package.json 文件中列出的包，你可以使用 npm（Node Package Manager）或 yarn。以下是两种工具的命令来更新你的依赖项： 使用 npm 更新所有包到最新版本 npm update如果你想将所有依赖项更新到其各自最新的大版本&#xf…...

编程日记 2024/12/20 8:45:07

SpringBoot3整合FastJSON2如何配置configureMessageConverters

在 Spring Boot 3 中整合 FastJSON 2 主要涉及到以下几个步骤，包括添加依赖、配置 FastJSON 作为 JSON 处理器等。下面是详细的步骤： 1. 添加依赖首先，你需要在你的 pom.xml 文件中添加 FastJSON 2 的依赖。以下是 Maven 依赖的示例&#…...

编程日记 2024/12/20 8:44:06

《Vue3实战教程》2：Vue3快速上手

如果您有疑问，请观看视频教程《Vue3实战教程》快速上手线上尝试 Vue 想要快速体验 Vue，你可以直接试试我们的演练场。如果你更喜欢不用任何构建的原始 HTML，可以使用 JSFiddle 入门。如果你已经比较熟悉 Node.js 和构建工具等概念…...

编程日记 2024/12/20 8:39:01

ubuntu 24.04.1安装FTP流程

1、安装vsftpd： sudo apt update sudo apt install vsftpd 2、安装后重启查看vsftpd状态 sudo systemctl status vsftpd 输出如下所示，表明vsftpd服务处于活动状态并正在运行： * vsftpd.service - vsftpd FTP server Loaded: loaded (/…...

编程日记 2024/12/20 8:35:59

多功能护照阅读器港澳通行证阅读机RS232串口主动输出协议，支持和单片机/Linux对接使用

此护照阅读器支持护照、电子芯片护照、港澳通行证、台湾通行证，和串口的被动的方式不一样。此护照阅读器通电后，自动读卡，串口输出，软件只需要去串口监听数据即可，例如用串口助手就可以收到读卡信息。非常适用于单片…...

编程日记 2024/12/20 8:32:54

5个用于构建Web应用程序的Go Web框架

探索高效Web开发的顶级Go框架 Go（或称为Golang）以其简洁性、高效性和出色的标准库而闻名。然而，有几个流行的Go Web框架和库为构建Web应用程序提供了额外的功能。以下是五个最值得注意的Go框架： 1. Gin： Gin是一个高…...

编程日记 2024/12/20 8:26:47

Prompt Tuning、P-Tuning、Prefix Tuning的区别

一、Prompt Tuning、P-Tuning、Prefix Tuning的区别 1. Prompt Tuning（提示调优）核心思想：固定预训练模型参数，仅学习额外的连续提示向量（通常是嵌入层的一部分）。实现方式：在输入文本前添加可训练的连续向量（软提示），模型只更新这些提示参数。优势：参数量少（仅提…...

编程新知 2026/2/11 1:23:00

边缘计算医疗风险自查APP开发方案

核心目标：在便携设备（智能手表/家用检测仪）部署轻量化疾病预测模型，实现低延迟、隐私安全的实时健康风险评估。一、技术架构设计 #mermaid-svg-iuNaeeLK2YoFKfao {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg…...

编程新知 2026/2/10 13:18:55

centos 7 部署awstats 网站访问检测

一、基础环境准备（两种安装方式都要做） bash # 安装必要依赖 yum install -y httpd perl mod_perl perl-Time-HiRes perl-DateTime systemctl enable httpd # 设置 Apache 开机自启 systemctl start httpd # 启动 Apache二、安装 AWStats&#xff0…...

编程新知 2026/1/23 8:33:56

使用分级同态加密防御梯度泄漏

抽象联邦学习 （FL） 支持跨分布式客户端进行协作模型训练，而无需共享原始数据，这使其成为在互联和自动驾驶汽车 （CAV） 等领域保护隐私的机器学习的一种很有前途的方法。然而，最近的研究表明&…...

编程新知 2026/1/24 6:22:43

转转集团旗下首家二手多品类循环仓店“超级转转”开业

6月9日，国内领先的循环经济企业转转集团旗下首家二手多品类循环仓店“超级转转”正式开业。转转集团创始人兼CEO黄炜、转转循环时尚发起人朱珠、转转集团COO兼红布林CEO胡伟琨、王府井集团副总裁祝捷等出席了开业剪彩仪式。据「TMT星球」了解，“超级…...

编程新知 2026/2/8 4:08:40

2025盘古石杯决赛【手机取证】

前言第三届盘古石杯国际电子数据取证大赛决赛最后一题没有解出来，实在找不到，希望有大佬教一下我。还有就会议时间，我感觉不是图片时间，因为在电脑看到是其他时间用老会议系统开的会。手机取证 1、分析鸿蒙手机检材&#x…...

编程新知 2026/1/29 17:12:17

ArcGIS Pro制作水平横向图例+多级标注

今天介绍下载ArcGIS Pro中如何设置水平横向图例。之前我们介绍了ArcGIS的横向图例制作：ArcGIS横向、多列图例、顺序重排、符号居中、批量更改图例符号等等（ArcGIS出图图例8大技巧），那这次我们看看ArcGIS Pro如何更加快捷的操作。…...

编程新知 2026/2/4 17:18:03

学习STC51单片机32（芯片为STC89C52RCRC）OLED显示屏2

每日一言今天的每一份坚持，都是在为未来积攒底气。案例：OLED显示一个A 这边观察到一个点，怎么雪花了就是都是乱七八糟的占满了屏幕。。解释 ： 如果代码里信号切换太快（比如 SDA 刚变，SCL 立刻变&#…...

编程新知 2026/2/6 0:50:24

QT3D学习笔记——圆台、圆锥

类名作用Qt3DWindow3D渲染窗口容器QEntity场景中的实体（对象或容器）QCamera控制观察视角QPointLight点光源QConeMesh圆锥几何网格QTransform控制实体的位置/旋转/缩放QPhongMaterialPhong光照材质（定义颜色、反光等）QFirstPersonC…...

编程新知 2026/1/29 5:26:37

STM32HAL库USART源代码解析及应用

STM32HAL库USART源代码解析前言STM32CubeIDE配置串口USART和UART的选择使用模式参数设置GPIO配置DMA配置中断配置硬件流控制使能生成代码解析和使用方法串口初始化__UART_HandleTypeDef结构体浅析HAL库代码实际使用方法使用轮询方式发送使用轮询方式接收使用中断方式发送使用中…...

编程新知 2026/1/31 13:18:46

知识点

NLP 语言模型技术发展一览

预训练语言模型 (Pre-trained language models)

预训练语言模型的三种网络架构（2018-2020）

生成式预训练转换器 （GPT-1） [Radford等人，2018 年]

半监督序列学习 context2Vec 预训练的 seq2seq

三个关键概念

In-Context Learning

Few-Shot Learning

Prompt Engineering

Pre-Trained LM + Fine-Tuning 范式

模型预训练与微调

ChatGPT三段训练法

提示工程

Prompt Learning vs In-context Learning

Prompt Learning vs Prompt Tuning

思维链

Chain-of-Thought Prompting

思维链

CoT Prompt ：Think step-by-step

自洽性（Self-Consistency）：多路径推理

思维树（Tree-of-Thoughts, ToT）

ToT 工作原理解读： Step 1 思维分解

ToT 工作原理解读： Step 2 思维生成

ToT 工作原理解读： Step 3 状态评估

ToT 工作原理解读： Step 4 搜索算法

相关文章：

生成式预训练转换器（GPT-1） [Radford等人，2018 年]