当前位置：首页 > news >正文

大语言模型LLM的一些点

news 2026/2/10 13:42:15

LLM发展史

GPT模型是一种自然语言处理模型，使用Transformer来预测下一个单词的概率分布，通过训练在大型文本语料库上学习到的语言模式来生成自然语言文本。

GPT-1(117亿参数)，GPT-1有一定的泛化能力。能够用于和监督任务无关的任务中。
GPT-2(15亿参数），在生成方面表现出很大天赋，阅读摘要、聊天、续写、编故事。
GPT-3(1750亿参数)，作为一个自监督模型，可以完成自然语言处理的绝大部分任务，模仿人类叙事，创作定制诗歌，生成游戏剧本等。
InstructGPT是一个经过微调的新版GPT-3，可以将有害的不真实的有偏差的输出最小化。
ChatGPT是InstructGPT的衍生产品，将人类的反馈纳入训练的过程。更好的使模型输出与用户意料保持一致。
ChatGPT-4.0多模态数据支撑，智能程度更高、具备更强大的常识、Plugins插件。

关于大模型

AI大模型是“人工智能预训练大模型”的简称，包含了“预训练”和“大模型”两层含义，二者结合产生了一种新的人工智能模式，即模型在大规模数据集上完成了预训练后无需微调，或仅需要少量数据的微调，就能直接支撑各类应用。
预训练大模型具备大量基础知识，针对某个垂直领域只需做微调就能完成任务。
当前AI大模型包含自然语言处理(NLP)、计算机视觉（CV）等，统一整合的多模态大模型等。

语言模型

统计语言模型是在1990年代基于统计学习方法发展起来的。其基本思想是基于马尔科夫假设，例如根据最近的上下文预测下一个词。如二元模型和三元模型，存在维度灾难问题，为了缓解数据稀疏性问题引入了特殊设计的平滑策略。
神经语言模型通过神经网络来建模词序列的概率，通过分布式词向量来建模上下文表示，例如Word2Vec使用浅层神经网络来学习分布式词表示。
预训练语言模型通过预先训练模型来捕捉上下文感知的词表示，并根据具体的下游任务进行微调。LSTM、Transformer之类的架构，预训练的模型显著提升了各种NLP任务的性能，"预训练和微调"的学习范式变得流行。
大语言模型是通过扩展预训练语言模型的规模，包括模型大小和训练数据实现一个超大模型。大语言模型除了提升任务性能上限外，还显示出与小模型不同的行为，涌现能力。

涌现能力

LLM的涌现能力指的是在大型模型中出现的一些令人惊讶且不同于较小模型的能力，类似于物理学中的相变现象。

上下文学习，LLM能在给定自然语言指令生成预期输出的能力，无需额外的训练。
指令遵循，通过多任务数据集微调能通过自然语言指令来执行各种任务。
逐步推理，LLM通过中间推理步骤的提示机制来实现逐步推理，链式思维推理。

Base模型与Chat模型

Base模型通常是海量语料进行的无监督学习出来的预测模型，是预训练模型，也可以称为LLM基座。
Chat模型通常是指令微调（SFT），人工标注指令数据集进行监督学习得到的模型，简单看就是能自然语言交互。

训练&微调

资源充足优先考虑Base模型微调。
数据少选择Chat模型微调。
资源允许选择全参数微调，效果好。
资源优先选择部分参数微调，性能上限被限制。
只用领域数据很可能遗忘，通用能力可能丢失。
NVLink很重要，多卡通信瓶颈。
IB卡很重要，跨机通信瓶颈。

微调添加知识

LLM lora微调增加知识，增加后基本不会影响到旧知识。
回答不是每次都一样，句子的主干差不多。
增加一个知识A100若干分钟微调完。
LLM可看成一种压缩存储，将知识压缩并存储。
增加太多新知识可能会遗忘旧知识。
微调或推理时可以使用x-shot-prompt提升。
某个任务传统bert之类的模型微调后也能得到相当的效果，LLM核心是任务统一及自然语言执行。

关于行业大模型

通用数据+领域数据，从0开始全量训练，千百张卡，正经的行业大模型。
选择开源预训练Base模型，二次预训练，百十张卡，也能说是行业大模型。
选择开源Chat模型，做SFT，若干张卡，也能吹是行业大模型。

LLM低代码

核心关键点就是要LLM具备自然语言的方式来操作结构化数据，比如json。

你是一个json解析器，现在有一个默认的json的为：
{
"type": "",
"properties": {
"columns": [""],
"operation": [""]
}
}
其中，type表示事件类型，columns表示列名，operation表示操作名。
现在根据用户的输入去填充这个json，并输出json。请提供用户输入，以便我可以填充json。把“事件类型”改为“点击”好的，我已将“事件类型”改为“点击”：{"type": "点击","properties": {"columns": [""],"operation": [""]}
}请注意，columns和operation都是空数组，因为它们还没有被填充。把“操作名”改为“delete”好的，我已将“操作名”改为“delete”：{"type": "点击","properties": {"columns": [""],"operation": ["delete"]}
}请注意，columns仍然是空数组，因为它们还没有被填充。

LLM评测

通用能力通过开源测试，例如SuperCLUE和c-eval。
通过通用能力筛选的LLM再进入业务能力层测试，由业务团队以业务角度去评测。
自动+手动方式。

落地场景上

没法在严谨客服领域端到端，黑盒生成不可控。
在点上嵌入LLM能力。
自动或半自动等辅助型工具，自动标注之类的。
文本分析领域。
自然语言转换成结构化指令，自然语言->DSL，在此基础上再做智能化。
坐席辅助生成回复参考、摘要。
LLM结合文档搜索提供更自然的回答。
不能直接取代知识图谱，可提升知识图谱维护效率。

大语言模型LLM的一些点

LLM发展史 GPT模型是一种自然语言处理模型，使用Transformer来预测下一个单词的概率分布，通过训练在大型文本语料库上学习到的语言模式来生成自然语言文本。 GPT-1(117亿参数)，GPT-1有一定的泛化能力。能够用于和监督任务无关的任务中。GPT-2(…...

编程日记 2023/8/16 20:14:14

leetcode810. 黑板异或游戏（博弈论 - java）

黑板异或游戏 lc 810 - 黑板异或游戏题目描述博弈论动态规划 lc 810 - 黑板异或游戏难度 - 困难原题链接 - 黑板异或游戏题目描述黑板上写着一个非负整数数组 nums[i] 。 Alice 和 Bob 轮流从黑板上擦掉一个数字，Alice 先手。如果擦除一个数字后，剩…...

编程日记 2023/8/16 20:13:13

算法练习Day48|198.打家劫舍 ● 213.打家劫舍II ● 337.打家劫舍III

LeetCode: 198. 打家劫舍 - 力扣（LeetCode） 1.思路边界思维，只有一个元素和两个元素的初始化考虑当元素数大于3个时， 逆向思维，是否偷最后一个元素，倒序得出递推公式dp[i] Math.max(dp[i - 1], dp[i …...

编程日记 2023/8/16 20:12:12

什么是设计模式？常用的设计有哪些？

单例模式工厂模式代理模式（proxy） 一、设计模式设计模式是前辈们经过无数次实践所总结的一些方法（针对特定问题的特定方法） 这些设计模式中的方法都是经过反复使用过的。二、常用的设计模式有哪些？ 1、单例模式&…...

编程日记 2023/8/16 20:11:11

docker仓库地址 https://hub.docker.com/ 1、docker环境搭建 # 1.先安装yml yum install -y yum-utils device-mapper-persistent-data lvm2 # 2.设置阿里云镜像 sudo yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo# 3.查…...

编程日记 2023/8/16 20:10:10

Flutter实现倒计时功能,秒数转时分秒，然后倒计时

Flutter实现倒计时功能发布时间：2023/05/12 本文实例为大家分享了Flutter实现倒计时功能的具体代码，供大家参考，具体内容如下有一个需求，需要在页面进行显示倒计时，倒计时结束后，做相应的逻辑处理。实…...

编程日记 2023/8/16 20:09:09

【hadoop】windows上hadoop环境的搭建步骤

文章目录前言基础环境下载hadoop安装包下载hadoop在windows中的依赖配置环境变量 Hadoop hdfs搭建创建hadfs数据目录修改JAVA依赖修改配置文件初始化hdfs namenode启动hdfs 前言在大数据开发领域中，不得不说说传统经典的hadoop基础计算框架。一般我们都会将hadoo…...

编程日记 2023/8/16 20:08:07

一周在榜9本计算机专业新书

本周在榜计算机专业新书9本。 1、扩散模型从原理到实战开启AI绘画新时代！AIGC大模型来临，配套赠送Diffusion视频课程！ HuggingFace平台学习实战，常春藤盟校数据科学硕士与算法工程师带你从理论到实战，了解、掌握扩散…...

编程日记 2023/8/16 20:07:06

CSS变形与动画（二）：perspctive透视效果与 preserve-3d 3d效果（奥运五环例子）

文章目录 perspective 3d透视效果preserve-3d 3d嵌套效果例子奥运五环 backface-visibility 背面效果 perspective 3d透视效果 perspective 指定了观察者与 z0 平面的距离，使具有三维位置变换的元素产生透视效果。z>0 的三维元素比正常大，而 z<0 …...

编程日记 2023/8/16 20:06:05

[论文笔记]Glancing Transformer for Non-Autoregressive Neural Machine Translation

引言这是论文Glancing Transformer for Non-Autoregressive Neural Machine Translation的笔记。传统的非自回归文本生成速度较慢，因为需要给定之前的token来预测下一个token。但自回归模型虽然效率高，但性能没那么好。这篇论文提出了Glancing Transformer，可以只需要一…...

编程日记 2023/8/16 20:05:04

视觉学习（七）---Flask 框架下接口调用及python requests 实现json字符串传输

在项目实施过程中需要与其他系统进行接口联调，将图像检测的结果传递给其他系统接口，进行逻辑调用。这中间的过程可以通过requests库进行实现。 1.安装requests库 pip install requests2.postman 接口测试我们先通过postman 了解下接口调用&#xff0…...

编程日记 2023/8/16 20:04:03

unity编写树形结构的文件管理页面

项目中需要实现点击“”按钮展开对应分类下的所有训练科目，再次点击“–”按钮将对应分类下的训练科目隐藏并收起整个面板。对此，编写一个类，将其挂载到树形结构的父类上，代码如下： using UnityEngine; using UnityEn…...

编程日记 2023/8/16 20:03:02

基于单片机的家用智能浇灌系统

1、开发环境 keil5，STM32CubeMX、Altium Designer 2、硬件清单单片机：STM32F051K8Ux 土壤湿度传感器：TL - 69 温度传感器：DS18B20（数字传感器直接输出数字信号） OLED屏幕：OLED12864、水…...

编程日记 2023/8/16 20:02:00

Solr的入门使用

Solr是Apache下的一个顶级开源项目，采用Java开发，它是基于Lucene的全文搜索服务器。Solr提供了比Lucene更为丰富的查询语言，同时实现了可配置、可扩展，并对索引、搜索性能进行了优化，被很多需要搜索的网站中广泛使用。…...

编程日记 2023/8/16 20:00:59

css鼠标样式 cursor: pointer

cursor: none; cursor:not-allowed; 禁止选择 user-select: none; pointer-events:none;禁止触发事件, 该样式会阻止默认事件的发生，但鼠标样式会变成箭头...

编程日记 2023/8/16 19:59:56

【解决】Kafka Exception thrown when sending a message with key=‘null‘ 异常

问题原因： 如下图，kafka 中配置的是监听域名的方式，但程序里使用的是 ip:port 的连接方式。解决办法： kafka 中配置的是域名的方式，程序里也相应配置成域名:port 的方式（注意：本地h…...

编程日记 2023/8/16 19:58:54

中心极限定理简明教程

中心极限定理是概率论中的一组定理，它们描述了一些独立随机变量的和或平均值的分布在一定条件下趋近于正态分布的现象。中心极限定理有多种形式，其中最常见的是独立同分布的中心极限定理，它可以用数学公式表示为： 前提条件&#x…...

编程日记 2023/8/16 19:57:51

商城-学习整理-基础-库存系统（八）

一、整合ware服务 1、配置注册中心 2、配置配置中心 3、配置网关，重启网关二、仓库维护 http://localhost:8001/#/ware-wareinfo 在前端项目module中创建ware文件夹保存仓库系统的代码。将生成的wareinfo.vue文件拷贝到项目中。根据功能，修改后台接…...

编程日记 2023/8/16 19:56:50

【C++ 学习 ⑬】- 详解 list 容器

目录一、list 容器的基本介绍二、list 容器的成员函数 2.1 - 迭代器 2.2 - 修改操作三、list 的模拟实现 3.1 - list.h 3.2 - 详解 list 容器的迭代器 3.2 - test.cpp 一、list 容器的基本介绍 list 容器以类模板 list<T>（T 为存储元素的类型&…...

编程日记 2023/8/16 19:55:49

设计模式十五：命令模式（Command Pattern）

命令模式（Command Pattern）是一种行为型设计模式，它旨在将请求或操作封装成一个对象，从而允许你将不同的请求参数化，并且能够在不同的时间点执行或者队列化这些请求。这种模式使得请求发送者与接收者之间解耦&#xff…...

编程日记 2023/8/16 19:54:48

＜6＞-MySQL表的增删查改

目录一，create（创建表） 二，retrieve（查询表） 1，select列 2，where条件三，update（更新表） 四，delete（删除表&#xf…...

编程新知 2025/12/11 18:28:17

基于ASP.NET+ SQL Server实现（Web）医院信息管理系统

医院信息管理系统 1. 课程设计内容在 visual studio 2017 平台上，开发一个“医院信息管理系统”Web 程序。 2. 课程设计目的综合运用 c#.net 知识，在 vs 2017 平台上，进行 ASP.NET 应用程序和简易网站的开发；初步熟悉开发一…...

编程新知 2026/2/10 13:19:02

线程与协程

1. 线程与协程 1.1. “函数调用级别”的切换、上下文切换 1. 函数调用级别的切换 “函数调用级别的切换”是指：像函数调用/返回一样轻量地完成任务切换。举例说明： 当你在程序中写一个函数调用： funcA() 然后 funcA 执行完后返回&…...

编程新知 2025/10/31 17:25:40

使用van-uploader 的UI组件，结合vue2如何实现图片上传组件的封装

以下是基于 vant-ui（适配 Vue2 版本 ）实现截图中照片上传预览、删除功能，并封装成可复用组件的完整代码，包含样式和逻辑实现，可直接在 Vue2 项目中使用： 1. 封装的图片上传组件 ImageUploader.vue <te…...

编程新知 2026/1/31 2:37:22

ip子接口配置及删除

配置永久生效的子接口，2个IP 都可以登录你这一台服务器。重启不失效。永久的 [应用] vi /etc/sysconfig/network-scripts/ifcfg-eth0修改文件内内容 TYPE"Ethernet" BOOTPROTO"none" NAME"eth0" DEVICE"eth0" ONBOOT&q…...

编程新知 2025/10/26 5:04:25