当前位置: 首页 > news >正文

大语言模型LLM的一些点

LLM发展史

GPT模型是一种自然语言处理模型,使用Transformer来预测下一个单词的概率分布,通过训练在大型文本语料库上学习到的语言模式来生成自然语言文本。

  • GPT-1(117亿参数),GPT-1有一定的泛化能力。能够用于和监督任务无关的任务中。

  • GPT-2(15亿参数),在生成方面表现出很大天赋,阅读摘要、聊天、续写、编故事。

  • GPT-3(1750亿参数),作为一个自监督模型,可以完成自然语言处理的绝大部分任务,模仿人类叙事,创作定制诗歌,生成游戏剧本等。

  • InstructGPT是一个经过微调的新版GPT-3,可以将有害的不真实的有偏差的输出最小化。

  • ChatGPT是InstructGPT的衍生产品,将人类的反馈纳入训练的过程。更好的使模型输出与用户意料保持一致。

  • ChatGPT-4.0多模态数据支撑,智能程度更高、具备更强大的常识、Plugins插件。

关于大模型

  • AI大模型是“人工智能预训练大模型”的简称,包含了“预训练”和“大模型”两层含义,二者结合产生了一种新的人工智能模式,即模型在大规模数据集上完成了预训练后无需微调,或仅需要少量数据的微调,就能直接支撑各类应用。

  • 预训练大模型具备大量基础知识,针对某个垂直领域只需做微调就能完成任务。

  • 当前AI大模型包含自然语言处理(NLP)、计算机视觉(CV)等,统一整合的多模态大模型等。

语言模型

  • 统计语言模型是在1990年代基于统计学习方法发展起来的。其基本思想是基于马尔科夫假设,例如根据最近的上下文预测下一个词。如二元模型和三元模型,存在维度灾难问题,为了缓解数据稀疏性问题引入了特殊设计的平滑策略。

  • 神经语言模型通过神经网络来建模词序列的概率,通过分布式词向量来建模上下文表示,例如Word2Vec使用浅层神经网络来学习分布式词表示。

  • 预训练语言模型通过预先训练模型来捕捉上下文感知的词表示,并根据具体的下游任务进行微调。LSTM、Transformer之类的架构,预训练的模型显著提升了各种NLP任务的性能,"预训练和微调"的学习范式变得流行。

  • 大语言模型是通过扩展预训练语言模型的规模,包括模型大小和训练数据实现一个超大模型。大语言模型除了提升任务性能上限外,还显示出与小模型不同的行为,涌现能力。

涌现能力

LLM的涌现能力指的是在大型模型中出现的一些令人惊讶且不同于较小模型的能力,类似于物理学中的相变现象。

  • 上下文学习,LLM能在给定自然语言指令生成预期输出的能力,无需额外的训练。

  • 指令遵循,通过多任务数据集微调能通过自然语言指令来执行各种任务。

  • 逐步推理,LLM通过中间推理步骤的提示机制来实现逐步推理,链式思维推理。

Base模型与Chat模型

  • Base模型通常是海量语料进行的无监督学习出来的预测模型,是预训练模型,也可以称为LLM基座。

  • Chat模型通常是指令微调(SFT),人工标注指令数据集进行监督学习得到的模型,简单看就是能自然语言交互。

训练&微调

  • 资源充足优先考虑Base模型微调。

  • 数据少选择Chat模型微调。

  • 资源允许选择全参数微调,效果好。

  • 资源优先选择部分参数微调,性能上限被限制。

  • 只用领域数据很可能遗忘,通用能力可能丢失。

  • NVLink很重要,多卡通信瓶颈。

  • IB卡很重要,跨机通信瓶颈。

微调添加知识

  • LLM lora微调增加知识,增加后基本不会影响到旧知识。

  • 回答不是每次都一样,句子的主干差不多。

  • 增加一个知识A100若干分钟微调完。

  • LLM可看成一种压缩存储,将知识压缩并存储。

  • 增加太多新知识可能会遗忘旧知识。

  • 微调或推理时可以使用x-shot-prompt提升。

  • 某个任务传统bert之类的模型微调后也能得到相当的效果,LLM核心是任务统一及自然语言执行。

关于行业大模型

  • 通用数据+领域数据,从0开始全量训练,千百张卡,正经的行业大模型。

  • 选择开源预训练Base模型,二次预训练,百十张卡,也能说是行业大模型。

  • 选择开源Chat模型,做SFT,若干张卡,也能吹是行业大模型。

LLM低代码

核心关键点就是要LLM具备自然语言的方式来操作结构化数据,比如json。

你是一个json解析器,现在有一个默认的json的为:
{
"type": "",
"properties": {
"columns": [""],
"operation": [""]
}
}
其中,type表示事件类型,columns表示列名,operation表示操作名。
现在根据用户的输入去填充这个json,并输出json。请提供用户输入,以便我可以填充json。把“事件类型”改为“点击”好的,我已将“事件类型”改为“点击”:{"type": "点击","properties": {"columns": [""],"operation": [""]}
}请注意,columns和operation都是空数组,因为它们还没有被填充。把“操作名”改为“delete”好的,我已将“操作名”改为“delete”:{"type": "点击","properties": {"columns": [""],"operation": ["delete"]}
}请注意,columns仍然是空数组,因为它们还没有被填充。

LLM评测

  • 通用能力通过开源测试,例如SuperCLUE和c-eval。

  • 通过通用能力筛选的LLM再进入业务能力层测试,由业务团队以业务角度去评测。

  • 自动+手动方式。

落地场景上

  • 没法在严谨客服领域端到端,黑盒生成不可控。

  • 在点上嵌入LLM能力。

  • 自动或半自动等辅助型工具,自动标注之类的。

  • 文本分析领域。

  • 自然语言转换成结构化指令,自然语言->DSL,在此基础上再做智能化。

  • 坐席辅助生成回复参考、摘要。

  • LLM结合文档搜索提供更自然的回答。

  • 不能直接取代知识图谱,可提升知识图谱维护效率。

相关文章:

大语言模型LLM的一些点

LLM发展史 GPT模型是一种自然语言处理模型,使用Transformer来预测下一个单词的概率分布,通过训练在大型文本语料库上学习到的语言模式来生成自然语言文本。 GPT-1(117亿参数),GPT-1有一定的泛化能力。能够用于和监督任务无关的任务中。GPT-2(…...

leetcode810. 黑板异或游戏(博弈论 - java)

黑板异或游戏 lc 810 - 黑板异或游戏题目描述博弈论 动态规划 lc 810 - 黑板异或游戏 难度 - 困难 原题链接 - 黑板异或游戏 题目描述 黑板上写着一个非负整数数组 nums[i] 。 Alice 和 Bob 轮流从黑板上擦掉一个数字,Alice 先手。如果擦除一个数字后,剩…...

算法练习Day48|198.打家劫舍 ● 213.打家劫舍II ● 337.打家劫舍III

LeetCode: 198. 打家劫舍 - 力扣(LeetCode) 1.思路 边界思维,只有一个元素和两个元素的初始化考虑 当元素数大于3个时, 逆向思维,是否偷最后一个元素,倒序得出递推公式dp[i] Math.max(dp[i - 1], dp[i …...

什么是设计模式?常用的设计有哪些?

单例模式工厂模式代理模式(proxy) 一、设计模式 设计模式是前辈们经过无数次实践所总结的一些方法(针对特定问题的特定方法) 这些设计模式中的方法都是经过反复使用过的。 二、常用的设计模式有哪些? 1、单例模式&…...

clickHouse部署

docker仓库地址 https://hub.docker.com/ 1、docker环境搭建 # 1.先安装yml yum install -y yum-utils device-mapper-persistent-data lvm2 # 2.设置阿里云镜像 sudo yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo# 3.查…...

Flutter实现倒计时功能,秒数转时分秒,然后倒计时

Flutter实现倒计时功能 发布时间:2023/05/12 本文实例为大家分享了Flutter实现倒计时功能的具体代码,供大家参考,具体内容如下 有一个需求,需要在页面进行显示倒计时,倒计时结束后,做相应的逻辑处理。 实…...

【hadoop】windows上hadoop环境的搭建步骤

文章目录 前言基础环境下载hadoop安装包下载hadoop在windows中的依赖配置环境变量 Hadoop hdfs搭建创建hadfs数据目录修改JAVA依赖修改配置文件初始化hdfs namenode启动hdfs 前言 在大数据开发领域中,不得不说说传统经典的hadoop基础计算框架。一般我们都会将hadoo…...

一周在榜9本计算机专业新书

本周在榜计算机专业新书9本。 1、扩散模型从原理到实战 开启AI绘画新时代!AIGC大模型来临,配套赠送Diffusion视频课程! HuggingFace平台学习实战,常春藤盟校数据科学硕士与算法工程师带你从理论到实战,了解、掌握扩散…...

CSS变形与动画(二):perspctive透视效果 与 preserve-3d 3d效果(奥运五环例子)

文章目录 perspective 3d透视效果preserve-3d 3d嵌套效果例子 奥运五环 backface-visibility 背面效果 perspective 3d透视效果 perspective 指定了观察者与 z0 平面的距离&#xff0c;使具有三维位置变换的元素产生透视效果。z>0 的三维元素比正常大&#xff0c;而 z<0 …...

[论文笔记]Glancing Transformer for Non-Autoregressive Neural Machine Translation

引言 这是论文Glancing Transformer for Non-Autoregressive Neural Machine Translation的笔记。 传统的非自回归文本生成速度较慢,因为需要给定之前的token来预测下一个token。但自回归模型虽然效率高,但性能没那么好。 这篇论文提出了Glancing Transformer,可以只需要一…...

视觉学习(七)---Flask 框架下接口调用及python requests 实现json字符串传输

在项目实施过程中需要与其他系统进行接口联调&#xff0c;将图像检测的结果传递给其他系统接口&#xff0c;进行逻辑调用。这中间的过程可以通过requests库进行实现。 1.安装requests库 pip install requests2.postman 接口测试 我们先通过postman 了解下接口调用&#xff0…...

unity编写树形结构的文件管理页面

项目中需要实现点击“”按钮展开对应分类下的所有训练科目&#xff0c;再次点击“–”按钮将对应分类下的训练科目隐藏并收起整个面板。对此&#xff0c;编写一个类&#xff0c;将其挂载到树形结构的父类上&#xff0c;代码如下&#xff1a; using UnityEngine; using UnityEn…...

基于单片机的家用智能浇灌系统

1、开发环境 keil5&#xff0c;STM32CubeMX、Altium Designer 2、硬件清单 单片机&#xff1a;STM32F051K8Ux 土壤湿度传感器&#xff1a;TL - 69 温度传感器&#xff1a;DS18B20&#xff08;数字传感器直接输出数字信号&#xff09; OLED屏幕&#xff1a;OLED12864、 水…...

Solr的入门使用

Solr是Apache下的一个顶级开源项目&#xff0c;采用Java开发&#xff0c;它是基于Lucene的全文搜索服务器。Solr提供了比Lucene更为丰富的查询语言&#xff0c;同时实现了可配置、可扩展&#xff0c;并对索引、搜索性能进行了优化&#xff0c;被很多需要搜索的网站中广泛使用。…...

css鼠标样式 cursor: pointer

cursor: none; cursor:not-allowed; 禁止选择 user-select: none; pointer-events:none;禁止触发事件, 该样式会阻止默认事件的发生&#xff0c;但鼠标样式会变成箭头...

【解决】Kafka Exception thrown when sending a message with key=‘null‘ 异常

问题原因&#xff1a; 如下图&#xff0c;kafka 中配置的是监听域名的方式&#xff0c;但程序里使用的是 ip:port 的连接方式。 解决办法&#xff1a; kafka 中配置的是域名的方式&#xff0c;程序里也相应配置成 域名:port 的方式&#xff08;注意&#xff1a;本地h…...

中心极限定理 简明教程

中心极限定理是概率论中的一组定理&#xff0c;它们描述了一些独立随机变量的和或平均值的分布在一定条件下趋近于正态分布的现象。中心极限定理有多种形式&#xff0c;其中最常见的是独立同分布的中心极限定理&#xff0c;它可以用数学公式表示为&#xff1a; 前提条件&#x…...

商城-学习整理-基础-库存系统(八)

一、整合ware服务 1、配置注册中心 2、配置配置中心 3、配置网关&#xff0c;重启网关 二、仓库维护 http://localhost:8001/#/ware-wareinfo 在前端项目module中创建ware文件夹保存仓库系统的代码。 将生成的wareinfo.vue文件拷贝到项目中。 根据功能&#xff0c;修改后台接…...

【C++ 学习 ⑬】- 详解 list 容器

目录 一、list 容器的基本介绍 二、list 容器的成员函数 2.1 - 迭代器 2.2 - 修改操作 三、list 的模拟实现 3.1 - list.h 3.2 - 详解 list 容器的迭代器 3.2 - test.cpp 一、list 容器的基本介绍 list 容器以类模板 list<T>&#xff08;T 为存储元素的类型&…...

设计模式十五:命令模式(Command Pattern)

命令模式&#xff08;Command Pattern&#xff09;是一种行为型设计模式&#xff0c;它旨在将请求或操作封装成一个对象&#xff0c;从而允许你将不同的请求参数化&#xff0c;并且能够在不同的时间点执行或者队列化这些请求。这种模式使得请求发送者与接收者之间解耦&#xff…...

eNSP-Cloud(实现本地电脑与eNSP内设备之间通信)

说明&#xff1a; 想象一下&#xff0c;你正在用eNSP搭建一个虚拟的网络世界&#xff0c;里面有虚拟的路由器、交换机、电脑&#xff08;PC&#xff09;等等。这些设备都在你的电脑里面“运行”&#xff0c;它们之间可以互相通信&#xff0c;就像一个封闭的小王国。 但是&#…...

简易版抽奖活动的设计技术方案

1.前言 本技术方案旨在设计一套完整且可靠的抽奖活动逻辑,确保抽奖活动能够公平、公正、公开地进行,同时满足高并发访问、数据安全存储与高效处理等需求,为用户提供流畅的抽奖体验,助力业务顺利开展。本方案将涵盖抽奖活动的整体架构设计、核心流程逻辑、关键功能实现以及…...

为什么需要建设工程项目管理?工程项目管理有哪些亮点功能?

在建筑行业&#xff0c;项目管理的重要性不言而喻。随着工程规模的扩大、技术复杂度的提升&#xff0c;传统的管理模式已经难以满足现代工程的需求。过去&#xff0c;许多企业依赖手工记录、口头沟通和分散的信息管理&#xff0c;导致效率低下、成本失控、风险频发。例如&#…...

JVM垃圾回收机制全解析

Java虚拟机&#xff08;JVM&#xff09;中的垃圾收集器&#xff08;Garbage Collector&#xff0c;简称GC&#xff09;是用于自动管理内存的机制。它负责识别和清除不再被程序使用的对象&#xff0c;从而释放内存空间&#xff0c;避免内存泄漏和内存溢出等问题。垃圾收集器在Ja…...

从零开始打造 OpenSTLinux 6.6 Yocto 系统(基于STM32CubeMX)(九)

设备树移植 和uboot设备树修改的内容同步到kernel将设备树stm32mp157d-stm32mp157daa1-mx.dts复制到内核源码目录下 源码修改及编译 修改arch/arm/boot/dts/st/Makefile&#xff0c;新增设备树编译 stm32mp157f-ev1-m4-examples.dtb \stm32mp157d-stm32mp157daa1-mx.dtb修改…...

【OSG学习笔记】Day 16: 骨骼动画与蒙皮(osgAnimation)

骨骼动画基础 骨骼动画是 3D 计算机图形中常用的技术&#xff0c;它通过以下两个主要组件实现角色动画。 骨骼系统 (Skeleton)&#xff1a;由层级结构的骨头组成&#xff0c;类似于人体骨骼蒙皮 (Mesh Skinning)&#xff1a;将模型网格顶点绑定到骨骼上&#xff0c;使骨骼移动…...

Spring是如何解决Bean的循环依赖:三级缓存机制

1、什么是 Bean 的循环依赖 在 Spring框架中,Bean 的循环依赖是指多个 Bean 之间‌互相持有对方引用‌,形成闭环依赖关系的现象。 多个 Bean 的依赖关系构成环形链路,例如: 双向依赖:Bean A 依赖 Bean B,同时 Bean B 也依赖 Bean A(A↔B)。链条循环: Bean A → Bean…...

阿里云Ubuntu 22.04 64位搭建Flask流程(亲测)

cd /home 进入home盘 安装虚拟环境&#xff1a; 1、安装virtualenv pip install virtualenv 2.创建新的虚拟环境&#xff1a; virtualenv myenv 3、激活虚拟环境&#xff08;激活环境可以在当前环境下安装包&#xff09; source myenv/bin/activate 此时&#xff0c;终端…...

数据库——redis

一、Redis 介绍 1. 概述 Redis&#xff08;Remote Dictionary Server&#xff09;是一个开源的、高性能的内存键值数据库系统&#xff0c;具有以下核心特点&#xff1a; 内存存储架构&#xff1a;数据主要存储在内存中&#xff0c;提供微秒级的读写响应 多数据结构支持&…...

Tauri2学习笔记

教程地址&#xff1a;https://www.bilibili.com/video/BV1Ca411N7mF?spm_id_from333.788.player.switch&vd_source707ec8983cc32e6e065d5496a7f79ee6 官方指引&#xff1a;https://tauri.app/zh-cn/start/ 目前Tauri2的教程视频不多&#xff0c;我按照Tauri1的教程来学习&…...