大语言模型-LLM简介
大语言模型如此火爆,查了些资料整理一下,做个初步的了解。
语言模型的发展从开始的统计方法到使用神经网络,再到现在通过使用Transformer架构的模型训练大量数据,理解文本规则和模式,同时随着训练数据和模型的扩大,语言模型的能力提升显著,此时大语言模型出现了-LLM。
相比于之前的明星模型-BERT,虽然大预言模型使用的架构和预训练任务相似,但参数数量级的提升使他们有了质的差别。BERT的参数为3.3亿,GPT-2为15亿,而GPT-3则有1750亿参数。此时GPT-3相比之前的模型,就有解决少样本任务的能力了,这种能力可称为涌现能力。
LLM的独特能力
上下文学习:语言模型在获得指令或任务示例时,通过上下文生成答案,此时不需要额外训练或更新参数。
指令微调:LLM可以处理未见过的任务,泛化能力强大。
推理能力:LLM可通过中间推理步骤的提示机制解决中间的任务得到最终的答案。
LLM的特点
模型规模大:参数通常在数十亿,甚至千亿规模,这也是大模型可以获取更多信息的基础。
预训练和微调:LLM使用大量无标签文本数据做预训练,获取通用的知识,再通过微调在单独任务重获得更好的效果。
上下文理解:可解决小模型对前文理解不足的问题。
支持多模态:LLM可支持图像、声音等内容的扩展。
现有的大模型
LLM大放异彩是从OpenAI发布ChatGPT开始的,后面还有Claude、PaLM、Bard等,但由于网络原因,并不好用,而且还需要国际支付以获取user key,国内使用不是很友好。
国内的LLM主要有文心一言、讯飞星火、通义千问等,分别由百度、讯飞、阿里推出。放开测试后只需手机号就能使用,但有些功能需要收费了。
LangChain
一个开源工具,帮助开发者调用大模型并应用于下游任务,其为LLM提供了通用接口,简化开发流程。
主要有六个标准接口:
Input/Output:用户输入及模型输出的结果
Data:将自由数据输入模型训练
Chain:链接多个LLM或组件
Memory:对每个用户生成短期记忆,加强对上文的理解
Agent:为LLM提供计算、检索等功能的支持
Callback:记录流程信息
相关文章:
大语言模型-LLM简介
大语言模型如此火爆,查了些资料整理一下,做个初步的了解。 语言模型的发展从开始的统计方法到使用神经网络,再到现在通过使用Transformer架构的模型训练大量数据,理解文本规则和模式,同时随着训练数据和模型的扩大&…...
创建多层级行索引,创建多层级行索引的DataFrameMultiIndex.from_product()
【小白从小学Python、C、Java】 【计算机等考500强证书考研】 【Python-数据分析】 创建多层级行索引, 创建多层级行索引的DataFrame MultiIndex.from_product() [太阳]选择题 使用pd.MultiIndex.from_product(),下列输出正确的是: import pandas as pd…...
用尽可能简单易懂的代码做个时间轴(时间线)
用尽可能简单的代码,做个时间线或者时间轴展示功能,效果如图: 特点:纯DIVCSS构建,需要展示到什么进度,直接加active属性就行了。 还贴心给配了个setProgress(step)函数,功能太简单,…...
STM32笔记—定时器
目录 一、TIM简介 二、基本定时器(TIM6和TIM7) 1. TIM6和TIM7简介 2. TIM6和TIM7的主要特性 3. TIM6和TIM7的功能 3.1 时基单元 3.2 计数模式 3.3 时钟源 三、通用定时器 1. TIMx(2、3、4、5)简介 2. TIMx主要功能 3. 时钟选择 4. 影子寄存…...
【力扣:1504】统计全1子矩阵
统计全1子矩阵个数 思路1:首先考虑深度优先模拟,从【0,0】出发向下、右扩展,符合条件res,最后输出res,比较直观,但重复进行了大量节点遍历操作,时间复杂度较高,数据量大时…...
排序算法之-选择
算法原理 在未排序的数列中找出最大(或最小)的元素,然后将其存入到已排序的数列起始位置,紧接着在剩余的未排序数列中继续查找最大(或最小)的元素,并将其放入到已排序的数列末尾,依…...
机器学习模板代码(期末考试复习)自用存档
机器学习复习代码 利用sklearn实现knn import numpy as np import pandas as pd from sklearn.neighbors import KNeighborsClassifier from sklearn.model_selection import GridSearchCVdef model_selection(x_train, y_train):## 第一个是网格搜索## p是选择查找方式:1是欧…...
使用sizeof()和strlen()去计算【数组】和【指针】的大小
文章目录 一、知识回顾1、回顾sizeof()、strlen的作用:2、数组和指针3、数组名 二、sizeof()、strlen()的使用区别1、注意区别:2、一维数组与一级指针3、二维数组与二级指针 三、总结回顾 一、知识回顾 1、回顾sizeof()、strlen的作用: siz…...
viple进阶4:打印空心三角形
题目:根据用户输入的行数n打印空心三角形,下图分别为n3、n4、n5和n10的效果图 第一步:观察效果图 输入的行数为3,打印结果就有3行;输入的行数为4,则打印结果就有4行;以此类推,输入的…...
Oauth2.0的内容
OAuth 2.0是一个授权协议,用于允许第三方应用程序访问用户在另一个应用程序上存储的受保护资源,而不需要将用户名或密码公开给第三方应用程序。 OAuth2.0基于客户端-服务器模型,通常需要三个主体:客户端、资源所有者和授权服务器…...
npm 下载包失败解决方案
1.【问题描述】使用 npm 下载vue项目依赖包时失败,版本不一致。 【解决方法】使用 npm install --force npm install --force 是一个命令行指令,用于在 Node.js 环境中使用 npm(Node Package Manager)安装包或模块。–force 参数表…...
C语言---插入排序、希尔排序、冒泡排序、选择排序、快速排序简单介绍
文章目录 插入排序希尔排序冒泡排序选择排序快速排序 本文主要介绍用C语言实现的一些排序方法,有插入排序、希尔排序、冒泡排序、选择排序和快速排序,文章中给出的例子都是按照升序排列的。 插入排序 若数组只有一个元素,自然不用排序&#…...
撸视频号收益这个副业靠谱吗?
我是卢松松,点点上面的头像,欢迎关注我哦! 昨天有个人问我说做视频号能月入过万吗? 我的回复是:99%的人不能。 但为什么会经常有人这么问呢,松松思考了一下,原因是最近很多人在晒视频号撸收益的项目&am…...
2、数组、Map+HashMap、Set+Hashset、Char和Character类、String类和Char类、Math类
数组 \\一个普通的长度为1的整数数组 Integer[] arr new Integer[1];\\一个普通长度为1的同时元素初始化为1的整数数组。 Integer[] arr new Integer[]{1};\\一个长度为0的空数组 Integer[] arr new Integer[0];Map 常见方法 void clear( ) 从此映射中移除所有映射关系&#…...
ESP8266 WiFi模块快速入门指南
ESP8266是一种低成本、小巧而功能强大的WiFi模块,非常适合于物联网和嵌入式系统应用。本指南将为您提供关于ESP8266 WiFi模块的快速入门步骤和基本知识。 第一步:硬件准备 首先,您需要将ESP8266 WiFi模块与您的开发板连接。通常情况下&#…...
微信小程序将后端返回的图片文件流解析显示到页面
说明 由于请求接口后端返回的图片格式不是一个完整的url,也不是其他直接能显示的图片格式,是一张图片 后端根据模板与二维码生成图片,返回二进制数据 返回为文件流的格式,用wx.request请求的时候,就自动解码成为了下面这样的数据数据格式,这样的数据没…...
网络基础(1)
目录: 1.了解局域网(LAN)和广域网(WAN) 2.认识“协议” 3.浅谈OSI七层模型 4.网络传输的基本流程 5.路由器这个设备 ---------------------------------------------------------------------------------------…...
flink的AggregateFunction,merge方法作用范围
背景 AggregateFunction接口是我们经常用的窗口聚合函数,其中有一个merge方法,我们一般情况下也是实现了的,但是你知道吗,其实这个方法只有在你使用会话窗口需要进行窗口合并的时候才需要实现 AggregateFunction.merge方法调用时…...
Day25力扣打卡
打卡记录 寻找旋转排序数组中的最小值(二分) 链接 由于是旋转排序数组,所以整个数组有两部分是递增的,选取右侧最后元素,即可将整个数组分为大于该元素和小于该元素,碰头地段即为最小值。 class Solutio…...
SpringCloud - OpenFeign 参数传递和响应处理(全网最详细)
目录 一、OpenFeign 参数传递和响应处理 1.1、feign 客户端参数传递 1.1.1、零散类型参数传递 1. 例如 querystring 方式传参 2. 例如路径方式传参 1.1.2、对象参数传递 1. 对象参数传递案例 1.1.3、数组参数传递 1. 数组传参案例 1.1.4、集合类型的参数传递…...
AI Agent Harness日志体系:可追溯性设计
AI Agent Harness日志体系全解密:从零搭建全链路可追溯能力,让每一次Agent决策都有迹可循 关键词 AI Agent、Harness日志体系、可追溯性、全链路追踪、分布式日志、决策审计、故障根因分析 摘要 随着AI Agent从单场景原型落地到企业级多Agent协作生产系统,「决策黑盒」「…...
MacBook外接4TB硬盘总失败?别急着换扩展坞,试试这个磁盘工具里的隐藏功能
MacBook外接4TB硬盘总失败?解锁磁盘工具的隐藏技能 刚入手一块4TB移动硬盘,兴冲冲插上MacBook准备备份照片库,结果访达里死活找不到设备?别急着下单新扩展坞,也别怀疑硬盘坏了。作为常年与外部存储打交道的视频剪辑师&…...
中国私营企业调查数据CPES1993-2016年
01、数据简介中国私营企业调查数据CPES(Chinese Private Enterprise Survey)是目前国内持续时间最长的大型全国性抽样调查数据之一,它针对私营企业和私营企业主的综合状况进行深入调查。旨在通过全面、系统、翔实的调查数据,记录私…...
3步轻松解决腾讯游戏卡顿:sguard_limit让你的电脑重获流畅体验
3步轻松解决腾讯游戏卡顿:sguard_limit让你的电脑重获流畅体验 【免费下载链接】sguard_limit 限制ACE-Guard Client EXE占用系统资源,支持各种腾讯游戏 项目地址: https://gitcode.com/gh_mirrors/sg/sguard_limit 在众多腾讯游戏玩家中…...
机器学习数学符号全解析:从入门到精通
1. 机器学习数学符号基础解析作为一名从业多年的机器学习工程师,我深知数学符号对初学者的困扰。记得我第一次阅读机器学习论文时,那些密密麻麻的希腊字母和奇怪符号让我几乎放弃。但经过系统梳理后,我发现这些符号其实是一套精密的"行业…...
日志越多越安全?不优化ELK,你只是在“制造噪音”
日志越多越安全?不优化ELK,你只是在“制造噪音” 日志堆满了磁盘,告警却还是慢半拍。 查询一条错误,要等10秒甚至更久。 你以为自己在做“可观测性”,其实只是——在堆数据。 说句不好听的: 很多团队的ELK,不是监控系统,是“日志坟场”。 一、引子:为什么你的ELK越用…...
网盘下载限速破解:这款免费开源工具让你的下载速度提升5倍
网盘下载限速破解:这款免费开源工具让你的下载速度提升5倍 【免费下载链接】baiduyun 油猴脚本 - 一个免费开源的网盘下载助手 项目地址: https://gitcode.com/gh_mirrors/ba/baiduyun 还在为网盘下载速度慢而烦恼吗?你是否经历过明明有高速网络&…...
RocketMQ部署踩坑实录:Broker启动失败?可能是你的broker.conf没配对(Docker版避坑指南)
RocketMQ容器化部署实战:Broker异常排查与网络配置精要 当你在深夜赶着上线前最后一次压测,突然发现RocketMQ的Broker节点集体罢工,控制台一片血红警告——这种场景对经历过生产环境部署的开发者来说绝不陌生。本文将带你直击Docker环境下Bro…...
测试开发如何突破35岁瓶颈?三个被验证的转型路径
在技术迭代如潮的今天,“35岁危机”仿佛一道隐形的门槛,横亘在许多软件测试与测试开发(SDET/Test Engineer)从业者面前。当体力与学习曲线不再具备绝对优势,当职业发展似乎触达天花板,焦虑与迷茫随之而来。…...
XOutput:你的老旧游戏手柄重获新生的终极兼容神器
XOutput:你的老旧游戏手柄重获新生的终极兼容神器 【免费下载链接】XOutput DirectInput to XInput wrapper 项目地址: https://gitcode.com/gh_mirrors/xo/XOutput 还在为心爱的旧手柄无法在新游戏中使用而烦恼吗?你是否有一抽屉功能完好的经典手…...
