当前位置: 首页 > news >正文

二、认识大模型

认识大模型

  • 什么是大模型?
  • 发展趋势
  • AGI是不是泡沫
  • 大模型对比【时效】
  • 大模型特点
  • 大模型技术原理
    • 向量化
    • 除了向量化,大模型还具有特征提取特点
  • 总结
  • 结语


什么是大模型?

大模型是大规模语言模型(Large Language Model)的简称。语言模型是一种人工智能模型,他被训练成理解和生成人类语言。“大”在“大语言模型”中的意思是指模型的参数量非常大。比如ChatGPT,文心一言等

发展趋势

更强大的模型: 未来AIGC将会使用更大规模、更强大的预训练模型。随着硬件技术的进步和模型设计的改进,模型的参数和能力将不断增加,使其能够处理更复杂的任务和生成更高质量的内容。
多模态生成: AIGC不仅限于文本生成,未来趋势将发展成为多模态生成,即同时生成文本、图像和音频等多种内容,GPT-4o就是多模态产物。这将为创意产业和多媒体应用带来更多的可能性。
个性化生成: 未来AIGC可能朝着更加个性化的方向发展,能够根据用户的偏好和需求生成内容,为用户提供定制化的体验。

当然最新的GPT-o1,主要是逻辑推理方面得到了很大的加强,具备自我规划、自我纠错、自我验证的能力,像一个超大的Agent,弥补了GPT-4逻辑推理方面的缺点。也给大模型发展除增加参数、增加算力之外开辟了一个新的发展道路。

AGI是不是泡沫

谷歌DeepMind提出了一个关于AGI发展的分级框架,让我们来看看这个框架:

  1. 涌现级(Emerging):这一阶段的模型技能相当于或略超过没有相关技能的人类。例如,像ChatGPT、Bard和Llama 2这样的大模型就属于这个阶段。
  2. 刚刚合格级(Competent):在技能上达到正常成年人50%的水平。例如,语音助手Sir和在短文写作/简单编码等任务中达到SOTA水平的大模型。
  3. 专家级(Expert):可以达到正常成年人90%的水平。这一阶段的模型包括拼写和语法检查器如Grammarly,以及图像生成模型Imagen。
  4. 大师级(Virtuoso):可达到正常人类99%的水平。AlphaGo和Deep Blue等模型属于这个阶段。
  5. 超人级(Superhuman):在技能上已经超越顶尖科学家的模型,例如AlphaFold和AlphaZero。

根据这个标准,目前大多数AI产品在技能水平上已经进入了不同的AGI阶段,但通用性方面仍有待提高。ChatGPT等模型已经完全合格,但仍处于最底层的“一级AGI”阶段。

总之,AGI的发展是一个复杂的过程,需要综合考虑技能和通用性。虽然目前还没有完全达到人类智能水平的AGI,但我们对其发展充满期待。

在这里插入图片描述

大模型对比【时效】

在这里插入图片描述

模型详细对比信息,可以参考:https://github.com/wgwang/awesome-LLMs-In-China

百度在AI方面布局多年,具有一定大模型先发优势。百度的文心一言API调用服务测试的企业已经上亿。在行业大模型上,已经与国网、浦发、人民网等有案例应用。

阿里通义大模型在逻辑运算、编码能力、语音处理方面见长,集团拥有丰富的生态和产品在线,在出行场景、办公场景、购物场景有广泛应用。

ChatGPT是目前最先进的模型之一,是最流行的模型

大模型特点

  • 知识丰富
  • 道德感强,法律边界清晰
  • 有记忆力,可联系上下文
  • 知错就改
  • 知人晓事

举例1:道德感强,法律边界清晰

在这里插入图片描述

举例2:知错就改

在这里插入图片描述

在这里插入图片描述

大模型技术原理

简单来说,就是将所有的信息(文字、图片等)转换为向量,转换为向量后,就可以使用任意的数学公式进行计算,通过大量的数据训练,模型学会如何在这些向量之间进行加、减、乘、除等操作,以达到理解、生成和预测的目的。其中的关键特点

向量化

向量化就是将各种信息转换为向量,用向量去表示原来的信息。

向量化就是为了方便计算机系统去运算处理,发现规律,从而推理出内容,完成智能任务。

向量化是来自Google发表的Word2vec算法来实现的,算法大家可以自行了解

除了向量化,大模型还具有特征提取特点

在这里插入图片描述

在本题中,传统的推理只是根据最近两个字进行推理,很有可能会推理出B,很明显是不对的

为了解决这个问题,Google发表的论文Attention Is All You Need,解决了自然语言特征提取的问题,简单理解为不仅从最近的词汇来推理,还从整个句子中获取多个关键词(如:直播、老师、喜爱),根据关键词还分析语义,从而进行推理(将多个关键词向量化进行运算)

总结

通过这篇文章大家可以对大模型有一个基础的认识,关于大模型的底层架构以及所涉及的算法,感兴趣的兄弟可以自行学习,确实具有一定的难度,本人作为运维出身,反复看了好几遍还是迷迷糊糊,后续如果理解的差不多了再考虑给大家分享。

结语

最后,引用数格科技AI网站上的一句话:“面对AI焦虑,你没必要跟汽车赛跑,而是应该考个驾照!

相关文章:

二、认识大模型

认识大模型 什么是大模型?发展趋势AGI是不是泡沫大模型对比【时效】大模型特点大模型技术原理向量化除了向量化,大模型还具有特征提取特点 总结结语 什么是大模型? 大模型是大规模语言模型(Large Language Model)的简…...

2024年【电工(高级)】考试题及电工(高级)考试内容

题库来源:安全生产模拟考试一点通公众号小程序 电工(高级)考试题根据新电工(高级)考试大纲要求,安全生产模拟考试一点通将电工(高级)模拟考试试题进行汇编,组成一套电工…...

Unity中分辨率适配

在Unity中,分辨率适配问题是一个常见的挑战,尤其是在开发跨平台游戏时。为了确保你的游戏在不同设备上都能良好显示,以下是一些解决方案和最佳实践: 1. 使用Canvas Scaler 在UI的Canvas组件中,设置 UI Scale Mode …...

图像处理基础知识点简记

简单记录一下图像处理的基础知识点 一、取样 1、释义 图像的取样就是图像在空间上的离散化处理,即使空间上连续变化的图像离散化, 决定了图像的空间分辨率。 2、过程 简单描述一下图象取样的基本过程,首先用一个网格把待处理的图像覆盖,然后把每一小格上模拟图像的各个…...

微信小程序-使用vant组件库

文章目录 微信小程序-使用vant组件库概述构建npm构建步骤使用vant注册使用添加事件使用插槽 样式覆盖解除样式隔离使用外部样式类使用CSS变量 微信小程序-使用vant组件库 概述 Vant Weapp 是有赞前端团队开源的小程序 UI 组件库,基于微信小程序的自定义组件开发&a…...

Java【注解】

概述 ①Java的注解又称标注,它是程序的元数据,也是程序代码的标记,主要添加到程序代码上,作说明和解释。元数据是用来描述数据的一种数据。 ②Java中的注解可用于类、构造方法、成员变量、方法、参数等的声明中,注解…...

基于安卓开发大型体育场管理系统的设计与实现(源码+定制+讲解)

博主介绍: ✌我是阿龙,一名专注于Java技术领域的程序员,全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师,我在计算机毕业设计开发方面积累了丰富的经验。同时,我也是掘金、华为云、阿里云、InfoQ等平台…...

【Go】-Websocket的使用

目录 为什么需要websocket 使用场景 在线教育 视频弹幕 Web端即时通信方式 什么是web端即时通讯技术? 轮询 长轮询 长连接 SSE websocket 通信方式总结 Websocket介绍 协议升级 连接确认 数据帧 socket和websocket 常见状态码 gorilla/websocket实…...

怎么查看员工电脑安装了什么软件

1、使用专业监控软件:安装如金刚钻信息网站行为审计系统、WorkWin等专业的电脑监控软件。这些软件能够实时监控员工的电脑操作,包括安装的软件、运行的程序等。通过软件的管理端,您可以轻松查看员工电脑上安装的所有软件,并可以设…...

面积开运算bwareaopen

一个非常有用的二值图像形态学后处理算法,建立在连通分量分析的基础之上。 bwareaopen 从二值图像中删除小对象 语法 BW2 bwareaopen(BW,P) BW2 bwareaopen(BW,P,conn) 说明 BW2 bwareaopen(BW,P) 从二值图像 BW 中删除少于 P 个像素的所有连通分量&#x…...

TortoiseGit 下载和安装

下载 1,下载路径 Download – TortoiseGit – Windows Shell Interface to Git 2,选择windows64的, 3,下载完成后 安装 1,双击运行,点击next 2,点击next 3,点击next 4&#xff0…...

0x09 瑞友 应用虚拟化系统 GetBSAppUrl SQL注入漏洞 - 复现

参考:瑞友 应用虚拟化系统 GetBSAppUrl SQL注入漏洞 | PeiQi文库 (wgpsec.org) 漏洞描述 瑞友应用虚拟化系统中的 GetBSAppUrl 方法存在 SQL注入漏洞。由于请求参数未经过滤,攻击者可以利用此漏洞执行恶意SQL查询,从而获取数据库中的敏感信息。 漏洞影响 受影响版本:瑞友…...

C++(Qt)软件调试---内存调试器Dr.Memory(21)

C(Qt)软件调试—内存调试器Dr. Memory(21) 文章目录 C(Qt)软件调试---内存调试器Dr. Memory(21)[toc]1、概述🐜2、安装Dr.Memory🪲3、命令行使用Dr.Memory🦗4、Qt Creator集成使用Dr.Memory&…...

Python3自带HTTP服务:轻松开启与后台管理

Python3自带有http服务,可以在服务器,也可以在本地启动,并运行一些常用的网页程序。比如:我们可以把streamlit框架编写的网页放到服务器上,开启http服务,就可以通过网页来调用这个pythont程序了&#xff0c…...

传统行业选择企业大文件传输系统需要注意哪些?

数字化转型的洪流中,传统行业正经历着前所未有的挑战与机遇。随着数据量的激增,企业大文件传输系统的选型成为了一个至关重要的议题。今天小编将深入探讨传统行业在这一过程中的考量因素,并以镭速企业大文件传输系统为例,展示其如…...

如何配置路由器支持UDP

一、UDP协议简介 UDP是一种传输层协议,与TCP(传输控制协议)不同,它不需要建立连接,因此传输速度较快。由于UDP不需要确认数据包的接收状态,它适用于不需要严格数据完整性但需要低延迟的场景。 常见的UDP应…...

CorePress Pro 网站加载慢 WordPress

一般来说是你用了「CorePress天气模块」 解决方案:这个插件从你右侧边栏里删掉就可以了(上方的图中已经是删掉后的效果了) 寻找加载时间长的原因: 谷歌浏览器F12->网络->打开录制->ShiftF5 得出结论:和风天气…...

关于uniapp wifi调用走过的坑

1. uniapp老脚手架与uni-wif带来的兼容性问题 且几乎找不到解决方法 2. uni-wif需要插件市场安装 3.还有一种可以使用导入安卓类的方式,可以正常获取到已经连接ssid(wifi名称),也可以获取到wifi列表 , 但ScanResul…...

docker学习笔记(1.0)

docker命令 下载镜像相关命令 检索:docker search 比如:docker search nginx 是查看有没有nginx镜像 后面的OK表示是不是官方镜像,如果有就是官方镜像,如果没有就是第三方的。 下载:docker pull 比如&#xff1a…...

如何高效管理知识产权全链条?

为了有效保护企业的创新成果,确保技术创意的顺利转化,以及高效管理知识产权案件,建立一套完善的知识产权管理体系至关重要。对于企业而言,如何有效地管理知识产权的各个环节,从研发项目到技术创意,再到提案…...

变量 varablie 声明- Rust 变量 let mut 声明与 C/C++ 变量声明对比分析

一、变量声明设计:let 与 mut 的哲学解析 Rust 采用 let 声明变量并通过 mut 显式标记可变性,这种设计体现了语言的核心哲学。以下是深度解析: 1.1 设计理念剖析 安全优先原则:默认不可变强制开发者明确声明意图 let x 5; …...

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向: 逆向设计 通过神经网络快速预测微纳结构的光学响应,替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…...

【Linux】shell脚本忽略错误继续执行

在 shell 脚本中,可以使用 set -e 命令来设置脚本在遇到错误时退出执行。如果你希望脚本忽略错误并继续执行,可以在脚本开头添加 set e 命令来取消该设置。 举例1 #!/bin/bash# 取消 set -e 的设置 set e# 执行命令,并忽略错误 rm somefile…...

CTF show Web 红包题第六弹

提示 1.不是SQL注入 2.需要找关键源码 思路 进入页面发现是一个登录框,很难让人不联想到SQL注入,但提示都说了不是SQL注入,所以就不往这方面想了 ​ 先查看一下网页源码,发现一段JavaScript代码,有一个关键类ctfs…...

智慧工地云平台源码,基于微服务架构+Java+Spring Cloud +UniApp +MySql

智慧工地管理云平台系统,智慧工地全套源码,java版智慧工地源码,支持PC端、大屏端、移动端。 智慧工地聚焦建筑行业的市场需求,提供“平台网络终端”的整体解决方案,提供劳务管理、视频管理、智能监测、绿色施工、安全管…...

django filter 统计数量 按属性去重

在Django中,如果你想要根据某个属性对查询集进行去重并统计数量,你可以使用values()方法配合annotate()方法来实现。这里有两种常见的方法来完成这个需求: 方法1:使用annotate()和Count 假设你有一个模型Item,并且你想…...

质量体系的重要

质量体系是为确保产品、服务或过程质量满足规定要求,由相互关联的要素构成的有机整体。其核心内容可归纳为以下五个方面: 🏛️ 一、组织架构与职责 质量体系明确组织内各部门、岗位的职责与权限,形成层级清晰的管理网络&#xf…...

sqlserver 根据指定字符 解析拼接字符串

DECLARE LotNo NVARCHAR(50)A,B,C DECLARE xml XML ( SELECT <x> REPLACE(LotNo, ,, </x><x>) </x> ) DECLARE ErrorCode NVARCHAR(50) -- 提取 XML 中的值 SELECT value x.value(., VARCHAR(MAX))…...

UR 协作机器人「三剑客」:精密轻量担当(UR7e)、全能协作主力(UR12e)、重型任务专家(UR15)

UR协作机器人正以其卓越性能在现代制造业自动化中扮演重要角色。UR7e、UR12e和UR15通过创新技术和精准设计满足了不同行业的多样化需求。其中&#xff0c;UR15以其速度、精度及人工智能准备能力成为自动化领域的重要突破。UR7e和UR12e则在负载规格和市场定位上不断优化&#xf…...

Android Bitmap治理全解析:从加载优化到泄漏防控的全生命周期管理

引言 Bitmap&#xff08;位图&#xff09;是Android应用内存占用的“头号杀手”。一张1080P&#xff08;1920x1080&#xff09;的图片以ARGB_8888格式加载时&#xff0c;内存占用高达8MB&#xff08;192010804字节&#xff09;。据统计&#xff0c;超过60%的应用OOM崩溃与Bitm…...