当前位置: 首页 > news >正文

解析:什么是生成式AI?与其他类型的AI有何不同?

原创 | 文 BFT机器人 

图片

快速浏览一下头条新闻,你会发现生成式AI似乎无处不在。事实上,一些新闻标题甚至可能是通过生成式AI编写的,例如OpenAI旗下的ChatGPT,这个聊天机器人已经展现出了生成看起来像人类所写文本的惊人能力。

当人们提到“生成式人工智能”时,他们指的到底是什么?

在生成式AI热潮兴起之前,当人们谈论人工智能时,通常是指那些可以基于数据进行预测的机器学习模型。例如,通过数百万个示例对此类模型进行训练,以预测某种X射线是否显示出肿瘤的迹象,或者某个借款人是否可能拖欠贷款。

图片

生成式 AI 可以被认为是一种另类的机器学习模型,经过训练后可以创建新数据,而不是对特定数据集进行预测。生成式AI系统指的是用来生成类似于其训练数据的更多对象的系统。“当涉及到生成式AI和其他类型的AI背后的技术时,它们之间的界限可能有点模糊。通常相同的算法可以用于两者,“麻省理工学院电气工程与计算机科学副教授、计算机科学与人工智能实验室(CSAIL)成员Phillip Isola表示。

尽管 ChatGPT 及其同类产品的发布引起了广泛的关注和讨论,但该技术本身并不是全新的。这些强大的机器学习模型是基于超过50年的研究和计算技术进步。

01

复杂性的提升

生成式AI的一个早期实例被称为马尔可夫链。该技术以俄罗斯数学家安德烈·马尔科夫(Andrey Markov)的名字命名,他在1906年引入了这种统计方法来模拟随机过程的行为。在机器学习中,马尔可夫模型长期被用于如电子邮件程序中预测下一个单词的自动填充任务。

图片

在文本预测中,马尔可夫模型能够通过分析前一个或几个单词来生成句子中的下一个单词。但这些模型由于只能回顾有限的信息,因此生成的文本往往不够合理,MIT电气工程与计算机科学Thomas Siebel教授、CSAIL和数据、系统与社会研究所(IDSS)成员Tommi Jaakkola表示。“我们在过去十年之前就开始进行生成式操作,但主要区别在于我们现在能生成的对象的复杂性以及训练这些模型的规模。”他补充道。

在几年前,研究人员倾向于寻找一种能够充分利用特定数据集的机器学习算法。但现在这种焦点已经略有转移,许多研究人员开始利用更大规模的数据集,可能包括数亿甚至数十亿数据点,来训练能够取得卓越成果的模型。

ChatGPT及其类似系统的基础模型在工作方式上与马尔可夫模型大致相同。区别在于,ChatGPT规模更大、更复杂,有数十亿个参数,并且它已经接受了互联网上可公开获取的大量数据的训练。在这个庞大的文本资料库中,单词和句子以具有某些依赖关系的顺序出现,这种重复性有助于模型了解如何将文本切割为具有一定可预测性的统计块。模型通过学习这些文本块的模式,并利用此知识来预测接下来可能出现的内容。

图片

02

更强大的架构

庞大的数据集是推动生成式AI热潮的催化剂之一,重要的研究进展也促成了更为复杂的深度学习架构的发展。

2014年,蒙特利尔大学的研究人员提出了一种名为生成对抗网络(GAN)的机器学习架构。GAN使用两个协同工作的模型:一个学习生成目标输出(如图像),另一个学习从生成器的输出中区分真实数据。生成器试图欺骗鉴别器,并在此过程中学习制作更逼真的输出。图像生成器StyleGAN就是基于此类模型的实例。

此后一年,斯坦福大学和加州大学伯克利分校的研究人员引入了扩散模型,通过迭代优化其输出,这些模型可以学习生成类似于训练数据集中样本的新数据样本,并用于创建逼真的图像。

图片

2017年,谷歌的研究人员推出了transformer架构,该架构已被用于开发大型语言模型,比如驱动ChatGPT的模型。在自然语言处理中,Transformer将文本语料库中的每个词编码为一个令牌,然后生成一个注意力图,该图捕捉每个令牌与所有其他令牌的关系。这个注意力图帮助Transformer在生成新文本时理解上下文。

这些仅仅是可用于生成式AI的众多方法中的一小部分。

03

应用范围广泛

这些方法的共同特点是将输入转换为一组令牌,这些令牌是数据块的数值表示形式。只要数据可以转换为这种标准的令牌格式,理论上可以应用这些方法来生成类似的新数据。“效果会因数据复杂度和信号提取难度而异,但它实际上越来越接近于通用CPU处理任意类型数据的方式,”Isola表示。

这为生成式AI开辟了大量的应用场景:

例如,Isola的团队正在使用生成式AI来创建合成图像数据,这些数据可用于训练另一个智能系统,例如教计算机视觉模型如何识别物体。

Jaakkola的团队正在使用生成式AI来设计新的蛋白质结构或有效的晶体结构以指定新材料。就像生成模型学习语言的依赖性一样,如果展示晶体结构,它也可以学习使结构稳定和可实现的关系。

图片

尽管生成模型可以取得惊人的成果,但它们并非适用于所有类型的数据,对于那些涉及在结构化数据(如电子表格中的表格数据)上进行预测的任务,生成式AI模型往往不如传统的机器学习方法。

04

生成式AI的机遇与风险

生成式AI聊天机器人目前在呼叫中心被用来解答客户的问题,但这一应用凸显了实施这些模型可能带来的一个潜在问题——人类的工作岗位被替代。此外,生成式AI可能会继承和扩散训练数据中存在的偏见,或放大仇恨言论和虚假陈述。同时这些模型具有抄袭的能力,并且可以生成看起来像是由特定人创作的内容,从而引发潜在的版权纠纷。

但另一方面,麻省理工学院的研究人员提出,生成式AI可能赋能艺术家,他们可以利用生成工具帮助创作他们可能无法用其他方式制作的创意内容。而在其他领域——如制造业,研究人员认为,在未来生成式AI不仅是让模型生成椅子的图像,它也许能生成可实际制造的椅子设计方案,这类应用或将彻底改变许多领域的经济格局。

若您对该文章内容有任何疑问,请与我们联系,我们将及时回应。

相关文章:

解析:什么是生成式AI?与其他类型的AI有何不同?

原创 | 文 BFT机器人 快速浏览一下头条新闻,你会发现生成式AI似乎无处不在。事实上,一些新闻标题甚至可能是通过生成式AI编写的,例如OpenAI旗下的ChatGPT,这个聊天机器人已经展现出了生成看起来像人类所写文本的惊人能力。 当人们…...

国产化项目改造:使用达梦数据库和东方通组件部署,前后端分离框架

前提&#xff1a;前后端分离前后端包都要用war包。 1、springboot后端改变war包 pom文件添加 <packaging>war</packaging>添加依赖&#xff0c;并且支持tomcat<!-- war包 --><dependency><groupId>org.springframework.boot</groupId><…...

Nginx实现负载均衡

Nginx实现负载均衡 负载均衡的作用 1、解决单点故障&#xff0c;让web服务器构成一个集群 2、将请求平均下发给后端的web服务器 负载均衡的软硬件介绍 负载均衡软件&#xff1a; # nginx 四层负载均衡&#xff1a;stream&#xff08;nginx 1.9版本以后有stream模块&#x…...

SpringCloud 2022有哪些变化

目录 前提条件 AOT支持 Spring Native支持 前提条件 Spring Cloud 2022.0.0是构建在Spring Framework 6.0和Spring Boot 3.0 之上的一S个主要版本。 JDK要求最低需要是Java 17J2EE要求最低需要Jakarta EE 9 AOT支持 Spring cloud 2022支持AOT编译&#xff0c;它是将程序源…...

如何快速本地搭建悟空CRM结合内网穿透工具高效远程办公

&#x1f308;个人主页&#xff1a;聆风吟 &#x1f525;系列专栏&#xff1a;数据结构、Cpolar杂谈 &#x1f516;少年有梦不应止于心动&#xff0c;更要付诸行动。 文章目录 &#x1f4cb;前言一. 无需公网IP&#xff0c;使用cpolar实现悟空CRM远程访问二. 通过公网来访问公司…...

Docker打包Python项目

1. 简介 Docker是一种开源的容器化平台&#xff0c;可以将应用程序及其依赖项打包到一个轻量级、可移植的容器中。通过使用Docker&#xff0c;可以简化Python项目的部署和运行&#xff0c;提高开发效率和应用程序的可移植性。 本文将介绍如何使用Docker来打包Python项目。我们…...

【Java并发编程一】并发与并行

为什么引入并发 摩尔定理逐渐失效&#xff0c;单核性能很难提升&#xff0c;通过组合多核性能来进一步满足实际需要&#xff0c;从而引入并发编程。在大部分场景下&#xff0c;并行是由于串行的&#xff0c;并行可以优化非关键节点的时间消耗。 并发的三大特性 原子性  某个…...

MFC/QT 一些快忘记的细节:

1&#xff1a;企业应用中&#xff0c;MFC平台除了用常见的对话框模式还有一种常用的就是单文档模式&#xff0c; 维护别人的代码&#xff0c;不容易区分,看它与程预序认同名cpp&#xff0c;就知道了&#xff0c;比如项目名称为 DoCMFCDemo&#xff0c;那么就看BOOL CDocMFCDe…...

在服务器上部署MVC 6应用程序

在服务器上成功部署MVC 6应用程序&#xff08;现在更为称为ASP.NET Core MVC&#xff09;涉及一系列步骤。以下是一般的指导步骤&#xff1a; 1. 准备服务器环境&#xff1a; - 确保服务器上安装了.NET Core Runtime和.NET Core SDK。可以从[.NET下载页面](https://dotnet.mi…...

golang学习笔记——斐波纳契数列

斐波纳契数列 编写一个程序来计算某个数字的斐波纳契数列。 斐波那契数列是一个数字列表&#xff0c;其中每个数字是前两个斐波那契数字之和。 例如&#xff0c;数字 6 的序列是 1,1,2,3,5,8&#xff0c;数字 7 的序列是 1,1,2,3,5,8,13&#xff0c;数字 8 的序列是 1,1,2,3,5…...

学习raft协议(1)

CAP C: 一致性 强调数据的正确性&#xff0c;每次读操作&#xff0c;要么读到最新&#xff0c;要么读失败 A:可用性 不发生错误&#xff0c;也不能出现过长的等待时间. P:分区容错性 在网络环境不可靠的背景下&#xff0c;整个系统仍然是正常运作的两种流派 &#xff08;1&am…...

SpringSecurity+jwt使用

参考文章链接 自定义SpringSecurity用户 package com.daben.springsecurityjwt.vo;import com.daben.springsecurityjwt.entity.SysUser; import org.springframework.security.core.GrantedAuthority; import org.springframework.security.core.userdetails.User; import j…...

html-网站菜单-点击显示导航栏

一、效果图 1.点击显示菜单栏&#xff0c;点击x号关闭&#xff1b; 2.点击一级菜单&#xff0c;展开显示二级&#xff0c;并且加号变为减号&#xff1b; 3.点击其他一级导航&#xff0c;自动收起展开的导航。 二、代码实现 <!DOCTYPE html> <html><head>&…...

【C++函数的进化】函数指针,模板,仿函数,lambda表达式

/*** poject * author jUicE_g2R(qq:3406291309)* file C函数的进化* * language C* EDA Base on VS2022* editor Obsidian&#xff08;黑曜石笔记软件&#xff09;* * copyright 2023* COPYRIGHT 原创学习笔记&#xff1a;转载需获得博…...

云服务器windows service2022 部署git服务器

1 安装 下载地址gitblit 解压到你的一个目录,我这里给的是C:\gitblit 根据官网提示要下载jre or jdk7.0,这里建议使用下载jre (jdk 有时候运行出问题,或者2个都安装),自行安装java,这里不做环境配置的说明 进入c:\gitblit\data 目录里面找到,defaults.properties 文件,编辑主…...

Linux_Docker修改Docker Root Dir

今天遇到需求&#xff0c;要修改一下docker容器和镜像的存储位置&#xff0c;默认位置为/var/lib/docker目录下&#xff0c;要修改到/new/dockerFile目录下。 停止docker服务 sudo service docker stop 备份docker容器镜像 移动/var/lib/docker目录下的文件到/dockerFile目录…...

解决requests 2.28.x版本SSL错误:证书验证失败

1、问题背景 在使用requests 2.28.1版本时&#xff0c;我进行HTTP post传输报告负载时&#xff0c;由于SSL验证设置为True&#xff0c;请求失败&#xff0c;错误如下&#xff1a;(Caused by SSLError(SSLCertVerificationError(1, ‘[SSL: CERTIFICATE_VERIFY_FAILED] certifi…...

【开源】基于Vue.js的开放实验室管理系统的设计和实现

项目编号&#xff1a; S 013 &#xff0c;文末获取源码。 \color{red}{项目编号&#xff1a;S013&#xff0c;文末获取源码。} 项目编号&#xff1a;S013&#xff0c;文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、研究内容2.1 实验室类型模块2.2 实验室模块2.3 实…...

使用composer安装ffmpeg的步骤

以下是使用composer安装ffmpeg的步骤&#xff1a; 1.在laravel根目录下执行以下命令安装ffmpeg&#xff1a; composer require php-ffmpeg/php-ffmpeg 2.如果不指定版本号&#xff0c;则默认使用0.14版本。 3.执行以上命令后&#xff0c;composer会自动下载并安装ffmpeg。 …...

RT-DETR优化策略:轻量级Backbone改进 | 高效模型 (Efficient MOdel, EMO),现代倒残差移动模块设计|ICCV2023

🚀🚀🚀本文改进:面向移动端的轻量化网络模型——EMO,它能够以相对较低的参数和 FLOPs 超越了基于 CNN/Transformer 的 SOTA 模型,支持四个版本EMO_1M, EMO_2M, EMO_5M, EMO_6M,参数量如下,相对于自带的rtdetr-l、rtdetr-x有很大提升 layersparametersgradientsEMO_1…...

React 第五十五节 Router 中 useAsyncError的使用详解

前言 useAsyncError 是 React Router v6.4 引入的一个钩子&#xff0c;用于处理异步操作&#xff08;如数据加载&#xff09;中的错误。下面我将详细解释其用途并提供代码示例。 一、useAsyncError 用途 处理异步错误&#xff1a;捕获在 loader 或 action 中发生的异步错误替…...

Redis相关知识总结(缓存雪崩,缓存穿透,缓存击穿,Redis实现分布式锁,如何保持数据库和缓存一致)

文章目录 1.什么是Redis&#xff1f;2.为什么要使用redis作为mysql的缓存&#xff1f;3.什么是缓存雪崩、缓存穿透、缓存击穿&#xff1f;3.1缓存雪崩3.1.1 大量缓存同时过期3.1.2 Redis宕机 3.2 缓存击穿3.3 缓存穿透3.4 总结 4. 数据库和缓存如何保持一致性5. Redis实现分布式…...

Auto-Coder使用GPT-4o完成:在用TabPFN这个模型构建一个预测未来3天涨跌的分类任务

通过akshare库&#xff0c;获取股票数据&#xff0c;并生成TabPFN这个模型 可以识别、处理的格式&#xff0c;写一个完整的预处理示例&#xff0c;并构建一个预测未来 3 天股价涨跌的分类任务 用TabPFN这个模型构建一个预测未来 3 天股价涨跌的分类任务&#xff0c;进行预测并输…...

Springcloud:Eureka 高可用集群搭建实战(服务注册与发现的底层原理与避坑指南)

引言&#xff1a;为什么 Eureka 依然是存量系统的核心&#xff1f; 尽管 Nacos 等新注册中心崛起&#xff0c;但金融、电力等保守行业仍有大量系统运行在 Eureka 上。理解其高可用设计与自我保护机制&#xff0c;是保障分布式系统稳定的必修课。本文将手把手带你搭建生产级 Eur…...

让回归模型不再被异常值“带跑偏“,MSE和Cauchy损失函数在噪声数据环境下的实战对比

在机器学习的回归分析中&#xff0c;损失函数的选择对模型性能具有决定性影响。均方误差&#xff08;MSE&#xff09;作为经典的损失函数&#xff0c;在处理干净数据时表现优异&#xff0c;但在面对包含异常值的噪声数据时&#xff0c;其对大误差的二次惩罚机制往往导致模型参数…...

【笔记】WSL 中 Rust 安装与测试完整记录

#工作记录 WSL 中 Rust 安装与测试完整记录 1. 运行环境 系统&#xff1a;Ubuntu 24.04 LTS (WSL2)架构&#xff1a;x86_64 (GNU/Linux)Rust 版本&#xff1a;rustc 1.87.0 (2025-05-09)Cargo 版本&#xff1a;cargo 1.87.0 (2025-05-06) 2. 安装 Rust 2.1 使用 Rust 官方安…...

Python训练营-Day26-函数专题1:函数定义与参数

题目1&#xff1a;计算圆的面积 任务&#xff1a; 编写一个名为 calculate_circle_area 的函数&#xff0c;该函数接收圆的半径 radius 作为参数&#xff0c;并返回圆的面积。圆的面积 π * radius (可以使用 math.pi 作为 π 的值)要求&#xff1a;函数接收一个位置参数 radi…...

Excel 怎么让透视表以正常Excel表格形式显示

目录 1、创建数据透视表 2、设计 》报表布局 》以表格形式显示 3、设计 》分类汇总 》不显示分类汇总 1、创建数据透视表 2、设计 》报表布局 》以表格形式显示 3、设计 》分类汇总 》不显示分类汇总...

claude3.7高阶玩法,生成系统架构图,国内直接使用

文章目录 零、前言一、操作指南操作指导 二、提示词模板三、实战图书管理系统通过4o模型生成系统描述通过claude3.7生成系统架构图svg代码转换成图片 在线考试系统通过4o模型生成系统描述通过claude3.7生成系统架构图svg代码转换成图片 四、感受 零、前言 现在很多AI大模型可以…...

旋量理论:刚体运动的几何描述与机器人应用

旋量理论为描述刚体在三维空间中的运动提供了强大而优雅的数学框架。与传统的欧拉角或方向余弦矩阵相比&#xff0c;旋量理论通过螺旋运动的概念统一了旋转和平移&#xff0c;在机器人学、计算机图形学和多体动力学领域具有显著优势。这种描述不仅几何直观&#xff0c;而且计算…...