当前位置: 首页 > article >正文

【大模型学习】第二十四章 生成式人工智能(GAI)简介

目录

一、什么是生成式人工智能(GAI)?‌

二、核心技术原理‌

‌三、典型应用场景‌

‌四、技术特点与挑战‌

五、训练优化策略

六、关键性能指标(2025年基准)

‌七、技术演进方向‌:


一、什么是生成式人工智能(GAI)?

生成式人工智能(GAI)是一类能够‌自主创造新内容‌的AI技术,其核心目标是通过学习数据中的规律,生成与训练数据类似但全新的文本、图像、音频、视频甚至代码。

  • 与判别式AI的区别‌:
    • 判别式AI‌:专注于分类或预测(如人脸识别、垃圾邮件检测)。
    • 生成式AI‌:专注于“创作”(如写文章、画图、作曲)。

二、核心技术原理

  1. 基础架构‌:

  • Transformer模型‌:通过自注意力机制处理序列数据(如GPT系列、BERT)。
  • 生成对抗网络(GAN)‌:由生成器和判别器对抗训练,生成逼真数据(如Deepfake)。
  • 变分自编码器(VAE)‌:通过概率分布学习数据特征,生成多样化内容。
  • 扩散模型(Diffusion Models)‌:通过逐步去噪生成高精度图像(如Stable Diffusion、DALL·E )。

        2. 训练方式‌:

  • 基于海量数据(如互联网文本、图片库)进行无监督或半监督学习。
  • 通过微调(Fine-tuning)适应特定任务(如医疗报告生成、法律文书撰写)。

三、典型应用场景

领域示例
文本生成自动写作(ChatGPT)、邮件润色、新闻稿生成、剧本创作
图像生成艺术设计(Midjourney)、广告素材生成、产品原型设计(DALL·E 3)
音频/视频语音合成(Sora)、虚拟主播、音乐创作(Suno AI)、影视特效
代码生成编程辅助(GitHub Copilot)、自动化脚本编写
跨模态生成根据文本生成图片(Stable Diffusion)、根据草图生成3D模型

四、技术特点与挑战

  • 核心优势‌:

    • 创造性‌:突破传统规则限制,生成人类未明确设计的内容。
    • 多模态融合‌:支持文本、图像、音频等多种形式的内容生成与转换。
    • 效率提升‌:自动化生成可节省人工成本(如设计、写作、编程)。
  • 关键挑战‌:

    • 伦理与安全‌:虚假信息、版权争议、深度伪造(Deepfake)风险。
    • 数据偏差‌:训练数据中的偏见可能导致生成内容偏离真实需求。
    • 算力依赖‌:大模型训练需消耗巨量计算资源(如千亿级参数模型)。

五、训练优化策略

技术实现方法
检索增强生成(RAG)将代码知识库向量化存储,生成时结合相似代码片段提升准确性‌
强化学习调优通过代码执行结果反馈优化模型(如单元测试通过率作为奖励函数)‌
量化压缩使用4-bit量化技术将模型体积缩小75%,保持90%以上精度‌

六、关键性能指标(2025年基准)

指标数值
单次推理延迟<500ms(A100 GPU)‌
代码正确率85%(LeetCode简单题)‌
多语言支持Python/Java/JS等12种语言‌

‌七、技术演进方向‌:

  1. 多模态代码生成‌:结合UML图生成完整项目框架‌
  2. 自修复能力‌:通过执行错误日志自动修正代码逻辑‌
  3. 低代码集成‌:与Figma等设计工具联动生成前端组件‌

 

相关文章:

【大模型学习】第二十四章 生成式人工智能(GAI)简介

目录 一、什么是生成式人工智能&#xff08;GAI&#xff09;&#xff1f;‌ 二、核心技术原理‌ ‌三、典型应用场景‌ ‌四、技术特点与挑战‌ 五、训练优化策略 六、关键性能指标&#xff08;2025年基准&#xff09; ‌七、技术演进方向‌&#xff1a; 一、什么是生成式…...

Pytorch中layernorm实现详解

平时我们在编写神经网络时&#xff0c;经常会用到layernorm这个函数来加快网络的收敛速度。那layernorm到底在哪个维度上进行归一化的呢&#xff1f; 一、问题描述 首先借用知乎上的一张图&#xff0c;原文写的也非常好&#xff0c;大家有空可以去阅读一下&#xff0c;链接放…...

YOLO11报错:AttributeError: module ‘torch‘ has no attribute ‘OutOfMemoryError‘

事情是这样的&#xff1a;前几天YOLO11的代码还是可以训练的&#xff0c;昨天训练了一天&#xff0c;今天换模型就报这个错。 AttributeError: module torch has no attribute OutOfMemoryError我查了一下&#xff1a;YOLO11官方代码issues里面也有人有同样的问题&#xff0c;…...

基于java的ssm+JSP+MYSQL的高校四六级报名管理系统(含LW+PPT+源码+系统演示视频+安装说明)

作者&#xff1a;计算机搬砖家 开发技术&#xff1a;SpringBoot、php、Python、小程序、SSM、Vue、MySQL、JSP、ElementUI等&#xff0c;“文末源码”。 专栏推荐&#xff1a;SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码 精品专栏&#xff1a;Java精选实战项…...

Starrocks 命令 Alter table DISTRIBUTED 重分布数据的实现

背景 在前文Starrocks 写入报错 primary key memory usage exceeds the limit中&#xff0c;可以通过ALTER TABLE xxxx DISTRIBUTED BY HASH(xx) BUCKETS 50;来改变数据的分布状态,具体的执行过程是怎么样的呢&#xff1f; 分析 首先对应的g4文件中为 alterTableStatement &…...

ns3使用入门_基于ns3.44_Part2_配置模块参数的Configuration 和Attributes

前言 事实上ns3的官方手册很全,相关书籍也是有的,官网先贴在这里: ns-3 | a discrete-event network simulator for internet systemsa discrete-event network simulator for internet systemshttps://www.nsnam.org/相关的脚本介绍也都有一些: ns-3.35_wifi-he-networ…...

性能测试过程实时监控分析

性能监控 前言一、查看性能测试结果的3大方式1、GUI界面报告插件2、命令行运行 html报告3、后端监听器接入仪表盘 二、influxDB grafana jmeter测试监控大屏1、原理&#xff1a;2、linux环境中influxDB 安装和配置3、jmerer后端监听器连接influxDB4、linux环境总grafana环境搭…...

Springboot List集合的校验方式

pom.xml 引入 <dependency><groupId>org.hibernate.validator</groupId><artifactId>hibernate-validator</artifactId><version>6.2.0.Final</version></dependency><dependency><groupId>org.springframework.b…...

C程序设计(第五版)及其参考解答,附pdf

通过网盘分享的文件&#xff1a;谭浩强C语言设计 链接: https://pan.baidu.com/s/1U927Col0XtWlF9TsFviApg?pwdeddw 提取码: eddw 谭浩强教授的《C程序设计》是C语言学习领域的经典教材&#xff0c;其内容深入浅出&#xff0c;适合不同层次的学习者。 一、教材版本与特点 最…...

【蓝桥杯速成】| 7.01背包练习生

题目一&#xff1a;分割等和子集 问题描述 416. 分割等和子集 - 力扣&#xff08;LeetCode&#xff09; 给你一个 只包含正整数 的 非空 数组 nums 。请你判断是否可以将这个数组分割成两个子集&#xff0c;使得两个子集的元素和相等。 示例 1&#xff1a; 输入&#xff1a…...

杰理科技JL703N双模蓝牙芯片—云信

杰理科技JL703N芯片运算能力、接收灵敏度、发射功率、音频性能等指标均处于行业一流水平&#xff0c;能满足多场景的应用需求&#xff0c;具有以下明显优势&#xff1a; 一、高性能双核浮点CPU&#xff0c;算力十足 JL703N芯片搭载了32位高性能双核CPU&#xff0c;主频高达32…...

Rust + 时序数据库 TDengine:打造高性能时序数据处理利器

引言&#xff1a;为什么选择 TDengine 与 Rust&#xff1f; TDengine 是一款专为物联网、车联网、工业互联网等时序数据场景优化设计的开源时序数据库&#xff0c;支持高并发写入、高效查询及流式计算&#xff0c;通过“一个数据采集点一张表”与“超级表”的概念显著提升性能…...

Nvidia 官方CUDA课程学习笔记

之前心血来潮学习了一下Nvidia CUDA&#xff0c;外行&#xff0c;文章有理解不当的地方&#xff0c;望指正。 主要根据以下Nvidia官方课程学习&#xff1a; https://www.bilibili.com/video/BV1JJ4m1P7xW/?spm_id_from333.337.search-card.all.click&vd_sourcec256dbf86b…...

基于TCN-BiLSTM-Attention的序列数据预测(功率预测、故障诊断)模型及代码详解

TCN-BiLSTM-Attention结构 在TCN-BiLSTM-Attention结构中,各层之间的协同工作构成了一个强大的时间序列预测模型。这种组合不仅充分利用了每种模型的优势,还通过精心设计的连接方式最大化了模型的性能。 TCN-BiLSTM-Attention结构的主要组成部分包括: 时间卷积网络(TCN) 功…...

【AI News | 20250319】每日AI进展

AI Repos 1、XianyuAutoAgent 实现了 24 小时自动化值守的 AI 智能客服系统&#xff0c;支持多专家协同决策、智能议价和上下文感知对话&#xff0c;让我们店铺管理更轻松。主要功能&#xff1a; 智能对话引擎&#xff0c;支持上下文感知和专家路由阶梯降价策略&#xff0c;自…...

一种基于大规模语言模型LLM的数据分析洞察生成方法

从复杂数据库中提取洞察对数据驱动决策至关重要,但传统手动生成洞察的方式耗时耗力,现有自动化数据分析方法生成的洞察不如人工生成的有洞察力,且存在适用场景受限等问题。下文将介绍一种新的方法,通过生成高层次问题和子问题,并使用SQL查询和LLM总结生成多表数据库中的见…...

怎么用LoRA的低秩结构近似Fisher矩阵

怎么用LoRA的低秩结构近似Fisher矩阵 目录 怎么用LoRA的低秩结构近似Fisher矩阵**1. Fisher矩阵的内存挑战****2. LoRA的低秩结构与Fisher近似****3. 具体实现步骤****4. 示例说明****5. 有效性分析****6. 扩展与优化****总结**在LoRA(低秩适应)中,通过低秩结构近似Fisher矩…...

docker(1) -- centos镜像

1. 前言 我在WSL中运行的系统是ubuntu2024&#xff0c;并安装了docker&#xff0c;想要在docker中运行一个centos的系统。 2. 下载并运行镜像 # 下载centos最新版镜像 $ docker pull centos Using default tag: latest latest: Pulling from library/centos a1d0c7532777: P…...

【npm ERR! code ERESOLVE npm ERR! ERESOLVE unable to resolve dependency tree】

npm ERR! code ERESOLVE npm ERR! ERESOLVE unable to resolve dependency tree npm ERR! code ERESOLVE npm ERR! ERESOLVE unable to resolve dependency tree 当我们拿到一个前端项目的时候&#xff0c;想要把它运行起来&#xff0c;首先是要给它安装依赖&#xff0c;即cd到…...

用 pytorch 从零开始创建大语言模型(四):从零开始实现一个用于生成文本的GPT模型

从零开始创建大语言模型&#xff08;Python/pytorch &#xff09;&#xff08;四&#xff09;&#xff1a;从零开始实现一个用于生成文本的GPT模型 4 从零开始实现一个用于生成文本的GPT模型4.1 编写 L L M LLM LLM架构4.2 使用层归一化对激活值进行标准化4.3 使用GELU激活函数…...

【新能源汽车“心脏”赋能:三电系统研发、测试与应用匹配的恒压恒流源技术秘籍】

新能源汽车“心脏”赋能&#xff1a;三电系统研发、测试与应用匹配的恒压恒流源技术秘籍 在新能源汽车蓬勃发展的浪潮中&#xff0c;三电系统&#xff08;电池、电机、电控&#xff09;无疑是其核心驱动力。而恒压源与恒流源&#xff0c;作为电源管理的关键要素&#xff0c;在…...

目标检测20年(一)

今天看的文献是《Object Detection in 20 Years: A Survey》&#xff0c;非常经典的一篇目标检测文献&#xff0c;希望通过这篇文章学习到目标检测的基础方法并提供一些创新思想。 论文链接&#xff1a;1905.05055 一、摘要 1.1 原文 Object detection, as of one the most…...

Scikit-learn 学习思维导图

Scikit-learn 学习思维导图 #mermaid-svg-LoibxEyLRA2fItOn {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-LoibxEyLRA2fItOn .error-icon{fill:#552222;}#mermaid-svg-LoibxEyLRA2fItOn .error-text{fill:#552222;…...

【MySQL数据库】存储过程与自定义函数(含: SQL变量、分支语句、循环语句 和 游标、异常处理 等内容)

存储过程&#xff1a;一组预编译的SQL语句和流程控制语句&#xff0c;被命名并存储在数据库中。存储过程可以用来封装复杂的数据库操作逻辑&#xff0c;并在需要时进行调用。 类似的操作还有&#xff1a;自定义函数、.sql文件导入。 我们先从熟悉的函数开始说起&#xff1a; …...

WEB攻防-PHP反序列化-字符串逃逸

目录 前置知识 字符串逃逸-减少 字符串逃逸-增多 前置知识 1.PHP 在反序列化时&#xff0c;语法是以 ; 作为字段的分隔&#xff0c;以 } 作为结尾&#xff0c;在结束符}之后的任何内容不会影响反序列化的后的结果 class people{ public $namelili; public $age20; } var_du…...

英伟达GTC 2025大会产品全景剖析与未来路线深度洞察分析

【完整版】3月19日&#xff0c;黄仁勋Nvidia GTC 2025 主题演讲&#xff5c;英伟达 英伟达GTC 2025大会产品全景剖析与未来路线深度洞察分析 一、引言 1.1 分析内容 本研究主要采用了文献研究法、数据分析以及专家观点引用相结合的方法。在文献研究方面&#xff0c;广泛收集了…...

基于java的ssm+JSP+MYSQL的九宫格日志网站(含LW+PPT+源码+系统演示视频+安装说明)

系统功能 管理员功能模块&#xff1a; 个人中心 用户管理 日记信息管理 美食信息管理 景点信息管理 新闻推荐管理 日志展示管理 论坛管理 我的收藏管理 管理员管理 留言板管理 系统管理 用户功能模块&#xff1a; 个人中心 日记信息管理 美食信息管理 景点信息…...

【Java】Mybatis学习笔记

目录 一.搭建Mybatis 二.Mybatis核心配置文件解析 1.environment标签 2.typeAliases 3.mappers 三.Mybatis获取参数值 四.Mybatis查询功能 五.特殊的SQL执行 1.模糊查询 2.批量删除 3.动态设置表名 4.添加功能获取自增的主键 六.自定义映射ResultMap 1.配置文件处…...

从DNA到AI:一部35亿年的智能进化史诗

从DNA到AI&#xff1a;一部35亿年的智能进化史诗 一、生命起源&#xff1a;宇宙熵增中的第一缕秩序之光 在35亿年前的地球原始海洋中&#xff0c;DNA的诞生标志着一场伟大的反叛&#xff1a;混沌汤中浮现出能自我复制的有序结构。这种由4种碱基组成的分子&#xff0c;用其双螺…...

遗传算法+四模型+双向网络!GA-CNN-BiLSTM-Attention系列四模型多变量时序预测

遗传算法四模型双向网络&#xff01;GA-CNN-BiLSTM-Attention系列四模型多变量时序预测 目录 遗传算法四模型双向网络&#xff01;GA-CNN-BiLSTM-Attention系列四模型多变量时序预测预测效果基本介绍程序设计参考资料 预测效果 基本介绍 基于GA-CNN-BiLSTM-Attention、CNN-BiL…...