生成式AI、大模型、多模态技术开发与应用学习清单
学习目的:
- 了解AIGC发展现状与核心技术。
- 掌握Transformer核心开发技术。
- 掌握向量数据库的工作原理、检索算法、主要开源数据库。
- 掌握大模型调用、微调方法。
- 掌握以GPT大语言模型为基础的工作原理。
- 掌握AIGC技术在跨模态领域的应用技术。
- 了解GPT提示工程和AIGC的安全标准。
- 掌握基于大模型的编程开发技术。
- 掌握扩散模型核心技术。
- 掌握 Agent 构建技术。
学习清单:
第一章、
生成式AI技术发展概述
一、AI:从判别决策到创造生成
1.从经典机器学习到深度学习
2.从Transformer到生成模型
二、生成式人工智能模型
1.生成对抗网络GAN
2.可变分自编码器VAE
3.自回归模型Auto-regressive Model
4.扩散模型Diffusion Model
三、AIGC技术及进展
1.AIGC的定义和发展
2.AIGC技术的分类
3.AIGC技术框架
四、大模型
1.从ChatGPT到Sora的技术演进
2.大语言模型
3.视觉大模型
4.多模态大模型
第二章、
AIGC技术在多模态领域的应用
一、AIGC在自然语言处理领域的应用
1.语义理解
2.内容生成
a、公文辅助写作 b、政策分析
c、研报生成 d、风控舆情
3.多轮会话
4.逻辑推理
二、AIGC在视频领域的应用
1.图像识别、检测与生成
2.视频理解与生成
3.3D生成
三、AIGC在视觉和音频生成领域的应用
1.图像生成
2.电影配音
3.智能客服
4.各类场景语音生成
第三章、
Transformer
一、Transformer模型的基本架构
二、Self-Attention机制的原理与计算过程
三、Multi-Head Attention 的设计与作用
四、Positional Encoding的实现方法
五、Rotary Positional Embedding
六、Transformer中的Feed-Forward Networks
七、Layer Normalization的原理
八、Transformer模型中的残差连接
九、Teacher Forcing技术
十、编码器与解码器的结构差异
十一、视觉Transformer
第四章、
大语言模型微调与量化
一、模型微调
1.全量微调FFT
2.部分参数微调PEFT
3.Prompt微调
4.Prefix微调
5.LoRA等微调方法
6.大语言模型微调开发
二、模型量化
1.线性量化
2.非线性量化
3.饱合量化
4.非饱合量化
5.大语言模型微调量化开发
三、实例开发
1.大语言模型微调框架
2.大语言模型微调实例
第五章、
AIGC技术
一、大语言模型技术原理
1.生成模型(扩散模型)
2.深度学习常用算法
3.人类反馈强化学习RLHF
4.典型大语言模型
二、提示工程
1.提示词的基础知识
2.思维链
3.提示词实操:明确具体任务、利用上下文、使用不同的语气、角色扮演、zero shot, one shot, few shot、零样本思维链提示、生成知识提示
三、AIGC的安全
1.内容安全
2.模型安全
3.用户信息安全
四、AIGC技术评价
1.AIGC标准体系
2.AIGC应用层标准
3.AIGC模型层标准
第六章、
AIGC技术的记忆模块(向量数据库)
一、向量数据库概述
1.AIGC技术的记忆模块的功能和作用
2.向量数据库的功能与发展历程
3.各种向量数据库的对比
4.向量数据库发展展望
二、向量数据库技术
1.向量数据库原理
2.向量检索算法
3.向量数据库实操
第七章、
大语言模型 Agent
一、大语言模型开发框架
1.大语言模型开发框架的原理与工作流程
2.大语言模型开发框架的分层结构
3.大语言模型开发框架的模块与库函数
二、Agent
1.Agent 工作原理
2.Agent 模式
3.Agent 开发步骤与工作流程
三、大语言模型 Agent 开发
1.大语言模型与 Agent 结合开发方式
2.大语言模型 Agent 开发实例
3.构建一个智能体
第八章、
扩散模型
一、前向扩散过程
二、反向生成过程
三、网络架构
四、参数化
五、采样方法
六、Stable Diffusion模型
七、Diffusion Transformer模型
第九章、
CLIP
一、CLIP架构
二、对比预训练
三、数据集分类器创建
四、Zero-shot 推理
五、提示词工程与集成
第十章、
VAE
一、Autoencoder
二、VAE模型原理
三、重参化
四、VAE与AE的区别
五、Spacetime Latent Representation
第十一章、
Sora训练
一、Sora 训练流程
二、patchify—视频数据转换为图像块
三、Scaling Transformer生成
四、Latent转换为视频向量
※
开发环境
1. 操作系统:Ubuntu
2. 开发语言:Python
3. 深度学习框架:Pytorch
4. 大语言模型:几种国产开源大语言模型
5.大语言模型开源微调、Agent 开源框架
参考构建学习清单:
https://mp.weixin.qq.com/s/pNrgtI2TLQw0X7NsjmJhAA
相关文章:

生成式AI、大模型、多模态技术开发与应用学习清单
学习目的: 了解AIGC发展现状与核心技术。 掌握Transformer核心开发技术。掌握向量数据库的工作原理、检索算法、主要开源数据库。掌握大模型调用、微调方法。掌握以GPT大语言模型为基础的工作原理。 掌握AIGC技术在跨模态领域的应用技术。了解GPT提示工程和AIGC的安…...

STM32 CubeMx HAL库 独立看门狗IWDG配置使用
看门狗这里我就不多介绍了,能搜到这篇文章说明你了解 总之就是一个单片机重启程序,设定好超时时间,在超时时间内没有喂狗,单片机就会复位 主要应用在单片机异常重启方面,比如程序跑飞(注意程序跑飞时你就…...

网络安全渗透测试概论
渗透测试,也称为渗透攻击测试是一种通过模拟恶意攻击者的手段来评估计算机系统、网络或应用程序安全性的方法。 目的 旨在主动发现系统中可能存在的安全漏洞、脆弱点以及潜在风险,以便在被真正的恶意攻击者利用之前,及时进行修复和加固&…...

【大数据技术基础】【记录Ubuntu 16.04升级到18.04】Ubuntu的一个版本升级到另一个版本
在 Ubuntu 操作系统中进行软件更新和系统升级 Ubuntu Kylin 16.04 LTS 系统进行系统升级到 Ubuntu 18.04.6 LTS 版本 升级提示:系统弹出提示框,告知用户有新版本的 Ubuntu 可用,询问用户是否想要升级。 认证窗口:显示了一个认证…...

知识库系统,集成neo4j,集成activiti工作流,集成es全文检索,知识图谱血缘关系,nlp知识库
一、项目介绍 一款全源码,可二开,可基于云部署、私有部署的企业级知识库云平台,一款让企业知识变为实打实的数字财富的系统,应用在需要进行文档整理、分类、归集、检索、分析的场景。 为什么建立知识库平台? 助力企业…...

批量合并多个Excel到一个文件
工作中,我们经常需要将多个Excel的数据进行合并,很多插件都可以做这个功能。但是今天我们将介绍一个完全免费的独立软件【非插件】,来更加方便的实现这个功能。 准备Excel 这里我们准备了两张待合并的Excel文件 的卢易表 打开的卢易表软件…...

CNCF云原生生态版图-项目和产品综合分析
CNCF云原生生态版图-项目和产品综合分析 CNCF云原生生态版图-项目和产品综合分析整体统计分析中国研发人员贡献项目和产品其中,纳入 CNCF 管理的开源项目 链接 CNCF云原生生态版图-项目和产品综合分析 整体统计分析 在对云原生技术选型时,优先选择经过 …...

MySQL生产环境备份脚本
全量备份脚本,其中BakDir,ZlbakDir,LogFile需要自己创建 #!/bin/bash export LANGen_US.UTF-8# 指定备份目录 BakDir/root/beifen/data/mysqlbak/data/allbak # 指定增量备份目录 ZlbakDir/root/beifen/data/mysqlbak/data/zlbak # 备份日志…...

leetcode 3224. 使差值相等的最少数组改动次数
题目链接:3224. 使差值相等的最少数组改动次数 题目: 给你一个长度为 n 的整数数组 nums ,n 是偶数 ,同时给你一个整数 k 。 你可以对数组进行一些操作。每次操作中,你可以将数组中任一元素替换为 0 到 k 之间的任一…...

多线程动态库里面调用静态库分配内存函数导致的崩溃cltp汇编指令导致
1、概述 有这样的一个场景,我有一个动态库myso.so里面有函数start_crash(),用到静态库的内存分配函数,其实静态库里面的static.a 里面就封装了一个函数叫system_malloc(),函数返回的是分配的内存地址,然后发现,我在测试demo里面创…...

力扣刷题TOP101: 31.BM38 在二叉树中找到两个节点的最近公共祖先
目录: 目的 思路 复杂度 记忆秘诀 python代码 目的: 给定一棵二叉树(保证非空)以及这棵树上的两个节点对应的val值 o1 和 o2,请找o1 和 o2 的最近公共祖先节点。 思路 这个任务目和上一题在二叉搜索树中找到两个节点的最近公共祖先有点类…...

前端项目打包部署
打包和部署前端项目是将开发环境中的代码转化为生产环境可直接运行的静态文件,并将其部署到服务器上的过程。 # 项目打包 pnpm run build# 上传文件至远程服务器 将本地打包生成的 dist 目录下的所有文件拷贝至服务器的 /usr/share/nginx/html 目录。# nginx.cofig…...

《CSS 知识点》大屏卡片布局思路:弹性布局 flex-grow
思路 大屏左右两侧高宽一致,内部卡片可按比例设置! 使用弹性布局和属性 flex-grow 设置比例;间隔使用 margin-bottom 设置,最后一个卡片不设置; 效果如图 代码说明 CSS代码 26 - 30,左右两侧设置弹性布…...

nVisual 登录页页面配置说明
一、概述 nVisual登录页面可根据具体客户需要通过public\config\access.js文件进行自定义配置。页面可以大致分为4个部分,头部、底部、可移动区域以及页面中间的信息填写区域。其中头部和底部又包含头部左侧、头部中间、头部右侧、底部左侧、底部中间、底部右侧六个…...

后端接受前端传递数组进行批量删除
问题描述:当我们需要做批量删除功能的时候,我们循环单次删除的接口也能进行批量删除,但要删除100条数据就要调用100次接口,或者执行100次sql,这样系统开销是比较大的,那么我们直接采用接收的数组格式数据sq…...

拍频实例 - 一组恒力矩电流采样数据
这是一组功率电机的感应电流波形。加载了重载恒力矩设备。你能看到什么? 首先,时间轴的坐标是对的,9.9~10.0秒,单位是秒,100ms有5个波形,所以是20ms一个波形。这是50Hz的信号。频差就体现为幅度的周期起伏…...

Jvm之NativeMemoryTracking 使用
开启 Native Memory Tracking 通过 -XX:NativeMemoryTracking 开启: -XX:NativeMemoryTrackingoff:这是默认值,即关闭 Native Memory Tracking -XX:NativeMemoryTrackingsummary: 开启 Native Memory Tracking,但是仅仅按照各个 JVM 子系统…...

PKCS#7、Bit padding(位填充)、Byte padding(字节填充)、Zero padding(零填充)
PKCS#7、Bit padding(位填充)、Byte padding(字节填充)、Zero padding(零填充)是密码学常见的填充方式。 Bit padding(位填充): 位填充可以应用于任意长度的消息。在消息…...

R语言学习笔记-1
1. 基础操作和函数 清空环境:rm(list ls()) 用于清空当前的R环境。 打印输出:print("Hello, world") 用于输出文本到控制台。 查看已安装包和加载包: search():查看当前加载的包。install.packages("package_na…...

我在广州学 Mysql 系列之 数据“表”的基本操作
ℹ️大家好,我是😆练小杰,今天主要讲得是Mysql数据表的基本操作内容~~ 昨天讲了“Mysql 数据“库“的基本操作”~~ 想要了解更多🈶️MYSQL 数据库的命令行总结!!! “真相永远只有一个”——工藤…...

auto-gptq安装以及不适配软硬件环境可能出现的问题及解决方式
目录 1、auto-gptq是什么?2、auto-gptq安装3、auto-gptq不正确安装可能会出现的问题(1)爆出:CUDA extension not installed.(2)没有报错但是推理速度超级慢 1、auto-gptq是什么? Auto-GPTQ 是一…...

【R语言】基础知识
一、对象与变量 R语言中的所有事物都是对象,如向量、列表、函数,变量、甚至环境等。它的所有代码都是基于对象object的操作,变量只是调用对象的手段。 1、对象 在R语言中,对计算机内存的访问是通过对象实现的。 # 字符型向量 …...

【一本通】虫洞
【一本通】虫洞 C语言代码C代码JAVA代码 💐The Begin💐点点关注,收藏不迷路💐 John在他的农场中闲逛时发现了许多虫洞。虫洞可以看作一条十分奇特的有向边,并可以使你返回到过去的一个时刻(相对你进入虫洞之…...

python爬虫--小白篇【爬虫实践】
一、前言 1.1、王者荣耀皮肤爬虫 根据王者荣耀链接,将王者荣耀的全部英雄的全部皮肤图片爬取保存到本地。经过分析得到任务的三个步骤: 根据首页全部英雄列表连接获取全部英雄的名称hero_name以及对应的hero_id;根据单个英雄的hero_name和h…...

Unity背包道具拖拽(极简版实现)
(感觉Csdn代码页面可以再大一点或者加个放大功能 不然得划着看不太舒服) 1.关键接口,三个拖拽相关的 2.关键参数,PointerEventData 一直没仔细看过,其实有包含鼠标相关的很多参数,鼠标点击次数ÿ…...

spark读取普通文件
spark读取普通文件 txt文件 """ 将一行数据当做一个字段,需要自己切割 字段名称为value 表结构 可以从sql中搞 """ df spark.read.text("../../data/wordcount/input/data.txt") df spark.read.format("text"…...

MySQL SQL语句性能优化
MySQL SQL语句性能优化指南 一、查询设计优化1. 避免 SELECT *2. 使用 WHERE 进行条件过滤3. 避免在索引列上使用函数和表达式4. 使用 LIMIT 限制返回行数5. 避免使用子查询6. 优化 JOIN 操作7. 避免全表扫描 二、索引优化1. 使用合适的索引2. 覆盖索引3. 索引选择性4. 多列索引…...

【蓝桥杯每日一题】技能升级
技能升级 2024-12-10 蓝桥杯每日一题 技能升级 二分 题目大意 一个角色有 N 种可以增加攻击力的技能,对于第 i 个技能首次升级可以提升 A i A_i Ai 点攻击力,随后的每次升级增加的攻击力都会减少 B i B_i Bi 。升级 ⌈ A i B i ⌉ \lceil \frac{A…...

css 实现在一条线上流动小物体(offset-path)
直接贴代码,留几个参考网址给大家 【SVG】路径<Path>标签详解,一次搞懂所有命令参数 探秘神奇的运动路径动画 Motion Path <!DOCTYPE html> <html lang="en"> <head><meta charset="UTF-8"><meta name="viewport&quo…...

探索 Robyn 框架 —— 下一代高性能 Web 框架
技术博客:探索 Robyn 框架 —— 下一代高性能 Web 框架 什么是 Robyn? Robyn 是一个用 Rust 编写的高性能 Web 框架,旨在通过极简设计和高效并发处理,帮助开发者快速构建可扩展的现代 Web 应用。得益于 Rust 的内存安全性和性能…...