【深度学习模型分类】
深度学习模型种类繁多,涵盖了从基础到前沿的多种架构。以下是主要模型的分类及代表性方法:
1. 基础模型
1.1 多层感知机(MLP)
特点:全连接神经网络,适用于结构化数据。
应用:分类、回归任务。
1.2 自编码器(Autoencoder)
特点:无监督学习,用于数据压缩和特征提取。
变体:
稀疏自编码器
去噪自编码器
变分自编码器(VAE)
2. 卷积神经网络(CNN)
2.1 经典CNN
LeNet:手写数字识别。
AlexNet:ImageNet竞赛冠军,开启深度学习热潮。
VGG:更深的网络结构。
GoogLeNet:引入Inception模块。
ResNet:残差连接,解决梯度消失问题。
2.2 轻量级CNN
MobileNet:适用于移动设备。
ShuffleNet:高效通道混洗。
EfficientNet:复合缩放策略。
2.3 特殊用途CNN
U-Net:医学图像分割。
YOLO/SSD:目标检测。
StyleGAN:图像生成。
3. 循环神经网络(RNN)
3.1 基础RNN
特点:处理序列数据。
问题:梯度消失/爆炸。
3.2 改进RNN
LSTM:长短期记忆网络,解决长依赖问题。
GRU:门控循环单元,简化LSTM。
3.3 应用场景
文本生成
语音识别
时间序列预测
4. 注意力机制与Transformer
4.1 Transformer
核心:自注意力机制。
应用:
BERT:双向编码表示。
GPT:生成式预训练模型。
T5:文本到文本转换。
4.2 视觉Transformer
ViT:将Transformer应用于图像分类。
DETR:目标检测Transformer。
5. 生成对抗网络(GAN)
5.1 基础GAN
生成器:生成数据。
判别器:区分真实与生成数据。
5.2 改进GAN
DCGAN:深度卷积GAN。
CycleGAN:图像风格转换。
StyleGAN:高质量图像生成。
5.3 应用场景
图像生成
数据增强
图像修复
6. 强化学习模型
6.1 深度Q网络(DQN)
特点:结合Q学习与深度学习。
应用:游戏AI(如AlphaGo)。
6.2 策略梯度方法
REINFORCE:蒙特卡洛策略梯度。
PPO:近端策略优化。
6.3 应用场景
机器人控制
自动驾驶
金融交易
7. 图神经网络(GNN)
7.1 基础GNN
GCN:图卷积网络。
GAT:图注意力网络。
7.2 应用场景
社交网络分析
分子结构预测
推荐系统
8. 自监督学习模型
8.1 对比学习
SimCLR:简单对比学习框架。
MoCo:动量对比学习。
8.2 掩码学习
MAE:掩码自编码器。
BEiT:BERT风格的图像Transformer。
9. 多模态模型
9.1 CLIP
特点:联合训练图像和文本编码器。
应用:零样本学习。
9.2 DALL-E
特点:生成图像从文本描述。
应用:创意设计。
10. 前沿模型
10.1 扩散模型
DDPM:去噪扩散概率模型。
Stable Diffusion:高质量图像生成。
10.2 神经辐射场(NeRF)
特点:3D场景重建。
应用:虚拟现实。
总结
类别 代表性模型 主要应用领域
基础模型 MLP, Autoencoder 结构化数据, 特征提取
CNN ResNet, YOLO, StyleGAN 图像处理, 目标检测
RNN LSTM, GRU 序列数据, NLP
Transformer BERT, GPT, ViT NLP, 图像分类
GAN DCGAN, CycleGAN 图像生成, 风格转换
强化学习 DQN, PPO 游戏AI, 机器人控制
GNN GCN, GAT 图数据分析
自监督学习 SimCLR, MAE 无监督特征学习
多模态 CLIP, DALL-E 图像-文本联合任务
前沿模型 DDPM, NeRF 图像生成, 3D重建
#通过以上分类,您可以根据具体任务选择合适的深度学习模型。
相关文章:
【深度学习模型分类】
深度学习模型种类繁多,涵盖了从基础到前沿的多种架构。以下是主要模型的分类及代表性方法: 1. 基础模型 1.1 多层感知机(MLP) 特点:全连接神经网络,适用于结构化数据。 应用:分类、回归任务…...
el-select 设置宽度 没效果
想实现下面的效果,一行两个,充满el-col12 然后设置了 width100%,当时一直没有效果 解决原因: el-form 添加了 inline 所以删除inline属性 即可...
chrome://version/
浏览器输入: chrome://version/ Google浏览器版本号以及安装路径 Google Chrome131.0.6778.205 (正式版本) (64 位) (cohort: Stable) 修订版本81b36b9535e3e3b610a52df3da48cd81362ec860-refs/branch-heads/6778_155{#8}操作系统Windows…...
反向代理块sjbe
1 概念 1.1 反向代理概念 反向代理是指以代理服务器来接收客户端的请求,然后将请求转发给内部网络上的服务器,将从服务器上得到的结果返回给客户端,此时代理服务器对外表现为一个反向代理服务器。 对于客户端来说,反向代理就相当于…...
封装一个sqlite3动态库
作者:小蜗牛向前冲 名言:我可以接受失败,但我不能接受放弃 如果觉的博主的文章还不错的话,还请点赞,收藏,关注👀支持博主。如果发现有问题的地方欢迎❀大家在评论区指正 目录 一、项目案例 二…...
P1878 舞蹈课(详解)c++
题目链接:P1878 舞蹈课 - 洛谷 | 计算机科学教育新生态 1.题目解析 1:我们可以发现任意两个相邻的都是异性,所以他们的舞蹈技术差值我们都要考虑,4和2的差值是2,2和4的差值是2,4和3的差值是1,根…...
力扣第一题 哈希解法 O(n)时间复杂度
题目: 给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 target 的那俩个整数,并返回它们的数组下标。 你可以假设每种输入只会对应一个答案,并且你不能使用两次相同的元素。 你可以按任意顺序返…...
【C++学习篇】C++11
目录 编辑 1. 初始化列表{} 1.1 C98中的{} 1.2 C11中的{} 2. C11中的std::initializer_list 3. 右值引用和移动语义 3.1 左值和右值 3.2 左值引用和右值引用 3.3 引用延长生命周期 3.4 左值和右值的参数匹配 3.5 右值引⽤和移动语义的使⽤场景 3.5.1 左值引⽤…...
leetcode刷题第十天——栈与队列Ⅱ
本次刷题顺序是按照卡尔的代码随想录中给出的顺序 1047. 删除字符串中的所有相邻重复项 char* removeDuplicates(char* s) {int len strlen(s);char* tmp malloc(sizeof(char) * (len 1));int top -1, idx 0;while(idx < len) {if(top -1) tmp[top] s[idx];else {i…...
Vulnhub靶机随笔-Hackable II
Vulnhub靶机Hackable II详解 攻击机Kali IP:192.168.1.6 靶机 IP:未知 系统:未知 A.信息收集 扫描靶机存活性 确定IP地址 1.命令:arp-scan -l 扫描靶机开放端口及其服务版本信息 2.命令:nmap -A -p- -sV 靶机IP 3.靶机开放三个端口: 21ftp端口:存在anonymous匿…...
适配器模式 + 外观模式联合使用:新旧系统的平滑整合之道
🌟 引言:当系统演进遇到历史包袱 场景痛点: 假设企业需要将老旧的CRM系统与新的SaaS平台整合,面临: 旧系统接口:XML格式+同步调用新系统接口:JSON格式+异步调用需要统一提供简洁的RESTful API给前端若直接修改旧系统: // 旧系统核心类(无法修改) public class Leg…...
九.Spring Boot使用 ShardingSphere + MyBatis + Druid 进行分库分表
文章目录 前言一、引入依赖二、创建一个light-db_1备用数据库三、配置文件 application-dev.yml四、创建shardingsphere-config.yml完整项目结构 五、测试总结 前言 在现代化微服务架构中,随着数据量的不断增长,单一数据库已难以满足高可用性、扩展性和…...
【第2章:神经网络基础与实现——2.3 多层感知机(MLP)的构建与调优技巧】
在当今科技飞速发展的时代,人工智能早已不是一个陌生的词汇,它已经渗透到我们生活的方方面面,从智能语音助手到自动驾驶汽车,从图像识别到自然语言处理。而支撑这一切的核心技术之一,就是神经网络。作为机器学习领域的璀璨明星,神经网络已经在众多任务中取得了令人瞩目的…...
宠物企业宣传网站静态模板 – 前端静态页面开发实例
该宠物宣传企业站是一个基于前端技术构建的静态网站,旨在为宠物行业的企业提供一个简洁、现代的在线展示平台。整个网站采用HTML、CSS和JavaScript三种技术,确保了良好的用户体验和页面表现。 前端技术: HTML:HTML负责构建网站的…...
git如何下载指定版本
要使用Git下载指定版本,可以通过以下步骤进行操作: 1. 使用Git命令行下载指定版本: 1.1 首先,使用git clone命令克隆整个git库到本地。例如:git clone [库的URL]。这将下载最新的代码到本地。 1.2 进入克隆…...
【第4章:循环神经网络(RNN)与长短时记忆网络(LSTM)——4.2 LSTM的引入与解决长期依赖问题的方法】
在人工智能的璀璨星空中,深度学习模型犹如一颗颗耀眼的星辰,引领着技术的革新。而在处理序列数据的领域中,循环神经网络(RNN)无疑是那颗最为亮眼的星星。然而,即便是这样强大的模型,也面临着一些棘手的问题,其中最突出的便是长期依赖问题。今天,我们就来深入探讨一下长…...
IoTDB 集群节点 IP 改变,如何更新集群
问题 问题1:如果 IoTDB 配置的时候用的 IP,没有用 hostname,后面 IP 修改了,历史数据需要重新导吗? 问题2:如果现场运行 IoTDB 半年,电脑 IP 要改的话,半年的数据要导出来再导入么…...
C++ 设计模式-建造者模式
以下是一个完整的C建造者模式示例,包含产品类、建造者接口、具体建造者、指挥者以及测试代码: #include <iostream> #include <string> #include <memory>// 产品类:汽车 class Car { public:void setBody(const std::str…...
词袋模型和词嵌入模型区别和关联分析(词袋模型是否属于词嵌入模型)
词袋模型(Bag of Words, BoW)不属于词嵌入模型,它们是两种完全不同的文本表示方法。以下从多个维度对比二者的核心区别 1. 本质区别 特性词袋模型 (BoW)词嵌入模型 (Word Embedding)表示形式离散的稀疏向量(高维,维度…...
png、jpg、gif、webp的区别
png、jpg、gif、webp的区别 1.img的格式2.问题 1.img的格式 png 无损压缩,尺寸体积比jpg/jpeg大;适合做小图标jpg 采用了压缩算法,有一点失真,比png体积小;适合中大型图片gif 动态图webp 同时支持有损和无损压缩,相同质量的图片,webp具有更小的体积,但兼容性不太好(在某些浏览…...
el-input输入框样式修改
el-input输入框样式修改 目的:蓝色边框去掉、右下角黑色去掉(可能看不清楚) 之前我试过deep不行 最有效的办法就是就是在底部添加一下css文件 代码中针对input的type为textarea,对于非textarea,只需将下面的css样式中的textarea替换成input…...
什么是多光谱环形光源
多光谱环形光源是一种用于机器视觉、工业检测和科学研究的光源设备,能够提供多种波长的光,适用于不同材料和表面的检测需求。以下是其关键特点和应用: 关键特点 多光谱输出:可发射多种波长的光(如可见光、红外光、紫外…...
几款C#开发的入门书籍与视频教程
以下是几本适合C#初学者的书籍和一些优质的视频教程推荐,帮助你快速入门C#开发: 书籍推荐 1. 《C#入门经典》 • 作者:Karli Watson, Christian Nagel 等 • 特点:经典的C#入门书籍,内容全面,从基础语法到…...
日常问题-pnpm install执行没有node_modules生成
日常问题-pnpm install执行没有node_modules生成 1.问题2.解决方法 1.问题 执行pnpm i后,提示Scope: all 3 workspace projects Done in 503ms,而且没有node_modules生成。很奇怪 2.解决方法 确保根目录有 pnpm-workspace.yaml 文件: 把这…...
2025蓝桥杯JAVA编程题练习Day4
1.艺术与篮球 问题描述 小蓝出生在一个艺术与运动并重的家庭中。 妈妈是位书法家,她希望小蓝能通过练习书法,继承她的艺术天赋,并练就一手好字。爸爸是一名篮球教练,他希望小蓝能通过篮球锻炼身体,培养运动的激情和…...
C++-----------酒店客房管理系统
酒店客房管理系统 要求: 1.客房信息管理:包括客房的编号、类型、价格、状态等信息的录入和修改; 2.顾客信息管理:包括顾客的基本信息、预订信息等的管理; 3.客房预订:客户可以根据需要进行客房的预订,系统会自动判断客房的可用情况; 4.入住管理:客户入住…...
ORDER BY盲注攻击:原理、实现与防御(附Python多线程爆破脚本)
引言 在SQL注入攻击中,ORDER BY注入是一种容易被忽视但危害极大的漏洞类型。与传统的UNION或WHERE注入不同,ORDER BY参数通常无法直接返回查询结果,攻击者需要依赖**盲注(Blind SQLi)**技术逐字符提取数据。本文将结合…...
DeepSeek大模型响应速度优化策略
大模型响应速度的影响因素 响应速度受多方面因素影响,主要限制条件包括: (1)计算资源分配 每个query需要消耗约3.2TFLOPS算力集群使用英伟达H100 GPU,单卡理论峰值算力51TFLOPS实际部署中因动态负载均衡,一…...
人工智能在临床应用、药物研发以及患者护理等方面的最新研究进展|顶刊速递·25-02-12
小罗碎碎念 推文速览 第一篇文章提出 CRAFT-MD 框架评估临床大语言模型(LLMs)在医患互动任务中的表现,发现其存在局限性,并基于结果给出改进评估的建议。 第二篇文章全面阐述了 2019 年以来人工智能在小分子药物研发全流程&#…...
【物联网】电子电路基础知识
文章目录 一、基本元器件1. 电阻2. 电容3. 电感4. 二极管(1)符号(2)特性(3)实例分析5. 三极管(1)符号(2)开关特性(3)实例6. MOS管(产效应管)(1)符号(2)MOS管极性判定(3)MOS管作为开关(4)MOS管vs三极管7. 门电路(1)与门(2)或门(3)非门二、常用元器件…...
