当前位置：首页 > news >正文

深度卷积神经网络 AlexNet

news 2026/2/10 3:46:08

一、机器学习深度学习的发展

1、机器学习SVM方法

（1）20世纪90年代，基于统计学习理论的结果，开发了一种新型的学习算法——支持向量机（SVM）。这就产生了一类新的理论上优雅的学习机器，它们将SVM的中心概念——内核用于许多....

（2）有一个核心是怎么样进行特征提取

（3）选择核函数来计算相关性，也就是判断在高维空间当中两个点是如何相关的

（4）如果是线性模型，就是做内积。如果是高维空间使用核方法的话可以通过变换空间把这个空间拉成一个想要的样子，然后通过核函数来计算后，就能形成一个凸优化问题

（5）老师提到了线性模型是一个凸优化问题，所以它有很好的理论结，可以得出显示解；因为是凸优化问题，所以有很好的定理，有一套完整的数学定理，能计算模型的复杂度，能计算在什么情况下会发生什么事情。

（6）Svm对调参没那么敏感,是深度学习神经网络之前最流行的机器学习算法

2、几何学

（1）思想：想要把整个计算机视觉的问题转化为几何学的问题

3、特征工程

（1）也就是对一张图片怎样去抽取它的特征。

（2）SIFT模型，抽取一些方向的向量来描述这个图片。如果特征向量抽取的好，可以使用一个简单的多分的模型（svm）进行分类

4、在计算机视觉领域，比较关心的是怎么样做一个更准确的特征提取，使得我们的机器学习能够比较好的去学习。所以整个计算机视觉，就是在针对不同的问题进行不同的特征提取。

二、发展史及流行方法

1、在90年代的时候，数据量不是特别大，计算也比较均匀，我们常用是神经网络，因为神经网络是一个比较便宜的框架，模型是比较小的，因为做了一个随机梯度下降，所以对内存的要求并不是特别高。

2、在00年左右，内存不错，CPU也不错，数据量有增加，但并不是特别大，核方法是一个更合适的方法。因为一它简单，二它有理论，第三是我们能够运行他（能够去把它的核矩阵给算出来，在这样的计算量下是比较好的）

3、目前我们又回到了神经网络，是因为计算量更多了（虽然数据没有涨得那么快，但是计算量已经比以前翻了许多倍，我们可以更多的去挖掘数据里面的信息，就可以构造更深的神经网络，用计算换取精度），我们可以构造更深的神经网络

4、计算能力和数据所要的算法能力，他们在不同阶段的发展程度，导致大家对网络的选取有不同的偏好

三、数据集

1、对于imagenet的数据集，它与之前的黑白数字数据集有一些样本数和类别的一些变化，所以允许使用更深的神经网络去抽取里面一些更复杂的信息

四、AlexNet算法

1、暂退法做一些模型的控制，因为模型更大了，所以使用暂退法来做一些模型的正则

2、relu与sigmoid的相比，relu在正值的梯度更大，梯度在正区间恒为1，在负区间为0，并且在零点的时候，relu的一阶导更好一点，Sigmoid 函数的导数在极值处（接近0或1）非常小，会导致梯度在反向传播过程中迅速衰减。

3、Maxpolling取得最大值，使得输出的值更大，也使得梯度更加的大，能使训练更加容易一些

4、在深度学习神经网络之前，也就是机器学习的svm，主要关注特征提取，机器视觉的专家，把对问题的理解转化为标准的机器学习的算法的数值；而现在与其说不用提特征，不如说是现在需要设计网络去提取特征了（机器学习，是专家去确定所需要的特征，再到svn里面去做分类。而深度学习神经网络是一起学习的过程，最后的分类器和特征提取是一起训练的过程；现在所使用的深度学习，我们构造卷积神经网络比在机器学习人工特征提取更为简单，并且容易应用于不同学科，更加高效）

五、AlexNet架构（与LeNet对比）

1、激活函数从sigmoid变为ReLu

2、隐藏、全连接层后加入了丢弃层做正则

3、数据增强（大概是在训练集中将样本做成了多许别的类别，比如截取、色温，加大学习难度）

六、总结

1、AlexNet的架构与LeNet相似，但使用了更多的卷积层和更多的参数来拟合大规模的ImageNet数据集。

2、今天，AlexNet已经被更有效的架构所超越，但它是从浅层网络到深层网络的关键一步。

3、尽管AlexNet的代码只比LeNet多出几行，但学术界花了很多年才接受深度学习这一概念，并应用其出色的实验结果。这也是由于缺乏有效的计算工具。

4、Dropout、ReLU和预处理是提升计算机视觉任务性能的其他关键步骤。

七、代码（跟LeNet差不多）

import torch
from torch import nn
from d2l import torch as d2lnet = nn.Sequential(# 这里使用一个11*11的更大窗口来捕捉对象。# 同时，步幅为4，以减少输出的高度和宽度。# 另外，输出通道的数目远大于LeNetnn.Conv2d(1, 96, kernel_size=11, stride=4, padding=1), nn.ReLU(),nn.MaxPool2d(kernel_size=3, stride=2),# 减小卷积窗口，使用填充为2来使得输入与输出的高和宽一致，且增大输出通道数nn.Conv2d(96, 256, kernel_size=5, padding=2), nn.ReLU(),nn.MaxPool2d(kernel_size=3, stride=2),# 使用三个连续的卷积层和较小的卷积窗口。# 除了最后的卷积层，输出通道的数量进一步增加。# 在前两个卷积层之后，汇聚层不用于减少输入的高度和宽度nn.Conv2d(256, 384, kernel_size=3, padding=1), nn.ReLU(),nn.Conv2d(384, 384, kernel_size=3, padding=1), nn.ReLU(),nn.Conv2d(384, 256, kernel_size=3, padding=1), nn.ReLU(),nn.MaxPool2d(kernel_size=3, stride=2),nn.Flatten(),# 这里，全连接层的输出数量是LeNet中的好几倍。使用dropout层来减轻过拟合nn.Linear(6400, 4096), nn.ReLU(),nn.Dropout(p=0.5),nn.Linear(4096, 4096), nn.ReLU(),nn.Dropout(p=0.5),# 最后是输出层。由于这里使用Fashion-MNIST，所以用类别数为10，而非论文中的1000nn.Linear(4096, 10))

深度卷积神经网络 AlexNet

一、机器学习深度学习的发展 1、机器学习SVM方法 （1）20世纪90年代，基于统计学习理论的结果，开发了一种新型的学习算法——支持向量机（SVM）。这就产生了一类新的理论上优雅的学习机器，它们将SVM…...

编程日记 2024/7/7 1:43:40

【刷题汇总--大数加法、链表相加(二)、大数乘法】

C日常刷题积累今日刷题汇总 - day0061、大数加法1.1、题目1.2、思路1.3、程序实现 2、链表相加(二)2.1、题目2.2、思路2.3、程序实现 3、大数乘法3.1、题目3.2、思路3.3、程序实现 4、题目链接今日刷题汇总 - day006 1、大数加法 1.1、题目 1.2、思路读完题,明白大数相加…...

编程日记 2024/7/7 1:42:39

基于Java的网上花店系统

目录 1 网上花店商品销售网站概述 1.1 课题简介 1.2 设计目的 1.3 系统开发所采用的技术 1.4 系统功能模块 2 数据库设计 2.1 建立的数据库名称 2.2 所使用的表 3 网上花店商品销售网站设计与实现 1. 用户注册模块 2. 用户登录模块 3. 鲜花列表模块 4. 用户购物车…...

编程日记 2024/7/7 1:41:38

uniApp 封装VUEX

Vuex Store (index.js) import Vue from vue; import Vuex from vuex; import Cookies from js-cookie;Vue.use(Vuex);const saveStateKeys [vuex_user, vuex_token, vuex_demo];const initialState {vuex_user: { name: 用户信息 },vuex_token: Cookies.get(token) || ,vue…...

编程日记 2024/7/7 1:40:37

最长公共子序列求长度和输出子序列C代码

求两个字符串的公共子序列我们都知道需要使用用动态规划思想用res[i][j]表示截止到字符串A的第i个字符串和截止到字符串B的第j个字符的最长公共子序列。如两个字符串helloworld和loop，res[5][3]表示子串hello和子串loo的最长公共子序列，为lo&#xff0…...

编程日记 2024/7/7 1:39:35

安卓Framework开发快速分析日志及定位源码

文章目录如何区分源码中 main system events 日志查看 Activity 生命周期日志分析 events 日志在源码中位置应用进程ID助分析具体应用ProtoLog 动态开关日志如何快速定位相关流程的代码位置本文首发地址 https://h89.cn/archives/285.html 最新更新地址 https://gitee.com/ch…...

编程日记 2024/7/7 1:38:35

数据结构算法之B树

一、绪论 1.1 数据结构的概念和作用 1.2 B树的起源和应用领域二、B树的基本原理 2.1 B树的定义和特点 2.2 B树的结构和节点组成 2.3 B树的插入 2.4 B树的删除操作三、B树的优势和应用 3.1 B树在数据库系统中的应用 3.2 B树在文件系统中的应用 3.3 B树在内存管理中…...

编程日记 2024/7/7 1:37:34

【图卷积网络】GCN基础原理简单python实现

基础原理讲解应用路径卷积网络最经典的就是CNN，其可以提取图片中的有效信息，而生活中存在大量拓扑结构的数据。图卷积网络主要特点就是在于其输入数据是图结构数据，即 G ( V , E ) G(V,E) G(V,E)，其中V是节点，E是…...

编程日记 2024/7/7 1:36:31

【话题】AI是在帮助开发者还是取代他们

大家好，我是全栈小5，欢迎阅读小5的系列文章，这是《话题》系列文章目录引言AI在代码生成中的应用AI在错误检测和自动化测试中的作用对开发者职业前景的影响技能需求的变化与适应策略结论文章推荐引言随着人工智能（AI&#xff…...

编程日记 2024/7/7 1:35:30

精通Perl正则表达式修饰符：提升文本处理能力的艺术

Perl语言以其强大的文本处理能力而闻名，其中正则表达式是其核心特性之一。正则表达式本身非常强大，但Perl提供的修饰符（Modifiers）进一步扩展了正则表达式的灵活性和表达能力。本文将深入探讨Perl中正则表达式修饰符的使用&#x…...

编程日记 2024/7/7 1:33:28

【web前端HTML+CSS+JS】--- HTML学习笔记01

学习链接：黑马程序员pink老师前端入门教程，零基础必看的h5(html5)css3移动端前端视频教程_哔哩哔哩_bilibili 学习文档： Web 开发技术 | MDN (mozilla.org) 一、前后端工作流程 WEB模型：前端用于采集和展示信息，中…...

编程日记 2024/7/7 1:31:26

Go 语言入门（一）

Go Modules依赖包查找机制下载的第三方的依赖存储在 $GOPATH/pkg/mod 下go install 生成的可执行文件存储在 $GOPATH/bin下依赖查找顺序： 工作目录$GOPATH/pkg/mod$GOPATH/src 一、Go语言基础 1.标识符与关键字 1.1 命名方式 go变量、常量、自定义类型、包…...

编程日记 2024/7/7 1:30:24

爬虫笔记20——票星球抢票脚本的实现

以下内容仅供交流学习使用！！！ 思路分析前面的爬虫笔记一步一步走过来我们的技术水平也有了较大的提升了，现在我们来进行一下票星球抢票实战项目，实现票星球的自动抢票。我们打开票星球的移动端页面，分…...

编程日记 2024/7/7 1:28:21

DDR3（三）

目录 1 预取1.1 什么是预取1.2 预取有哪些好处1.3 结构框图1.4 总结 2 突发2.1 什么是突发2.2 突发与预取本文讲解DDR中常见的两个术语：预取和突发，对这两个概念理解的关键在于地址线的低位是否参与译码，具体内容请继续往下看。 1 预取 1.1…...

编程日记 2024/7/7 1:27:20

JDK都出到20多了，你还不会使用JDK8的Stream流写代码吗？

目录前言 Stream流是什么？ 为什么要用Steam流常见stream流使用案例映射 map() & 集合 collect() 单字段映射多字段映射映射为其他的对象映射为 Map 去重 distinct() 过滤 filter() Stream流的其他方法使用Stream流的弊端前言当你某天看…...

编程日记 2024/7/7 1:25:17

QT slots 函数

文章目录概述小结概述在Qt中，slots 是一种特殊的成员函数，它们可以与对象发出的信号连接。当信号被触发时，连接的槽函数会被调用。来个简单的示例吧，如下图： #include <QObject> #include <QDebug>…...

编程日记 2024/7/7 1:24:16

pycharm如何使用jupyter

目录配置jupyter新建jupyter文件别人写的方法（在pycharm种安装，在网页中使用） pycharm专业版配置jupyter 在pycharm终端启动一个conda虚拟环境，输入 conda install jupyter会有很多前置包需要安装： 新建jupyter…...

编程日记 2024/7/7 1:22:15

机器学习——无监督学习(k-means算法)

1、K-Means聚类算法 K表示超参数个数，如分成几个类别，K值就取多少。若无需求，可使用网格搜索找到最佳的K。步骤： 1、随机设置K个特征空间内的点作为初始聚类中心； 2、对于其他每个点计算到K个中心的距离，…...

编程日记 2024/7/7 1:21:14

强化学习-6 DDPG、PPO、SAC算法

文章目录 1 DPG方法2 DDPG算法3 DDPG算法的优缺点4 TD3算法4.1 双Q网络4.2 延迟更新4.3 噪声正则 5 附15.1 Ornstein-Uhlenbeck (OU) 噪声5.1.1 定义5.1.2 特性5.1.3 直观理解5.1.4 数学性质5.1.5 代码示例5.1.6 总结 6 重要性采样7 PPO算法8 附28.1 重要性采样方差计算8.1.1 公…...

编程日记 2024/7/7 1:19:12

vue3实现多表头列表el-table，拖拽，鼠标滑轮滚动条优化

需求背景解决效果index.vue 需求背景需要实现多表头列表的用户体验优化解决效果 index.vue  <template><el-table ref"tableRef" height"calc(100% - 80px)&qu…...

编程日记 2024/7/7 1:16:10

XML Group端口详解

在XML数据映射过程中，经常需要对数据进行分组聚合操作。例如，当处理包含多个物料明细的XML文件时，可能需要将相同物料号的明细归为一组，或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码，增加了开…...

编程新知 2026/2/9 13:51:46

【网络】每天掌握一个Linux命令 - iftop

在Linux系统中，iftop是网络管理的得力助手，能实时监控网络流量、连接情况等，帮助排查网络异常。接下来从多方面详细介绍它。目录【网络】每天掌握一个Linux命令 - iftop工具概述安装方式核心功能基础用法进阶操作实战案例面试题场景生产场景…...

编程新知 2025/10/10 17:03:53

【人工智能】神经网络的优化器optimizer（二）：Adagrad自适应学习率优化器

一.自适应梯度算法Adagrad概述 Adagrad（Adaptive Gradient Algorithm）是一种自适应学习率的优化算法，由Duchi等人在2011年提出。其核心思想是针对不同参数自动调整学习率，适合处理稀疏数据和不同参数梯度差异较大的场景。Adagrad通…...

编程新知 2026/2/8 14:57:14

Docker 运行 Kafka 带 SASL 认证教程

Docker 运行 Kafka 带 SASL 认证教程 Docker 运行 Kafka 带 SASL 认证教程一、说明二、环境准备三、编写 Docker Compose 和 jaas文件docker-compose.yml代码说明：server_jaas.conf 四、启动服务五、验证服务六、连接kafka服务七、总结 Docker 运行 Kafka 带 SASL 认…...

编程新知 2026/1/23 4:15:03

大数据零基础学习day1之环境准备和大数据初步理解

学习大数据会使用到多台Linux服务器。一、环境准备 1、VMware 基于VMware构建Linux虚拟机是大数据从业者或者IT从业者的必备技能之一也是成本低廉的方案所以VMware虚拟机方案是必须要学习的。 （1）设置网关打开VMware虚拟机，点击编辑…...

编程新知 2026/1/25 14:43:07

（二）原型模式

原型的功能是将一个已经存在的对象作为源目标，其余对象都是通过这个源目标创建。发挥复制的作用就是原型模式的核心思想。一、源型模式的定义原型模式是指第二次创建对象可以通过复制已经存在的原型对象来实现，忽略对象创建过程中的其它细节。 📌 核心特点：避免重复初…...

编程新知 2026/2/7 10:59:04

cf2117E

原题链接：https://codeforces.com/contest/2117/problem/E 题目背景： 给定两个数组a,b，可以执行多次以下操作：选择 i (1 < i < n - 1)，并设置或，也可以在执行上述操作前执行一次删除任意和。求…...

编程新知 2026/2/4 15:29:40

AI编程--插件对比分析：CodeRider、GitHub Copilot及其他

AI编程插件对比分析：CodeRider、GitHub Copilot及其他随着人工智能技术的快速发展，AI编程插件已成为提升开发者生产力的重要工具。CodeRider和GitHub Copilot作为市场上的领先者，分别以其独特的特性和生态系统吸引了大量开发者。本文将从功…...

编程新知 2026/2/9 2:15:44

Maven 概述、安装、配置、仓库、私服详解

目录 1、Maven 概述 1.1 Maven 的定义 1.2 Maven 解决的问题 1.3 Maven 的核心特性与优势 2、Maven 安装 2.1 下载 Maven 2.2 安装配置 Maven 2.3 测试安装 2.4 修改 Maven 本地仓库的默认路径 3、Maven 配置 3.1 配置本地仓库 3.2 配置 JDK 3.3 IDEA 配置本地 Ma…...

编程新知 2026/2/8 1:58:01

Hive 存储格式深度解析：从 TextFile 到 ORC，如何选对数据存储方案？

在大数据处理领域，Hive 作为 Hadoop 生态中重要的数据仓库工具，其存储格式的选择直接影响数据存储成本、查询效率和计算资源消耗。面对 TextFile、SequenceFile、Parquet、RCFile、ORC 等多种存储格式，很多开发者常常陷入选择困境。本文将从底…...

编程新知 2025/12/6 10:54:35

相关文章：