当前位置：首页 > news >正文

深度学习与计算机视觉（一）

news 2026/2/10 20:08:07

文章目录

- 计算机视觉与图像处理的区别
- 人工神经元
- 感知机 - 分类任务
- Sigmoid神经元/对数几率回归
- 对数损失/交叉熵损失函数
- 梯度下降法- 极小化对数损失函数
- 线性神经元/线性回归
- - 均方差损失函数-线性回归常用损失函数
  - 使用梯度下降法训练线性回归模型
  - 线性分类器
  - - 多分类器的决策面
  - softmax Regression
  - 训练softmax regression
  - 交叉熵损失
  - 解决参数冗余
  - 训练softmax Classifier
  - 混淆矩阵
  - 合页（铰链）损失

计算机视觉与图像处理的区别

图像处理得到的结果是处理后的图像，图像处理的目的是改善图像的质量
- 图像增强
- 图像复原
计算机视觉得到的结果可能是一个符号、一堆数据、一个知识
- 人脸识别
- 人脸比对
传统的图像识别的机器学习方法的一般流程包括：
- 特征提取→数据
- 数据→机器学习
为什么要提取图像的特征
- 提取有利于识别的信息，抑制与识别无关的或者对识别有干扰的信息
- 把不同尺度的图像映射到一个统一的特征空间，便于应用机器学习算法。
机器学习的框架：D数据，A算法，H假设空间，h* H中最好的假设（真实误差最小的假设）
概率近似正确

人工神经元

在这里插入图片描述

f：响应函数/激活函数一般都是非线性的函数，且一般都单调递增；常用的激活函数包括以下：

在这里插入图片描述

因为f是单调递增的函数，，如果 w>0，则，说明前一个神经元对后一个神经元有激活的作用；如果w<0 ，说明前一个神经元对后一个神经元有抑制作用。

感知机 - 分类任务

在这里插入图片描述

感知机算法在线性可分的情况下，一定可以收敛，也就是一定可以找到一个能正确分类所有样本的分类函数
但是同一个样本集，有可能会得到不同的解
- 不同的初始值，不同的样本处理次序产生的结果不同
- 不能得到全局最优的解
线性不可分的时候，算法会失败

感知机的算法

在这里插入图片描述

损失函数：不能处处可导

在这里插入图片描述

解决方法：次梯度

Sigmoid神经元/对数几率回归

只有激活函数的不同，sigmoid处处连续可导，输出的是对数几率
在这里插入图片描述

对数损失/交叉熵损失函数

损失函数通过比较模型对样本X的预测结果与样本的真实类别y之间的差异，计算损失，差异越大，损失越大，差异越小，损失越小。

在这里插入图片描述

梯度下降法- 极小化对数损失函数

在这里插入图片描述

线性神经元/线性回归

神经元有两个部分组成：收集信号的过程和激活的过程，收集信号如果是使用线性过程（累加）就是线性神经元。至于收集到的信号能不能激活下一个神经元，要看激活函数的过程，这个过程一般不是线性的。

均方差损失函数-线性回归常用损失函数

在这里插入图片描述

使用梯度下降法训练线性回归模型

是对w，b进行更新

在这里插入图片描述
$一元导数与微分的关系： df / d x = f^{'}$
$全微分： d F = (α F / αx) d x + (α F / α y) d y$

线性分类器

$α * β = ∣ α ∣ * ∣ β ∣ cos < α ， β > （ α ， β 为向量），其中 ∣ β ∣ cos < α ， β > 称为 β 在 α 上的投影$
在这里插入图片描述

多分类器的决策面

决策面是可以把各种分类分开的一个面，在三级分类中，决策面应该在超平面的角平分线处划分
在这里插入图片描述

softmax Regression

在这里插入图片描述

这种argmax会把打分最高的结果设为1，其他的结果设为0；但是这种投影的坏处在于只看得到分类，看不到分类的置信为多少，所以引入了softmax Regression（ $e^z变成正数，正数加和为分母，求概率$ ）

在这里插入图片描述

softmax的决策规则就是：寻找概率最大的作为分类的输出，又因为e函数是单调递增的，所以只要z最大，则概率就会最大。

训练softmax regression

在这里插入图片描述

这里要特别注意，这里计算损失函数的那个概率，是真实样本所对应的概率，不是预测值的那个概率

在这里插入图片描述

训练过程

在这里插入图片描述

交叉熵损失

在这里插入图片描述

解决参数冗余

可以使用一个正则化项：选择损失函数小且Ω也小的

在这里插入图片描述

训练softmax Classifier

在这里插入图片描述

混淆矩阵

在这里插入图片描述

对角线上的表示第k个类别的精度，混淆矩阵可以清晰的看到哪一个类别的分类情况较好（精度高），哪一个类别的分类情况不好（精度第），以及具体的分类情况是什么

合页（铰链）损失

在这里插入图片描述

深度学习与计算机视觉（一）

文章目录计算机视觉与图像处理的区别人工神经元感知机 - 分类任务Sigmoid神经元/对数几率回归对数损失/交叉熵损失函数梯度下降法- 极小化对数损失函数线性神经元/线性回归均方差损失函数-线性回归常用损失函数使用梯度下降法训练线性回归模型线性分类器多分类器的决策面 soft…...

编程日记 2023/10/27 1:33:17

【vector题解】杨辉三角 | 删除有序数组中的重复项 | 只出现一次的数字Ⅱ

杨辉三角力扣（LeetCode）官网 - 全球极客挚爱的技术成长平台给定一个非负整数 numRows，生成「杨辉三角」的前 numRows 行。在「杨辉三角」中，每个数是它左上方和右上方的数的和。示例 1: 输入: numRows 5 输出: [[1],[1,1…...

编程日记 2023/10/27 1:32:17

金字塔切分注意力模块PSA学习笔记（附代码）

已有研究表明：将注意力模块嵌入到现有CNN中可以带来显著的性能提升。比如，SENet、BAM、CBAM、ECANet、GCNet、FcaNet等注意力机制均带来了可观的性能提升。但是，目前仍然存在两个具有挑战性的问题需要解决。一是如何有效地获取和利用不同尺度…...

编程日记 2023/10/27 1:30:14

Jenkins自动化测试

学习 Jenkins 自动化测试的系列文章 Robot Framework 概念Robot Framework 安装Pycharm Robot Framework 环境搭建Robot Framework 介绍Jenkins 自动化测试 1. Robot Framework 概念 Robot Framework是一个基于Python的，可扩展的关键字驱动的自动化测试框架。它…...

编程日记 2023/10/27 1:29:11

python 字典dict和列表list的读取速度问题, range合并

嗨喽，大家好呀~这里是爱看美女的茜茜呐 python 字典和列表的读取速度问题最近在进行基因组数据处理的时候，需要读取较大数据（2.7G）存入字典中， 然后对被处理数据进行字典key值的匹配，在被处理文件中每次…...

编程日记 2023/10/27 1:28:08

测试用例的设计方法（全）：等价类划分方法

一.方法简介 1.定义是把所有可能的输入数据,即程序的输入域划分成若干部分（子集）,然后从每一个子集中选取少数具有代表性的数据作为测试用例。该方法是一种重要的,常用的黑盒测试用例设计方法。 2.划分等价类： 等价类是指某个输入域的…...

编程日记 2023/10/27 1:27:07

Office技巧（持续更新）（Word、Excel、PPT、PowerPoint、连续引用、标题、模板、论文）

1. Word 1.1 标题设置为多级列表选住一级标题，之后进行“定义新的多级列表” 1.2 图片和表的题注自动排序正常插入题注后就可以了。如果一级标题是 “汉字序号”，那么需要对题注进行修改： 从原来的图 { STYLEREF 1 \s }-{ SEQ 图 \* A…...

编程日记 2023/10/27 1:26:05

Java实现ORM第一个api-FindAll

经过几天的业余开发，今天终于到ORM对业务api本身的实现了，首先实现第一个查询的api 老的C#定义如下因为Java的泛型不纯，所以无法用只带泛型的方式实现api，对查询类的api做了调整，第一个参数要求传入实体对象首先…...

编程日记 2023/10/27 1:25:04

HFSS笔记——求解器和求解分析

文章目录 1、求解器2、求解类型3、自适应网格剖分4、求解频率选择4.1 求解设置项的含义4.2 扫频类型 1、求解器自从ANSYS将HFSS收购后，其所有的求解器都集成在一起了，点击Project，会显示所有的求解器类型。其中， HFSS design&…...

编程日记 2023/10/27 1:24:02

jenkins配置gitlab凭据

下载Credentials Binding插件（默认是已经安装了） 在凭据配置里添加凭据类型点击保存 Username with password： 用户名和密码 SSH Username with private 在凭据管理里面添加gitlab账号和密码点击全局点击添加凭据（版本不同…...

编程日记 2023/10/27 1:23:01

0基础学习PyFlink——用户自定义函数之UDTF

大纲表值函数完整代码在《0基础学习PyFlink——用户自定义函数之UDF》中，我们讲解了UDF。本节我们将讲解表值函数——UDTF 表值函数我们对比下UDF和UDTF def udf(f: Union[Callable, ScalarFunction, Type] None,input_types: Union[List[DataType], DataTy…...

编程日记 2023/10/27 1:22:00

【Java 进阶篇】Java Request 原理详解

在网络应用开发中，HTTP请求是一项常见而关键的任务。当我们使用Java编写网络应用时，了解HTTP请求的工作原理变得至关重要。本文将详细介绍Java中HTTP请求的原理，包括请求的结构、发送请求的方法以及处理请求的过程。 HTTP请求的基本结构 HT…...

编程日记 2023/10/27 1:20:59

13 结构性模式-装饰器模式

1 装饰器模式介绍在软件设计中,装饰器模式是一种用于替代继承的技术,它通过一种无须定义子类的方式给对象动态的增加职责,使用对象之间的关联关系取代类之间的继承关系. 2 装饰器模式原理 //抽象构件类 public abstract class Component{public abstract void operation(); }…...

编程日记 2023/10/27 1:19:58

支持向量机（SVM）

一. 什么是SVM 1. 简介 SVM，曾经是一个特别火爆的概念。它的中文名：支持向量机（Support Vector Machine, 简称SVM）。因为它红极一时，所以关于它的资料特别多，而且杂乱。虽然如此，只要把握住SV…...

编程日记 2023/10/27 1:18:57

Rabbitmq----分布式场景下的应用

服务异步通信-分布式场景下的应用如果单机模式忘记也可以看看这个快速回顾rabbitmq,在做学习消息队列在使用过程中，面临着很多实际问题需要思考： 1.消息可靠性消息从发送，到消费者接收，会经理多个过程： 其中的每一…...

编程日记 2023/10/27 1:17:56

springboot + redis实现签到与统计功能

在很多项目中都会有签到与统计功能，最容易想到的方案是创建一个签到表来记录每个用户的签到记录，比如设计一个mysql数据库表： CREATE TABLE tb_sign id bigint(20) unsigned NOT NULL AUTOINCREMENT COMMENT 主键, user_id bigint(20) unsig…...

编程日记 2023/10/27 1:16:55

Redis | 数据结构（02）SDS

一、键值对数据库是怎么实现的？ 在开始讲数据结构之前，先给介绍下 Redis 是怎样实现键值对（key-value）数据库的。 Redis 的键值对中的 key 就是字符串对象，而 value 可以是字符串对象，也可以是集合数据类型…...

编程日记 2023/10/27 1:15:54

Linux C语言开发-D7D8运算符

算术运算符：-*/%，浮点数可以参与除法运算，但不能参与取余运算 a%b：表示取模或取余关系运算符：<,>,>,<,,! 逻辑运算符:!,&&,|| &&,||逻辑运算符是从左到右，依次运算&#…...

编程日记 2023/10/27 1:14:53

redis 配置主从复制,哨兵模式案例

哨兵(Sentinel)模式 1 . 什么是哨兵模式？ 反客为主的自动版，能够自动监控master是否发生故障，如果故障了会根据投票数从slave中挑选一个作为master，其他的slave会自动转向同步新的master，实现故障自动转义 2 . 原理…...

编程日记 2023/10/27 1:13:53

Python---练习：使用for循环实现用户名+密码认证

案例： 用for循环实现用户登录 ① 输入用户名和密码 ② 判断用户名和密码是否正确（usernamelaowang，passwordlw123） ③ 登录仅有三次机会，超过3次会报错思考： 用户登陆情况有3种: ① 用户名错误(此时…...

编程日记 2023/10/27 1:12:51

深入浅出Asp.Net Core MVC应用开发系列-AspNetCore中的日志记录

ASP.NET Core 是一个跨平台的开源框架，用于在 Windows、macOS 或 Linux 上生成基于云的新式 Web 应用。 ASP.NET Core 中的日志记录 .NET 通过 ILogger API 支持高性能结构化日志记录，以帮助监视应用程序行为和诊断问题。可以通过配置不同的记录提供程…...

编程新知 2026/2/8 4:37:06

【Redis技术进阶之路】「原理分析系列开篇」分析客户端和服务端网络诵信交互实现（服务端执行命令请求的过程 - 初始化服务器）

服务端执行命令请求的过程【专栏简介】【技术大纲】【专栏目标】【目标人群】1. Redis爱好者与社区成员2. 后端开发和系统架构师3. 计算机专业的本科生及研究生初始化服务器1. 初始化服务器状态结构初始化RedisServer变量 2. 加载相关系统配置和用户配置参数定制化配置参数案…...

编程新知 2026/2/2 0:45:02

Objective-C常用命名规范总结

【OC】常用命名规范总结文章目录【OC】常用命名规范总结1.类名（Class Name)2.协议名（Protocol Name)3.方法名（Method Name)4.属性名（Property Name）5.局部变量/实例变量（Local / Instance Variables&…...

编程新知 2025/12/14 22:33:06

将对透视变换后的图像使用Otsu进行阈值化，来分离黑色和白色像素。这句话中的Otsu是什么意思？

Otsu 是一种自动阈值化方法，用于将图像分割为前景和背景。它通过最小化图像的类内方差或等价地最大化类间方差来选择最佳阈值。这种方法特别适用于图像的二值化处理，能够自动确定一个阈值，将图像中的像素分为黑色和白色两类。 Otsu 方法的原…...

编程新知 2026/1/9 19:36:58

WEB3全栈开发——面试专业技能点P2智能合约开发（Solidity）

一、Solidity合约开发下面是 Solidity 合约开发的概念、代码示例及讲解，适合用作学习或写简历项目背景说明。 🧠 一、概念简介：Solidity 合约开发 Solidity 是一种专门为以太坊（Ethereum）平台编写智能合约的高级编…...

编程新知 2026/1/27 9:33:09

【C语言练习】080. 使用C语言实现简单的数据库操作

080. 使用C语言实现简单的数据库操作 080. 使用C语言实现简单的数据库操作使用原生APIODBC接口第三方库ORM框架文件模拟1. 安装SQLite2. 示例代码：使用SQLite创建数据库、表和插入数据3. 编译和运行4. 示例运行输出：5. 注意事项6. 总结080. 使用C语言实现简单的数据库操作在…...

编程新知 2025/9/22 21:37:01

SpringCloudGateway 自定义局部过滤器

场景： 将所有请求转化为同一路径请求（方便穿网配置）在请求头内标识原来路径，然后在将请求分发给不同服务 AllToOneGatewayFilterFactory import lombok.Getter; import lombok.Setter; import lombok.extern.slf4j.Slf4j; impor…...

编程新知 2026/2/1 4:53:36

mac 安装homebrew (nvm 及git)

mac 安装nvm 及git 万恶之源 mac 安装这些东西离不开Xcode。及homebrew 一、先说安装git步骤通用： 方法一：使用 Homebrew 安装 Git（推荐） 步骤如下：打开终端（Terminal.app） 1.安装 Homebrew…...

编程新知 2026/1/30 4:58:21

Bean 作用域有哪些？如何答出技术深度？

导语： Spring 面试绕不开 Bean 的作用域问题，这是面试官考察候选人对 Spring 框架理解深度的常见方式。本文将围绕“Spring 中的 Bean 作用域”展开，结合典型面试题及实战场景，帮你厘清重点，打破模板式回答&#xff0c…...

编程新知 2025/11/12 21:44:33

文章目录

计算机视觉与图像处理的区别

人工神经元

感知机 - 分类任务

Sigmoid神经元/对数几率回归

对数损失/交叉熵损失函数

梯度下降法- 极小化对数损失函数

线性神经元/线性回归

均方差损失函数-线性回归常用损失函数

使用梯度下降法训练线性回归模型

线性分类器

多分类器的决策面

softmax Regression

训练softmax regression

交叉熵损失

解决参数冗余

训练softmax Classifier

混淆矩阵

合页（铰链）损失

相关文章：