当前位置: 首页 > news >正文

00、计算机视觉入门与调优简介

写在前面

  1. 每天更新1篇文章,共更新100篇以上

  2. 相关代码会放在gitee上

  3. 中间会按进度和反馈安排视频讲解

  4. 预计2023-11-11开始推送文章,持续3个月左右

专栏简介

本专栏带你从头开始入门计算机视觉。

内容会比之前写的文章更专业更全面,并且你可以深度链接作者,确保你能完全学会。

预计更新100篇文章以及实战代码(预计在3个月左右时间更新完成),包含以下章节(更新过程中会有调整):

我所理解的计算机视觉

基础背景知识

  1. 图片和像素

  2. 灰度图

  3. 彩色 RGB以及通道在计算机视觉中的含义

  4. 彩色YUV

  5. OpenCV 介绍、环境搭建及一个实战完成YUV的分量提取

传统计算机视觉初探

  1. 高斯滤波

  2. 均值滤波

  3. 利用 opencv 完成一张图片的高斯模糊

  4. 边缘检测

  5. 大津算法

  6. C++ 利用大津算法完成一张图片的分割

深度学习基础

  1. 机器学习和深度学习的关系

  2. 神经网络

  3. 训练和推理

  4. 正向传播和反向传播

  5. 损失函数

  6. 正向推理的性能,那些框架存在的意义

图片分类模型 - Resnet50

  1. 什么是 Resnet50 神经网络?

  2. Resnet 神经网络为什么这么重要?

  3. Resnet 中共包含哪些算法?

  4. 卷积 - 计算机视觉为什么离不开卷积(conv)

  5. 卷积 - 卷积的输入和输出, 特征图, feature map

  6. 卷积 - 卷积核

  7. 卷积 - 感受野(卷积是如何看到图像的)

  8. 卷积 - 图片通道数

  9. 卷积 - 图片的特征是如何通过卷积表征的

  10. 卷积 - 卷积算法的可视化

  11. 卷积 - 卷积的本质  - 图片特征的融合

  12. 卷积 - 特征图可视化,卷积到底学到了图片的什么特征

  13. 卷积 - 卷积算法公式推导

  14. 卷积参数 - padding 的作用

  15. 卷积参数 - stride 的作用

  16. 卷积参数 - dilation 的作用

  17. 变种卷积 - 空洞卷积

  18. 变种卷积 - 分组卷积

  19. 变种卷积 - 逐通道卷积

  20. 实战环境搭建 - python  和 C++ 卷积实战 - 手写一个基础卷积算法

  21. 卷积总结 池化 - 什么是池化算法

  22. 池化 - 池化的核函数

  23. 池化 - 和卷积的区别

  24. 池化 - 最大池化

  25. 池化 - 最大池化的特征不变性

  26. 池化 - 平均池化 ,全局平均池化

  27. 池化实战 - 手写一个最大池化函数

  28. BatchNorm - 批归一化,为什么在特征图的 batch 维度做?

  29. BatchNorm - 解决了什么问题

  30. BatchNorm 实战 - 公式推导以及手写一个BatchNorm 算法

  31. BatchNorm 为什么可以和卷积融合?

  32. 激活函数 - 非线性的重要性

  33. 激活函数 - Relu 公式

  34. 激活函数 - 为什么有人说可以无脑用Relu

  35. 激活函数 - sigmoid

  36. 激活函数 - 梯度消失和梯度爆炸

  37. Resnet - 残差结构

  38. Resnet - 残差结构的作用

  39. python/c++ 实战 - 利用卷积+relu + add 手写一个残差结构

  40. 全连接 - 全连接的本质,图片特征的大融合

  41. 全连接 - 和卷积的区别和联系

  42. python/c++ 实战 - 手写一个全连接算法

  43. Softmax 分类器的作用

  44. Softamx 分类的本质

  45. Softmax 与损失函数的关系

  46. python/c++  实战 - 手写 softmax 算法

  47. Resnet 中的下采样

  48. Resnet 中的BottleNeck 结构

模型实战

  1. python/c++ 实战 - 手写搭建 conv + batchnorm + relu conv_bn_relu)结构

  2. python/c++ 实战 - 手写搭建 bottleneck 结构

  3. python/c++ 实战 - 手写全局平均池化

  4. python/c++ 实战 - 利用 conv_bn_relu + bottleneck + 最大池化 + 全局池化 + 全连接搭建resnet50

  5. python/c++ 实战 - 下载该神经网络预训练权值

  6. python/c++ 实战 - 对神经网络加载权值 python/c++

  7. 实战解析 - 图像预处理介绍

  8. python/c++ 手写图像预处理

  9. python/c++ 输入任意图片,正确推理结果

  10. 神经网络评价指标 - Top1/Top5, 看你手写的神经网络正确率如何?

模型性能优化

  1. python/c++ 实战总结 神经网络性能指标 - 吞吐和延时

  2. 计算机基础 - 计算数据流加载(IO)

  3. 性能优化1 - 循环展开(unrooling) 及其原理

  4. 性能优化2 - 图融合及其原理

  5. 性能优化2 - resnet中可融合的层的算法等价关系介绍

  6. 性能优化实战 - 以上述手写的神经网络代码为基础,完成图融合的实战

  7. 性能优化3 - 什么是计算向量化

  8. 性能优化3 - 内积和卷积的关系

  9. 性能优化3 - 利用 python 的内积优化卷积运算

  10. 性能优化3 - CPU 向量指令和标量指令介绍

  11. 性能优化3 - CPU avx指令集介绍

  12. 性能优化3实战 - 利用avx指令集做卷积算法的优化

  13. 性能优化4 - 权值预加载技术

  14. 性能优化5 - 模型预编译技术和代码生成介绍

专栏总结

小册内容丰富,从原理入门到算法解析到实战,全部包含。

围绕着Resnet50这一神经网络,会带你将基础知识打牢,无论你是小白,还是已有一些基础想提高,都很适合。

相关文章:

00、计算机视觉入门与调优简介

写在前面 每天更新1篇文章,共更新100篇以上 相关代码会放在gitee上 中间会按进度和反馈安排视频讲解 预计2023-11-11开始推送文章,持续3个月左右 专栏简介 本专栏带你从头开始入门计算机视觉。 内容会比之前写的文章更专业更全面,并且你…...

.L0CK3D来袭:如何保护您的数据免受致命攻击

尊敬的读者: 网络犯罪的威胁日益增长,其中.L0CK3D勒索病毒是一种极具挑战性的数字威胁。为了助您应对这一风险,本文将深入探讨.L0CK3D病毒的狡猾手法、毁灭性影响,提供详实的数据恢复方法,同时为您提供极具实战性的预…...

多媒体ffmpeg学习教程

多媒体ffmpeg 目前比较流行的音视频文件为:MP4 flv m3u8 ffmpeg ffmpeg ffplay ffprobe ffserverffmpeg -i INPUT -vf "split [main][tmp]; [tmp] cropiw:ih/2:0:0, vflip [flip];[main][flip] overlay0:H/2" OUTPUTffmpeg -i 2022.mp4 -vcodec mpeg4 -b:…...

SELinux零知识学习十五、SELinux策略语言之客体类别和许可(9)

接前一篇文章:SELinux零知识学习十四、SELinux策略语言之客体类别和许可(8) 一、SELinux策略语言之客体类别和许可 4. 客体类别许可实例 (3)进程客体类别许可 与文件许可不同,许多进程许可没有直接对应到…...

OpenSign:安全可靠的电子签名解决方案 | 开源日报 No.76

microsoft/Web-Dev-For-Beginners Stars: 71.5k License: MIT 这个开源项目是一个为期 12 周的全面课程,由微软云倡导者团队提供。它旨在帮助初学者掌握 JavaScript、CSS 和 HTML 的基础知识。每一节都包括预习和复习测验、详细的书面指南、解决方案、作业等内容。…...

Linux | 进程间通信

目录 前言 一、进程间通信的基本概念 二、管道 1、管道的基本概念 2、匿名管道 (1)原理 (2)测试代码 (3)读写控制相关问题 a、读端关闭 b、写端关闭 c、读快写慢 d、读慢些快 (4&a…...

Vue.js正式环境中配置多个请求的URL

在Vue.js中,你可以在正式环境中配置多个请求的URL,通常使用一些配置文件或者环境变量的方式。下面是一种常见的配置方式: 1. 创建配置文件:在项目的根目录下,创建一个配置文件,比如可以是config.js&#x…...

简单的 UDP 网络程序

文章目录: 简单的UDP网络程序服务端创建套接字服务端绑定启动服务器udp客户端本地测试INADDR_ANY 地址转换函数关于 inet_ntoa 简单的UDP网络程序 服务端创建套接字 我们将服务端封装为一个类,当定义一个服务器对象之后,需要立即进行初始化…...

人工智能-深度学习之文本预处理

文本预处理 对于序列数据处理问题, 这样的数据存在许多种形式,文本是最常见例子之一。 例如,一篇文章可以被简单地看作一串单词序列,甚至是一串字符序列。 本节中,我们将解析文本的常见预处理步骤。 这些步骤通常包括…...

【Java 进阶篇】插上翅膀:JQuery 插件机制详解

在前端开发中,JQuery 作为一个广泛应用的 JavaScript 库,为开发者提供了丰富的工具和方法,简化了 DOM 操作、事件处理等繁琐的任务。而在这个庞大的生态系统中,插件机制是 JQuery 的一项重要特性,使得开发者能够轻松地…...

手动编译GDB

手动编译GDB 起因在于使用Clang-14编译C文件并生成调试信息,使用gdb调试时报DWARF相关错误。经检查原因在于虚拟机为Ubuntu 20.04,使用apt下载时官方提供gdb版本为9.2,不支持DWARF5,而Clang-14生成的调试信息是DWARF5版本的。为解决该问题,手…...

竞赛选题 深度学习花卉识别 - python 机器视觉 opencv

文章目录 0 前言1 项目背景2 花卉识别的基本原理3 算法实现3.1 预处理3.2 特征提取和选择3.3 分类器设计和决策3.4 卷积神经网络基本原理 4 算法实现4.1 花卉图像数据4.2 模块组成 5 项目执行结果6 最后 0 前言 🔥 优质竞赛项目系列,今天要分享的是 &a…...

替换SlowFast中Detectron2为Yolov8

一 需求 FaceBookReserch中SlowFast源码中检测框是用Detectron2进行目标检测,本文想实现用yolov8替换detectron2二 实施方案 首先,yolov8 支持有自定义库ultralytics(仅支持yolov8),安装对应库 pip install ultraly…...

轻量化网络--MobileNet V1

文章目录 depth-wise separable convolutions普通卷积depthwise conconvolutionspointwise convolutions网络结构进一步分析网络训练方式两个重要的超参数Width Multiplier: Thinner ModelsResolution Multiplier: Reduced Representation实验结果消融实验细粒度,高分辨率识别…...

gittee启动器

前言 很多小伙伴反馈不是使用gitee,不会寻找好的项目,在拿到一个项目不知道从哪里入手。 鼠鼠我呀就是宠粉,中嘞,老乡。整!!! git的基本指令 在使用gitee的时候呢,我们只需要记住…...

Spark数据倾斜_产生原因及定位处理办法_生产环境

在最近的项目中,历史和实时数据进行关联平滑时出现了数据倾斜,产生了笛卡尔积,具体现象如下:运行内存175GB,核数64,运行代码时,查看SparkUI界面的active jobs ,数据输入是1G&#xf…...

2023OceanBase年度发布会后,有感

很荣幸收到了OceanBase邀请,于本周四(11月16日)参加了OceanBase年度发布会并参加了DBA老友会,按照理论应该我昨天(星期五)就回到成都了,最迟今天白天就该把文章写出来了,奈何媳妇儿买…...

ubuntu18.04中代码迁移到20.04报错

一、 PCL库,Eigen库报错,如: /usr/include/pcl-1.10/pcl/point_types.h:903:29: error: ‘enable_if_t’ in namespace ‘std’ does not name a template type; did you mean ‘enable_if’?/usr/include/pcl-1.10/pcl/point_types.h:698:…...

QQ五毛项目记

问题与挑战:某公司为了实现某马总造福全人类,红旗插遍全球的宏伟目标,为应对后续用户激增的问题。特别安排了一次针对全体用户的秒杀活动:于XXXX年XX月XX日XX时XX分XX秒开始的秒杀五毛钱一百个QQ币的活动。每个账户仅限一次&#…...

小程序实现登录持久化

小程序实现登录持久化需要使用到小程序的缓存API,例如wx.getStorageSync()和wx.setStorageSync()等方法。以下是一个简单的代码实现: // App.js App({ // 在全局的App.js中定义全局变量userInfo,用于存放用户信息 globalData: { userInfo: …...

【Redis技术进阶之路】「原理分析系列开篇」分析客户端和服务端网络诵信交互实现(服务端执行命令请求的过程 - 初始化服务器)

服务端执行命令请求的过程 【专栏简介】【技术大纲】【专栏目标】【目标人群】1. Redis爱好者与社区成员2. 后端开发和系统架构师3. 计算机专业的本科生及研究生 初始化服务器1. 初始化服务器状态结构初始化RedisServer变量 2. 加载相关系统配置和用户配置参数定制化配置参数案…...

dify打造数据可视化图表

一、概述 在日常工作和学习中,我们经常需要和数据打交道。无论是分析报告、项目展示,还是简单的数据洞察,一个清晰直观的图表,往往能胜过千言万语。 一款能让数据可视化变得超级简单的 MCP Server,由蚂蚁集团 AntV 团队…...

无人机侦测与反制技术的进展与应用

国家电网无人机侦测与反制技术的进展与应用 引言 随着无人机(无人驾驶飞行器,UAV)技术的快速发展,其在商业、娱乐和军事领域的广泛应用带来了新的安全挑战。特别是对于关键基础设施如电力系统,无人机的“黑飞”&…...

从 GreenPlum 到镜舟数据库:杭银消费金融湖仓一体转型实践

作者:吴岐诗,杭银消费金融大数据应用开发工程师 本文整理自杭银消费金融大数据应用开发工程师在StarRocks Summit Asia 2024的分享 引言:融合数据湖与数仓的创新之路 在数字金融时代,数据已成为金融机构的核心竞争力。杭银消费金…...

论文阅读笔记——Muffin: Testing Deep Learning Libraries via Neural Architecture Fuzzing

Muffin 论文 现有方法 CRADLE 和 LEMON,依赖模型推理阶段输出进行差分测试,但在训练阶段是不可行的,因为训练阶段直到最后才有固定输出,中间过程是不断变化的。API 库覆盖低,因为各个 API 都是在各种具体场景下使用。…...

tauri项目,如何在rust端读取电脑环境变量

如果想在前端通过调用来获取环境变量的值&#xff0c;可以通过标准的依赖&#xff1a; std::env::var(name).ok() 想在前端通过调用来获取&#xff0c;可以写一个command函数&#xff1a; #[tauri::command] pub fn get_env_var(name: String) -> Result<String, Stri…...

LCTF液晶可调谐滤波器在多光谱相机捕捉无人机目标检测中的作用

中达瑞和自2005年成立以来&#xff0c;一直在光谱成像领域深度钻研和发展&#xff0c;始终致力于研发高性能、高可靠性的光谱成像相机&#xff0c;为科研院校提供更优的产品和服务。在《低空背景下无人机目标的光谱特征研究及目标检测应用》这篇论文中提到中达瑞和 LCTF 作为多…...

DBLP数据库是什么?

DBLP&#xff08;Digital Bibliography & Library Project&#xff09;Computer Science Bibliography是全球著名的计算机科学出版物的开放书目数据库。DBLP所收录的期刊和会议论文质量较高&#xff0c;数据库文献更新速度很快&#xff0c;很好地反映了国际计算机科学学术研…...

Linux 下 DMA 内存映射浅析

序 系统 I/O 设备驱动程序通常调用其特定子系统的接口为 DMA 分配内存&#xff0c;但最终会调到 DMA 子系统的dma_alloc_coherent()/dma_alloc_attrs() 等接口。 关于 dma_alloc_coherent 接口详细的代码讲解、调用流程&#xff0c;可以参考这篇文章&#xff0c;我觉得写的非常…...

在golang中如何将已安装的依赖降级处理,比如:将 go-ansible/v2@v2.2.0 更换为 go-ansible/@v1.1.7

在 Go 项目中降级 go-ansible 从 v2.2.0 到 v1.1.7 具体步骤&#xff1a; 第一步&#xff1a; 修改 go.mod 文件 // 原 v2 版本声明 require github.com/apenella/go-ansible/v2 v2.2.0 替换为&#xff1a; // 改为 v…...