【北邮鲁鹏老师计算机视觉课程笔记】01 introduction
1 生活中的计算机视觉

生活中的各种计算机视觉识别系统已经广泛地应用起来了。
2 计算机视觉与其他学科的关系

认知科学和神经科学是研究人类视觉系统的,如果能把人类视觉系统学习得更好,可以迁移到计算机视觉。是计算机视觉的理论基础。
算法、系统、框架、机器学习等是计算机视觉的工具。
光学设备采集图像给计算机视觉提供输入
图像处理强调的是:我输入的是图像,输出的也是图像,比如增强亮度、去噪
计算机视觉系统:输入的图像,输出的不只是图像。
应用:①图像检索。文字搜图,计算机视觉识别后给图像打了标签。在互联网上占领大的流量的还是图像和视频。②机器人。
3 计算机视觉的介绍

首先谈谈智能的概念,1997年的人工智能系统“深蓝”,战胜了国际象棋的世界冠军。2015年和2017年AlphaGo战胜了李世石和柯洁。
但是这是不是真的智能,现在的人工智能系统能下棋,但是它不能创作诗歌超过人类最优秀的诗人。从这个角度看,这并不是真的智能,它有一个很好的搜索算法,去搜索出最优解。因此,现在只能在数理和数学计算上部分实现人类的智能。
4 三维重构

计算机视觉系统还不够完善。
5 什么是视觉系统

感知 + 解释
人类的视觉系统
机器视觉系统

机器看到的是什么?是一个灰度图,是一个二维矩阵300 * 400
语义鸿沟:从像素到语义内容。存在的极大的差距
我们首先会从人类的视觉系统中去借鉴
6 人类的视觉系统是什么样的


诺贝尔奖成果:让猫去看图片。确定视觉和大脑皮层的关系。
给猫看了大量的图片,但是猫的大脑皮层没有反应。
给猫看简单的图形,某些神经元会有反应。通过后续实验,发现大脑对视觉信息的处理事分层的。
人类的视觉系统非常优秀。

任务:人类能以多快的速度和多高的精度去区分动物和非动物

过了150ms,区分动物和非动物的脑电波信号就不一样了。
7 运动视盲

8 利用上下文去理解语义


上下文背景引导了我们理解图像的过程。


实际上A、B的颜色是一样的。人类的视觉系统会对B进行自动增强。

9 计算机视觉的起源

MIT的研究生暑期项目
1966年,计算机视觉从图像处理中独立出来

先驱人物:马尔
计算机视觉的框架:①计算理论:任务是什么?②表达和算法:输入和输出是什么?③硬件实现:
10 我们能从图像中获取什么信息


3D信息更多地是用于定位
①SLAM
②三维重建
③漫游:一天建成罗马

从这个角度,计算机视觉分为两个大方向:从图像中恢复3D结构信息、从图像中恢复语义信息
11 计算机视觉的发展历程

12 为什么要做计算机视觉

三维重建



人脸识别:计算机识别的第一个真正的应用
虹膜识别




检测与跟踪:

VR:虚拟现实

13 课程资源

14 路线图

相关文章:
【北邮鲁鹏老师计算机视觉课程笔记】01 introduction
1 生活中的计算机视觉 生活中的各种计算机视觉识别系统已经广泛地应用起来了。 2 计算机视觉与其他学科的关系 认知科学和神经科学是研究人类视觉系统的,如果能把人类视觉系统学习得更好,可以迁移到计算机视觉。是计算机视觉的理论基础。 算法、系统、框…...
maven依赖报错处理(或者maven怎么刷新都下载不了依赖)
maven依赖报错,或者不报错,但是怎么刷新maven都没反应,可以试一下以下操作 当下载jar的时候,如果断网,或者连接超时的时候,会自动在文件夹中创建一个名为*lastupdate的文件,当有了这个文件之后…...
[VulnHub靶机渗透] dpwwn: 1
🍬 博主介绍👨🎓 博主介绍:大家好,我是 hacker-routing ,很高兴认识大家~ ✨主攻领域:【渗透领域】【应急响应】 【python】 【VulnHub靶场复现】【面试分析】 🎉点赞➕评论➕收藏…...
Android14音频进阶:MediaPlayerService如何启动AudioTrack 下篇(五十六)
简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏:多媒体系统工程师系列【原创干货持续更新中……】🚀 人生格言: 人生从来没有捷径,只…...
Python基础篇_修饰符(Decorators)【下】
上一篇:Python基础篇_修饰符(Decorators)【中】property、<attribute_name>.setter、<attribute_name>.deleter、functools.lru_cache(maxsizeNone) Python基础篇_修饰符(Decorators)【下】 Python基础篇_…...
C#,十进制展开数(Decimal Expansion Number)的算法与源代码
1 十进制展开数 十进制展开数(Decimal Expansion Number)的计算公式: DEN n^3 - n - 1 The decimal expansion of a number is its representation in base -10 (i.e., in the decimal system). In this system, each "decimal place…...
Vue3快速上手(一)使用vite创建项目
一、准备 在此之前,你的电脑,需要安装node.js,我这边v18.19.0 wangdymb 2024code % node -v v18.19.0二、创建 执行npm create vuelatest命令即可使用vite创建vue3项目 有的同学可能卡主不动,可能是npm的registry设置的问题 先看下&#x…...
使用navicat导出mysql离线数据后,再导入doris的方案
一、背景 doris本身是支持直接从mysql中同步数据的,但有时候,客户不允许我们使用doris直连mysql,此时就需要客户配合将mysql中的数据手工导出成离线文件,我们再导入到doris中 二、环境 doris 1.2 三、方案 doris支持多种导入…...
re:从0开始的CSS学习之路 1. CSS语法规则
0. 写在前面 现在大模型卷的飞起,感觉做页面的活可能以后就不需要人来做了,不知道现在还有没有学前端的必要。。。 1. HTML和CSS结合的三种方式 在HTML中,我们强调HTML并不关心显示样式,样式是CSS的工作,现在就轮到C…...
npm install express -g报错或一直卡着,亲测可解决
问题描述: 最近学习vue3前端框架,安装Node.js之后,在测试是否可行时,cmd窗口执行了:npm install express -g,发现如下图所示一直卡着不动,最后还报错了,网上找了好久,各…...
机器学习11-前馈神经网络识别手写数字1.0
在这个示例中,使用的神经网络是一个简单的全连接前馈神经网络,也称为多层感知器(Multilayer Perceptron,MLP)。这个神经网络由几个关键组件构成: 1. 输入层 输入层接收输入数据,这里是一个 28x…...
vscode wsl远程连接 权限问题
问题描述:执行命令时遇到Operation not permitted 和 Permission denied问题,是有关ip地址和创建文件的权限问题,参考网络上更改wsl.conf文件等方法均无法解决,只能加sudo来解决...
VED-eBPF:一款基于eBPF的内核利用和Rootkit检测工具
关于VED-eBPF VED-eBPF是一款功能强大的内核漏洞利用和Rootkit检测工具,该工具基于eBPF技术实现其功能,可以实现Linux操作系统运行时内核安全监控和漏洞利用检测。 eBPF是一个内核内虚拟机,它允许我们直接在内核中执行代码,而无…...
配置ARM交叉编译工具的通用步骤
ARM交叉编译工具是用于编译在ARM架构上运行的代码的工具。这些工具允许开发者在一种架构(通常是x86或x64)上编写和编译代码,然后将其移植到ARM架构上运行。 ARM交叉编译工具链通常包括编译器、链接器、调试器和其他必要的工具,用…...
相机图像质量研究(5)常见问题总结:光学结构对成像的影响--景深
系列文章目录 相机图像质量研究(1)Camera成像流程介绍 相机图像质量研究(2)ISP专用平台调优介绍 相机图像质量研究(3)图像质量测试介绍 相机图像质量研究(4)常见问题总结:光学结构对成像的影响--焦距 相机图像质量研究(5)常见问题总结:光学结构对成…...
使用django构建一个多级评论功能
,评论系统是交流和反馈的重要工具,尤其是多级评论系统,它允许用户回复特定评论,形成丰富的对话结构。这个文章是使用Django框架从零开始构建一个多级评论系统。Django是一个高级Python Web框架,它鼓励快速开发和干净、…...
测试管理_利用python连接禅道数据库并自动统计bug数据到钉钉群
测试管理_利用python连接禅道数据库并统计bug数据到钉钉 这篇不多赘述,直接上代码文件。 另文章基础参考博文:参考博文 加以我自己的需求优化而成。 统计的前提 以下代码统计的前提是禅道的提bug流程应规范化 bug未解决不删除bug未关闭不删除 db_…...
Python 小白的 Leetcode Daily Challenge 刷题计划 - 20240209(除夕)
368. Largest Divisible Subset 难度:Medium 动态规划 方案还原 Yesterdays Daily Challenge can be reduced to the problem of shortest path in an unweighted graph while todays daily challenge can be reduced to the problem of longest path in an unwe…...
BFS——双向广搜+A—star
有时候从一个点能扩展出来的情况很多,这样几层之后搜索空间就很大了,我们采用从两端同时进行搜索的策略,压缩搜索空间。 190. 字串变换(190. 字串变换 - AcWing题库) 思路:这题因为变化规则很多,所以我们一层一层往外…...
LLM之LangChain(七)| 使用LangChain,LangSmith实现Prompt工程ToT
如下图所示,LLM仍然是自治代理的backbone,可以通过给LLM增加以下模块来增强LLM功能: Prompter AgentChecker ModuleMemory moduleToT controller 当解决具体问题时,这些模块与LLM进行多轮对话。这是基于LLM的自治代理的典型情况,…...
计算机基础:从半导体到CPU指令执行全解析
1. 从半导体到逻辑门:计算机的物理基础 计算机的核心部件CPU本质上是由无数微小开关组成的精密电路,而这些开关的物理基础就是半导体材料。半导体之所以被称为"半导体",是因为它的导电性介于导体和绝缘体之间。这种特性使得我们可以…...
ZYNQ7010核心板硬件设计实战——从原理图到PCB的工程化思考
1. 从零开始构建ZYNQ7010核心板 第一次接触ZYNQ7010这种集成了ARM处理器和FPGA的SoC芯片时,我既兴奋又忐忑。这种混合架构的芯片确实强大,但随之而来的硬件设计复杂度也让人头疼。特别是当看到官方推荐的8层甚至12层PCB方案时,作为个人开发者…...
八位行波进位加法器设计全攻略:从理论到Quartus II实现
八位行波进位加法器设计全攻略:从理论到Quartus II实现 在数字电路设计中,加法器是最基础也是最重要的运算单元之一。无论是简单的计算器还是复杂的CPU,都离不开高效可靠的加法器设计。八位行波进位加法器作为入门级但实用性极强的设计案例&a…...
SteamStub DRM高效移除解决方案:从技术原理到实战应用全流程指南
SteamStub DRM高效移除解决方案:从技术原理到实战应用全流程指南 【免费下载链接】Steamless Steamless is a DRM remover of the SteamStub variants. The goal of Steamless is to make a single solution for unpacking all Steam DRM-packed files. Steamless a…...
IndexTTS-2-LLM语音合成应用:无障碍辅助与内容创作指南
IndexTTS-2-LLM语音合成应用:无障碍辅助与内容创作指南 1. 语音合成技术概述 1.1 什么是智能语音合成 智能语音合成(Text-to-Speech,TTS)技术能够将文字信息转换为自然流畅的语音输出。IndexTTS-2-LLM作为新一代语音合成系统&a…...
typedef用法
将为你介绍typedef 4 种应用方式。应用一、为基本数据类型定义新的类型名用uint32_t替代unsigned int声明变量/* 变量名重定义 */typedef unsigned int uint32_t;/* 定义一个unsigned int类型的变量 */uint32_t count 0;应用二、为自定义数据类型(结构体、共用体和…...
遥感数据处理避坑指南:实测光谱如何用Matlab匹配卫星波段(以GF-6为例)
遥感数据处理避坑指南:实测光谱如何用Matlab匹配卫星波段(以GF-6为例) 当你在野外辛苦采集的ASD高光谱数据与卫星影像比对时,是否遇到过这样的困惑:明明地面测量值看起来合理,但和卫星数据对比时却总存在难…...
动态对抗Zygisk-IL2CppDumper:Unity游戏安全新策略
1. 认识Zygisk-IL2CppDumper的攻击原理 如果你开发过Unity游戏,一定对IL2CPP不陌生。这是Unity官方推荐的脚本后端,它把C#代码转换成C代码再编译为本地机器码,相比Mono模式确实安全不少。但最近一年,一个叫Zygisk-IL2CppDumper的工…...
TM1651驱动LED条形图模块原理与嵌入式驱动开发
1. Whadda LED Bar Graph 模块技术解析与嵌入式驱动开发实践1.1 模块硬件架构与核心芯片特性Whadda WPI471 是一款基于 TM1651 驱动 IC 的 10 段 LED 条形图显示模块,广泛应用于嵌入式系统中的模拟量可视化指示场景,如电池电量、信号强度、温度梯度、音频…...
Day4 Python的函数和参数机制
函数的定义与调用最基本的函数结构如下:def greet(name): return f"Hello, {name}!" print(greet("Alice")) def 定义函数调用时传入对应参数如果参数数量或顺序不匹配,就会报错,这是最常见的问题之一。默认参数默认参数…...
