当前位置: 首页 > news >正文

【北邮鲁鹏老师计算机视觉课程笔记】01 introduction

1 生活中的计算机视觉

在这里插入图片描述

生活中的各种计算机视觉识别系统已经广泛地应用起来了。

2 计算机视觉与其他学科的关系

在这里插入图片描述

认知科学和神经科学是研究人类视觉系统的,如果能把人类视觉系统学习得更好,可以迁移到计算机视觉。是计算机视觉的理论基础。
算法、系统、框架、机器学习等是计算机视觉的工具。
光学设备采集图像给计算机视觉提供输入
图像处理强调的是:我输入的是图像,输出的也是图像,比如增强亮度、去噪
计算机视觉系统:输入的图像,输出的不只是图像。
应用:①图像检索。文字搜图,计算机视觉识别后给图像打了标签。在互联网上占领大的流量的还是图像和视频。②机器人。

3 计算机视觉的介绍

在这里插入图片描述

首先谈谈智能的概念,1997年的人工智能系统“深蓝”,战胜了国际象棋的世界冠军。2015年和2017年AlphaGo战胜了李世石和柯洁。
但是这是不是真的智能,现在的人工智能系统能下棋,但是它不能创作诗歌超过人类最优秀的诗人。从这个角度看,这并不是真的智能,它有一个很好的搜索算法,去搜索出最优解。因此,现在只能在数理和数学计算上部分实现人类的智能。

4 三维重构

在这里插入图片描述

计算机视觉系统还不够完善。

5 什么是视觉系统

在这里插入图片描述

感知 + 解释

人类的视觉系统
机器视觉系统

在这里插入图片描述

机器看到的是什么?是一个灰度图,是一个二维矩阵300 * 400

语义鸿沟:从像素到语义内容。存在的极大的差距

我们首先会从人类的视觉系统中去借鉴

6 人类的视觉系统是什么样的

在这里插入图片描述

在这里插入图片描述

诺贝尔奖成果:让猫去看图片。确定视觉和大脑皮层的关系。
给猫看了大量的图片,但是猫的大脑皮层没有反应。
给猫看简单的图形,某些神经元会有反应。通过后续实验,发现大脑对视觉信息的处理事分层的。
人类的视觉系统非常优秀。

在这里插入图片描述
任务:人类能以多快的速度和多高的精度去区分动物和非动物

在这里插入图片描述
过了150ms,区分动物和非动物的脑电波信号就不一样了。

7 运动视盲

在这里插入图片描述

8 利用上下文去理解语义

在这里插入图片描述
在这里插入图片描述
上下文背景引导了我们理解图像的过程。

在这里插入图片描述
在这里插入图片描述
实际上A、B的颜色是一样的。人类的视觉系统会对B进行自动增强。

在这里插入图片描述

9 计算机视觉的起源

在这里插入图片描述
MIT的研究生暑期项目
1966年,计算机视觉从图像处理中独立出来

在这里插入图片描述
先驱人物:马尔

计算机视觉的框架:①计算理论:任务是什么?②表达和算法:输入和输出是什么?③硬件实现:

10 我们能从图像中获取什么信息

在这里插入图片描述
在这里插入图片描述
3D信息更多地是用于定位
①SLAM
②三维重建
③漫游:一天建成罗马

在这里插入图片描述
从这个角度,计算机视觉分为两个大方向:从图像中恢复3D结构信息、从图像中恢复语义信息

11 计算机视觉的发展历程

在这里插入图片描述

12 为什么要做计算机视觉

在这里插入图片描述
三维重建

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
人脸识别:计算机识别的第一个真正的应用
虹膜识别

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
检测与跟踪:

在这里插入图片描述
VR:虚拟现实

在这里插入图片描述

13 课程资源

在这里插入图片描述

14 路线图

在这里插入图片描述

相关文章:

【北邮鲁鹏老师计算机视觉课程笔记】01 introduction

1 生活中的计算机视觉 生活中的各种计算机视觉识别系统已经广泛地应用起来了。 2 计算机视觉与其他学科的关系 认知科学和神经科学是研究人类视觉系统的,如果能把人类视觉系统学习得更好,可以迁移到计算机视觉。是计算机视觉的理论基础。 算法、系统、框…...

maven依赖报错处理(或者maven怎么刷新都下载不了依赖)

maven依赖报错,或者不报错,但是怎么刷新maven都没反应,可以试一下以下操作 当下载jar的时候,如果断网,或者连接超时的时候,会自动在文件夹中创建一个名为*lastupdate的文件,当有了这个文件之后…...

[VulnHub靶机渗透] dpwwn: 1

🍬 博主介绍👨‍🎓 博主介绍:大家好,我是 hacker-routing ,很高兴认识大家~ ✨主攻领域:【渗透领域】【应急响应】 【python】 【VulnHub靶场复现】【面试分析】 🎉点赞➕评论➕收藏…...

Android14音频进阶:MediaPlayerService如何启动AudioTrack 下篇(五十六)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏:多媒体系统工程师系列【原创干货持续更新中……】🚀 人生格言: 人生从来没有捷径,只…...

Python基础篇_修饰符(Decorators)【下】

上一篇&#xff1a;Python基础篇_修饰符&#xff08;Decorators&#xff09;【中】property、<attribute_name>.setter、<attribute_name>.deleter、functools.lru_cache(maxsizeNone) Python基础篇_修饰符&#xff08;Decorators&#xff09;【下】 Python基础篇_…...

C#,十进制展开数(Decimal Expansion Number)的算法与源代码

1 十进制展开数 十进制展开数&#xff08;Decimal Expansion Number&#xff09;的计算公式&#xff1a; DEN n^3 - n - 1 The decimal expansion of a number is its representation in base -10 (i.e., in the decimal system). In this system, each "decimal place…...

Vue3快速上手(一)使用vite创建项目

一、准备 在此之前&#xff0c;你的电脑&#xff0c;需要安装node.js,我这边v18.19.0 wangdymb 2024code % node -v v18.19.0二、创建 执行npm create vuelatest命令即可使用vite创建vue3项目 有的同学可能卡主不动&#xff0c;可能是npm的registry设置的问题 先看下&#x…...

使用navicat导出mysql离线数据后,再导入doris的方案

一、背景 doris本身是支持直接从mysql中同步数据的&#xff0c;但有时候&#xff0c;客户不允许我们使用doris直连mysql&#xff0c;此时就需要客户配合将mysql中的数据手工导出成离线文件&#xff0c;我们再导入到doris中 二、环境 doris 1.2 三、方案 doris支持多种导入…...

re:从0开始的CSS学习之路 1. CSS语法规则

0. 写在前面 现在大模型卷的飞起&#xff0c;感觉做页面的活可能以后就不需要人来做了&#xff0c;不知道现在还有没有学前端的必要。。。 1. HTML和CSS结合的三种方式 在HTML中&#xff0c;我们强调HTML并不关心显示样式&#xff0c;样式是CSS的工作&#xff0c;现在就轮到C…...

npm install express -g报错或一直卡着,亲测可解决

问题描述&#xff1a; 最近学习vue3前端框架&#xff0c;安装Node.js之后&#xff0c;在测试是否可行时&#xff0c;cmd窗口执行了&#xff1a;npm install express -g&#xff0c;发现如下图所示一直卡着不动&#xff0c;最后还报错了&#xff0c;网上找了好久&#xff0c;各…...

机器学习11-前馈神经网络识别手写数字1.0

在这个示例中&#xff0c;使用的神经网络是一个简单的全连接前馈神经网络&#xff0c;也称为多层感知器&#xff08;Multilayer Perceptron&#xff0c;MLP&#xff09;。这个神经网络由几个关键组件构成&#xff1a; 1. 输入层 输入层接收输入数据&#xff0c;这里是一个 28x…...

vscode wsl远程连接 权限问题

问题描述&#xff1a;执行命令时遇到Operation not permitted 和 Permission denied问题&#xff0c;是有关ip地址和创建文件的权限问题&#xff0c;参考网络上更改wsl.conf文件等方法均无法解决&#xff0c;只能加sudo来解决...

VED-eBPF:一款基于eBPF的内核利用和Rootkit检测工具

关于VED-eBPF VED-eBPF是一款功能强大的内核漏洞利用和Rootkit检测工具&#xff0c;该工具基于eBPF技术实现其功能&#xff0c;可以实现Linux操作系统运行时内核安全监控和漏洞利用检测。 eBPF是一个内核内虚拟机&#xff0c;它允许我们直接在内核中执行代码&#xff0c;而无…...

配置ARM交叉编译工具的通用步骤

ARM交叉编译工具是用于编译在ARM架构上运行的代码的工具。这些工具允许开发者在一种架构&#xff08;通常是x86或x64&#xff09;上编写和编译代码&#xff0c;然后将其移植到ARM架构上运行。 ARM交叉编译工具链通常包括编译器、链接器、调试器和其他必要的工具&#xff0c;用…...

相机图像质量研究(5)常见问题总结:光学结构对成像的影响--景深

系列文章目录 相机图像质量研究(1)Camera成像流程介绍 相机图像质量研究(2)ISP专用平台调优介绍 相机图像质量研究(3)图像质量测试介绍 相机图像质量研究(4)常见问题总结&#xff1a;光学结构对成像的影响--焦距 相机图像质量研究(5)常见问题总结&#xff1a;光学结构对成…...

使用django构建一个多级评论功能

&#xff0c;评论系统是交流和反馈的重要工具&#xff0c;尤其是多级评论系统&#xff0c;它允许用户回复特定评论&#xff0c;形成丰富的对话结构。这个文章是使用Django框架从零开始构建一个多级评论系统。Django是一个高级Python Web框架&#xff0c;它鼓励快速开发和干净、…...

测试管理_利用python连接禅道数据库并自动统计bug数据到钉钉群

测试管理_利用python连接禅道数据库并统计bug数据到钉钉 这篇不多赘述&#xff0c;直接上代码文件。 另文章基础参考博文&#xff1a;参考博文 加以我自己的需求优化而成。 统计的前提 以下代码统计的前提是禅道的提bug流程应规范化 bug未解决不删除bug未关闭不删除 db_…...

Python 小白的 Leetcode Daily Challenge 刷题计划 - 20240209(除夕)

368. Largest Divisible Subset 难度&#xff1a;Medium 动态规划 方案还原 Yesterdays Daily Challenge can be reduced to the problem of shortest path in an unweighted graph while todays daily challenge can be reduced to the problem of longest path in an unwe…...

BFS——双向广搜+A—star

有时候从一个点能扩展出来的情况很多&#xff0c;这样几层之后搜索空间就很大了&#xff0c;我们采用从两端同时进行搜索的策略&#xff0c;压缩搜索空间。 190. 字串变换(190. 字串变换 - AcWing题库) 思路&#xff1a;这题因为变化规则很多&#xff0c;所以我们一层一层往外…...

LLM之LangChain(七)| 使用LangChain,LangSmith实现Prompt工程ToT

如下图所示&#xff0c;LLM仍然是自治代理的backbone&#xff0c;可以通过给LLM增加以下模块来增强LLM功能: Prompter AgentChecker ModuleMemory moduleToT controller 当解决具体问题时&#xff0c;这些模块与LLM进行多轮对话。这是基于LLM的自治代理的典型情况&#xff0c;…...

驾驶舱前端设计方案:从“花架子”到“真能用”的组件化实战

很多人一提起“驾驶舱”或“ dashboard ”&#xff0c;脑海里浮现的就是&#xff1a;满屏图表、深色背景、会转动的3D地球、还有一堆看起来很高端但没人点开的按钮。但真正在一线做过驾驶舱的人都知道——大部分驾驶舱&#xff0c;上线当天截个图发朋友圈之后&#xff0c;就再也…...

Rust实现PDF解析与渲染:pdf_oxide库的安全高性能实践

1. 项目概述&#xff1a;当Rust遇上PDF&#xff0c;一场性能与安全的革命如果你在Rust社区或者高性能数据处理领域待过一阵子&#xff0c;大概率听说过或用过pdf_oxide这个库。乍一看&#xff0c;它只是GitHub上一个名为yfedoseev/pdf_oxide的仓库&#xff0c;一个用纯Rust编写…...

悬而未决:Nacos 与 Apollo 能否终结“改配置就要重启”的诅咒?

写在前面“你把 log-level 从 INFO 改成 DEBUG 了&#xff1f;行&#xff0c;我记一下。等下次发布的时候一起上线。”这句话&#xff0c;是不是很熟悉&#xff1f;在一个超过 5 年的大型微服务项目中&#xff0c;我见过太多这样的场景&#xff1a;开发团队在线上环境排查问题时…...

零基础录音转日程教程包教包会避坑,看完就能直接上手

做销售近5年&#xff0c;日常需频繁跑客户拜访、对接客户&#xff0c;每次沟通结束后&#xff0c;将录音整理成待办日程都十分繁琐&#xff0c;先和大家分享我之前踩过的一些坑&#xff0c;不少同行可能也有类似经历。第一个坑是误以为录音转日程&#xff0c;只需先将录音转成文…...

容器存储进阶:PersistentVolume(PV)_PVC 底层原理 + 动态供应踩坑 + 数据备份恢复实战

容器存储进阶:PersistentVolume(PV)/PVC 底层原理 + 动态供应踩坑 + 数据备份恢复实战 前言:在Kubernetes容器集群中,PersistentVolume(PV)与PersistentVolumeClaim(PVC)是实现容器持久化存储的核心组件,但生产环境中,多数运维人员往往卡在基础配置层面,而忽略了动…...

飞书文档批量导出终极指南:3步实现自动化文档迁移

飞书文档批量导出终极指南&#xff1a;3步实现自动化文档迁移 【免费下载链接】feishu-doc-export 飞书文档导出服务 项目地址: https://gitcode.com/gh_mirrors/fe/feishu-doc-export 还在为飞书文档迁移而烦恼吗&#xff1f;飞书文档批量导出工具让你彻底告别手动下载…...

Agent史上最全八股,来啦!

涉及到 RAG、MCP、Skills 等 12 个方向&#xff0c;共计 200 多个问题。 因为最近一段时间&#xff0c;我越来越明显地感觉到&#xff0c;前端 AI 方面的面试已经越来越倾向语 AI 化了。 以前很多同学去面试&#xff0c;面试官问的还是比较浅的东西。 你用过哪些大模型&#xf…...

TV Bro电视浏览器完全指南:如何在智能电视上享受大屏上网的终极体验

TV Bro电视浏览器完全指南&#xff1a;如何在智能电视上享受大屏上网的终极体验 【免费下载链接】tv-bro Simple web browser for android optimized to use with TV remote 项目地址: https://gitcode.com/gh_mirrors/tv/tv-bro TV Bro是一款专为智能电视和遥控器操作优…...

Go泛型实战经验总结:何时应该在新老项目中采用泛型

Go泛型实战经验总结&#xff1a;何时应该在新老项目中采用泛型 【免费下载链接】go-generics-the-hard-way A hands-on approach to getting started with Go generics. 项目地址: https://gitcode.com/gh_mirrors/go/go-generics-the-hard-way Go泛型是Go 1.18版本引入…...

基于MCP协议与微软Graph API构建安全可控的AI助手Outlook集成方案

1. 项目概述&#xff1a;为AI助手开启你的Outlook个人账户 如果你和我一样&#xff0c;每天被Outlook邮箱、日历和待办事项淹没&#xff0c;同时又希望AI助手能真正帮上忙——比如自动整理邮件、安排日程、甚至起草回复——那么你肯定遇到过工具链断裂的烦恼。市面上的自动化方…...