图像处理与计算机视觉--第一章-计算机视觉简介-10问
第一章-计算机视觉简介-10问 |
1.CV与AI的关系是什么? |
CV(Computer Vision)是Al的子领域,它致力于使计算机能够理解和解释图像和数据,CV借助AI技术,比如深度学习/机器学习,实现目标识别,分析和处理任务。AI提供了CV所需要的算法和模型,使得计算机能够自动从图像和视频中提取信息,对于自动化,智能化以及自主系统的实现有着非常重要的作用。
2.Marr教授把CV划分 为哪三阶段? |
Marr理论把视觉过程划分为三个阶段:
第一阶段将输入的图像作原始的处理,抽取图像中诸如角点、边缘、纹理、线条、边界等基本特征,这些特征的集合称为基元图。
第二阶段在以观测者为观测坐标的中心,由输入图像和基元图恢复场景可见部分的深度、法线方向、轮廓等,这些信息的包含了深度信息,但不是真正的物体三维表示,因此,称为二维半图(2.5D)。
第三阶段在以物体为中心的坐标系中,由输入图像、基元图、二维半图来恢复、表示和识别三维物体
3.21 世纪CV快速发展得益于哪些方法或技术的运用?请列出两个以上 |
1.深度学习:深度神经网络的出现以及广泛的应用在图像处理任务上,特别是CNN(卷积神经网络)的出现,大大提高了计算机视觉的性能,开源的深度学习框架如TensorFlow和PyTorch的兴起,使得越来越多的人开始接触深度学习的领域。
2.计算能力:图形处理单元GPU和专用硬件的发展加速了CV算法的训练和推断速度。
3.大规模数据集:互联网上可用的大规模图像和视频数据集使CV模型能够更好地学习和泛化。
4.CV领域尚未解决的关键问题有哪些?请列出三个以上。 |
1.物体遮挡:如何处理部分遮挡的物体,以更好地理解场景,目前CV领域对于物体遮挡类的问题还是无从下手,如何更好的去还原和模拟物体遮挡的场景,CV领域在这个方面还有很长的路要去走。
2.视觉推理:如何使计算机进行更深层次的视觉推理,例如理解物体之间的因果关系,对于复杂场景上的模型,CV领域仍然不能如同人眼那般去做处理,对于视觉的推断不够智能呢个,只能做简单场景的推断。
3.不确定性处理:如何更好地处理不确定性,特别是在复杂环境中的目标跟踪和场景理解。
5.请列出三个CV的主要应用领域。 |
1.图像分类和物体识别:将图像中的物体分类为预定义的类别。
2.目标检测和跟踪:检测和跟踪视频中的特定物体或目标。
3.人脸识别和生物特征识别:识别人脸或生物特征以进行身份验证和安全应用,这是计算机视觉最为广泛的应用场景了。
4.机器人视觉处理: 机器人的兴起和发展离不开计算机视觉的发展和进步,准确来说,失去了计算机视觉的帮助,机器人就会像无头苍蝇一样,所以计算机视觉在机器人的发展中起到至关重要的作用。
6.请列出人眼视觉结构与成像系统结构的区别与联系? |
1.视觉结构与系统结构的区别:人眼视觉结构是生物系统,包括眼球、视网膜、神经系统等,用于感知和理解视觉信息。成像系统结构是工程系统,如摄像机、传感器和处理器,用于捕获和处理图像信息。
2.视觉结构与系统结构的联系:成像系统的设计受到人眼视觉的启发,例如,摄像机的镜头和传感器安排模仿了眼睛的结构。同时,CV领域的研究也借鉴了人眼视觉的一些特性,如边缘检测和色彩感知。
7.机器人按照功能可以划分为哪三类? |
机器人按功能分被分为以下3类:
1.工业机器人:这类机器人用于执行物理任务和基本的工程任务,如现实生活执行简单物品的安装和工厂内的加工型机器人。
2.服务机器人:这类机器人的涵盖范围非常广泛,目前比较多的用途有:物流配送性机器人,人机交互性机器人(迎宾机器人和引导机器人较多),以及安防巡逻机器人。
3.特种机器人:国内一般会把这类机器人单独列出,因为这一部分的机器人我们通常都是见不到的,其常常用到在特定的领域以及特定的场景之下,用途非常的单一,比如核电检修机器人,月球车机器人等等,这种机器人千差万别,通用性很差。
8.主动视觉与被动视觉区别是什么? |
主动视觉(Active Vision):主动视觉涉及机器或系统主动选择视觉信息,并采取措施来改变视点或获取更多信息。例如,一个机器人可以移动其摄像头以查看不同角度的场景。
被动视觉(Passive Vision):被动视觉是指系统接收来自外部世界的视觉信息,而不采取主动措施来改变视点或获取信息。例如,一个普通的摄像机只能记录其视野中的内容。
结合PPT内容的回答:
主动视觉在识别方面采用投射结构光向测量目标的表面贴上人造的纹理来解决对应点匹配问题,而被动视觉则是采用输入视点或者图像的数目来处理识别问题的这样的方法在处理单目视觉的问题上还能够行的通,但是在处理立体视觉的问题上,容易受到纹理/关照/反射率等因素的影响。
9.请尝试回答VR与AR的区别与联系? |
•VR (Virtual Reality,虚拟现实):是一种通过计算机模拟真实感的图像,声音和其他感觉,从而复制出一个真实或者假想的场景,并且让人觉得身处这个场景之中,还能够与这个场景发生交互。
•AR (Augmented Reality, 增强现实):是一种直接或间接地观察真实场景,但其内容通过计算机生成的组成部分被增强,计算机生成的部分包括图像,声音,视频或其他类型的信息。
综上所述,AR和VR的最为本质的区别就是AR需要尽可能与现实相结合而VR需要极可能多的隔绝现实。同时两者对于硬件的要求也不一样,AR需要对于场景进行理解,对于CPU的要求高,对于GPU的要求反而低了,而VR需要涉及丰富的图形资源,所以对于GPU的要求高,对于CPU的要求较低。同时AR和VR的联系是两者都是通过计算机信息技术来绘制虚拟图像。
10.请列出与CV关系密切的三个研究领域 |
•图像识别:图像处理领域时计算机视觉研究最多的开端,如何更为高效的研究器图像识别是发展计算机视觉的第一环节。
•图像处理:图像处理领域时计算机视觉研究和应用最多的领域,对于图像进行更好的处理,获取更多有用的信心组合是支撑计算机视觉在其他领域广泛应用的关键。
•机器学习:CV领域广泛使用机器学习技术,尤其是深度学习,来训练和优化图像识别和分析模型。CV领域广泛使用机器学习技术,尤其是深度学习,来训练和优化图像识别和分析模型。
相关文章:
图像处理与计算机视觉--第一章-计算机视觉简介-10问
第一章-计算机视觉简介-10问 1.CV与AI的关系是什么? CV(Computer Vision)是Al的子领域,它致力于使计算机能够理解和解释图像和数据,CV借助AI技术,比如深度学习/机器学习,实现目标识别,分析和处理任务。AI提供了CV所需要的算法…...
LeetCode 80. 删除有序数组中的重复项 II
文章目录 一、题目二、Java 题解 一、题目 给你一个有序数组 nums,请你 原地 删除重复出现的元素,使得出现次数超过两次的元素只出现两次 ,返回删除后数组的新长度。 不要使用额外的数组空间,你必须在 原地 修改输入数组 并在使用…...

【前端面试题】浏览器面试题
文章目录 前言一、浏览器面试问题1.cookie sessionStorage localStorage 区别2.如何写一个会过期的localStorage,说说想法2.如何定时删除localstorage数据2.localStorage 能跨域吗2.memory cache 如何开启2.localstorage的限制2.浏览器输入URL发生了什么2.浏览器如何…...
PHP 生成 PDF文件
参考官网 Example 009 : Image() TCPDF laravel 可以使用 composer 安装 tecnickcom/tcpdf 进行使用 //require_once("../app/Extend/tcpdf/tcpdf.php"); $pdf new TCPDF();// 设置文档信息$pdf->SetCreator(懒人开发网);$pdf->SetAuthor(懒人开发网);$…...

讲讲项目里的仪表盘编辑器(一)
需求 要做一个仪表盘系统,要求有: ① 设计功能(包括布局、大小、排列) ② 预览功能 ③ 运行功能 布局选择 做编辑器,肯定要先选择布局。 前端有几种常用布局。 静态布局 也叫文档布局。默认的网页形式…...

解决方案 | 如何构建市政综合管廊安全运行监测系统?
如何构建市政综合管廊安全运行监测系统?WITBEE万宾城市生命线智能监测仪器,5年免维护设计,集成10多项结构与气体健康监测指标,毫秒级快速响应,时刻感知综合管廊运行态势...

JCEF中js与java交互、js与java相互调用
jcef中js与java相互调用,java与js相互调用,chrome与java相互调用,java与chrome相互调用、jcef与java相互调用 前提:https://blog.csdn.net/weixin_44480167/article/details/133170970(java内嵌浏览器CEF-JAVA、jcef、…...
9.20 校招 实习 内推 面经
绿泡*泡: neituijunsir 交流裙 ,内推/实习/校招汇总表格 1、校招丨智行者2024年校园招聘正式启动啦 校招丨智行者2024年校园招聘正式启动啦 2、校招 | 乐动机器人2024校园招聘 校招 | 乐动机器人2024校园招聘 3、校招丨小天才2024届秋季校园招聘 …...

基于JAVA+SpringBoot+Vue+协同过滤算法+爬虫的前后端分离的租房系统
✌全网粉丝20W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取项目下载方式🍅 一、项目背景介绍: 随着城市化进程的加快…...

【Android Framework系列】第16章 存储访问框架 (SAF)
1 概述 Android 4.4(API 级别 19)引入了存储访问框架 (Storage Access Framework)。SAF让用户能够在其所有首选文档存储提供程序中方便地浏览并打开文档、图像以及其他文件。 用户可以通过易用的标准 UI,以统一方式在所有应用和提供程序中浏…...

Antdesign 4中让分页组件居中显示的方法
在Ant Design 4中分页组件默认是最右边显示的,而这个没有设置位置的属性的 解决办法: 在pagination的属性中增加: style: {textAlign: "center"} 在Ant Design 5中可以让pagination使用align: center来实现分页组件居中...

【笔记】ubuntu 20.04 + mongodb 4.4.14定时增量备份脚本
环境 ubuntu 20.04mongodb 4.4.14还没实际使用(20230922)后续到10月底如果有问题会修改 原理 只会在有新增数据时生成新的备份日期目录备份恢复时,如果恢复的数据库未删除,则会覆盖数据 准备 准备一个文件夹,用于…...
c++实现的一个定时器实例
/* * author: hjjdebug * date : 2023年 09月 23日 星期六 11:52:29 CST * description: 用std::thread 实现了一个定时器,深刻理解一下定时器是怎样工作的. * 参考Timer.h, Timer.cpp */ $ cat main.cpp #include "Timer.h" #include <unis…...

Python线程和进程
1、深度解析Python线程和进程 一篇文章带你深度解析Python线程和进程 - 知乎使用Python中的线程模块,能够同时运行程序的不同部分,并简化设计。如果你已经入门Python,并且想用线程来提升程序运行速度的话,希望这篇教程会对你有所帮…...
算法 寻找峰值-(二分查找+反向双指针)
牛客网: BM19 题目: 寻找数组峰值,可能多个返回任一个,每个值满足nums[i] ! nums[i 1] 思路: 双指针 left 0, right n-1, 相向而行,取中间位置mid, nums[mid]与nums[mid1]比较,如果nums[mid] < nums[mid1],说明…...

【数据结构】—交换排序之快速排序究极详解,手把手带你从简单的冒泡排序升级到排序的难点{快速排序}(含C语言实现)
食用指南:本文在有C基础的情况下食用更佳 🔥这就不得不推荐此专栏了:C语言 ♈️今日夜电波:靴の花火—ヨルシカ 0:28━━━━━━️💟──────── 5:03 …...

【c#-Nuget 包“在此源中不可用”】 Nuget package “Not available in this source“
标题c#-Nuget 包“在此源中不可用”…但 VS 仍然知道它吗? (c# - Nuget package “Not available in this source”… but VS still knows about it?) 背景: 今日从公司svn 上拉取很久很久以前的代码,拉取下来200报错,进一步发…...

【数据结构】二叉树之堆的实现
🔥博客主页:小王又困了 📚系列专栏:数据结构 🌟人之为学,不日近则日退 ❤️感谢大家点赞👍收藏⭐评论✍️ 目录 一、二叉树的顺序结构 📒1.1顺序存储 📒1.2堆的性质…...

电工-三极管输入输出特性曲线讲解
三极管特性曲线是反映三极管各电极电压和电流之间相互关系的曲线,是用来描述晶体三极管工作特性曲线,常用的特性曲线有输入特性曲线和输出特性曲线。这里以下图所示的共发射极电路来分析三极管的特性曲线。 输入特性曲线 该曲线表示当e极与c极之间的电…...

深入解析容器与虚拟化:技术、对比与生态
深入解析容器与虚拟化:技术、对比与生态 文章目录 深入解析容器与虚拟化:技术、对比与生态容器和虚拟化的基本概念和原理容器的定义和特点虚拟化的定义和特点 容器使用场景容器和虚拟机的对比虚拟化技术的四个特点容器实现虚拟化的原理常见容器引擎和容器…...
uniapp 对接腾讯云IM群组成员管理(增删改查)
UniApp 实战:腾讯云IM群组成员管理(增删改查) 一、前言 在社交类App开发中,群组成员管理是核心功能之一。本文将基于UniApp框架,结合腾讯云IM SDK,详细讲解如何实现群组成员的增删改查全流程。 权限校验…...

Spark 之 入门讲解详细版(1)
1、简介 1.1 Spark简介 Spark是加州大学伯克利分校AMP实验室(Algorithms, Machines, and People Lab)开发通用内存并行计算框架。Spark在2013年6月进入Apache成为孵化项目,8个月后成为Apache顶级项目,速度之快足见过人之处&…...

DAY 47
三、通道注意力 3.1 通道注意力的定义 # 新增:通道注意力模块(SE模块) class ChannelAttention(nn.Module):"""通道注意力模块(Squeeze-and-Excitation)"""def __init__(self, in_channels, reduction_rat…...
Rapidio门铃消息FIFO溢出机制
关于RapidIO门铃消息FIFO的溢出机制及其与中断抖动的关系,以下是深入解析: 门铃FIFO溢出的本质 在RapidIO系统中,门铃消息FIFO是硬件控制器内部的缓冲区,用于临时存储接收到的门铃消息(Doorbell Message)。…...

OPENCV形态学基础之二腐蚀
一.腐蚀的原理 (图1) 数学表达式:dst(x,y) erode(src(x,y)) min(x,y)src(xx,yy) 腐蚀也是图像形态学的基本功能之一,腐蚀跟膨胀属于反向操作,膨胀是把图像图像变大,而腐蚀就是把图像变小。腐蚀后的图像变小变暗淡。 腐蚀…...
Pinocchio 库详解及其在足式机器人上的应用
Pinocchio 库详解及其在足式机器人上的应用 Pinocchio (Pinocchio is not only a nose) 是一个开源的 C 库,专门用于快速计算机器人模型的正向运动学、逆向运动学、雅可比矩阵、动力学和动力学导数。它主要关注效率和准确性,并提供了一个通用的框架&…...
React---day11
14.4 react-redux第三方库 提供connect、thunk之类的函数 以获取一个banner数据为例子 store: 我们在使用异步的时候理应是要使用中间件的,但是configureStore 已经自动集成了 redux-thunk,注意action里面要返回函数 import { configureS…...

springboot整合VUE之在线教育管理系统简介
可以学习到的技能 学会常用技术栈的使用 独立开发项目 学会前端的开发流程 学会后端的开发流程 学会数据库的设计 学会前后端接口调用方式 学会多模块之间的关联 学会数据的处理 适用人群 在校学生,小白用户,想学习知识的 有点基础,想要通过项…...

华为OD机试-最短木板长度-二分法(A卷,100分)
此题是一个最大化最小值的典型例题, 因为搜索范围是有界的,上界最大木板长度补充的全部木料长度,下界最小木板长度; 即left0,right10^6; 我们可以设置一个候选值x(mid),将木板的长度全部都补充到x,如果成功…...
深度学习之模型压缩三驾马车:模型剪枝、模型量化、知识蒸馏
一、引言 在深度学习中,我们训练出的神经网络往往非常庞大(比如像 ResNet、YOLOv8、Vision Transformer),虽然精度很高,但“太重”了,运行起来很慢,占用内存大,不适合部署到手机、摄…...