图像处理与计算机视觉--第一章-计算机视觉简介-10问
第一章-计算机视觉简介-10问 |
1.CV与AI的关系是什么? |
CV(Computer Vision)是Al的子领域,它致力于使计算机能够理解和解释图像和数据,CV借助AI技术,比如深度学习/机器学习,实现目标识别,分析和处理任务。AI提供了CV所需要的算法和模型,使得计算机能够自动从图像和视频中提取信息,对于自动化,智能化以及自主系统的实现有着非常重要的作用。
2.Marr教授把CV划分 为哪三阶段? |
Marr理论把视觉过程划分为三个阶段:
第一阶段将输入的图像作原始的处理,抽取图像中诸如角点、边缘、纹理、线条、边界等基本特征,这些特征的集合称为基元图。
第二阶段在以观测者为观测坐标的中心,由输入图像和基元图恢复场景可见部分的深度、法线方向、轮廓等,这些信息的包含了深度信息,但不是真正的物体三维表示,因此,称为二维半图(2.5D)。
第三阶段在以物体为中心的坐标系中,由输入图像、基元图、二维半图来恢复、表示和识别三维物体
3.21 世纪CV快速发展得益于哪些方法或技术的运用?请列出两个以上 |
1.深度学习:深度神经网络的出现以及广泛的应用在图像处理任务上,特别是CNN(卷积神经网络)的出现,大大提高了计算机视觉的性能,开源的深度学习框架如TensorFlow和PyTorch的兴起,使得越来越多的人开始接触深度学习的领域。
2.计算能力:图形处理单元GPU和专用硬件的发展加速了CV算法的训练和推断速度。
3.大规模数据集:互联网上可用的大规模图像和视频数据集使CV模型能够更好地学习和泛化。
4.CV领域尚未解决的关键问题有哪些?请列出三个以上。 |
1.物体遮挡:如何处理部分遮挡的物体,以更好地理解场景,目前CV领域对于物体遮挡类的问题还是无从下手,如何更好的去还原和模拟物体遮挡的场景,CV领域在这个方面还有很长的路要去走。
2.视觉推理:如何使计算机进行更深层次的视觉推理,例如理解物体之间的因果关系,对于复杂场景上的模型,CV领域仍然不能如同人眼那般去做处理,对于视觉的推断不够智能呢个,只能做简单场景的推断。
3.不确定性处理:如何更好地处理不确定性,特别是在复杂环境中的目标跟踪和场景理解。
5.请列出三个CV的主要应用领域。 |
1.图像分类和物体识别:将图像中的物体分类为预定义的类别。
2.目标检测和跟踪:检测和跟踪视频中的特定物体或目标。
3.人脸识别和生物特征识别:识别人脸或生物特征以进行身份验证和安全应用,这是计算机视觉最为广泛的应用场景了。
4.机器人视觉处理: 机器人的兴起和发展离不开计算机视觉的发展和进步,准确来说,失去了计算机视觉的帮助,机器人就会像无头苍蝇一样,所以计算机视觉在机器人的发展中起到至关重要的作用。
6.请列出人眼视觉结构与成像系统结构的区别与联系? |
1.视觉结构与系统结构的区别:人眼视觉结构是生物系统,包括眼球、视网膜、神经系统等,用于感知和理解视觉信息。成像系统结构是工程系统,如摄像机、传感器和处理器,用于捕获和处理图像信息。
2.视觉结构与系统结构的联系:成像系统的设计受到人眼视觉的启发,例如,摄像机的镜头和传感器安排模仿了眼睛的结构。同时,CV领域的研究也借鉴了人眼视觉的一些特性,如边缘检测和色彩感知。
7.机器人按照功能可以划分为哪三类? |
机器人按功能分被分为以下3类:
1.工业机器人:这类机器人用于执行物理任务和基本的工程任务,如现实生活执行简单物品的安装和工厂内的加工型机器人。
2.服务机器人:这类机器人的涵盖范围非常广泛,目前比较多的用途有:物流配送性机器人,人机交互性机器人(迎宾机器人和引导机器人较多),以及安防巡逻机器人。
3.特种机器人:国内一般会把这类机器人单独列出,因为这一部分的机器人我们通常都是见不到的,其常常用到在特定的领域以及特定的场景之下,用途非常的单一,比如核电检修机器人,月球车机器人等等,这种机器人千差万别,通用性很差。
8.主动视觉与被动视觉区别是什么? |
主动视觉(Active Vision):主动视觉涉及机器或系统主动选择视觉信息,并采取措施来改变视点或获取更多信息。例如,一个机器人可以移动其摄像头以查看不同角度的场景。
被动视觉(Passive Vision):被动视觉是指系统接收来自外部世界的视觉信息,而不采取主动措施来改变视点或获取信息。例如,一个普通的摄像机只能记录其视野中的内容。
结合PPT内容的回答:
主动视觉在识别方面采用投射结构光向测量目标的表面贴上人造的纹理来解决对应点匹配问题,而被动视觉则是采用输入视点或者图像的数目来处理识别问题的这样的方法在处理单目视觉的问题上还能够行的通,但是在处理立体视觉的问题上,容易受到纹理/关照/反射率等因素的影响。
9.请尝试回答VR与AR的区别与联系? |
•VR (Virtual Reality,虚拟现实):是一种通过计算机模拟真实感的图像,声音和其他感觉,从而复制出一个真实或者假想的场景,并且让人觉得身处这个场景之中,还能够与这个场景发生交互。
•AR (Augmented Reality, 增强现实):是一种直接或间接地观察真实场景,但其内容通过计算机生成的组成部分被增强,计算机生成的部分包括图像,声音,视频或其他类型的信息。
综上所述,AR和VR的最为本质的区别就是AR需要尽可能与现实相结合而VR需要极可能多的隔绝现实。同时两者对于硬件的要求也不一样,AR需要对于场景进行理解,对于CPU的要求高,对于GPU的要求反而低了,而VR需要涉及丰富的图形资源,所以对于GPU的要求高,对于CPU的要求较低。同时AR和VR的联系是两者都是通过计算机信息技术来绘制虚拟图像。
10.请列出与CV关系密切的三个研究领域 |
•图像识别:图像处理领域时计算机视觉研究最多的开端,如何更为高效的研究器图像识别是发展计算机视觉的第一环节。
•图像处理:图像处理领域时计算机视觉研究和应用最多的领域,对于图像进行更好的处理,获取更多有用的信心组合是支撑计算机视觉在其他领域广泛应用的关键。
•机器学习:CV领域广泛使用机器学习技术,尤其是深度学习,来训练和优化图像识别和分析模型。CV领域广泛使用机器学习技术,尤其是深度学习,来训练和优化图像识别和分析模型。
相关文章:
图像处理与计算机视觉--第一章-计算机视觉简介-10问
第一章-计算机视觉简介-10问 1.CV与AI的关系是什么? CV(Computer Vision)是Al的子领域,它致力于使计算机能够理解和解释图像和数据,CV借助AI技术,比如深度学习/机器学习,实现目标识别,分析和处理任务。AI提供了CV所需要的算法…...
LeetCode 80. 删除有序数组中的重复项 II
文章目录 一、题目二、Java 题解 一、题目 给你一个有序数组 nums,请你 原地 删除重复出现的元素,使得出现次数超过两次的元素只出现两次 ,返回删除后数组的新长度。 不要使用额外的数组空间,你必须在 原地 修改输入数组 并在使用…...

【前端面试题】浏览器面试题
文章目录 前言一、浏览器面试问题1.cookie sessionStorage localStorage 区别2.如何写一个会过期的localStorage,说说想法2.如何定时删除localstorage数据2.localStorage 能跨域吗2.memory cache 如何开启2.localstorage的限制2.浏览器输入URL发生了什么2.浏览器如何…...
PHP 生成 PDF文件
参考官网 Example 009 : Image() TCPDF laravel 可以使用 composer 安装 tecnickcom/tcpdf 进行使用 //require_once("../app/Extend/tcpdf/tcpdf.php"); $pdf new TCPDF();// 设置文档信息$pdf->SetCreator(懒人开发网);$pdf->SetAuthor(懒人开发网);$…...

讲讲项目里的仪表盘编辑器(一)
需求 要做一个仪表盘系统,要求有: ① 设计功能(包括布局、大小、排列) ② 预览功能 ③ 运行功能 布局选择 做编辑器,肯定要先选择布局。 前端有几种常用布局。 静态布局 也叫文档布局。默认的网页形式…...

解决方案 | 如何构建市政综合管廊安全运行监测系统?
如何构建市政综合管廊安全运行监测系统?WITBEE万宾城市生命线智能监测仪器,5年免维护设计,集成10多项结构与气体健康监测指标,毫秒级快速响应,时刻感知综合管廊运行态势...

JCEF中js与java交互、js与java相互调用
jcef中js与java相互调用,java与js相互调用,chrome与java相互调用,java与chrome相互调用、jcef与java相互调用 前提:https://blog.csdn.net/weixin_44480167/article/details/133170970(java内嵌浏览器CEF-JAVA、jcef、…...
9.20 校招 实习 内推 面经
绿泡*泡: neituijunsir 交流裙 ,内推/实习/校招汇总表格 1、校招丨智行者2024年校园招聘正式启动啦 校招丨智行者2024年校园招聘正式启动啦 2、校招 | 乐动机器人2024校园招聘 校招 | 乐动机器人2024校园招聘 3、校招丨小天才2024届秋季校园招聘 …...

基于JAVA+SpringBoot+Vue+协同过滤算法+爬虫的前后端分离的租房系统
✌全网粉丝20W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取项目下载方式🍅 一、项目背景介绍: 随着城市化进程的加快…...

【Android Framework系列】第16章 存储访问框架 (SAF)
1 概述 Android 4.4(API 级别 19)引入了存储访问框架 (Storage Access Framework)。SAF让用户能够在其所有首选文档存储提供程序中方便地浏览并打开文档、图像以及其他文件。 用户可以通过易用的标准 UI,以统一方式在所有应用和提供程序中浏…...

Antdesign 4中让分页组件居中显示的方法
在Ant Design 4中分页组件默认是最右边显示的,而这个没有设置位置的属性的 解决办法: 在pagination的属性中增加: style: {textAlign: "center"} 在Ant Design 5中可以让pagination使用align: center来实现分页组件居中...

【笔记】ubuntu 20.04 + mongodb 4.4.14定时增量备份脚本
环境 ubuntu 20.04mongodb 4.4.14还没实际使用(20230922)后续到10月底如果有问题会修改 原理 只会在有新增数据时生成新的备份日期目录备份恢复时,如果恢复的数据库未删除,则会覆盖数据 准备 准备一个文件夹,用于…...
c++实现的一个定时器实例
/* * author: hjjdebug * date : 2023年 09月 23日 星期六 11:52:29 CST * description: 用std::thread 实现了一个定时器,深刻理解一下定时器是怎样工作的. * 参考Timer.h, Timer.cpp */ $ cat main.cpp #include "Timer.h" #include <unis…...

Python线程和进程
1、深度解析Python线程和进程 一篇文章带你深度解析Python线程和进程 - 知乎使用Python中的线程模块,能够同时运行程序的不同部分,并简化设计。如果你已经入门Python,并且想用线程来提升程序运行速度的话,希望这篇教程会对你有所帮…...
算法 寻找峰值-(二分查找+反向双指针)
牛客网: BM19 题目: 寻找数组峰值,可能多个返回任一个,每个值满足nums[i] ! nums[i 1] 思路: 双指针 left 0, right n-1, 相向而行,取中间位置mid, nums[mid]与nums[mid1]比较,如果nums[mid] < nums[mid1],说明…...

【数据结构】—交换排序之快速排序究极详解,手把手带你从简单的冒泡排序升级到排序的难点{快速排序}(含C语言实现)
食用指南:本文在有C基础的情况下食用更佳 🔥这就不得不推荐此专栏了:C语言 ♈️今日夜电波:靴の花火—ヨルシカ 0:28━━━━━━️💟──────── 5:03 …...

【c#-Nuget 包“在此源中不可用”】 Nuget package “Not available in this source“
标题c#-Nuget 包“在此源中不可用”…但 VS 仍然知道它吗? (c# - Nuget package “Not available in this source”… but VS still knows about it?) 背景: 今日从公司svn 上拉取很久很久以前的代码,拉取下来200报错,进一步发…...

【数据结构】二叉树之堆的实现
🔥博客主页:小王又困了 📚系列专栏:数据结构 🌟人之为学,不日近则日退 ❤️感谢大家点赞👍收藏⭐评论✍️ 目录 一、二叉树的顺序结构 📒1.1顺序存储 📒1.2堆的性质…...

电工-三极管输入输出特性曲线讲解
三极管特性曲线是反映三极管各电极电压和电流之间相互关系的曲线,是用来描述晶体三极管工作特性曲线,常用的特性曲线有输入特性曲线和输出特性曲线。这里以下图所示的共发射极电路来分析三极管的特性曲线。 输入特性曲线 该曲线表示当e极与c极之间的电…...

深入解析容器与虚拟化:技术、对比与生态
深入解析容器与虚拟化:技术、对比与生态 文章目录 深入解析容器与虚拟化:技术、对比与生态容器和虚拟化的基本概念和原理容器的定义和特点虚拟化的定义和特点 容器使用场景容器和虚拟机的对比虚拟化技术的四个特点容器实现虚拟化的原理常见容器引擎和容器…...

shell脚本--常见案例
1、自动备份文件或目录 2、批量重命名文件 3、查找并删除指定名称的文件: 4、批量删除文件 5、查找并替换文件内容 6、批量创建文件 7、创建文件夹并移动文件 8、在文件夹中查找文件...

MFC内存泄露
1、泄露代码示例 void X::SetApplicationBtn() {CMFCRibbonApplicationButton* pBtn GetApplicationButton();// 获取 Ribbon Bar 指针// 创建自定义按钮CCustomRibbonAppButton* pCustomButton new CCustomRibbonAppButton();pCustomButton->SetImage(IDB_BITMAP_Jdp26)…...

YSYX学习记录(八)
C语言,练习0: 先创建一个文件夹,我用的是物理机: 安装build-essential 练习1: 我注释掉了 #include <stdio.h> 出现下面错误 在你的文本编辑器中打开ex1文件,随机修改或删除一部分,之后…...
相机Camera日志分析之三十一:高通Camx HAL十种流程基础分析关键字汇总(后续持续更新中)
【关注我,后续持续新增专题博文,谢谢!!!】 上一篇我们讲了:有对最普通的场景进行各个日志注释讲解,但相机场景太多,日志差异也巨大。后面将展示各种场景下的日志。 通过notepad++打开场景下的日志,通过下列分类关键字搜索,即可清晰的分析不同场景的相机运行流程差异…...

CMake 从 GitHub 下载第三方库并使用
有时我们希望直接使用 GitHub 上的开源库,而不想手动下载、编译和安装。 可以利用 CMake 提供的 FetchContent 模块来实现自动下载、构建和链接第三方库。 FetchContent 命令官方文档✅ 示例代码 我们将以 fmt 这个流行的格式化库为例,演示如何: 使用 FetchContent 从 GitH…...

vue3+vite项目中使用.env文件环境变量方法
vue3vite项目中使用.env文件环境变量方法 .env文件作用命名规则常用的配置项示例使用方法注意事项在vite.config.js文件中读取环境变量方法 .env文件作用 .env 文件用于定义环境变量,这些变量可以在项目中通过 import.meta.env 进行访问。Vite 会自动加载这些环境变…...

全志A40i android7.1 调试信息打印串口由uart0改为uart3
一,概述 1. 目的 将调试信息打印串口由uart0改为uart3。 2. 版本信息 Uboot版本:2014.07; Kernel版本:Linux-3.10; 二,Uboot 1. sys_config.fex改动 使能uart3(TX:PH00 RX:PH01),并让boo…...

使用 Streamlit 构建支持主流大模型与 Ollama 的轻量级统一平台
🎯 使用 Streamlit 构建支持主流大模型与 Ollama 的轻量级统一平台 📌 项目背景 随着大语言模型(LLM)的广泛应用,开发者常面临多个挑战: 各大模型(OpenAI、Claude、Gemini、Ollama)接口风格不统一;缺乏一个统一平台进行模型调用与测试;本地模型 Ollama 的集成与前…...
docker 部署发现spring.profiles.active 问题
报错: org.springframework.boot.context.config.InvalidConfigDataPropertyException: Property spring.profiles.active imported from location class path resource [application-test.yml] is invalid in a profile specific resource [origin: class path re…...

基于Java+VUE+MariaDB实现(Web)仿小米商城
仿小米商城 环境安装 nodejs maven JDK11 运行 mvn clean install -DskipTestscd adminmvn spring-boot:runcd ../webmvn spring-boot:runcd ../xiaomi-store-admin-vuenpm installnpm run servecd ../xiaomi-store-vuenpm installnpm run serve 注意:运行前…...