sheng的学习笔记-【中】【吴恩达课后测验】Course 3 - 结构化机器学习项目 - 第二周测验
课程3_第2周_测验题
目录:目录
要解决的问题
① 为了帮助你练习机器学习的策略,本周我们将介绍另一个场景,并询问你将如何行动。
② 我们认为这个在机器学习项目中工作的“模拟器”将给出一个任务,即领导一个机器学习项目可能是什么样的!
③ 您受雇于一家初创公司,制造自动驾驶汽车。
④ 您负责检测图像中的道路标志(停车标志、人行横道标志、施工先行标志)和交通信号(红绿灯)。
⑤ 目标是识别每张图像中的这些对象。例如,上面的图像包含人行横道标志和红色交通灯。
第一题
① 您的100,000张带标签的图片是使用您汽车的前置摄像头拍摄的,这也是你最关心的数据分布,您认为您可以从互联网上获得更大的数据集,即使互联网数据的分布不相同,这也可能对训练有所帮助。你刚刚开始着手这个项目,你做的第一件事是什么?假设下面的每个步骤将花费大约相等的时间(大约几天)。
A. 【 】花几天时间去获取互联网的数据,这样你就能更好地了解哪些数据是可用的。
B. 【 】花几天的时间检查这些任务的人类表现,以便能够得到贝叶斯误差的准确估计。
C. 【 】花几天的时间使用汽车前置摄像头采集更多数据,以更好地了解每单位时间可收集多少数据。
D. 【 】花几天时间训练一个基本模型,看看它会犯什么错误。
答案:
D.【 √ 】花几天时间训练一个基本模型,看看它会犯什么错误。
第二题
① 您的目标是检测道路标志(停车标志、行人过路标志、前方施工标志)和交通信号(红灯和绿灯)的图片,目标是识别这些图片中的哪一个标志出现在每个图片中。 您计划在隐藏层中使用带有ReLU单位的深层神经网络。
② 对于输出层,使用Softmax激活将是输出层的一个比较好的选择,因为这是一个多任务学习问题,对吗?
A. 【 】对
B. 【 】不对
答案:
B.【 √ 】不对
第三题
① 你正在做误差分析并计算错误率,在这些数据集中,你认为你应该手动仔细地检查哪些图片(每张图片都做检查)?
A. 【 】随机选择10,000图片
B. 【 】随机选择500图片
C. 【 】500张算法分类错误的图片
D. 【 】10,000张算法分类错误的图片
答案:
C.【 √ 】500张算法分类错误的图片
第四题
① 在处理了数据几周后,你的团队得到以下数据:
- 100,000 张使用汽车前摄像头拍摄的标记了的图片。
- 900,000 张从互联网下载的标记了道路的图片。
② 每张图片的标签都精确地表示任何的特定路标和交通信号的组合。
③ 例如 y ( i ) y^{(i)} y(i)表示图片包含了停车标志和红色交通信号灯。
y ( i ) = [ 1 0 0 1 0 ] y^{(i)}=\begin{bmatrix} 1\\ 0\\ 0\\ 1\\ 0 \end{bmatrix} y(i)= 10010
④ 因为这是一个多任务学习问题,你需要让所有 y ( i ) y^{(i)} y(i)向量被完全标记。 如果一个样本等于
[ 1 ? 0 1 ? ] \begin{bmatrix} 1\\ ?\\ 0\\ 1\\ ? \end{bmatrix} 1?01?
⑤ 那么学习算法将无法使用该样本,是正确的吗?
A. 【 】对
B. 【 】不对
答案:
B.【 √ 】不对
第五题
5.你所关心的数据的分布包含了你汽车的前置摄像头的图片,这与你在网上找到并下载的图片不同。如何将数据集分割为训练/验证/测试集?
A. 【 】将10万张前摄像头的图片与在网上找到的90万张图片随机混合,使得所有数据都随机分布。 将有100万张图片的数据集分割为:有60万张图片的训练集、有20万张图片的验证集和有20万张图片的测试集。
B. 【 】将10万张前摄像头的图片与在网上找到的90万张图片随机混合,使得所有数据都随机分布。将有100万张图片的数据集分割为:有98万张图片的训练集、有1万张图片的验证集和有1万张图片的测试集。
C. 【 】选择从互联网上的90万张图片和汽车前置摄像头的8万张图片作为训练集,剩余的2万张图片在验证集和测试集中平均分配。
D. 【 】选择从互联网上的90万张图片和汽车前置摄像头的2万张图片作为训练集,剩余的8万张图片在验证集和测试集中平均分配。
答案:
C.【 √ 】选择从互联网上的90万张图片和汽车前置摄像头的8万张图片作为训练集,剩余的2万张图片在验证集和测试集中平均分配。
第六题
6.假设您最终选择了以下拆分数据集的方式:
① 您还知道道路标志和交通信号分类的人为错误率大约为0.5%。以下哪项是对的?(选出所有正确项)
A. 【 】由于开发集(验证集)和测试集的错误率非常接近,所以你过拟合了开发集(验证集)。
B. 【 】你有很大的数据不匹配问题,因为你的模型在训练-开发集(训练-验证集)上比在开发集(验证集)上做得好得多。
C. 【 】你有很大的可避免偏差问题,因为你的训练集上的错误率比人为错误率高很多。
D. 【 】你有很大的方差问题,因为你的训练集上的错误率比人为错误率要高得多。
E. 【 】你有很大的方差问题,因为你的模型不能很好地适应它从来没有见过,但是来自训练集同一分布的数据
答案:
B.【 √ 】你有很大的数据不匹配问题,因为你的模型在训练-开发集(训练-验证集)上比在开发集(验证集)上做得好得多。
C.【 √ 】你有很大的可避免偏差问题,因为你的训练集上的错误率比人为错误率高很多。
第七题
① 根据上一个问题的表格,一位朋友认为训练数据分布比验证/测试分布要容易得多。你怎么看?
A. 【 】你的朋友是对的。(即训练数据分布的贝叶斯误差可能低于验证/测试分布)。
B. 【 】你的朋友错了。(即训练数据分布的贝叶斯误差可能比验证/测试分布更高)。
C. 【 】没有足够的信息来判断你的朋友是对还是错。
D. 【 】无论你的朋友是对还是错,这些信息都对你没有用。
答案:
C.【 √ 】没有足够的信息来判断你的朋友是对还是错。
第八题
8.您决定将重点放在验证集上, 并手动检查是什么原因导致的错误。下面是一个表, 总结了您的发现:
- 验证集总误差 14.3%
- 由于数据标记不正确而导致的错误 4.1%
- 由于雾天的图片引起的错误 8.0%
- 由于雨滴落在汽车前摄像头上造成的错误 2.2%
- 其他原因引起的错误 1.0%
① 在这个表格中,4.1%、8.0%这些比例是占总验证集的比例(不仅仅是您的算法错误标记的样本),即大约8.0 / 14.3 = 56%的错误是由于雾天的图片造成的。
② 从这个分析的结果意味着团队最先做的应该是把更多雾天的图片纳入训练集,以便解决该类别中的8%的错误,对吗?
A. 【 】错误,因为这取决于添加这些数据的容易程度以及您要考虑团队认为它会有多大帮助。
B. 【 】是的,因为它是错误率最大的类别。正如视频中所讨论的,我们应该对错误率进行按大小排序,以避免浪费团队的时间。
C. 【 】是的,因为它比其他的错误类别错误率加在一起都大(8.0 > 4.1+2.2+1.0)。
D. 【 】错误,因为数据增强(通过清晰的图像+雾的效果合成雾天的图像)更有效。
答案:
A.【 √ 】错误,因为这取决于添加这些数据的容易程度以及您要考虑团队认为它会有多大帮助。
第九题
9.你可以买一个专门设计的雨刮,帮助擦掉正面相机上的一些雨滴。 根据上一个问题的表格,您同意以下哪些陈述?
A. 【 】对于挡风玻璃雨刷可以改善模型的性能而言,2.2%是改善的最大值。
B. 【 】对于挡风玻璃雨刷可以改善模型的性能而言,2.2%是改善最小值。
C. 【 】对于挡风玻璃雨刷可以改善模型的性能而言,改善的性能就是2.2%。
D. 【 】在最坏的情况下,2.2%将是一个合理的估计,因为挡风玻璃刮水器会损坏模型的性能。
答案:
A.【 √ 】对于挡风玻璃雨刷可以改善模型的性能而言,2.2%是改善的最大值。
第十题
10.您决定使用数据增强来解决雾天的图像,您可以在互联网上找到1,000张雾的照片,然后拿清晰的图片和雾来合成雾天图片,如下所示:
① 你同意下列哪种说法?(选出所有正确项)
A. 【 】只要你把它与一个更大(远大于1000)的清晰/不模糊的图像结合在一起,那么对雾的1000幅图片就没有太大的过拟合的风险。
B. 【 】将合成的看起来像真正的雾天图片添加到从你的汽车前摄像头拍摄到的图片的数据集对与改进模型不会有任何帮助,因为它会引入可避免的偏差。
C. 【 】只要合成的雾对人眼来说是真实的,你就可以确信合成的数据和真实的雾天图像差不多,因为人类的视觉对于你正在解决的问题是非常准确的。
答案:
C.【 √ 】只要合成的雾对人眼来说是真实的,你就可以确信合成的数据和真实的雾天图像差不多,因为人类的视觉对于你正在解决的问题是非常准确的。
第十一题
10.在进一步处理问题之后,您已决定更正验证集上错误标记的数据。 您同意以下哪些陈述? (选出所有正确项)
A. 【 】您不应更正训练集中的错误标记的数据, 因为这不值得
B. 【 】您应该更正训练集中的错误标记数据, 以免您训练集与验证集差距更大
C. 【 】您不应该更正测试集中错误标记的数据,以便验证和测试集来自同一分布
D. 【 】您还应该更正测试集中错误标记的数据,以便验证和测试集来自同一分布
答案:
A.【 √ 】您不应更正训练集中的错误标记的数据, 因为这不值得
D.【 √ 】您还应该更正测试集中错误标记的数据,以便验证和测试集来自同一分布
第十二题
12.到目前为止,您的算法仅能识别红色和绿色交通灯,该公司的一位同事开始着手识别黄色交通灯(一些国家称之为橙色光而不是黄色光,我们将使用美国的黄色标准),含有黄色灯的图像非常罕见,而且她没有足够的数据来建立一个好的模型,她希望你能用迁移学习帮助她。
① 你告诉你的同事怎么做?
A. 【 】她应该尝试使用在你的数据集上预先训练过的权重,并用黄光数据集进行进一步的微调。
B. 【 】如果她有10,000个黄光图像,从您的数据集中随机抽取10,000张图像,并将您和她的数据放在一起,这可以防止您的数据集“淹没”她的黄灯数据集。
C. 【 】你没办法帮助她,因为你的数据分布与她的不同,而且缺乏黄灯标签的数据。
D. 【 】建议她尝试多任务学习,而不是使用所有数据进行迁移学习。
答案:
A.【 √ 】她应该尝试使用在你的数据集上预先训练过的权重,并用黄光数据集进行进一步的微调。
第十三题
13.另一位同事想要使用放置在车外的麦克风来更好地听清你周围是否有其他车辆。 例如,如果你身后有警车,你就可以听到警笛声。 但是,他们没有太多的训练这个音频系统,你能帮忙吗?
A. 【 】从视觉数据集迁移学习可以帮助您的同事加快步伐,多任务学习似乎不太有希望。
B. 【 】从您的视觉数据集中进行多任务学习可以帮助您的同事加快步伐,迁移学习似乎不太有希望。
C. 【 】迁移学习或多任务学习可以帮助我们的同事加快步伐。
D. 【 】迁移学习和多任务学习都不是很有希望。
答案:
D.【 √ 】迁移学习和多任务学习都不是很有希望。
第十四题
14.要识别红色和绿色的灯光。
① 你一直在使用这种方法:将图像 x x x输入到神经网络,并直接学习映射以预测是否存在红光(和/或)绿光。
② 一个队友提出了另一种两步的方法:先要检测图像中的交通灯(如果有),然后确定交通信号灯中照明灯的颜色。
③ 在这两者之间,方法B更多的是端到端的方法,因为它在输入端和输出端有不同的步骤,这种说法正确吗?
A. 【 】对
B. 【 】不对
答案:
B.【 √ 】不对
第十五题
15.上一题中,A方法似乎比B方法更有效,如果你有一个__
A. 【 】大训练集
B. 【 】多任务学习的问题
C. 【 】偏差比较大的问题
D. 【 】高贝叶斯误差的问题
答案:
A.【 √ 】大训练集
相关文章:

sheng的学习笔记-【中】【吴恩达课后测验】Course 3 - 结构化机器学习项目 - 第二周测验
课程3_第2周_测验题 目录:目录 要解决的问题 ① 为了帮助你练习机器学习的策略,本周我们将介绍另一个场景,并询问你将如何行动。 ② 我们认为这个在机器学习项目中工作的“模拟器”将给出一个任务,即领导一个机器学习项目可能…...

基于Pytorch的驾驶员分心行为实时检测
本文使用深度学习和Pytorch(PyTorch 2.0.1\Torchvision 0.15.2)实时检测驾驶员的分心行为,并附录完整代码。 检测分心驾驶是现代汽车中最重要的功能之一。无论是自动驾驶汽车还是其它高端汽车,都配备了驾驶员监控系统,以持续跟踪驾驶员的行为。这对确保驾驶员保持目光在道路…...

【uniapp】小程序开发7:自定义组件、自动注册组件
一、自定义轮播图组件、自动注册 以首页轮播图组件为例。 1、创建组件文件src/components/my-swipper.vue 代码如下: <template><view><view class"uni-margin-wrap"><swiper class"swiper" circular :indicator-dots…...

Modbus转MQTT以太网网关MQT-802主要特点和典型应用
随着社会的快速发展,物联网已经潜移默化地深入工控行业的各个领域,其高效的资源整合和强大的数据采集能力,深受客户的喜爱。上海泗博为实现客户在云端平台接收处理世界万物的信息以及实现远程控制,精心打造一款全新物联网产品&…...

Go学习第五章——函数与包
Go学习第五章——函数与包 1 函数1.1 基本语法1.2 函数多返回值1.3 函数的可见性和包级函数1.4 函数调用机制底层原理1.5 值类型和引用类型1.6 注意事项和细节1.7 逃逸机制(补,可不看) 2 包2.1 快速入门2.2 包的使用细节 3 函数详细讲解3.1 递…...

【Python 常用脚本及命令系列 5 -- 如何使用 BeautifulSoup 解析CSDN网页表格中的数据】
文章目录 Python BeautifulSoup 介绍CSDN 网页表格解析开发问题总结 Python BeautifulSoup 介绍 BeautifulSoup是一个Python库,用于解析HTML和XML文档。它常常用于网络爬虫来提取网页中的信息。 以下是BeautifulSoup的一些主要特性: 解析HTMLÿ…...

OpenFeign实现分析、源码解析
什么是openfeign? 是springcloud全家桶的组件之一,其核心作用是为Rest API提供高效简洁的rpc调用方式。 为什么只定义接口而没有实现类? 源码解读(省略) 总结: 源码分析:如何发送http请求? …...

2023 10月最新Vmd 下载安装教程,WindowsLinux
文章目录 下载Vmdwindows版本安装LINUX版本安装 下载Vmd 谷歌搜索VMD 点击左下角download VMD 可选择对应版本 注:点击后会出现输入用户名和密码,由于我已注册,界面不见了,所以直接描述一下。 输入用户名和密码然后会出现让登记…...

Photoshop(PS)安装教程(图文教程超详细)
目录 一.简介 二.安装步骤 软件:PS版本:2023语言:简体中文大小:3.20G系统要求:Win10(1903)及以上版本,64位操作系统硬件要求:CPU2.0GHz 内存8G(或更高,不支…...

C++模版进阶
一、非类型模版参数 之前学习的模版,参数一般是某种类型,但其实非类型的参数也可以定义在模版里面,但也有一定的限制,只可以定义整形家族的参数,而且具有常量性 注意: 1. 浮点数、类对象以及字符串是不允…...

CloudCompare
CloudCompare 源码编译Windows 功能格式转换 源码编译 Windows 源码编译出来的默认基本不带几个插件,包括保存为 .las 的功能 可以直接从 https://www.danielgm.net/cc/ 下载编译好的版本,插件比较多。也有免安装版本 cmake -B build -S . -G "Vi…...

【算法小课堂】深入理解前缀和算法
前缀和是指某序列的前n项和,可以把它理解为数学上的数列的前n项和,而差分可以看成前缀和的逆运算。合理的使用前缀和与差分,可以将某些复杂的问题简单化。 我们通过一个例子来理解前缀和算法的优势: 一维前缀和: ww…...

元对象系统功能
元对象系统功能 建立工程 布局页面 布局页面 修改原件名称 建立元对象 函数作为接口 增加一些固定的属性 #------------------------------------------------- # # Project created by QtCreator 2023-10-24T21:54:44 # #----------------------------…...

【2024秋招】小米中间件后端开发一面2023-9-13-base武汉
1 自我介绍 2 快手实习 2.1 讲讲你写的curd启动器,做了哪些工作呢 答: 2.2 网上也有一些开源的curd代码生成器,你为什么需要自研呢(重要) 答: (1)这个必须得自研,因…...

SpringMVC Day 01:入门案例
前言 在我们的日常工作和学习中,Web 开发是一个无法回避的重要环节。而在 Java Web 开发领域,SpringMVC 无疑是一个重量级选手。它以其灵活性、强大功能和清晰的 MVC 结构,赢得了大量开发者的青睐。但是,对于初学者来说ÿ…...

docker、docker-compose安装教程,很详细
docker、docker-compose安装教程,很详细 一、卸载旧版1、查看有没有安装过旧版2、停止docker3、删除安装过docker的相关包4、删除docker相关的镜像和容器 二、docker安装1、设置阿里云镜像2、查看所有docker3、安装最新版本4、安装指定版本 三、使用前准备1、启动do…...

源代码转换:Tangible Software Solutions 23.10 Crack
Tangible Software Solutions The Most Accurate and Reliable Source Code Converters Convert between C#, Java, C, Python, & VB, while saving countless hours of painstaking work and valuable time.源代码转换 Key Benefits Saves valuable time Accurate and com…...

SAD notes
ESKF 总结 prediction 更新误差先验 F F F通过3.42来算 得到 这里有点绕的一点是: 误差状态的 F F F牵涉到名义状态, 而名义状态又需要在时间上推进更新 其中, F中的名义状态的推进通过公式3.41得到, (名义状态不考虑误差, 这一点从3.41d, 3.41e可以看出, 误差状态只考虑…...

[SQL开发笔记]BETWEEN操作符:选取介于两个值之间的数据范围内的值
一、功能描述: BETWEEN操作符:选取介于两个值之间的数据范围内的值。这些值可以是数值、文本或者日期。 二、BETWEEN操作符语法详解: BETWEEN操作符语法: SELECT column1, column2,…FROM table_nameWHERE column BETWEEN val…...

Babylonjs学习笔记(三)——创建天空盒
书接上回,这里讨论创建天空盒!!! // 天空盒const envTex CubeTexture.CreateFromPrefilteredData(./env/environmentSpecular.env,scene)scene.environmentTexture envTex;scene.createDefaultSkybox(envTex,true)scene.environ…...

【计算机网络】文件传输协议FTP和SFTP
1. 介绍 SFTP(SSH文件传输协议)和FTP(文件传输协议)都是用于在计算机之间传输文件的网络协议。FTP和SFTP都位于OSI模型中的应用层。这两种协议用于文件传输和管理,是应用层协议,因此它们工作在OSI模型的最…...

Python 编程语言的介绍
Python 是一种高级、动态类型的解释型语言。由 Guido van Rossum 于1989年底发明,并在1991年首次发布。Python 的设计哲学强调代码的可读性和简洁的语法,特别是使用缩进来表示代码块,这使得开发者能够用更少的代码表达想法。 基础概念: 语法…...

centos服务器搭建安装Gitlab教程使用教程
1、更新服务器: sudo yum update -y && sudo yum upgrade -y 2、下载Gitlab的RPM包 https://packages.gitlab.com/gitlab/gitlab-cece表示开源el表示centos 选64位el8对应CentOS8 本教程以centos8为例,在服务器中,下载centos8的…...

linux复习笔记02(小滴课堂)
linux下输入输出错误重定向: 输入重定向:< 一个大于号是进行了覆盖。 两个大于号是追加。 输出重定向可以用于以后日志打印。 错误重定向: 错误重定向是不把信息打印到屏幕上而是打印到指定文件中去: 输出重定向其实是用的1…...

AWVS漏洞扫描使用基础与介绍
漏洞扫描的基本概念和原理 漏洞扫描是指通过使用自动化工具和技术来检测和识别计算机系统和网络中可能存在的安全漏洞,用于帮助网络安全运维人员及时获取网络安全态势。漏洞扫描是网络安全中的重要环节,它可以帮助我们发现和修复网络中的安全漏洞&#x…...

Flink 维表关联
1、实时查询维表 实时查询维表是指用户在 Flink 算子中直接访问外部数据库,比如用 MySQL 来进行关联,这种方式是同步方式,数据保证是最新的。但是,当我们的流计算数据过大,会对外 部系统带来巨大的访问压力࿰…...

阳光蟹场小程序的盈利模式与思考深度
随着移动互联网的快速发展,小程序成为了各行各业进行数字化转型的重要工具之一。阳光蟹场小程序作为一款专为蟹场管理和销售提供支持的移动,其盈利模式也备受关注。本文将从阳光蟹场小程序的盈利途径、商业模式和对蟹场管理的影响等方面,深入…...

2-Java进阶知识总结-7-UDP-TCP
文章目录 网络编程概述网络编程三要素--IP地址IP地址--概念(IP:Internet Protocol)IP地址--分类IP地址--特殊的地址:127.0.0.1IP地址获取--DOS命令IP地址获取--InetAddress类 网络编程三要素--端口端口--概念端口号 网络编程三要素…...

C++数据结构X篇_19_排序基本概念及冒泡排序(重点是核心代码,冒泡是稳定的排序)
文章目录 1. 排序基本概念2. 冒泡排序2.1 核心代码2.2 冒泡排序代码2.3 查看冒泡排序的时间消耗2.4 冒泡排序改进版减小时间消耗 1. 排序基本概念 现实生活中排序很重要,例如:淘宝按条件搜索的结果展示等。 概念 排序是计算机内经常进行的一种操作,其目…...

工作:三菱伺服驱动器连接参数及其电机钢性参数配置与调整
工作:三菱伺服驱动器参数及电机钢性参数配置与调整 一、三菱PLC与伺服驱动器连接参数的设置 1. 伺服配置 单个JET伺服从站链接侧占用点数:Rx/Ry占用64点、RWw/RWr占用32点 图中配置了22个JET伺服从站,占用点数:Rx/Ry占用64222048点、RWw/RWr占用322…...