当前位置：首页 > article >正文

深度学习习题3

article 2026/2/8 6:19:30

1.训练神经网络过程中，损失函数在一些时期（Epoch）不再减小, 原因可能是：

1.学习率太低 2.正则参数太大 3.卡在了局部最小值

A1 and 2 B. 2 and 3 C. 1 and 3 D. 都是

2.对于分类任务，我们不是将神经网络中的随机权重初始化，而是将所有权重设为零。下列哪项正确？
A.没有任何问题，神经网络模型将正常训练
B.神经网络模型可以训练，但所有的神经元最终将识别同样的事情
C.神经网络模型不会进行训练，因为没有净梯度变化
D.这些均不会发生

3.开始时有一个停滞期，这是因为神经网络在进入全局最小值之前陷入局部最小值。为了避免这种情况，下面的哪个策略有效？
A.增加参数的数量，因为网络不会卡在局部最小值处
B.在开始时把学习率降低10倍，然后使用梯度下降加速算子(momentum)
C.抖动学习速率，即改变几个时期的学习速率
D.以上均不是

4.假设在训练时，你遇到这个问题。在几次迭代后，错误突然增加。您确定数据一定有问题。您将数据描绘出来，找到了原始数据有点偏离，这可能是导致出现问题的地方。你将如何应对这个挑战？
A.归一化 B. 应用PCA然后归一化 C.对数据进行对数变换 D.以上这些都不符合
注：b应该是先归一化再pca

5.下面哪个描述可以最好的描述early stopping?
A在每一个训练epoch后在测试集上模拟网络，当归一化误差(generalization error)减小时停止训练
B 一种更快的后向传播方式，像是"Quickprop"算法
C 在权重值更新时上加一个动量项(momentum term)，使训练能够更快地收敛
D 训练网络直到误差函数出现一个局部最小值

6.其他条件不变，以下哪种做法不会引起过拟合问题（）
A.增加训练集数量 B. 减少神经网络隐藏节点数
C.删除稀疏的特征 D. SVM算法使用高斯核函数/RBF代替线性核

7.以下属于多层前馈神经网络的是（）
A.线性回归 B.逻辑回归 C.SVM D.都不是

8.机器学习中L1正则化和L2正则化的区别是？
A、使用L1可以得到稀疏的权值 B、使用L1可以得到平滑的权值
C、使用L2可以得到稀疏的权值 D、使用L2可以得到平滑的权值

9.哪种方法可以较好地处理RNN中梯度爆炸的问题（）
A Dropout B 梯度裁剪 C. LSTM（梯度消失） D都不行

10.五层神经网络单个数据测试需要2s，新架构分别在第二层和第四层添加Dropout，则测试时间为
A 大于2s B 小于2s C等于2s D不确定

Dropout只是在训练的时候丢弃神经元，但测试的时候神经元数量还是一样，所以时间不变

11.哪种技术不能解决过拟合（）
A dropout B 样本增强 C 权值衰减 D SGD

12.如果要设计一个有2000个特征，100万数据的机器学习模型，如何有效的处理这样大数据训练（）
A随机抽样，在小样本上训练B在线机器学习算法C.PCA降维，减少特征数 D. SVM分类器

深度学习习题3

相关文章：

深度学习习题3

勒让德多项式

atc abc409E

Mysql批处理写入数据库

基于安卓的文件管理器程序开发研究源码数据库文档

EMC VNXe 存储系统日志收集方法

嵌入式链表操作原理详解

从“人找政策”到“政策找人”：智能退税ERP数字化重构外贸生态

一.设计模式的基本概念

以人类演示视频为提示，学习可泛化的机器人策略

split方法

SOC-ESP32S3部分：36-适配自己的板卡

LLMs 系列科普文（8）

【明日方舟 × 红黑树】干员调度如何不掉线？算法工程的平衡魔法全揭秘！

Vue3 + Vite 中使用 Lodash-es 的防抖 debounce 详解

机器学习基础相关问题

验证负载均衡与弹性伸缩

Three.js中AR实现详解并详细介绍基于图像标记模式AR生成的详细步骤

CSS高级技巧及新增属性

GeoBoundaries下载行政区划边界数据（提供中国资源shapefile）

《深入理解 Nacos 集群与 Raft 协议》系列四：日志复制机制：Raft 如何确保提交可靠且幂等

大模型如何选型？嵌入模型如何选型？

float转换为整型过程中关于小数部分的处理

开源大模型网关：One API实现主流AI模型API的统一管理与分发

Java线程工厂：定制线程的利器

智慧充电：新能源汽车智慧充电桩的发展前景受哪些因素影响？

在Pnetlab6上绕过TPM、安全启动和 RAM 检查安装windows 11笔记

【网站建设】不同类型网站如何选择服务器？建站项目实战总结

利用Pandas AI完成Excel大模型的结合实现自然语言问数

iptables实验