100 个 NLP 面试问题
100 个 NLP 面试问题
一、 说明
对于技术磨练中,其中一项很酷的技能培训是提问。不知道答案并没有多大的错;错就错在不谷歌这些疑问。本篇就是在面试之前,您将此文档复制给自己,做一个系统的模拟实战。
二、经典NLP问题(共8题)
TF-IDF 和 ML ;
-
从头开始编写 TF-IDF。
-
什么是TF-IDF中的归一化?
-
为什么在我们这个时代需要了解TF-IDF,如何在复杂的模型中使用它?
-
解释朴素贝叶斯的工作原理。你可以用它来做什么?
-
SVM 如何容易出现过拟合?
-
解释文本预处理的可能方法(词形还原和词干提取)。您知道哪些算法,在什么情况下会使用它们?
-
你知道哪些文本相似度指标?
-
解释余弦相似度和余弦距离的区别。以下哪个值可以是负数?你会如何使用它们?
三、计量指标 (7题)
-
用简单的语言解释精确度和回忆力,如果没有 F1 分数,你会看什么?
-
在什么情况下,你会观察到特异性的变化?
-
你什么时候会看宏观指标,什么时候看微观指标?为什么存在加权指标?
-
什么是困惑?我们可以用什么来考虑它?
-
什么是 BLEU 指标?
-
解释不同类型的ROUGE指标之间的区别?
-
BLUE和ROUGE有什么区别?
四、WORD2VEC(9题)
-
解释Word2Vec是如何学习的?什么是损失函数?什么是最大化?
-
您知道哪些获取嵌入的方法?什么时候会更好?
-
静态嵌入和上下文嵌入有什么区别?
-
你知道的两种主要架构是什么,哪一种学得更快?
-
Glove、ELMO、FastText 和 Word2Vec 有什么区别?
-
什么是负抽样,为什么需要负抽样?您还知道 Word2Vec 的哪些其他技巧,以及如何应用它们?
-
什么是密集嵌入和稀疏嵌入?请举例说明。
-
为什么嵌入的维度很重要?
-
在短文本数据上训练Word2Vec时会出现什么问题,如何处理?
五、RNN 和 CNN(7题)
-
一个简单的 1 层 RNN 有多少个训练参数?
-
RNN训练是如何进行的?
-
RNN存在哪些问题?
-
您知道哪些类型的 RNN 网络?解释 GRU 和 LSTM 之间的区别?
-
我们可以在这样的网络中调整哪些参数?(堆垛,层数)
-
什么是RNN的消失梯度?你如何解决这个问题?
-
为什么要在 NLP 中使用卷积神经网络,如何使用它?你怎么能在注意力范式中比较CNN?
六、NLP 和 TRANSFORMERS
注意力和变压器架构 (15题)
32.你如何计算注意力?(补充:它被提议用于什么任务,为什么?
-
注意力的复杂性?将其与 RNN 的复杂性进行比较。
-
比较 RNN 和注意力。在什么情况下你会使用注意力,什么时候 RNN?
-
从头开始写注意力。
-
解释注意中的掩饰。
-
自注意力矩阵的维度是多少?
-
BERT和GPT在注意力计算方面有什么区别?
-
变压器中嵌入层的尺寸是多少?
-
为什么嵌入被称为上下文?它是如何工作的?
-
变压器中使用什么,层规范或批量规范,为什么?
-
为什么变压器有PreNorm和PostNorm?
-
解释软注意力和硬注意力(局部/全局)之间的区别?
-
解释多头注意力。
-
您还知道哪些其他类型的注意力机制?这些修改的目的是什么?
-
随着人头数量的增加,自我注意力如何变得更加复杂?
七、变压器型号类型 (7题)
-
为什么 BERT 在很大程度上落后于 RoBERTa ,你能从 RoBERTa 中学到什么?
-
什么是 T5 和 BART 型号?它们有何不同?
-
什么是与任务无关的模型?请举例说明。
-
通过比较 BERT、GPT 和 T5 来解释 transformer 模型。
-
BERT、GPT等在模型知识方面存在哪些主要问题?如何解决这个问题?
-
类似解码器的 GPT 在训练和推理过程中是如何工作的?有何不同?
-
解释变压器模型中头部和层之间的区别。
八、位置编码 (6题)
-
为什么在变压器模型的嵌入中丢失了有关位置的信息?
-
解释位置嵌入的方法及其优缺点。
-
为什么我们不能简单地添加一个带有标记索引的嵌入?
-
我们为什么不训练位置嵌入?
-
什么是相对和绝对位置编码?
-
详细解释旋转位置嵌入的工作原理。
九、预训练 (4题)
-
因果语言建模是如何工作的?
-
我们什么时候使用预训练模型?
-
如何从头开始训练变压器?解释一下你的管道,在什么情况下你会这样做?
-
除了 BERT 和 GPT 之外,您还知道哪些模型可用于各种预训练任务?
十、分词器 (9题)
-
您知道哪些类型的分词器?比较它们。
-
你能扩展一个分词器吗?如果是,在什么情况下你会这样做?你什么时候会重新训练一个分词器?添加新代币时需要做什么?
-
普通代币与特殊代币有何不同?
-
为什么变压器中不使用词形还原?为什么我们需要代币?
-
如何训练分词器?用 WordPiece 和 BPE 的例子来解释。
-
CLS向量占据什么位置?为什么?
-
BERT 中使用了什么分词器,GPT 中使用了哪个分词器?
-
解释现代分词器如何处理词汇表外的单词?
-
分词器词汇大小有什么影响?在新培训的情况下,您将如何选择它?
十一、训练 (8题)
-
什么是阶级失衡?如何识别它?说出解决此问题的所有方法。
-
在推理过程中可以使用 dropout 吗,为什么?
-
Adam 优化器和 AdamW 有什么区别?
-
消耗的资源如何随着梯度积累而变化?
-
如何优化训练期间的资源消耗?
-
你知道哪些分布式训练方法?
-
什么是文本增强?说出您知道的所有方法。
-
为什么填充物的使用频率较低?取而代之的是做什么?
-
解释热身是如何工作的。
-
解释渐变裁剪的概念?
-
教师强迫如何工作,请举例说明?
-
为什么以及如何使用跳过连接?
-
什么是适配器?我们可以在哪里以及如何使用它们?
-
解释度量学习的概念。你知道什么方法?
十二、推理 (4题)
-
softmax中的温度控制什么?你会设置什么值?
-
解释生成中的采样类型?top-k、top-p、细胞核采样?
-
波束搜索的复杂性是什么,它是如何工作的?
-
什么是句子嵌入?您可以通过哪些方式获得它?
十三、LLM (13题)
-
LoRA是如何工作的?您将如何选择参数?想象一下,我们想要微调一个大型语言模型,将 LORA 与小 R 一起应用,但该模型仍然不适合内存。还能做些什么?
-
prefix tuning , p-tuning 和 prompt tuning 和有什么不一样?
-
解释缩放定律。
-
解释LLM训练的所有阶段。我们可以从哪些阶段弃权,在什么情况下?
-
RAG是如何工作的?它与小镜头 KNN 有何不同?
-
你知道什么量化方法?我们可以微调量化模型吗?
-
如何防止 LLM 中的灾难性遗忘?
-
讲解KV缓存、分组查询注意力和多查询注意力的工作原理。
-
解释 MixTral 背后的技术,它的优缺点是什么?
-
你好吗?事情进展如何?
如果你觉得这些信息有帮助,并想以其他方式感谢我。
相关文章:
100 个 NLP 面试问题
100 个 NLP 面试问题 一、 说明 对于技术磨练中,其中一项很酷的技能培训是提问。不知道答案并没有多大的错;错就错在不谷歌这些疑问。本篇就是在面试之前,您将此文档复制给自己,做一个系统的模拟实战。 二、经典NLP问题(共8题&a…...

C# OMRON PLC FINS TCP协议简单测试
FINS(factory interface network service)通信协议是欧姆龙公司开发的用于工业自动化控制网络的指令/响应系统。运用 FINS指令可实现各种网络间的无缝通信,包括用于信息网络的 Etherne(以太网),用于控制网络的Controller Link和SYSMAC LINK。…...

MQTT在linux下服务端和客户端的应用
MQTT(Message Queuing Telemetry Transport)是一种轻量级、开放标准的消息传输协议,设计用于受限设备和低带宽、不稳定网络的通信。 MQTT的一些关键特点和概念: 发布/订阅模型: MQTT采用发布/订阅(Publ…...
韦达定理用处多
文章目录 前言一、一元二次方程中根和系数之间的关系二、韦达定理的数学推导和作用1. 韦达定理的数学推导2. 韦达定理的作用 三、韦达定理的应用举例1. 解题示例12. 解题示例23. 解题示例34. 解题示例45. 解题示例56. 解题示例67. 解题示例7 总结 前言 韦达定理说明了一元n次方…...
Kotlin-类
构造函数 Java final File file new File("file.txt");Kotlin val file File("file.txt")类 Java public final class User { }Kotlin class User公开类 Java public class User { }Kotlin open class User属性类 Java final class User {pri…...
redis基本数据结构介绍
Redis(Remote Dictionary Server)是一个开源的高性能键值对数据库,它支持多种数据结构,包括字符串、哈希、列表、集合、有序集合等。这些数据结构为开发者提供了丰富的数据操作方式,使得Redis在缓存、消息队列、排行榜…...
云数据库RDS云监控
1. 什么是云数据库RDS?它有哪些特点? 云数据库RDS是一种在线关系型数据库服务,它具备的特点包括: 安全可靠:提供了容灾、备份、恢复等高可用性功能,确保数据的安全与可靠。弹性伸缩:用户可以根…...

全自动网页生成系统重构版源码
全自动网页生成系统重构版源码分享,所有模板经过精心审核与修改,完美兼容小屏手机大屏手机,以及各种平板端、电脑端和360浏览器、谷歌浏览器、火狐浏览器等等各大浏览器显示。 为用户使用方便考虑,全自动网页制作系统无需繁琐的注…...

Leetcode—33. 搜索旋转排序数组【中等】
2024每日刷题(110) Leetcode—33. 搜索旋转排序数组 实现代码 class Solution { public:int search(vector<int>& nums, int target) {int n nums.size();int l 0, r n - 1;while(l < r) {int m l (r - l) / 2;if(nums[m] target) …...

vulhub中Apache APISIX Dashboard API权限绕过导致RCE(CVE-2021-45232)
Apache APISIX是一个动态、实时、高性能API网关,而Apache APISIX Dashboard是一个配套的前端面板。 Apache APISIX Dashboard 2.10.1版本前存在两个API/apisix/admin/migrate/export和/apisix/admin/migrate/import,他们没有经过droplet框架的权限验证&…...
JavaSE习题 使用函数求最大值、求最大值方法的重载和求和方法的重载
目录 1 使用函数求最大值2 求最大值方法的重载3 求和方法的重载 1 使用函数求最大值 使用函数求最大值:创建方法求两个数的最大值max2,随后再写一个求3个数的最大值的函数max3。 要求: 在max3这个函数中,调用max2函数ÿ…...

英码科技携手昇腾共建算力底座:推出EA500I超强AI处理能力边缘计算盒子!
在数字经济浪潮中,算力已成为不可或缺的驱动力,为各行各业的数字化转型提供了强大的推动力。面对多元化和供需不平衡的挑战,需要实现从理论架构到软硬件实现的质的飞跃,以满足持续增长的算力需求,华为昇腾在这一方面展…...

蓝桥杯每日一题-----数位dp练习
题目 链接 参考代码 写了两个,一个是很久以前写的,一个是最近刚写的,很久以前写的时候还不会数位dp所以写了比较详细的注释,这两个代码主要是设置了不同的记忆数组,通过这两个代码可以理解记忆数组设置的灵活性。 im…...

JS(react)图片压缩+图片上传
上传dome var fileNodeTakeStock: any createRef();<inputref{fileNodeTakeStock}onChange{showPictureTakeStock}style{{ display: "none" }}id"fileInpBtn"type"file"accept"image/*" //限制上传格式multiple{false}capture&qu…...
WPF DispatcherTimer用法
System.Windows.Threading.DispatcherTimer 类主要用于WPF应用程序中进行周期性任务调度,并且保证这些任务在UI线程上执行。 这对于需要更新界面或与UI元素交互的定时操作非常有用,因为WPF的所有UI操作都必须在主线程(即Dispatcher线程&…...

【网络安全实验】snort实现高级IDS
注:本实验分别使用kali和CentOS6.8进行测试,可惜的是使用kali进行实验过程中遇到了困难,未能完成完整实验,而使用CentOS6.8成功完成了完整实验。 实验中用到的软件: https://download.csdn.net/download/weixin_5255…...

19.HarmonyOS App(JAVA)依赖布局DependentLayout使用方法
layout/ability_main.xml 显示位置不对:检查布局文件ohos:lef_of "id:tuzi",比如显示在兔子的左侧,这里就会显示不对。 需要id前没有$符号。改为: ohos:lef_of "$id:tuzi" <?xml version"1.0" encodi…...

玩家笔记:幻兽帕鲁搭建服务器开服教程
玩转幻兽帕鲁服务器,阿里云推出新手0基础一键部署幻兽帕鲁服务器教程,傻瓜式一键部署,3分钟即可成功创建一台Palworld专属服务器,成本仅需26元,阿里云服务器网aliyunfuwuqi.com分享2024年新版基于阿里云搭建幻兽帕鲁服…...
Liunx基本指令
目录 1、ls 列出当前路径下的文件 2、pwd 打印当前工作目录 (print working directory) 3、cd 进入路径 4、mkdir 创建文件夹(make dirctory) 5、touch 创建文件 6、cp 复制(copy) 7、mv 移动/剪切、重命名 8、rm 删除 (remover) 9、vim 文本编辑器 10、cat 打开文件…...

面试题:Redis 分布式锁存在什么问题 ?如何解决 ?
文章目录 如何实现分布式锁2. Redis 分布式锁存在什么问题2.1 解决死锁问题2.2 解决锁误删问题 如何实现分布式锁 Redis 天生就可以作为一个分布式系统来使用,所以它实现的锁都是分布式锁。 Redis 可以通过 setnx(set if not exists)命令实…...

蓝牙 BLE 扫描面试题大全(2):进阶面试题与实战演练
前文覆盖了 BLE 扫描的基础概念与经典问题蓝牙 BLE 扫描面试题大全(1):从基础到实战的深度解析-CSDN博客,但实际面试中,企业更关注候选人对复杂场景的应对能力(如多设备并发扫描、低功耗与高发现率的平衡)和前沿技术的…...
C#中的CLR属性、依赖属性与附加属性
CLR属性的主要特征 封装性: 隐藏字段的实现细节 提供对字段的受控访问 访问控制: 可单独设置get/set访问器的可见性 可创建只读或只写属性 计算属性: 可以在getter中执行计算逻辑 不需要直接对应一个字段 验证逻辑: 可以…...

在 Spring Boot 中使用 JSP
jsp? 好多年没用了。重新整一下 还费了点时间,记录一下。 项目结构: pom: <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://ww…...
LCTF液晶可调谐滤波器在多光谱相机捕捉无人机目标检测中的作用
中达瑞和自2005年成立以来,一直在光谱成像领域深度钻研和发展,始终致力于研发高性能、高可靠性的光谱成像相机,为科研院校提供更优的产品和服务。在《低空背景下无人机目标的光谱特征研究及目标检测应用》这篇论文中提到中达瑞和 LCTF 作为多…...
云原生周刊:k0s 成为 CNCF 沙箱项目
开源项目推荐 HAMi HAMi(原名 k8s‑vGPU‑scheduler)是一款 CNCF Sandbox 级别的开源 K8s 中间件,通过虚拟化 GPU/NPU 等异构设备并支持内存、计算核心时间片隔离及共享调度,为容器提供统一接口,实现细粒度资源配额…...

GraphRAG优化新思路-开源的ROGRAG框架
目前的如微软开源的GraphRAG的工作流程都较为复杂,难以孤立地评估各个组件的贡献,传统的检索方法在处理复杂推理任务时可能不够有效,特别是在需要理解实体间关系或多跳知识的情况下。先说结论,看完后感觉这个框架性能上不会比Grap…...

Win系统权限提升篇UAC绕过DLL劫持未引号路径可控服务全检项目
应用场景: 1、常规某个机器被钓鱼后门攻击后,我们需要做更高权限操作或权限维持等。 2、内网域中某个机器被钓鱼后门攻击后,我们需要对后续内网域做安全测试。 #Win10&11-BypassUAC自动提权-MSF&UACME 为了远程执行目标的exe或者b…...

OPENCV图形计算面积、弧长API讲解(1)
一.OPENCV图形面积、弧长计算的API介绍 之前我们已经把图形轮廓的检测、画框等功能讲解了一遍。那今天我们主要结合轮廓检测的API去计算图形的面积,这些面积可以是矩形、圆形等等。图形面积计算和弧长计算常用于车辆识别、桥梁识别等重要功能,常用的API…...

基于Python的气象数据分析及可视化研究
目录 一.🦁前言二.🦁开源代码与组件使用情况说明三.🦁核心功能1. ✅算法设计2. ✅PyEcharts库3. ✅Flask框架4. ✅爬虫5. ✅部署项目 四.🦁演示效果1. 管理员模块1.1 用户管理 2. 用户模块2.1 登录系统2.2 查看实时数据2.3 查看天…...
宠物车载安全座椅市场报告:解读行业趋势与投资前景
一、什么是宠物车载安全座椅? 宠物车载安全座椅是一种专为宠物设计的车内固定装置,旨在保障宠物在乘车过程中的安全性与舒适性。它通常由高强度材料制成,具备良好的缓冲性能,并可通过安全带或ISOFIX接口固定于车内。 近年来&…...