100道大模型面试八股文
算法暑期实习机会快结束了,校招大考即将来袭。
当前就业环境已不再是那个双向奔赴时代了。求职者在变多,岗位在变少,要求还更高了。
最近,我们陆续整理了很多大厂的面试题,帮助球友解惑答疑和职业规划,分享了面试中的那些弯弯绕绕。
分享100道大模型面试八股文,喜欢记得点赞、收藏、关注:
-
你了解ReAct吗,它有什么优点?
-
解释一下langchain Agent的概念
-
langchain 有哪些替代方案?
-
langchain token计数有什么问题?如何解决?
-
LLM预训练阶段有哪几个关键步骤?
-
RLHF模型为什么会表现比SFT更好?
-
参数高效的微调(PEFT)有哪些方法?
-
LORA微调相比于微调适配器或前缀微调有什么优势?
-
你了解过什么是稀疏微调吗?
-
训练后量化(PTQ)和量化感知训练(QAT)有什么区别?
-
LLMs中,量化权重和量化激活的区别是什么?
-
AWQ量化的步骤是什么?
-
介绍一下GPipe推理框架
-
矩阵乘法如何做数量并行?
-
请简述TPPO算法流程,它跟TRPO的区别是什么?
-
什么是检索增强生成(RAG)?
-
目前主流的中文向量模型有哪些?
-
为什么LLM的知识更新很困难?
-
RAG和微调的区别是什么?
-
大模型一般评测方法及其准是什么?
-
什么是Kv cache技术,它具体是如何实现的?
-
DeepSpeed推理对算子融合做了哪些优化?
-
简述一下FlashAttention的原理
-
MHA、GQA、MQA三种注意力机制的区别是什么?
-
请介绍一下微软的ZeRO优化器
-
Paged Attention的原理是什么,解决了LLM中的什么问题?
-
什么是投机采样技术,请举例说明?
-
简述GPT和BERT的区别
-
讲一下GPT系列模型的是如何演进的?
-
为什么现在的大模型大多是decoder-only的架构?
-
讲一下生成式语言模型的工作机理
-
哪些因素会导致LLM中的偏见?
-
LLM中的因果语言建模与掩码语言建模有什么区别?
-
如何减轻LLM中的“幻觉”现象?
-
解释ChatGPT的“零样本”和“少样本”学习的概念
-
你了解大型语言模型中的哪些分词技术?
-
如何评估大语言模型(LLMs)的性能?
-
如何缓解LLMs复读机问题?
-
请简述下Transformer基本原理
-
为什么Transformer的架构需要多头注意力机制?
-
为什么transformers需要位置编码?
-
transformer中,同一个词可以有不同的注意力权重吗?
-
Wordpiece与BPE之间的区别是什么?
-
有哪些常见的优化LLMs输出的技术?
-
GPT-3拥有的1750亿参数,是怎么算出来的?
-
温度系数和top-p、top-k参数有什么区别?
-
为什么transformer块使用LayerNorm而不是BatchNorm?
-
介绍一下post layer norm和pre layer norm的区别
-
什么是思维链(CoT)提示?
-
你觉得什么样的任务或领域适合用思维链提示?
-
目前主流的开源模型体系有哪些?
-
prefix LM和causal LM区别是什么?
-
涌现能力是啥原因?
-
大模型LLM的架构介绍?
-
什么是LLMs复读机问题?
-
为什么会出现LLMs复读机问题?
-
如何缓解LLMs复读机问题?
-
llama输入句子长度理论上可以无限长吗?
-
什么情况下用Bert模型,什么情况下用LLama、ChatGLM类大模型,咋选?
-
各个专长领域是否需要各自的大模型来服务?
-
如何让大模型处理更长的文本?
-
为什么大模型推理时显存涨的那么多还一直占着?
-
大模型在gpu和cpu上推理速度如何?
-
推理速度上,int8和fp16比起来怎么样?
-
大模型有推理能力吗?
-
大模型生成时的参数怎么设置?
-
有哪些省内存的大语言模型训练/微调/推理方法?
-
如何让大模型输出台规化
-
应用模式变更
-
大模型怎么评测?
-
大模型的honest原则是如何实现的?
-
模型如何判断回答的知识是训练过的已知的知识,怎么训练这种能力?
-
奖励模型需要和基础模型一致吗?
-
RLHF在实践过程中存在哪些不足?
-
如何解决人工产生的偏好数据集成本较高,很难量产问题?
-
如何解决三个阶段的训练(SFT->RM->PPO)过程较长,更新迭代较慢问题?
-
如何解决PPO的训练过程中同时存在4个模型(2训练,2推理),对计算资源的要求较高问题?
-
如何给LLM注入领域知识?
-
如果想要快速检验各种模型,该怎么办?
-
预训练数据Token重复是否影响模型性能?
-
什么是位置编码?
-
什么是绝对位置编码?
-
什么是相对位置编码?
-
旋转位置编码RoPE思路是什么?
-
旋转位置编码RoPE有什么优点?
-
什么是长度外推问题?
-
长度外推问题的解决方法有哪些?
-
ALiBi(Attention with Linear Biases)思路是什么?
-
ALiBi(Attention with Linear Biases)的偏置矩阵是什么?有什么作用?
-
ALiBi(Attention with Linear Biases)有什么优点?
-
Layer Norm的计算公式写一下?
-
RMS Norm的计算公式写一下?
-
RMS Norm相比于Layer Norm有什么特点?
-
Deep Norm思路?
-
写一下Deep Norm代码实现?
-
Deep Norm有什么优点?
-
LN在LLMs中的不同位置有什么区别么?如果有,能介绍一下区别么?
-
LLMs各模型分别用了哪种Layer normalization?
-
介绍一下FFN块计算公式?
-
介绍一下GeLU计算公式?
-
介绍一下Swish计算公式?
-
介绍一下使用GLU线性门控单元的FFN块计算公式?
-
介绍一下使用GeLU的GLU块计算公式?
-
介绍一下使用Swish的GLU块计算公式?
面试精选
-
《大模型面试宝典》(2024版) 正式发布!
-
一文搞懂 Transformer
-
一文搞懂 Attention(注意力)机制
-
一文搞懂 Self-Attention 和 Multi-Head Attention
-
一文搞懂 BERT(基于Transformer的双向编码器)
-
一文搞懂 GPT(Generative Pre-trained Transformer)
-
一文搞懂 Embedding(嵌入)
-
一文搞懂 Encoder-Decoder(编码器-解码器)
-
一文搞懂大模型的 Prompt Engineering(提示工程)
-
一文搞懂 Fine-tuning(大模型微调)
-
一文搞懂 LangChain
-
一文搞懂 LangChain 的 Retrieval 模块
-
一文搞懂 LangChain 的智能体 Agents 模块
-
一文搞懂 LangChain 的链 Chains 模块
相关文章:
100道大模型面试八股文
算法暑期实习机会快结束了,校招大考即将来袭。 当前就业环境已不再是那个双向奔赴时代了。求职者在变多,岗位在变少,要求还更高了。 最近,我们陆续整理了很多大厂的面试题,帮助球友解惑答疑和职业规划,分…...
【ARM Cache 及 MMU 系列文章 6.2 -- ARMv8/v9 Cache 内部数据读取方法详细介绍】
请阅读【ARM Cache 及 MMU/MPU 系列文章专栏导读】 及【嵌入式开发学习必备专栏】 文章目录 Direct access to internal memoryL1 cache encodingsL1 Cache Data 寄存器Cache 数据读取代码实现Direct access to internal memory 在ARMv8架构中,缓存(Cache)是用来加速数据访…...
使用Vue.js将form表单传递到后端
一.form表单 <form submit.prevent"submitForm"></form> form表单像这样写出来,然后把需要用户填写的内容写在form表单内。 二.表单内数据绑定 <div class"input-container"><div style"margin-left: 9px;"&…...
6、架构-服务端缓存
为系统引入缓存之前,第一件事情是确认系统是否真的需要缓 存。从开发角度来说,引入缓存会提 高系统复杂度,因为你要考虑缓存的失效、更新、一致性等问题;从运维角度来说,缓存会掩盖一些缺 陷,让问题在更久的…...
服务器遭遇UDP攻击时的应对与解决方案
UDP攻击作为分布式拒绝服务(DDoS)攻击的一种常见形式,通过发送大量的UDP数据包淹没目标服务器,导致网络拥塞、服务中断。本文旨在提供一套实用的策略与技术手段,帮助您识别、缓解乃至防御UDP攻击,确保服务器稳定运行。我们将探讨监…...
美团发布2024年一季度财报:营收733亿元,同比增长25%
6月6日,美团(股票代码:3690.HK)发布2024年第一季度业绩报告。受益于经济持续回暖和消费复苏,公司各项业务继续取得稳健增长,营收733亿元(人民币,下同),同比增长25%。 财报显示,一季度,美团继续…...
sql注入-布尔盲注
布尔盲注(Boolean Blind SQL Injection)是一种SQL注入攻击技术,用于在无法直接获得查询结果的情况下推断数据库信息;它通过发送不同的SQL查询来观察应用程序的响应,进而判断查询的真假,并逐步推断出有用的信…...
docker-compose部署 kafka 3.7 集群(3台服务器)并启用账号密码认证
文章目录 1. 规划2. 服务部署2.1 kafka-012.2 kafka-022.3 kafka-032.4 启动服务 3. 测试3.1 kafkamap搭建(测试工具)3.2 测试 1. 规划 服务IPkafka-0110.10.xxx.199kafka-0210.10.xxx.198kafka-0310.10.xxx.197kafkamp10.10.xxx.199 2. 服务部署 2.1…...
LeetCode-704. 二分查找【数组 二分查找】
LeetCode-704. 二分查找【数组 二分查找】 题目描述:解题思路一:注意开区间和闭区间背诵版:解题思路三: 题目描述: 给定一个 n 个元素有序的(升序)整型数组 nums 和一个目标值 target …...
Rust 性能分析
都说Rust性能好,但是也得代码写得好,猜猜下面两个代码哪个快 . - 力扣(LeetCode) use std::collections::HashMap; use lazy_static::lazy_static;lazy_static! {static ref DIGIT: HashMap<char, usize> {let mut m HashMap::new();for c in …...
Gradle和Maven都是广泛使用的项目自动化构建工具
Gradle和Maven都是广泛使用的项目自动化构建工具,但它们在多个方面存在差异。以下是关于Gradle和Maven的详细对比: 一、构建脚本语言 Maven:使用XML作为构建脚本语言。XML的语法较为繁琐,不够灵活,对于复杂的构建逻辑…...
Seed-TTS语音编辑有多强?对比实测结果让你惊叹!
GLM-4-9B 开源系列模型 前言 就在最近,ByteDance的研究人员最近推出了一系列名为Seed-TTS的大规模自回归文本转语音(TTS)模型,能够合成几乎与人类语音无法区分的高质量语音。那么Seed-TTS的表现究竟有多强呢?让我们一起来感受下Seed-TTS带来的惊喜吧! 介绍Seed-TTS…...
Vue3——实现word,pdf上传之后,预览功能(实测有效)
vue-office/pdf - npm支持多种文件(**docx、excel、pdf**)预览的vue组件库,支持vue2/3。也支持非Vue框架的预览。. Latest version: 2.0.2, last published: a month ago. Start using vue-office/pdf in your project by running npm i vue-office/pdf. There are …...
JVM之【类的生命周期】
首先,请区分Bean的声明周期和类的声明周期。此处讲的是类的声明周期 可以同步观看另一篇文章JVM之【类加载机制】 概述 在Java中数据类型分为基本数据类型和引用数据类型 基本数据类型由虚拟机预先定义,引用数据类型则需要进行类的加载 按照]ava虚拟机…...
分库分表场景下,如何设计与实现一种高效的分布式ID生成策略
在构建大规模分布式系统时,随着数据量的爆炸式增长,单个数据库往往难以承载如此庞大的数据存储与访问需求。这时,分库分表便成为一种有效的解决方案,它通过将数据分散存储在多个数据库或表中,从而提高系统的处理能力和…...
机器人系统ros2-开发学习实践16-RViz 用户指南
RViz 是 ROS(Robot Operating System)中的一个强大的 3D 可视化工具,用于可视化机器人模型、传感器数据、路径规划等。以下是RViz用户指南,帮助你了解如何使用RViz来进行机器人开发和调试。 启动可视化工具 ros2 run rviz2 rviz2…...
安全测试 之 安全漏洞 CSRF
1. 背景 安全测试是在功能测试的基础上进行的,它验证软件的安全需求,确保产品在遭受恶意攻击时仍能正常运行,并保护用户信息不受侵犯。 2. CSRF 定义 CSRF(Cross-Site Request Forgery),中文名为“跨站请…...
交易中的预测和跟随
任何的交易决策,一定是基于某种推理关系的,这种推理关系是基于t时刻之前的状态,得到t时刻之后的结果,我们基于这种推理关系,根据当前的状态,形成了未来结果的某种预期,然后基于这种预期采取相应…...
vs2022专业版永久密钥
vs2022专业版永久密钥: vs2022专业版永久密钥: Visual Studio 2022 Enterprise:VHF9H-NXBBB-638P6-6JHCY-88JWH Visual Studio 2022 Professional:TD244-P4NB7-YQ6XK-Y8MMM-YWV2J...
MongoDB环境搭建
一.下载安装包 Download MongoDB Community Server | MongoDB 二、双击下载完成后的安装包开始安装,除了以下两个部分需要注意操作,其他直接next就行 三.可视化界面安装 下载MongoDB-compass,地址如下 MongoDB Compass Download (GUI) | M…...
(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)
题目:3442. 奇偶频次间的最大差值 I 思路 :哈希,时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况,哈希表这里用数组即可实现。 C版本: class Solution { public:int maxDifference(string s) {int a[26]…...
未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?
编辑:陈萍萍的公主一点人工一点智能 未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战,在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…...
Android Wi-Fi 连接失败日志分析
1. Android wifi 关键日志总结 (1) Wi-Fi 断开 (CTRL-EVENT-DISCONNECTED reason3) 日志相关部分: 06-05 10:48:40.987 943 943 I wpa_supplicant: wlan0: CTRL-EVENT-DISCONNECTED bssid44:9b:c1:57:a8:90 reason3 locally_generated1解析: CTR…...
Linux 文件类型,目录与路径,文件与目录管理
文件类型 后面的字符表示文件类型标志 普通文件:-(纯文本文件,二进制文件,数据格式文件) 如文本文件、图片、程序文件等。 目录文件:d(directory) 用来存放其他文件或子目录。 设备…...
【决胜公务员考试】求职OMG——见面课测验1
2025最新版!!!6.8截至答题,大家注意呀! 博主码字不易点个关注吧,祝期末顺利~~ 1.单选题(2分) 下列说法错误的是:( B ) A.选调生属于公务员系统 B.公务员属于事业编 C.选调生有基层锻炼的要求 D…...
Rust 异步编程
Rust 异步编程 引言 Rust 是一种系统编程语言,以其高性能、安全性以及零成本抽象而著称。在多核处理器成为主流的今天,异步编程成为了一种提高应用性能、优化资源利用的有效手段。本文将深入探讨 Rust 异步编程的核心概念、常用库以及最佳实践。 异步编程基础 什么是异步…...
UR 协作机器人「三剑客」:精密轻量担当(UR7e)、全能协作主力(UR12e)、重型任务专家(UR15)
UR协作机器人正以其卓越性能在现代制造业自动化中扮演重要角色。UR7e、UR12e和UR15通过创新技术和精准设计满足了不同行业的多样化需求。其中,UR15以其速度、精度及人工智能准备能力成为自动化领域的重要突破。UR7e和UR12e则在负载规格和市场定位上不断优化…...
#Uniapp篇:chrome调试unapp适配
chrome调试设备----使用Android模拟机开发调试移动端页面 Chrome://inspect/#devices MuMu模拟器Edge浏览器:Android原生APP嵌入的H5页面元素定位 chrome://inspect/#devices uniapp单位适配 根路径下 postcss.config.js 需要装这些插件 “postcss”: “^8.5.…...
解读《网络安全法》最新修订,把握网络安全新趋势
《网络安全法》自2017年施行以来,在维护网络空间安全方面发挥了重要作用。但随着网络环境的日益复杂,网络攻击、数据泄露等事件频发,现行法律已难以完全适应新的风险挑战。 2025年3月28日,国家网信办会同相关部门起草了《网络安全…...
Spring Security 认证流程——补充
一、认证流程概述 Spring Security 的认证流程基于 过滤器链(Filter Chain),核心组件包括 UsernamePasswordAuthenticationFilter、AuthenticationManager、UserDetailsService 等。整个流程可分为以下步骤: 用户提交登录请求拦…...
