当前位置：首页 > news >正文

搜广推实习面经四

news 2026/2/10 17:49:46

字节跳动TAC 广告算法

一、回归任务的评价指标有哪些

1.均方误差（Mean Squared Error, MSE）/均方根误差（Root Mean Squared Error, RMSE）
$\frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2$
2.平均绝对误差（Mean Absolute Error, MAE）
$\frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i|$
3.平均绝对百分比误差（Mean Absolute Percentage Error, MAPE）
MAPE 衡量模型预测误差相对于真实值的百分比。
$\frac{1}{n} \sum_{i=1}^{n} \left|\frac{y_i - \hat{y}_i}{y_i}\right| \times 100$
4.R² 或决定系数（Coefficient of Determination）
R² 反映了模型对数据的拟合程度，值的范围在 [0,1]之间。R² 值越接近 1，表示模型越能解释数据的方差；接近 0 则表示模型的解释能力较弱。
$R^2 = 1 - \frac{\sum_{i=1}^{n} (y_i - \hat{y}_i)^2}{\sum_{i=1}^{n} (y_i - \bar{y})^2}$
5.调整后的 R²（Adjusted R²）
调整后的 R² 是对 R² 的修正，考虑到模型中自变量的数量。当自变量较多时，R² 值可能会偏高（特征多了更容易拟合），防止模型因增加无关特征而导致 R² 值虚高。因此调整后的 R² 提供了更可靠的评价。
$R^2_{\text{adj}} = 1 - \left(1 - R^2\right) \frac{n - 1}{n - p - 1}$
- $n$ 是样本数，
- $p$ 是自变量数量。

二、标签长尾分布，多峰分布怎么应对？

1.长尾分布
- 少数类范围的样本做过采样、多数类范围的样本做降采样
- 做log、Box_Cox变换等
- 变换目标（比如房价，大部分价格都是百万级别，尾巴肯定有千万、上亿的，可以通过房价/面积得到每平方价格，用每平方价格当作标签计数）
  - 用无监督模型对每个样本预先打上一个标签（这个类别标签表示这个样本大概属于那个范围）
  - 稀疏样本加权
2.多峰分布
感觉和长尾分布处理方式差不多。但是多峰分布可能更适合采用分组建模
分组建模：如果数据中的不同部分存在不同的模式，考虑使用分组建模或分段模型，为每个群体（峰值区域）建立单独的模型。

三、优化器有哪些

在机器学习中，优化器负责调整模型的参数以最小化损失函数，帮助模型更好地拟合数据。

1.基础的优化器
- Ⅰ.随机梯度下降 (SGD)
  $\theta = \theta - \eta \cdot \nabla_{\theta} J(\theta)$
  - $\theta$ : 模型参数
  - $\eta$ : 学习率
  - $J(\theta)$ : 损失函数
- Ⅱ.动量法 (Momentum)
  引入动量，使得更新方向受之前梯度的影响，平滑收敛路径。
  $v_t = \beta v_{t-1} + (1 - \beta) \nabla_{\theta} J(\theta) \\ \theta = \theta - \eta v_t$
  - $v_t$ : 动量向量
  - $\beta$ : 动量系数（如 0.9）
2.自适应优化器
自适应优化器（Adaptive Optimizer）是指能够根据梯度变化动态调整学习率的优化算法。这类优化器的主要目标是改进传统优化器（如SGD）的收敛速度和稳定性，特别是在训练非凸深度学习模型时表现优异。
- Ⅰ.Adagrad
  可以为每个参数自适应调整学习率，但是累积历史梯度平方和导致学习率持续下降，后期更新较慢
  $\theta = \theta - \frac{\eta}{\sqrt{G_{t,ii} + \epsilon}} \nabla_{\theta} J(\theta)$
  - $G_t$ : 梯度平方的累加矩阵。
  - $\epsilon$ : 防止分母为零的小值。
- Ⅱ.RMSprop
  通过梯度平方的指数加权平均，解决了 Adagrad 的学习率衰减问题。
  $E[g^2]_t = \beta E[g^2]_{t-1} + (1 - \beta) g_t^2 \\ \ \\ \theta = \theta - \frac{\eta}{\sqrt{E[g^2]_t + \epsilon}} \nabla_{\theta} J(\theta)$
  - $E[g^2]_t$ : 梯度平方的指数加权平均。
- Ⅲ.Adam (Adaptive Moment Estimation)
  综合了动量法和 RMSprop 的优点，基本默认的都是用Adam
  $一阶动量：m_t = \beta_1 m_{t-1} + (1 - \beta_1) g_t \\ 二阶动量：v_t = \beta_2 v_{t-1} + (1 - \beta_2) g_t^2 \\ 参数更新：\theta = \theta - \eta \cdot \frac{\hat{m}_t}{\sqrt{\hat{v}_t} + \epsilon} \\$
  - $\hat{m}_t$ , $\hat{v}_t$ : 偏差校正。
3.高级的优化器
- Ⅰ.SGDW / AdamW
  增加权重衰减项（Weight Decay），替代 L2 正则化。
- Ⅱ.LAMB (Layer-wise Adaptive Moments)
  专为大规模分布式训练设计，适用于大批量训练。每一层都有独立的学习率调整。
四、力扣_215. 数组中的第K个最大元素
给定整数数组 nums 和整数 k，请返回数组中第 k 个最大的元素。
这是一道经典的使用快排和堆的，这里可以背一下快排的模板

class Solution:def findKthLargest(self, nums, k):def quick_select(nums, k):# 随机选择基准数pivot = random.choice(nums)big, equal, small = [], [], []# 将大于、小于、等于 pivot 的元素划分至 big, small, equal 中for num in nums:if num > pivot:big.append(num)elif num < pivot:small.append(num)else:equal.append(num)if k <= len(big):# 第 k 大元素在 big 中，递归划分return quick_select(big, k)if len(nums) - len(small) < k:# 第 k 大元素在 small 中，递归划分return quick_select(small, k - len(nums) + len(small))# 第 k 大元素在 equal 中，直接返回 pivotreturn pivotreturn quick_select(nums, k)

搜广推实习面经四

字节跳动TAC 广告算法一、回归任务的评价指标有哪些 1.均方误差（Mean Squared Error, MSE）/均方根误差（Root Mean Squared Error, RMSE） M S E 1 n ∑ i 1 n ( y i − y ^ i ) 2 MSE \frac{1}{n} \sum_{i1}^{n} (y_i - \ha…...

编程日记 2025/1/22 16:01:00

【Elasticsearch】inference ingest pipeline

Elasticsearch 的 Ingest Pipeline 功能允许你在数据索引之前对其进行预处理。通过使用 Ingest Pipeline，你可以执行各种数据转换和富化操作，包括使用机器学习模型进行推理（inference）。这在处理词嵌入、情感分析、图像识别等场景…...

编程日记 2025/1/22 15:58:54

AQS加锁逻辑 ReentrantLock.lock public void lock() {sync.acquire(1);}AbstractQueuedSynchronizer#acquire public final void acquire(int arg) {if (!tryAcquire(arg) &&acquireQueued(addWaiter(Node.EXCLUSIVE), arg))selfInterrupt();}addWaiter就是将节点加入…...

编程日记 2025/1/22 15:55:44

若依框架在企业中的应用调研

若依框架作为一款基于 Spring Boot 的轻量级 Java 快速开发框架，在企业级应用开发中发挥着重要作用。以下是对其在企业中应用的调研情况： 应用现状广泛应用于多种管理系统：在众多企业中，若依框架常被用于构建各类后台管理系统&a…...

编程日记 2025/1/22 15:52:32

【Day23 LeetCode】贪心算法题

一、贪心算法贪心没有套路，只有碰运气（bushi），举反例看看是否可行，（运气好）刚好贪心策略的局部最优就是全局最优。 1、分发饼干 455 思路：按照孩子的胃口从小到大的顺序依次满足…...

编程日记 2025/1/22 15:50:22

2025年PHP面试宝典，技术总结。

面试是进入职场的第一道坎，因为我本身学校太一般的问题在面试中遇到了各种不爽，和那些高学历的相比自己真是信心大跌。我面试的方向是php开发工程师，主要做网站后台、APP接口等。下面是我这段时间总结的面试方面的常考常问的知识点&#xff0…...

编程日记 2025/1/22 15:48:02

Qt中的按钮组：QPushButton、QToolButton、QRadioButton和QCheckBox使用方法（详细图文教程）

💪 图像算法工程师，专业从事且热爱图像处理，图像处理专栏更新如下👇： 📝《图像去噪》 📝《超分辨率重建》 📝《语义分割》 📝《风格迁移》 📝《目标检测》 &a…...

编程日记 2025/1/22 15:46:55

influxdb+grafana+jmeter

influxdb influxd先启动启动完成后执行 influxdb的端口号 grafana的启动通过grafana-server.exe启动grafana 启动后打开 http://localhost:8087/...

编程日记 2025/1/22 15:44:51

Net Core微服务入门全纪录（三）——Consul-服务注册与发现（下）

系列文章目录 1、.Net Core微服务入门系列（一）——项目搭建 2、.Net Core微服务入门全纪录（二）——Consul-服务注册与发现（上） 3、.Net Core微服务入门全纪录（三）——Consul-服务注…...

编程日记 2025/1/22 15:42:49

leetcode 479. 最大回文数乘积

题目如下看完题目后没有想到取巧的办法所以尝试使用枚举法。使用枚举法之前先回答两个问题： 1. 如何构造回文串？ 2. 如何判断是否存在两个n位整数相乘可以得到这个回文串？ 显然n位数与n位数相乘必然是2n位数也就是说最大回文整数长度必然…...

编程日记 2025/1/22 15:40:43

独立搭建UI自动化测试框架

🍅 点击文末小卡片，免费获取软件测试全套资料，资料在手，涨薪更快今天给大家分享一个seleniumtestngmavenant的UI自动化，可以用于功能测试，也可按复杂的业务流程编写测试用例，今天此篇文章不过多…...

编程日记 2025/1/22 15:39:41

62,【2】 BUUCTF WEB [强网杯 2019]Upload1

进入靶场此处考点不是SQL，就正常注册并登录进去先随便传一个进行目录扫描，我先用爆破代替先随便后面写个文件名为了提供payload位置 www.tar.gz真的存在返回浏览器修改url就自动下载了看到tp5,应该是ThinkPHP5框架参考此博客的思路方法c[强网杯…...

编程日记 2025/1/22 15:37:40

Spring Boot 整合 ShedLock 处理定时任务重复执行的问题

🌷 古之立大事者，不惟有超世之才，亦必有坚忍不拔之志 🎐 个人CSND主页——Micro麦可乐的博客 🐥《Docker实操教程》专栏以最新的Centos版本为基础进行Docker实操教程，入门到实战 🌺《RabbitMQ》…...

编程日记 2025/1/22 15:34:37

常见Arthas命令与实践

Arthas 官网：https://arthas.aliyun.com/doc/，官方文档对 Arthas 的每个命令都做出了介绍和解释，并且还有在线教程，方便学习和熟悉命令。 Arthas Idea 的 IDEA 插件。这是一款能快速生成 Arthas命令的插件，可快速生成…...

编程日记 2025/1/22 15:29:29

Glide加载gif遇到的几个坑

Glide本身支持gif格式的动画加载，但是大多数情况下我们用Glide都是去加载一些静态图片，加载gif动态图的需求不是很多，因此这次使用Glide加载gif就遇到了一些令人匪夷所思的问题问题一：加载gif图片会有明显的卡顿通常情况下我们…...

编程日记 2025/1/22 15:28:27

STM32学习之通用定时器

1.1通用定时器介绍通用定时器具有基本定时器的所有特征，基本定时器只能递增计数，而通用定时器可以递减计数，可以中心对齐计数；也可以触发ADC和DAC，同时在更新事件，触发事件，输入捕获&#xff…...

编程日记 2025/1/22 15:27:24

MiniMax-Text-01——模型详细解读与使用

MiniMax发布了最新的旗舰款模型，MiniMax-Text-01。这是一个456B参数的MOE模型，支持最大4M上下文。今天我们来解读一下这个模型，最后会讲一下模型的使用方式和价格。先来看整体指标，以下图表分为三块指标，分别是文本能…...

编程日记 2025/1/22 15:23:20

Redis的Windows版本安装以及可视化工具

文章目录 redis安装redis安装包下载解压文件夹启动redis服务Redis路径配置环境变量打开redis客户端进行连接基础操作测试 redis可视化工具下载Redis Desktop Manager redis安装 redis安装包下载 windows版本readis下载：Releases tporadowski/redis 解压文件夹我…...

编程日记 2025/1/22 15:20:17

tensorflow源码编译在C++环境使用

https://tensorflow.google.cn/install/source?hlzh-cn查看tensorflow和其他需要下载软件对应的版本，最好一模一样 1、下载TensorFlow源码 https://github.com/tensorflow/tensorflow 2、安装编译protobuf（3.9.2） protobuf版本要和TensorFlo…...

编程日记 2025/1/22 15:19:16

第四届机器学习、云计算与智能挖掘国际会议

一、会议信息会议名称：第四届机器学习、云计算与智能挖掘国际会议（MLCCIM 2025） 会议地点：中国漠河会议时间：2025年7月21-25日支持单位：佛山市人工智能学会、佛山大学二、大会主席 …...

编程日记 2025/1/22 15:17:14

网络编程（Modbus进阶）

思维导图 Modbus RTU（先学一点理论） 概念 Modbus RTU 是工业自动化领域最广泛应用的串行通信协议，由 Modicon 公司（现施耐德电气）于 1979 年推出。它以高效率、强健性、易实现的特点成为工业控制系统的通信标准。包…...

编程新知 2026/2/9 2:42:51

8k长序列建模，蛋白质语言模型Prot42仅利用目标蛋白序列即可生成高亲和力结合剂

蛋白质结合剂（如抗体、抑制肽）在疾病诊断、成像分析及靶向药物递送等关键场景中发挥着不可替代的作用。传统上，高特异性蛋白质结合剂的开发高度依赖噬菌体展示、定向进化等实验技术，但这类方法普遍面临资源消耗巨大、研发周期冗长…...

编程新知 2026/1/25 13:18:12

ETLCloud可能遇到的问题有哪些？常见坑位解析

数据集成平台ETLCloud，主要用于支持数据的抽取（Extract）、转换（Transform）和加载（Load）过程。提供了一个简洁直观的界面，以便用户可以在不同的数据源之间轻松地进行数据迁移和转换。…...

编程新知 2026/2/3 12:56:31

论文浅尝 | 基于判别指令微调生成式大语言模型的知识图谱补全方法（ISWC2024）

笔记整理：刘治强，浙江大学硕士生，研究方向为知识图谱表示学习，大语言模型论文链接：http://arxiv.org/abs/2407.16127 发表会议：ISWC 2024 1. 动机传统的知识图谱补全（KGC）模型通过…...

编程新知 2026/2/10 15:49:34

Module Federation 和 Native Federation 的比较

前言 Module Federation 是 Webpack 5 引入的微前端架构方案，允许不同独立构建的应用在运行时动态共享模块。 Native Federation 是 Angular 官方基于 Module Federation 理念实现的专为 Angular 优化的微前端方案。概念解析 Module Federation (模块联邦) Modul…...

编程新知 2026/1/31 13:48:37

在WSL2的Ubuntu镜像中安装Docker

Docker官网链接: https://docs.docker.com/engine/install/ubuntu/ 1、运行以下命令卸载所有冲突的软件包： for pkg in docker.io docker-doc docker-compose docker-compose-v2 podman-docker containerd runc; do sudo apt-get remove $pkg; done2、设置Docker…...

编程新知 2026/2/4 16:23:56

OPenCV CUDA模块图像处理-----对图像执行均值漂移滤波（Mean Shift Filtering）函数meanShiftFiltering()

操作系统：ubuntu22.04 OpenCV版本：OpenCV4.9 IDE:Visual Studio Code 编程语言：C11 算法描述在 GPU 上对图像执行均值漂移滤波（Mean Shift Filtering），用于图像分割或平滑处理。该函数将输入图像中的…...

编程新知 2026/2/10 9:20:22

Web 架构之 CDN 加速原理与落地实践

文章目录一、思维导图二、正文内容（一）CDN 基础概念1. 定义2. 组成部分 （二）CDN 加速原理1. 请求路由2. 内容缓存3. 内容更新 （三）CDN 落地实践1. 选择 CDN 服务商2. 配置 CDN3. 集成到 Web 架构 &#xf…...

编程新知 2025/9/13 16:17:01

系统掌握PyTorch：图解张量、Autograd、DataLoader、nn.Module与实战模型

本文较长，建议点赞收藏，以免遗失。更多AI大模型应用开发学习视频及资料，尽在聚客AI学院。本文通过代码驱动的方式，系统讲解PyTorch核心概念和实战技巧，涵盖张量操作、自动微分、数据加载、模型构建和训练全流程&#…...

编程新知 2026/2/7 23:15:50

Neko虚拟浏览器远程协作方案：Docker+内网穿透技术部署实践

前言：本文将向开发者介绍一款创新性协作工具——Neko虚拟浏览器。在数字化协作场景中，跨地域的团队常需面对实时共享屏幕、协同编辑文档等需求。通过本指南，你将掌握在Ubuntu系统中使用容器化技术部署该工具的具体方案，并结合内网…...

编程新知 2026/2/9 22:04:22

搜广推实习面经四

字节跳动TAC 广告算法

一、回归任务的评价指标有哪些

二、标签长尾分布，多峰分布怎么应对？

三、优化器有哪些

相关文章：

搜广推实习面经四

【Elasticsearch】inference ingest pipeline

AQS公平锁与非公平锁之源码解析

若依框架在企业中的应用调研

【Day23 LeetCode】贪心算法题

2025年PHP面试宝典，技术总结。

Qt中的按钮组：QPushButton、QToolButton、QRadioButton和QCheckBox使用方法（详细图文教程）

influxdb+grafana+jmeter

Net Core微服务入门全纪录（三）——Consul-服务注册与发现（下）

leetcode 479. 最大回文数乘积

独立搭建UI自动化测试框架

62,【2】 BUUCTF WEB [强网杯 2019]Upload1

Spring Boot 整合 ShedLock 处理定时任务重复执行的问题

常见Arthas命令与实践

Glide加载gif遇到的几个坑

STM32学习之通用定时器

MiniMax-Text-01——模型详细解读与使用

Redis的Windows版本安装以及可视化工具

tensorflow源码编译在C++环境使用

第四届机器学习、云计算与智能挖掘国际会议

网络编程（Modbus进阶）

8k长序列建模，蛋白质语言模型Prot42仅利用目标蛋白序列即可生成高亲和力结合剂

ETLCloud可能遇到的问题有哪些？常见坑位解析

论文浅尝 | 基于判别指令微调生成式大语言模型的知识图谱补全方法（ISWC2024）

Module Federation 和 Native Federation 的比较

在WSL2的Ubuntu镜像中安装Docker

OPenCV CUDA模块图像处理-----对图像执行均值漂移滤波（Mean Shift Filtering）函数meanShiftFiltering()

Web 架构之 CDN 加速原理与落地实践

系统掌握PyTorch：图解张量、Autograd、DataLoader、nn.Module与实战模型

Neko虚拟浏览器远程协作方案：Docker+内网穿透技术部署实践