当前位置：首页 > article >正文

华为深度学习面试手撕题：手写nn.Conv2d()函数

article 2026/4/22 10:24:28

题目

只允许利用numpy包，实现Pytorch二维卷积函数nn.Conv2d()

解答

此代码考察二维卷积的概念，详见：

6.2. 图像卷积 — 动手学深度学习 2.0.0 documentation

6.3. 填充和步幅 — 动手学深度学习 2.0.0 documentation

6.4. 多输入多输出通道 — 动手学深度学习 2.0.0 documentation

代码实现：

import numpy as np
import torch
import torch.nn as nndef conv2d(input, weight, bias=None, stride=1, padding=0):"""实现二维卷积操作参数:input:  输入数据, 形状为 (batch_size, in_channels, height, width)weight: 卷积核, 形状为 (out_channels, in_channels, kernel_h, kernel_w)bias:   偏置项, 形状为 (out_channels,)stride: 步长, 可以是整数或元组 (stride_h, stride_w)padding: 填充, 可以是整数或元组 (pad_h, pad_w)返回:输出特征图, 形状为 (batch_size, out_channels, out_h, out_w)"""# 解析步长和填充参数if isinstance(stride, int):stride_h = stride_w = strideelse:stride_h, stride_w = strideif isinstance(padding, int):pad_h = pad_w = paddingelse:pad_h, pad_w = padding# 获取输入尺寸batch_size, in_channels, in_h, in_w = input.shapeout_channels, _, kernel_h, kernel_w = weight.shape# 计算输出尺寸out_h = (in_h + 2 * pad_h - kernel_h) // stride_h + 1out_w = (in_w + 2 * pad_w - kernel_w) // stride_w + 1# 添加填充if pad_h > 0 or pad_w > 0:# 使用零填充padded_input = np.pad(input, ((0, 0), (0, 0), (pad_h, pad_h), (pad_w, pad_w)),mode='constant')else:padded_input = input# 初始化输出数组output = np.zeros((batch_size, out_channels, out_h, out_w))# 执行卷积操作for b in range(batch_size):for c_out in range(out_channels):for h_out in range(out_h):for w_out in range(out_w):# 计算输入窗口位置h_start = h_out * stride_hw_start = w_out * stride_wh_end = h_start + kernel_hw_end = w_start + kernel_w# 提取输入窗口window = padded_input[b, :, h_start:h_end, w_start:w_end]# 计算点积 (卷积操作)conv_val = np.sum(window * weight[c_out])# 添加偏置if bias is not None:conv_val += bias[c_out]# 存储结果output[b, c_out, h_out, w_out] = conv_valreturn outputimport torch
import torch.nn as nnif __name__ == "__main__":# 创建测试数据np.random.seed(42)# 输入数据: (batch_size=2, in_channels=3, height=5, width=5)input_data = np.random.randn(2, 3, 5, 5).astype(np.float32)# 卷积核: (out_channels=2, in_channels=3, kernel_h=3, kernel_w=3)weights = np.random.randn(2, 3, 3, 3).astype(np.float32)# 偏置: (out_channels=2)bias = np.array([0.5, -0.5], dtype=np.float32)# 转换为 PyTorch 张量input_torch = torch.tensor(input_data)weights_torch = torch.tensor(weights)bias_torch = torch.tensor(bias)# 测试1: 无填充, 步长=1print("测试1: 无填充, 步长=1")output1 = conv2d(input_data, weights, bias, stride=1, padding=0)# 创建 PyTorch 卷积层conv1_nn = nn.Conv2d(in_channels=3, out_channels=2, kernel_size=3, stride=1, padding=0, bias=True)# 设置权重和偏置with torch.no_grad():conv1_nn.weight.data = weights_torchconv1_nn.bias.data = bias_torch# 计算 PyTorch 输出output1_nn = conv1_nn(input_torch).detach().numpy()# 比较结果print("自定义实现与PyTorch输出是否一致:", np.allclose(output1, output1_nn, atol=1e-6))print(f"输出形状: {output1.shape}")print("自定义实现输出 (第一个样本的第一个通道前2x2):")print(output1[0, 0, :2, :2])print("PyTorch输出 (第一个样本的第一个通道前2x2):")print(output1_nn[0, 0, :2, :2])# 测试2: 填充=1, 步长=1print("\n测试2: 填充=1, 步长=1")output2 = conv2d(input_data, weights, bias, stride=1, padding=1)# 创建 PyTorch 卷积层conv2_nn = nn.Conv2d(in_channels=3, out_channels=2, kernel_size=3, stride=1, padding=1, bias=True)with torch.no_grad():conv2_nn.weight.data = weights_torchconv2_nn.bias.data = bias_torchoutput2_nn = conv2_nn(input_torch).detach().numpy()print("自定义实现与PyTorch输出是否一致:", np.allclose(output2, output2_nn, atol=1e-6))print(f"输出形状: {output2.shape}")print("自定义实现输出 (第一个样本的第一个通道前2x2):")print(output2[0, 0, :2, :2])print("PyTorch输出 (第一个样本的第一个通道前2x2):")print(output2_nn[0, 0, :2, :2])# 测试3: 无填充, 步长=2print("\n测试3: 无填充, 步长=2")output3 = conv2d(input_data, weights, bias, stride=2, padding=0)# 创建 PyTorch 卷积层conv3_nn = nn.Conv2d(in_channels=3, out_channels=2, kernel_size=3, stride=2, padding=0, bias=True)with torch.no_grad():conv3_nn.weight.data = weights_torchconv3_nn.bias.data = bias_torchoutput3_nn = conv3_nn(input_torch).detach().numpy()print("自定义实现与PyTorch输出是否一致:", np.allclose(output3, output3_nn, atol=1e-6))print(f"输出形状: {output3.shape}")print("自定义实现输出 (第一个样本的第一个通道):")print(output3[0, 0])print("PyTorch输出 (第一个样本的第一个通道):")print(output3_nn[0, 0])# 测试4: 无偏置print("\n测试4: 无偏置")output4 = conv2d(input_data, weights, None, stride=1, padding=0)# 创建 PyTorch 卷积层conv4_nn = nn.Conv2d(in_channels=3, out_channels=2, kernel_size=3, stride=1, padding=0, bias=False)with torch.no_grad():conv4_nn.weight.data = weights_torchoutput4_nn = conv4_nn(input_torch).detach().numpy()print("自定义实现与PyTorch输出是否一致:", np.allclose(output4, output4_nn, atol=1e-6))print("自定义实现输出 (第一个样本的第一个通道前2x2):")print(output4[0, 0, :2, :2])print("PyTorch输出 (第一个样本的第一个通道前2x2):")print(output4_nn[0, 0, :2, :2])'''
测试1: 无填充, 步长=1
自定义实现与PyTorch输出是否一致: True
输出形状: (2, 2, 3, 3)
自定义实现输出 (第一个样本的第一个通道前2x2):
[[-6.4546895  -2.49435902][-6.27663374  3.31103873]]
PyTorch输出 (第一个样本的第一个通道前2x2):
[[-6.4546895 -2.4943593][-6.276634   3.3110385]]测试2: 填充=1, 步长=1
自定义实现与PyTorch输出是否一致: True
输出形状: (2, 2, 5, 5)
自定义实现输出 (第一个样本的第一个通道前2x2):
[[ 1.17402518  1.28695214][-0.09722954 -6.4546895 ]]
PyTorch输出 (第一个样本的第一个通道前2x2):
[[ 1.1740253   1.2869523 ][-0.09722958 -6.4546895 ]]测试3: 无填充, 步长=2
自定义实现与PyTorch输出是否一致: True
输出形状: (2, 2, 2, 2)
自定义实现输出 (第一个样本的第一个通道):
[[-6.4546895   1.38441801][ 3.1934371  -1.1537782 ]]
PyTorch输出 (第一个样本的第一个通道):
[[-6.4546895  1.3844179][ 3.1934366 -1.1537789]]测试4: 无偏置
自定义实现与PyTorch输出是否一致: True
自定义实现输出 (第一个样本的第一个通道前2x2):
[[-6.9546895  -2.99435902][-6.77663374  2.81103873]]
PyTorch输出 (第一个样本的第一个通道前2x2):
[[-6.9546895 -2.9943593][-6.776634   2.811039 ]]
'''

华为深度学习面试手撕题：手写nn.Conv2d()函数

题目只允许利用numpy包，实现Pytorch二维卷积函数nn.Conv2d() 解答此代码考察二维卷积的概念，详见： 6.2. 图像卷积 — 动手学深度学习 2.0.0 documentation 6.3. 填充和步幅 — 动手学深度学习 2.0.0 documentation 6.4. 多输入多输出通…...

编程日记 2026/4/21 0:40:00

归一化相关问题归一化方式Batch NormalizationLayer NormalizationInstance NormalizationGroup NormalizationRMSNorm（Root Mean Square Layer Normalization）:RMSNorm 和 LayerNorm区别？归一化方式 Batch Normalization 在每一层的输入进行归一化处理，使其在每个批次内…...

编程日记 2026/4/20 19:12:23

STM32Cubemx-H7-17-麦克纳姆轮驱动

前言 --末尾有总体的.c和.h 本篇文章把麦克纳姆轮的代码封装到.c和.h，使用者只需要根据轮子正转的方向，在.h处修改定义方向引脚，把轮子都统一正向后，后面的轮子驱动函数就可以正常了，然后直接调用函数驱动即可。设…...

编程日记 2026/4/22 6:09:56

机器学习算法-逻辑回归

今天我们用「预测考试是否及格」的例子来讲解逻辑回归，从原理到实现一步步拆解，保证零基础也能懂！ 🎯 例子背景假设你是班主任，要根据学生的「学习时间」预测「是否及格」，手上有以下数据：…...

编程日记 2026/3/1 9:14:14

Office 2024免费下载安装包

各位办公小能手们，你们知道吗？咱们日常办公经常会用到一个超厉害的软件套件，那就是Office，它全称Microsoft Office，是微软公司开发的。这玩意儿能大大提升个人和团队的办公效率，像文档处理、数据分析、演示…...

编程日记 2026/4/21 10:04:41

Linux云计算训练营笔记day18（Python）

# 猜数字游戏: 程序生产一个 1-100的随机数 # 让用户重复去猜测, 直到猜对为止 # 如果用户输入的数字大于随机生成的数字提示大了 # 如果用户输入的数字小于随机生产的数字提示小了 # 否则猜对了 break # 增加需求最多猜6次,如果没有猜对，提示你失…...

编程日记 2026/3/1 15:43:25

Git深入解析功能逻辑与核心业务场景流程

一、Git核心功能逻辑架构 #mermaid-svg-9tj1iCr99u6QenJM {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-9tj1iCr99u6QenJM .error-icon{fill:#552222;}#mermaid-svg-9tj1iCr99u6QenJM .error-text{fill:#552222;st…...

编程日记 2026/4/21 20:25:43

Opencv4 c++ 自用笔记 03 滑动条、相机与视频操作

1. 相机与视频操作 1.1 打开视频／相机 OpenCV 中 imread() 只能读取静态图像，若要读取视频文件或摄像头流，需要使用 VideoCapture 类： // 构造函数 cv::VideoCapture::VideoCapture(); cv::VideoCapture…...

编程日记 2025/9/22 4:12:56

LINUX528 重定向

2>&1 我的理解： 2>&1，2stderr错误输出，1stdout输出，stderr一般和stdout是分别输出（管道符只传递stdout，据元宝，stderr默认输出到终端；如果重定向符不进行2显示重定向&…...

编程日记 2026/4/20 8:03:32

研华工控机安装Windows10系统,适用UEFI（GPT）格式安装

主要硬件主板：AIMB-787 、CPU：i5-6500 U盘启动工具：通过网盘分享的文件：rufus-3.20.zip 链接: https://pan.baidu.com/s/1YlFfd-_EhFHCG4sEHBQ8dQ?pwdQT12 提取码: QT12 Win10 22H2 Pro 纯净版系统：通过网盘分享…...

编程日记 2026/4/21 20:50:05

1、树莓派更换软件下载源

树莓派官方系统raspbian自带的是国外的软件源，在国内使用经常会遇到无法下载软件的问题。以下是把raspbian系统（buster版本）的下载源改为阿里云软件源的方法。 1、修改sources.list文件 sudo nano /etc/apt/sources.list 将初始化中的代…...

编程日记 2026/4/20 8:04:19

历年中山大学计算机保研上机真题

历年中山大学计算机保研上机真题 2025中山大学计算机保研上机真题 2024中山大学计算机保研上机真题 2023中山大学计算机保研上机真题在线测评链接：https://pgcode.cn/school 不连续1的子串题目描述给定一个数字 n n n，输出长度为 n n n 的 01…...

编程日记 2026/4/20 8:03:34

Python----目标检测（《SSD: Single Shot MultiBox Detector》论文和SSD的原理与网络结构）

一、SSD：单次多框检测器 1.1、基本信息标题：SSD: Single Shot MultiBox Detector 作者：Wei Liu (UNC Chapel Hill), Dragomir Anguelov (Zoox Inc.), Dumitru Erhan, Christian Szegedy (Google Inc.), Scott Reed (University of Michiga…...

编程日记 2026/4/10 16:32:36

springboot集成websocket给前端推送消息

一般通常情况下，我们都是前端主动朝后端发送请求，那么有没有可能，后端主动给前端推送消息呢？这时候就可以借助websocket来实现。下面给出一个简单的实现样例。首先创建一个websocketDemo工程，该工程的整体结构如下&a…...

编程日记 2026/4/17 9:03:20

DrissionPage SessionPage模式：轻量级HTTP请求的利器

引言在Python自动化领域，DrissionPage以其创新的三模式设计脱颖而出。作为专为HTTP请求优化的SessionPage模式，凭借其轻量级架构和高效性能，成为API调用、数据采集等场景的首选方案。本文将深入解析SessionPage的技术特性、核心优势及典型应…...

编程日记 2026/1/23 7:13:52

0527漏洞原理：XSS笔记

理论知识 01 前端基础知识 1.1 HTML基础定义：HTML（超文本标记语言）用于描述网页结构。标准结构： 内嵌脚本： <script>JavaScript代码</script>1.4 JavaScript弹窗函数函数描述alert("文本&quo…...

编程日记 2026/4/13 11:28:09

智能制造之精读——RPA制造行业常见场景【附全文阅读】

RPA 在制造行业应用广泛，为企业带来显著价值，是极具潜力的智能化解决方案。它能节省成本，降低人力与管理成本；提升运营效率，减少人机交互损耗；提高质量，保障流程准确性；还能增强合规…...

编程日记 2026/4/22 9:51:28

spark shuffle的分区支持动态调整，而hive不支持

根据Spark官方文档，Spark Shuffle分区支持动态调整的核心原因在于其架构设计和执行模型的先进性： 1. 自适应查询执行（AQE）机制 Spark 3.0引入的AQE特性允许在运行时动态优化执行计划，包括Shuffle分区调整&#xff1a…...

编程日记 2025/11/19 17:38:17

网络安全十大漏洞

1️⃣ 失效的访问控制（Broken Access Control） 核心问题：用户能访问本应被禁止的资源或操作攻击案例： 修改URL参数：https://shop.com/order?user_id100 → 改为 user_id101 查看他人订单直接访问管理员页面&#…...

编程日记 2026/4/15 15:46:19

关于uv 工具的使用总结（uv，conda，pip什么关系）

最近要开发MCP 项目，uv工具使用是官方推荐的方式，逐要了解这个uv工具。整体理解如下： 一.uv工具的基本情况 UV 是一个由 Rust 编写的现代化 Python 包管理工具，旨在通过极速性能和一体化功能替代传统工具（如 pip、vi…...

编程日记 2026/4/22 6:53:44

深入剖析 Docker 容器化原理与实战应用，开启技术新征程！

文章目录前言一、为什么是Docker ？二、Docker 容器化原理分析2.1 镜像（Image）2.2 容器（Container）2.3 仓库（Registry） 三、Docker 容器化实践3.1 Docker安装3.2 创建一个 Docker 镜像3.3 运行…...

编程日记 2026/4/21 10:43:43

Xamarin劝退之踩坑笔记

初级代码游戏的专栏介绍与文章目录-CSDN博客我的github：codetoys，所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。这些代码大部分以Linux为目标但部分代码是纯C的，可以在任何平台上使用。源码指引：github源…...

编程日记 2026/4/14 6:35:28

计算机网络(4)——网络层

1.概述 1.1 网络层服务 (1) 网络层为不同主机(Host)之间提供了一种逻辑通信机制 (2)每个主机和路由器都运行网络层协议发送方：将来自传输层的消息封装到数据报(datagram)中接收方：向传输层交付数据段(segment) 1.2 网络层核心功能路由选择(routing…...

编程日记 2026/4/20 9:32:30

java 多线程中的volatile关键字作用

文章目录前置作用一：多线程下，保证可见性作用二：多线程下，禁止指令重排序前置保证可见性和保证没有指令重排导致的问题但是不保证原子性 volatile 常常见到和 static 一起使用，因为 volatile 用在多线程中共享变…...

编程日记 2026/4/10 23:14:57

ESP32基础知识1：项目工程建立和烧录

ESP32基础知识1：项目工程建立和烧录一、本文内容与前置知识点1. 本文内容2. 前置知识点二、新建工程1. 工程配置2. 依照模板建立项目三、硬件烧录1. 硬件准备2. 烧录器和ESP32连接3. 电脑端设置4. 烧录成功演示四、参考文献一、本文内容与前置知识点 1. 本文内…...

编程日记 2026/4/20 9:53:15

allWebPlugin中间件VLC专用版之录像功能介绍

背景 VLC控件原有接口是不支持录像的，且libVLC提供的接口库，不能获取录像文件完整名称（VLC-3.0.11 录制直播时有的无法保存视频的解决方法 - 1CM - 博客园）；因此，非常的不友好。为了能够彻底解决这个问题&a…...

编程日记 2026/4/22 4:18:00

Vim 支持多种编程语言编辑器

软件简介 Vim是Vi编辑器的增强版，它提供了更多的功能和快捷键。Vim是一款自由软件，它是由Bram Moolenaar在1991年创建的。Vim支持多种编程语言，包括C、C、Java、Python、Perl等等。它是一款轻量级的编辑器，可以快速打开和编辑大型…...

编程日记 2026/4/20 8:03:39

解决 IDEA 在运行时中文乱码问题

直接说解决办法编译 IDEA 所在目录的启动的 .vmoptions 文件，添加以下JVM 参数即可 -Dfile.encodingUTF-8如下图所示，Help > Edit Custom VM Options，随后在编辑框中添加-Dfile.encodingUTF-8 的 JVM 参数...

编程日记 2026/4/21 0:43:31

Diffusion Planner:扩散模型重塑自动驾驶路径规划（ICLR‘25）

1. 概述 2025年2月14日，清华大学AIR智能产业研究院联合毫末智行、中科院自动化所和香港中文大学团队，在ICLR 2025会议上发布了Diffusion Planner——一种创新性的基于Diffusion Transformer的自动驾驶规划模型架构。该系统联合建模周车运动预测与自车行…...

编程日记 2026/4/16 22:10:46

华为OD机试真题——阿里巴巴找黄金宝箱 IV（2025A卷：200分）Java/python/JavaScript/C++/C语言/GO六种最佳实现

2025 A卷 200分题型本文涵盖详细的问题分析、解题思路、代码实现、代码详解、测试用例以及综合分析；并提供Java、python、JavaScript、C++、C语言、GO六种语言的最佳实现方式！ 2025华为OD真题目录+全流程解析/备考攻略/经验分享华为OD机试真题《阿里巴巴找黄金宝箱 IV》：…...

编程日记 2026/4/21 3:57:45

题目

解答

相关文章：