当前位置：首页 > news >正文

Pytorch中张量矩阵乘法函数(mm, bmm, matmul)使用说明，含高维张量实例及运行结果

news 2026/2/9 16:16:35

Pytorch中张量矩阵乘法函数使用说明

1 torch.mm() 函数
- 1.1 torch.mm() 函数定义及参数
- 1.2 torch.bmm() 官方示例
2 torch.bmm() 函数
- 2.1 torch.bmm() 函数定义及参数
- 2.2 torch.bmm() 官方示例
3 torch.matmul() 函数
- 3.1 torch.matmul() 函数定义及参数
- 3.2 torch.matmul() 规则约定
- 3.3 torch.matmul() 官方示例
- 3.4 高维数据实例解释
参考博文及感谢

1 torch.mm() 函数

全称为matrix-matrix product，对输入的张量做矩阵乘法运算，输入输出维度一定是2维；

1.1 torch.mm() 函数定义及参数

torch.bmm(input, mat2, , out=None) → Tensor
input (Tensor) – – 第一个要相乘的矩阵
** mat2* (Tensor) – – 第二个要相乘的矩阵
不支持广播到通用形状、类型推广以及整数、浮点和复杂输入。

1.2 torch.bmm() 官方示例

mat1 = torch.randn(2, 3)
mat2 = torch.randn(3, 3)
torch.mm(mat1, mat2)tensor([[ 0.4851,  0.5037, -0.3633],[-0.0760, -3.6705,  2.4784]])

2 torch.bmm() 函数

全称为batch matrix-matrix product，对输入的张量做矩阵乘法运算，输入输出维度一定是3维；

2.1 torch.bmm() 函数定义及参数

torch.bmm(input, mat2, , out=None) → Tensor
input (Tensor) – – 第一批要相乘的矩阵
** mat2* (Tensor) – – 第二批要相乘的矩阵
不支持广播到通用形状、类型推广以及整数、浮点和复杂输入。

2.2 torch.bmm() 官方示例

input = torch.randn(10, 3, 4)
mat2 = torch.randn(10, 4, 5)
res = torch.bmm(input, mat2)
res.size()torch.Size([10, 3, 5])

3 torch.matmul() 函数

可进行多维矩阵运算，根据不同输入维度进行广播机制然后运算，和点积类似，广播机制可参考之前博文torch.mul()函数。

3.1 torch.matmul() 函数定义及参数

torch.matmul(input, mat2, , out=None) → Tensor
input (Tensor) – – 第一个要相乘的张量
** mat2* (Tensor) – – 第二个要相乘的张量
支持广播到通用形状、类型推广以及整数、浮点和复杂输入。

3.2 torch.matmul() 规则约定

（1）若两个都是1D（向量）的，则返回两个向量的点积；

（2）若两个都是2D（矩阵）的，则按照（矩阵相乘）规则返回2D；

（3）若input维度1D，other维度2D，则先将1D的维度扩充到2D（1D的维数前面+1），然后得到结果后再将此维度去掉，得到的与input的维度相同。即使作扩充（广播）处理，input的维度也要和other维度做对应关系；

（4）若input是2D，other是1D，则返回两者的点积结果；

（5）如果一个维度至少是1D，另外一个大于2D，则返回的是一个批矩阵乘法（ a batched matrix multiply）

（a）若input是1D，other是大于2D的，则类似于规则(3)；
（b）若other是1D，input是大于2D的，则类似于规则(4)；
（c）若input和other都是3D的，则与torch.bmm()函数功能一样；
（d）如果input中某一维度满足可以广播（扩充），那么也是可以进行相乘操作的。例如 input（j,1,n,m）* other (k,m,p) = output(j,k,n,p)

matmul() 根据输入矩阵自动决定如何相乘。低维根据高维需求，合理广播。

3.3 torch.matmul() 官方示例

# vector x vector
tensor1 = torch.randn(3)
tensor2 = torch.randn(3)
torch.matmul(tensor1, tensor2).size()torch.Size([])
# matrix x vector
tensor1 = torch.randn(3, 4)
tensor2 = torch.randn(4)
torch.matmul(tensor1, tensor2).size()torch.Size([3])
# batched matrix x broadcasted vector
tensor1 = torch.randn(10, 3, 4)
tensor2 = torch.randn(4)
torch.matmul(tensor1, tensor2).size()torch.Size([10, 3])
# batched matrix x batched matrix
tensor1 = torch.randn(10, 3, 4)
tensor2 = torch.randn(10, 4, 5)
torch.matmul(tensor1, tensor2).size()torch.Size([10, 3, 5])
# batched matrix x broadcasted matrix
tensor1 = torch.randn(10, 3, 4)
tensor2 = torch.randn(4, 5)
torch.matmul(tensor1, tensor2).size()torch.Size([10, 3, 5])

3.4 高维数据实例解释

直接看一个4维的二值例子，先看图（红虚线和实线是为了便于区分维度而添加），不懂再结合代码和结果分析，先做广播，然后对应矩阵进行乘积运算。
在这里插入图片描述

代码如下：

import torch
import numpy as npnp.random.seed(2022)
a = np.random.randint(low=0, high=2, size=(2, 2, 3, 4))
a = torch.tensor(a)
b = np.random.randint(low=0, high=2, size=(2, 1, 4, 3))
b = torch.tensor(b)
c = torch.matmul(a, b)
# or
# c = a @ b
print(a)
print("=============================================")
print(b)
print("=============================================")
print(c.size())
print("=============================================")
print(c)

运行结果为：

tensor([[[[1, 0, 1, 0],[1, 1, 0, 1],[0, 0, 0, 0]],[[1, 1, 1, 1],[1, 1, 0, 0],[0, 1, 0, 1]]],[[[0, 0, 0, 1],[0, 0, 0, 1],[0, 1, 0, 0]],[[1, 1, 1, 1],[1, 1, 1, 1],[0, 0, 0, 0]]]], dtype=torch.int32)
=============================================
tensor([[[[0, 1, 0],[1, 1, 0],[0, 0, 0],[1, 1, 0]]],[[[0, 1, 0],[1, 1, 1],[1, 1, 1],[1, 0, 1]]]], dtype=torch.int32)
=============================================
torch.Size([2, 2, 3, 3])
=============================================
tensor([[[[0, 1, 0],[2, 3, 0],[0, 0, 0]],[[2, 3, 0],[1, 2, 0],[2, 2, 0]]],[[[1, 0, 1],[1, 0, 1],[1, 1, 1]],[[3, 3, 3],[3, 3, 3],[0, 0, 0]]]], dtype=torch.int32)

参考博文及感谢

部分内容参考以下链接，这里表示感谢 Thanks♪(･ω･)ﾉ
参考博文1 官方文档查询地址
https://pytorch.org/docs/stable/index.html
参考博文2 Pytorch矩阵乘法之torch.mul() 、 torch.mm() 及torch.matmul()的区别
https://blog.csdn.net/irober/article/details/113686080

Pytorch中张量矩阵乘法函数(mm, bmm, matmul)使用说明，含高维张量实例及运行结果

Pytorch中张量矩阵乘法函数使用说明 1 torch.mm() 函数1.1 torch.mm() 函数定义及参数1.2 torch.bmm() 官方示例 2 torch.bmm() 函数2.1 torch.bmm() 函数定义及参数2.2 torch.bmm() 官方示例 3 torch.matmul() 函数3.1 torch.matmul() 函数定义及参数3.2 torch.matmul() 规则约…...

编程日记 2023/9/15 3:54:13

如何在matlab绘图的标题中添加变量？变量的格式化字符串输出浅析

文章目录 matlab的格式化输出控制符字段宽度、精度和对齐方式的控制matlab的格式化输出总结 matlab的格式化输出控制符 Matlab在画图的时候，采用title函数可以增加标题，该函数的输入是一个字符串，有时候我们想在字符串中添加一些变量&#x…...

编程日记 2023/9/15 3:53:12

Spring MVC 八 - 内置过滤器

SpringMVC内置如下过滤器： Form DataForwarded HeadersShallow ETagCORS Form Data 浏览器可以通过HTTP GET或HTTP POST提交form data（表单数据），但是非浏览器客户端可以通过HTTP PUT、HTTP DELETE、HTTP PATCH提交表单数据。但…...

编程日记 2023/9/15 3:50:09

@Change监听事件与vue监听属性：watch的区别？

change 和 watch 是 Vue 中用于处理数据变化的两种不同方式。 1. change: - change 是一个事件监听器，用于监听特定DOM元素的变化事件，通常用于表单元素（如输入框、下拉框等）的值变化。 - 它在用户与表单元素交互并提交了变化时触…...

编程日记 2023/9/15 3:47:06

C++面试记录之中望软件

上次面试体验不好，记录了，这次同样记录一次体验不好的面试，中望软件…直接写了名字，因为真的很无语😓 记录一下我不知道的问题忘记录音了😢 1. main函数之前做了什么？ 我：实话我…...

编程日记 2023/9/15 3:45:04

多功能翻译工具：全球翻译、润色和摘要生成 | 开源日报 0914

openai-translator/openai-translator Stars: 18.1k License: AGPL-3.0 这个项目是一个多功能翻译工具，由 OpenAI 提供支持。可以进行全球单词翻译、单词润色和摘要生成等操作提供三种模式：翻译、润色和摘要支持 55 种不同语言的互相转换支持流模式允…...

编程日记 2023/9/15 3:42:01

在 Vue.js 中，使用 watch 监听data变量如：对象属性/data变量

watch 监听对象属性在 Vue.js 中，使用 watch 监听对象属性的变化时，应该将属性名作为字符串传递给 watch 选项。示例如下： javascript watch: {addform.isCheck1: function(newValue) {console.log(newValue);var quantity this.addform…...

编程日记 2023/9/15 3:40:59

vue中预览xml并高亮显示

项目中有需要将接口返回的数据流显示出来，并高亮显示； 1.后端接口返回blob,类型为xml,如图 2.页面中使用pre code标签： <pre v-if"showXML"><code class"language-xml">{{xml}}</code></pre> …...

编程日记 2023/9/15 3:38:57

MFC中嵌入显示opencv窗口

在MFC窗体中建立一个Picture Control控件，用于显示opencv窗口在属性中设置图片控件的资源ID为IDC_PIC1 主要的思路：使用GetWindowRect可以获取图片控件的区域使用cv::resizeWindow可以设置opencv窗口的大小，适合图片控件的大小使用cvGetWindowHandle函数可以获取到ope…...

编程日记 2023/9/15 3:37:56

金鸣识别网页版：轻松实现表格识别的神器

来百度APP畅享高清图片金鸣识别网页版是一款功能强大的在线识别工具，它可对图片或PDF中的表格文本内容进行识别，还支持各种证票的结构化识别。以下是以表格识别为例，对金鸣识别网页版的操作说明进行详细介绍： 首先，打…...

编程日记 2023/9/15 3:34:53

DasViewer可以设置打开指定文件吗？

答：会员可以。工具里面选择坐标转换，输入源数据，设置好源坐标和目标坐标以及路径。根据两张坐标系的性质选择转换方式。 DasViewer是由大势智慧自主研发的免费的实景三维模型浏览器,采用多细节层次模型逐步自适应加载技术,让用户在极低的电脑…...

编程日记 2023/9/15 3:32:50

uniapp微信小程序用户隐私保护指引弹窗组件

<template><view v-if"showPrivacy" :class"privacyClass"><view :class"contentClass"><view class"title">用户隐私保护指引</view><view class"des">感谢您选择使用我们的小程序&am…...

编程日记 2023/9/15 3:31:50

Java的反射应用(Method和Class)

记录：473 场景：使用java.lang.reflect.Method和java.lang.Class类，根据Java反射原理实现使用指定字符串类名和方法名称，调用对应对象和对应方法。版本：JDK 1.8。 1.使用Java反射调用指定类的指定方法 (1)参数说明…...

编程日记 2023/9/15 3:29:47

Java之泛型系列--Class使用泛型的方法(有示例)

原文网址：Java之泛型系列--Class使用泛型的方法(有示例)_IT利刃出鞘的博客-CSDN博客简介本文用示例介绍Java在方法前加泛型的使用。类类型的写法对象所对应的类的泛型写法 Class classAClass<T> classAClass<?> classB Class与Class<?&g…...

编程日记 2023/9/15 3:27:44

【【无用的知识之串口学习】】

无用的知识之串口学习 USART串口协议 •通信的目的：将一个设备的数据传送到另一个设备，扩展硬件系统 •通信协议：制定通信的规则，通信双方按照协议规则进行数据收发就是我们并不能在芯片上设计完全部的一下子完成所有的设计&am…...

编程日记 2023/9/15 3:26:43

9月13日上课内容第三章 ELK日志分析系统

本章结构 ELK日志分析系统简介 ELK日志分析系统分为 Elasticsearch Logstash Kibana 日志处理步骤 1.将日志进行集中化管理 2.将日志格式化(Logstash) 并输出到Elasticsearch 3.对格式化后的数据进行索引和存储 (Elasticsearch) 4.前端数据的展示(Kibana) Elasticsearch介…...

编程日记 2023/9/15 3:25:42

不知道有用没用的Api

encodeURIComponent(https://www.baidu.com/?name啊啊啊) decodeURIComponent(https%3A%2F%2Fwww.baidu.com%2F%3Fname%3D%E5%95%8A%E5%95%8A%E5%95%8A) encodeURI(https://www.baidu.com/?name啊啊啊) decodeURI(https://www.baidu.com/?name%E5%95%8A%E5%95%8A%E5%95%8A) …...

编程日记 2023/9/15 3:23:40