当前位置：首页 > news >正文

CCF CSP题解：矩阵运算（202305-2）

news 2026/2/10 8:47:55

链接和思路

OJ链接：传送门

本题要求计算1个公式：
$\left(\mathbf{W} \cdot (\mathbf{Q} \times \mathbf{K}^{T})\right) \times \mathbf{V}$
其中， $\mathbf{Q}$ 、 $\mathbf{K}$ 和 $\mathbf{V}$ 均是 $n$ 行 $d$ 列的矩阵， $\mathbf{K}^{T}$ ，表示矩阵 $\mathbf{K}$ 的转置， $\times$ 表示矩阵乘法。 $\cdot$ 为点乘，即对应位相乘，记 $\mathbf{W}^{(i)}$ 为向量 $\mathbf{W}$ 的第 $i$ 个元素，即将 $(\mathbf{Q} \times \mathbf{K}^{T})$ 第 $i$ 行中的每个元素都与 $\mathbf{W}^{(i)}$ 相乘。

本题有2点需要注意，否则只能过70%的样例：

使用int会导致溢出，可使用long long表示数据。
如果按照公式给出的顺序计算，复杂度为 $O(dn^2)$ ，注意到 $n$ 远大于 $d$ ，因此应该修改运算顺序，优化到 $O(d^2n)$ 。

由于注意到矩阵乘法 $\mathbf{A}_{n\times m} \times \mathbf{B}_{m \times k}$ 的复杂度是 $O (nmk)$ ，因此我们尽可能要让 $m$ 更小，于是原式的计算顺序可以改变为：
$\left(\mathbf{W} \cdot (\mathbf{Q} \times \mathbf{K}^{T})\right) \times \mathbf{V} =\mathbf{W} \cdot \left(\mathbf{Q} \times (\mathbf{K}^{T} \times \mathbf{V} ) \right)$
调整矩阵乘法顺序在矩阵乘法计算中是十分常见的，如果是一连串任意给定的矩阵相乘，可以用动态规划的方法得到最优的矩阵运算效率。此外，使用行优先的方式比列优先更能充分利用缓存命中率，这也是优化矩阵乘法效率的一个思路，但是由于已经满分，因此在本题中我们没有继续优化。

AC代码

#include <iostream>
#include <vector>using namespace std;void print_vector(const vector<vector<long long>> &arr) {for (int i = 0; i < arr.size(); i++) {for (int j = 0; j < arr[0].size(); j++) {if (j != 0)cout << " ";cout << arr[i][j];}cout << endl;}
}int main() {int n, d;cin >> n >> d;vector<vector<long long>> q(n), k(n), v(n);vector<long long> w(n);for (int i = 0; i < n; ++i) {q[i].resize(d);for (int j = 0; j < d; ++j) {cin >> q[i][j];}}for (int i = 0; i < n; ++i) {k[i].resize(d);for (int j = 0; j < d; ++j) {cin >> k[i][j];}}for (int i = 0; i < n; ++i) {v[i].resize(d);for (int j = 0; j < d; ++j) {cin >> v[i][j];}}for (int i = 0; i < n; ++i) {cin >> w[i];}//kv: d x dvector<vector<long long>> kv(d);for (int i = 0; i < d; ++i) {kv[i].resize(d);}for (int i = 0; i < d; ++i) {for (int j = 0; j < d; ++j) {for (int l = 0; l < n; ++l) {kv[i][j] += k[l][i] * v[l][j];}}}//qkv: n x dfor (int i = 0; i < n; ++i) {for (int j = 0; j < d; ++j) {k[i][j] = 0;for (int l = 0; l < d; ++l) {k[i][j] += q[i][l] * kv[l][j];
//                printf("k[%d][%d]=%d\n", i, j, k[i][j]);}}}// wqkv: n x dfor (int i = 0; i < n; i++)for (int j = 0; j < d; ++j)k[i][j] *= w[i];print_vector(k);return 0;
}

CCF CSP题解：矩阵运算（202305-2）

链接和思路

AC代码

相关文章：

CCF CSP题解：矩阵运算（202305-2）

划分字母区间【贪心算法】

低代码的探索之路

easyUI combobox不可手动输入和禁用

RV64和ARM64栈结构差异

将 Python 与 RStudio IDE 配合使用（R与Python系列第一篇）

数据库访问性能优化

vue 预览有token验证的 doc、docx、pdf、xlsx、csv、图片并下载

WPF数据视图

C++ new/delete 与 malloc/free 的区别？

【数学建模】常微分，偏微分方程

浙大数据结构之09-排序1 排序

Pydantic 学习随笔

11 mysql float/double/decimal 的数据存储

【高效数据结构——位图bitmap】

ArrayList LinkedList

iOS砸壳系列之三：Frida介绍和使用

Git学习——细节补充

【设计模式】Head First 设计模式——装饰者模式 C++实现

layui实现数据列表的复选框回显

网络编程（Modbus进阶）

Vim 调用外部命令学习笔记

【OSG学习笔记】Day 18: 碰撞检测与物理交互

从零实现富文本编辑器#5-编辑器选区模型的状态结构表达

Qt Widget类解析与代码注释

省略号和可变参数模板

PHP 8.5 即将发布：管道操作符、强力调试

Python网页自动化Selenium中文文档

DiscuzX3.5发帖json api

ThreadLocal 源码