“东方杯”英特尔oneAPI黑客松大赛—参赛经验分享
目录
- 前言
- 1、大赛要求
- 2、oneMKL介绍
- 3、准备
- oneMKL基本使用
- 1、下载:
- 2、安装:
- 3、初始化oneMKL环境:
- 4、编译代码
- 5、运行
- 所需的头文件
- 使用oneMKL工具生成随机数
- 使用fftw3计算FFT
- 调用oneMKL API加速计算FFT
- 对比两种方法的准确性
- 输出结果
- 结束语
前言
1、大赛要求
本次比赛为命题形式,题目要求如下:
- 使用oneMKl工具生成2048*2048随机单精度实数
- 使用FFT算法实现实数到复数的快速傅里叶变换
- 使用oneMKL加速计算实数到复数的快速傅里叶变换
- 对比上面两种快速傅里叶变换的精度、性能
2、oneMKL介绍
oneMKL(oneAPI Math Kernel Library)是oneAPI包含的一种数学工具,能对各种数据工程问题实现加速与优化。
oneAPI官网:oneAPI
oneMKL官网:oneMKL
oenMKL对C语言的API文档:oneMKL—C语言参考文档
3、准备
- Ubuntu系统
- C++基础
- oneMKL
由于题目比较简单,不需要很复杂的编译方法,上手简单。使用onelMKL工具的话,你的电脑的CPU最好是intel的。而且推荐使用linux系统,加速效果明显。
oneMKL基本使用
oneMKL下载网址:oneMKL下载
注意要使用离线版本安装,如果你使用的是为window的话,使用在线版本的方式安装。
1、下载:
一定要注意下载的是oneMKl_baseKit,不能仅仅下载MKL工具包
wget https://registrationcenter-download.intel.com/akdlm/IRC_NAS/992857b9-624c-45de-9701-f6445d845359/l_BaseKit_p_2023.2.0.49397_offline.sh
2、安装:
sudo sh ./l_BaseKit_p_2023.2.0.49397_offline.sh
默认安装目录:/opt/intel/oneapi
3、初始化oneMKL环境:
source /opt/intel/oneapi/setvars.sh
可以将这条命令放到~/bashrc文件内并激活,这样不用每次启动一个终端都初始化了。
4、编译代码
icpx -qmkl my.cpp -o my.out
注意其中的-qmkl是比较方便的也是不容易出错的动态库链接参数,它是把关于oneMKL的所有动态库都链上了,懒人必备。
5、运行
./my.out
直接把编译好的运行就可。
所需的头文件
#include <chrono> // 计算程序运行时间
#include <iostream>
#include <stdio.h>
#include <math.h>
#include <mkl.h> // onemkl工具包
#include "fftw3.h" // fftw3,onemkl自带,使用fftw3来对比经过oneMKL加速过的fft
using namespace std;
使用oneMKL工具生成随机数
#define ROW 2048
#define COL 2048
float *data = (float *)malloc((ROW * COL) * sizeof(float));
VSLStreamStatePtr stream;
vslNewStream(&stream, VSL_BRNG_MT19937, 42); // 42是随机数种子
vsRngUniform(VSL_RNG_METHOD_UNIFORM_STD, stream, ROW * COL, data, 0.0f, 1.0f); // 生成0到1之间的随机数
vslDeleteStream(&stream);
使用fftw3计算FFT
void fftw3(float *data, MKL_Complex8 *x)
{fftwf_plan r2c;r2c = fftwf_plan_dft_r2c_2d(ROW, COL, data, (fftwf_complex *)x, FFTW_ESTIMATE);fftwf_execute(r2c);fftwf_destroy_plan(r2c);
}
// 开辟内存空间,存储普通FFT计算的结果
MKL_Complex8 *x = (MKL_Complex8 *)malloc(ROW * (COL / 2 + 1) * 2 * sizeof(float));
fftw3(data, x);
注意给x开的空间是:ROW * (COL / 2 + 1) * 2 * sizeof(float)
,
调用oneMKL API加速计算FFT
void r2c_oneMKL(float *data, MKL_Complex8 *y)
{MKL_LONG status;MKL_LONG dim_sizes[2] = {ROW, COL};DFTI_DESCRIPTOR_HANDLE handle;status = DftiCreateDescriptor(&handle, DFTI_SINGLE, DFTI_REAL, 2, dim_sizes);status = DftiSetValue(handle, DFTI_PLACEMENT, DFTI_NOT_INPLACE); // 不覆盖datastatus = DftiSetValue(handle, DFTI_CONJUGATE_EVEN_STORAGE, DFTI_COMPLEX_COMPLEX);status = DftiCommitDescriptor(handle);status = DftiComputeForward(handle, data, y);DftiFreeDescriptor(&handle);
}
// 开辟空间,存储oneMKL API FFT计算的结果
MKL_Complex8 *y = (MKL_Complex8 *)malloc(ROW * COL * 2 * sizeof(float));
r2c_oneMKL(data, y);
注意,要多给y多开点内存空间,乘以2是因为有实部和虚部
对比两种方法的准确性
对比的时候要对比实部和虚部
void compare_results(MKL_Complex8 *x, MKL_Complex8 *y)
{bool is_same=true;// 实部对比for (int i = 0; i < ROW; i++){for (int j = 0; j < (COL / 2 + 1); j++){// cout << x[i*(ROW/2+1)+j].real<< " ";// cout << y[i*(COL)+j].real<< " ";// 实部一个一个比较:if (x[i * (COL / 2 + 1) + j].real - y[i * (COL) + j].real > 1e-6){is_same=false;break;}}}if (is_same){cout<<"实部:"<<"结果正确"<<endl;}else{cout<<"实部:"<<"结果不正确"<<endl;}// 虚部对比is_same=true;for (int i = 0; i < ROW; i++){for (int j = 0; j < (COL / 2 + 1); j++){// 虚部一个一个比较:if (x[i * (COL / 2 + 1) + j].imag - y[i * (COL) + j].imag > 1e-6){is_same=false;break;}}}if (is_same){cout<<"虚部:"<<"结果正确"<<endl;}else{cout<<"虚部:"<<"结果不正确"<<endl;}
}
输出结果
结束语
本次大赛的题目比较基础,对非计算机专业的工科生很友好。本人是地质专业,由于要经常进行地震数据处理、地震数据解释等,对傅里叶变换的需要也很大,oneMKl工具计算速度快,对大型地震数据的复杂计算有着不可替代的性能优势。
相关文章:

“东方杯”英特尔oneAPI黑客松大赛—参赛经验分享
目录 前言1、大赛要求2、oneMKL介绍3、准备 oneMKL基本使用1、下载:2、安装:3、初始化oneMKL环境:4、编译代码5、运行 所需的头文件使用oneMKL工具生成随机数使用fftw3计算FFT调用oneMKL API加速计算FFT对比两种方法的准确性输出结果结束语 前…...

win10家庭版远程桌面补丁_rdp wrapper
RDP Wrapper Library 就是可以帮你在 Windows 7、Windows 8、Windows 10 家庭版中打开远程桌面的工具。 1、把电脑上打开的安全软件与杀毒软件都关掉,因为这个远程桌面补丁会修改系统文件,所以安全软件可能会拦截。 2、下载RDP Wrapper Library补丁压缩…...
【C++设计模式】开放-封闭原则
2023年8月27日,周日下午 我觉得我的这篇博客还是写得很不错的,哈哈哈。 目录 概述举例说明用开放-封闭原则重构 概述 开放-封闭原则(Open-Closed Principle,OCP)是面向对象设计中的一个重要原则,也是许多…...

vue+file-saver+xlsx+htmlToPdf+jspdf实现本地导出PDF和Excel
页面效果如下(echarts图表按需添加,以下代码中没有) 1、安装插件 npm install xlsx --save npm install file-saver --save npm install html2canvas --save npm install jspdf --save2、main.js引入html2canvas import htmlToPdf from …...

axios 进阶
axios 进阶 接口传参方式 使用 xhr 原生技术或者是 axios 时,它的 post 传参方式是键值对的形式 keyvalue。但是在实际开发中一般是使用对象的形式定义数据,方便读取和赋值。所以当我们需要发起请求时可以通过 qs 这一款插件将对象转成键值对形式&…...

Redis限流实践:实现用户消息推送每天最多通知2次的功能
🏆作者简介,黑夜开发者,CSDN领军人物,全栈领域优质创作者✌,CSDN博客专家,阿里云社区专家博主,2023年6月CSDN上海赛道top4。 🏆数年电商行业从业经验,历任核心研发工程师…...
uniapp 存储base64资源为http链接图片
1. 新建一个base64.js 文件 const fsm wx.getFileSystemManager(); // base64data base64资源 // name 文件名 function base64src(base64data, name, cb) {const time new Date().getTime();const filePath ${wx.env.USER_DATA_PATH}/${name}.${time}.png;const buffer …...
列表类控件虚拟化
WPF列表控件提供的最重要的功能是UI虚拟化(WPF编程宝典说的)。所有的WPF列表控件(所有继承自ItemsControl的控件,包括ListBox、CombBox、ListView、TreeView、DataGrid)都支持UI虚拟化。 UI虚拟化的支持实际上没有被构…...
c# 多线程Task.Run 取消正在执行的多线程
c# 异步处理,上次处理没有完成,下次有紧接着处理多线程出错 在 C# 中进行异步处理时,确保处理上一个任务完成后再处理下一个任务是很重要的,特别是在涉及多线程的情况下。如果上一个任务尚未完成,而下一个任务又开始执…...
sql server 如何设置主键
开始之前 限制和局限 一个表只能包含一个 PRIMARY KEY 约束。 在 PRIMARY KEY 约束中定义的所有列都必须定义为 NOT NULL。 如果没有指定为 Null 性,则加入 PRIMARY KEY 约束的所有列的为 Null 性都将设置为 NOT NULL。 创建主键会自动创建相应的唯一群集索引、…...

【LeetCode-中等题】19. 删除链表的倒数第 N 个结点
文章目录 题目方法一:节点加入集合找索引方法二:直接计算长度,然后找出要删除的节点的前一个节点方法三:栈方法四:前后双指针 题目 这题的关键在与两个点 一定要设置一个哑结点,防止删除第一个元素时,导致空…...

Matlab图像处理-减法运算
减法运算 图像减法也称为差分方法,是一种常用于检测图像变化及运动物体的图像处理方法。常用来检测一系列相同场景图像的差异,其主要的应用在于检测同一场景下两幅图像之间的变化或是混合图像的分离。 差影法 将同一景物在不同时问拍摄的图像或同一景…...

stm32之11.USART串口通信
可以添加上拉电阻,但会增加功耗,传输距离变长 要添加库函数USART 官方参考文档说明书位置 ALT+左键可实现整体删除(如下图) 输出模式第三种模式AF ---------------------- 源码 远程控制pc端 #include <stm32f4x…...

Python实现T检验
今天来分享一下T检验的python实现方法。 01 先来上一波概念。 1.单样本t检验,又称单样本均数t检验,适用于来自正态分布的某个样本均数与已知总体均数的比较,其比较目的是检验样本均数所代表的总体均数是否与已知总体均数有差别。已知总体均数…...

校招算法题实在不会做,有没有关系?
文章目录 前言一、校招二、时间复杂度1、单层循环2、双层循环 三、空间复杂度四、数据结构五、校招算法题实在不会做,有没有关系?六、英雄算法集训 前言 英雄算法联盟八月集训 已经接近尾声,九月算法集训将于 09月01日 正式开始,目…...

Michael.W基于Foundry精读Openzeppelin第32期——SignatureChecker.sol
Michael.W基于Foundry精读Openzeppelin第32期——SignatureChecker.sol 0. 版本0.1 SignatureChecker.sol 1. 目标合约2. 代码精读2.1 isValidSignatureNow(address signer, bytes32 hash, bytes memory signature) 0. 版本 [openzeppelin]:v4.8.3,[for…...

如何修改字符串内容?
⭐ 作者:小胡_不糊涂 🌱 作者主页:小胡_不糊涂的个人主页 📀 收录专栏:浅谈Java 💖 持续更文,关注博主少走弯路,谢谢大家支持 💖 String 1. 修改字符串2. StringBuilder和…...

pgadmin4中的备份与恢复
一,postgresql 数据的备份与恢复 (一)数据库备份与恢复 1,备份 windows环境 1> dump 逻辑备份 1,用管理员身份打开power shell 2,切换到本机 postgresql 安装目录下的 bin 目录: PS C…...

内网穿透——搭建私人影音媒体平台
文章目录 1. 前言2. Jellyfin服务网站搭建2.1. Jellyfin下载和安装2.2. Jellyfin网页测试 3.本地网页发布3.1 cpolar的安装和注册3.2 Cpolar云端设置3.3 Cpolar本地设置 4.公网访问测试5. 结语 1. 前言 随着移动智能设备的普及,各种各样的使用需求也被开发出来&…...
使用psql操作PostgreSQL数据库
postgresql的操作和mysql差别较大。。 可以使用 psql 命令行工具或者其他的 PostgreSQL 客户端工具来查看表。如下是使用 psql 命令行工具查看表的方法: 连接到 PostgreSQL 数据库: 如果一个PostgreSQL的连接为 postgresql://用户名:密码127.0.0.1:5432/…...
web vue 项目 Docker化部署
Web 项目 Docker 化部署详细教程 目录 Web 项目 Docker 化部署概述Dockerfile 详解 构建阶段生产阶段 构建和运行 Docker 镜像 1. Web 项目 Docker 化部署概述 Docker 化部署的主要步骤分为以下几个阶段: 构建阶段(Build Stage):…...

深入剖析AI大模型:大模型时代的 Prompt 工程全解析
今天聊的内容,我认为是AI开发里面非常重要的内容。它在AI开发里无处不在,当你对 AI 助手说 "用李白的风格写一首关于人工智能的诗",或者让翻译模型 "将这段合同翻译成商务日语" 时,输入的这句话就是 Prompt。…...

调用支付宝接口响应40004 SYSTEM_ERROR问题排查
在对接支付宝API的时候,遇到了一些问题,记录一下排查过程。 Body:{"datadigital_fincloud_generalsaas_face_certify_initialize_response":{"msg":"Business Failed","code":"40004","sub_msg…...

《Qt C++ 与 OpenCV:解锁视频播放程序设计的奥秘》
引言:探索视频播放程序设计之旅 在当今数字化时代,多媒体应用已渗透到我们生活的方方面面,从日常的视频娱乐到专业的视频监控、视频会议系统,视频播放程序作为多媒体应用的核心组成部分,扮演着至关重要的角色。无论是在个人电脑、移动设备还是智能电视等平台上,用户都期望…...

React第五十七节 Router中RouterProvider使用详解及注意事项
前言 在 React Router v6.4 中,RouterProvider 是一个核心组件,用于提供基于数据路由(data routers)的新型路由方案。 它替代了传统的 <BrowserRouter>,支持更强大的数据加载和操作功能(如 loader 和…...

家政维修平台实战20:权限设计
目录 1 获取工人信息2 搭建工人入口3 权限判断总结 目前我们已经搭建好了基础的用户体系,主要是分成几个表,用户表我们是记录用户的基础信息,包括手机、昵称、头像。而工人和员工各有各的表。那么就有一个问题,不同的角色…...

【SQL学习笔记1】增删改查+多表连接全解析(内附SQL免费在线练习工具)
可以使用Sqliteviz这个网站免费编写sql语句,它能够让用户直接在浏览器内练习SQL的语法,不需要安装任何软件。 链接如下: sqliteviz 注意: 在转写SQL语法时,关键字之间有一个特定的顺序,这个顺序会影响到…...

srs linux
下载编译运行 git clone https:///ossrs/srs.git ./configure --h265on make 编译完成后即可启动SRS # 启动 ./objs/srs -c conf/srs.conf # 查看日志 tail -n 30 -f ./objs/srs.log 开放端口 默认RTMP接收推流端口是1935,SRS管理页面端口是8080,可…...
GitHub 趋势日报 (2025年06月08日)
📊 由 TrendForge 系统生成 | 🌐 https://trendforge.devlive.org/ 🌐 本日报中的项目描述已自动翻译为中文 📈 今日获星趋势图 今日获星趋势图 884 cognee 566 dify 414 HumanSystemOptimization 414 omni-tools 321 note-gen …...
今日科技热点速览
🔥 今日科技热点速览 🎮 任天堂Switch 2 正式发售 任天堂新一代游戏主机 Switch 2 今日正式上线发售,主打更强图形性能与沉浸式体验,支持多模态交互,受到全球玩家热捧 。 🤖 人工智能持续突破 DeepSeek-R1&…...