当前位置: 首页 > news >正文

为什么我们要使用向量化运算

问题背景

如果你是matlab用户,你一般都会使用向量化运算进行编程。原因也许很简单,因为matlab针对向量化运算在底层做了深度优化,尤其是针对矩阵乘法调用了MKL之类的高度优化的第三库来加速。所以我们在推演算法的阶段,尽量的以向量化,矩阵化,张量化的数学语言来描述算法,不仅仅是描述问题变得简单,更重要的是实现起来也比较容易。事实上还有另外一个原因,和代码本身是否经过深度优化无关。

问题分析

我们知道,程序代码运行的时间不仅仅和算法的计算复杂度有关,还和内存读写有莫大的关系。我们把它们表示为两部分t_1t2,如果你的软件系统有m次的内存读写,每次读写内存的平均时间为t_m;还有n次在执行真正的计算,每一次实施计算的平均时间为t_c,则有:

\begin{aligned} T_{total\_time} &= t_1 + t_2\\ &= m \,t_m+ n \,t_c\\ &=n\,t_c(1 + \frac{m}{n} \cdot \frac{t_m}{t_c})\\ &=n\,t_c(1 + \frac{1}{q} \cdot \frac{t_m}{t_c})\\ \qquad \text{ where } q &= \frac{n}{m} \end{aligned}

表示平均每读/写一次数据可以实施计算的次数,显然 q 这个值越大,该项任务的执行效率就越高。

常见向量化运算的q值

我们直接给出一个表格吧:

\begin{array}{|c|l|c|c|} \hline & n & m & q \\ \hline y=y+\alpha \, x & 2 N & 3N + 1 & 2/3 \\ \hline y = y + A x & 2N^2 & N^2+3N & 2 \\ \hline C = C + AB & 2N^3 & 4N^2 & N/2\\ \hline \end{array}

这里假设向量或矩阵的维度为N,我们发现只有矩阵乘法的q值和N有关,其它两种运算都是一个常数,其中标量乘法的运算效率是最低的。

结论

算法的实施采用矩阵语言描述不仅能使算法本身言简意赅,在真正实施计算的时候也是效率最高的,和是否使用了最优化的代码本身没有任何关系。

相关文章:

为什么我们要使用向量化运算

问题背景 如果你是matlab用户,你一般都会使用向量化运算进行编程。原因也许很简单,因为matlab针对向量化运算在底层做了深度优化,尤其是针对矩阵乘法调用了MKL之类的高度优化的第三库来加速。所以我们在推演算法的阶段,尽量的以向…...

Makefile零基础教学(一)初识makefile

从这篇文章开始就开始进入 Makefile 的零基础教程,相信只要看了本教程的都可以对 Makefile 有一个清晰的理解和正确的运用。那么现在就开始我们的 Makefile 学习之路。 文章目录 一、什么是 Makefile,优点?二、什么是 make, 为什么使用make?…...

如何使用SpringMVC之常用注解

❣️关注专栏:JavaEE Spring MVC ⌛️ 1. Spring MVC 创建和连接⌛️ 1.1 RequestMapping⌛️ 1.2 GetMapping⌛️ 1.3 PostMapping ⌛️ 2. 获取参数⌛️ 2.1 传递/获取单个参数⌛️ 2.2 传递/获取多个参数⌛️ 2.3 传递/获取对象⌛️ 2.4 参数重命名⌛️ 2.4.1 …...

Vue3的axios请求封装,请求拦截,相应拦截

对于三者放在Service.js中封装,方便使用 axios.create 的作用是创建一个新的 axios 实例,该实例可以具有自定义配置。通过使用 axios.create,您可以为任何 API 生成一个客户端,并在使用同一客户端的任何调用中重复使用相同的配置…...

ZC706P试验PL_DDR3内存条的步骤方法

ZC706P 板卡完全兼容XILINX官方的ZC706,当然也支持PL外挂的1G的DDR3内存条,这个片BLOG我提供从官方下载的一个文档和一个项目,演示一下验证DDR3的步骤。 步骤1:准备好板子,安装好软件。 链接:https://pan.baidu.com/s…...

通达信W底形态选股公式,也称双底形态

W底形态,也称双底形态,是一种经典的技术分析形态,代表了跌势的逆转。看起来像字母 "W",描述了一波下跌,反弹,再次下跌到与上一波下跌相同或相近的位置,最后是另一波反弹。W底形态两次…...

java语言与算法、数据结构的用法

Java语言是一种广泛使用的计算机编程语言,也是开发各种软件和操作系统的重要工具之一。除了具有高效性和可移植性之外,Java语言还具有丰富的算法和数据结构支持,可以帮助程序员轻松地解决各种问题。 算法和数据结构是计算机科学中的两个基本…...

中国社科院与美国杜兰大学金融管理硕士项目,引领你走在金融行业前沿

作为金融领域从业人员时刻都在关注行业最新资讯,只有掌握一手的前沿讯息,才能在职场上无往不胜。针对在职的你,如何利用业余时间让自己更增值呢,中国社科院与美国杜兰大学金融管理硕士项目引领你走在金融行业前沿。 金融管理硕士…...

第三十五章 Unity人形动画(下)

本章内容主要就是动画数据的独立文件使用方式。有了独立的动画文件,我们就可以将其应用到其他模型上面了。最简单的方式就是,我们可以给其他模型编辑动画控制器的时候,使用这些动画文件。Unity则给我们提供了更加高级的共享方式,就…...

vue导入导出excel、设置单元格背景色、文字居中、合并单元格、设置列宽(使用xlsx库和xlsx-style库)

xlsx xlsx是由SheetJS开发的一个处理excel文件的npm库 适用于前端开发者实现导入导出excel文件的经典需求 为了区别于xlsx文件,突出其应用语言,该库通常又被称为js-xlsx 导出js数据为Excel文件 需要以下步骤: 安装 xlsx 库 你可以使用 …...

java 线程池

线程池 是 一个 容器,其中管理着多个线程(预先创建并维护一定数量的线程),当有一个任务a需要一个线程去完成时,从容器(线程池)中获取一个线程A去执行任务a,当线程A完成任务a后,线程A…...

音频焦点使用及原理

音频焦点使用及原理 本博客代码基于Android 10源码 为什么会有音频焦点这一概念? 在Android音频领域中,应用层所有的App播放音频,最终都是走到音频回播线程PlaybackThread中,如果多个App都走到同一个PlaybackThread中去&#xff0…...

PyQt5桌面应用开发(8):从QInputDialog转进到函数参数传递

本文目录 PyQt5桌面应用系列How old are you, Dialog?QInputDialog minimalistwhy not lambdaand how partial worksSummary PyQt5桌面应用系列 PyQt5桌面应用开发(1):需求分析 PyQt5桌面应用开发(2):事件…...

2.0 Vue框架设计的核心要素

本章主要讲解,一个好的框架在构建的时候,需要考虑到的要素,包含报错信息反馈、警告信息反馈、减少打包体积、良好的输出、特性开关(兼容)等 1、提升用户开发体验 提升用户开发体验主要体现在用户使用框架进行开发时&…...

“智慧赋能 强链塑链”——精细化工行业仓储物流数字化转型探讨

精细化工行业作为衡量国家化学工业水平高低的重要标志,为国民经济提供重要的终端产品支持,相比较大化工产品,精细化工产品需要高度专业技能和工艺,其生产过程需要复杂的化学反应,以及严格的控制条件,产出的…...

用DG备库做的rman备份恢复一个数据库

环境描述: 1.因为主库存储空间不足,于是将备份放在dg备库上做。 2.主库因为磁盘空间问题,数据文件有两个目录。 3.dg备库因为主库两个数据文件目录里面有两个同名数据文件,所有dg备库也有两个数据文件目录。 4.主库与备库与测…...

JAVA中的IO操作有哪些?

在Java编程语言中,输入/输出(IO)操作是很重要的部分,它允许程序从外部系统读取数据,或将数据输出到外部系统。Java提供了一组强大的IO类库,可以让开发人员方便地进行各种IO操作。 Java中的IO操作可以分为两…...

10:00面试,10:04就出来了 ,问的实在是太...

从外包出来,没想到竟然死在了另一家厂子 自从加入这家公司,每天都在加班,钱倒是给的不少,所以我也就忍了。没想到12月一纸通知,所有人都不许加班,薪资直降30%,顿时有吃不起饭的赶脚。 好在有个…...

wangzherongyao PMO

感谢【五一节】大家的相遇,总结下。 2023年05月02日,【第一组】组队开黑 我总结了下这天为什么打的那么好,首先赛季初段位在王者附近,大家心态重视程度也高,不轻敌,也不盲目,运营好兵线一步一步…...

Dart语法上

一、Dart介绍及环境 1.1 Dart介绍: Dart是由谷歌开发的计算机编程语言,它可以被用于web、服务器、移动应用 和物联网等领域的开发。Dart诞生于2011年,号称要取代JavaScript。但是过去的几年中一直不温不火。直到Flutter的出现现在被人们重新重视。 要学…...

微信聊天记录永久保存终极指南:用WeChatMsg轻松掌控你的数字记忆

微信聊天记录永久保存终极指南:用WeChatMsg轻松掌控你的数字记忆 【免费下载链接】WeChatMsg 提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/GitHub_Trendin…...

告别PWM!用STM32串口轻松驱动幻尔16路舵机控制板(附完整代码)

STM32串口驱动幻尔16路舵机控制板的实战指南 从PWM到串口:舵机控制的技术演进 记得我第一次尝试用STM32控制机械臂时,光是配置PWM定时器就花了两天时间。每个舵机需要独立的PWM通道,复杂的定时器分频计算,还有那令人头疼的占空比换…...

Fish-Speech-1.5零样本语音克隆:10秒音频实现高质量语音合成

Fish-Speech-1.5零样本语音克隆:10秒音频实现高质量语音合成 1. 引言 你有没有想过,只需要10秒钟的录音,就能让AI学会你的声音,然后用你的声音说出任何你想说的话?这听起来像是科幻电影里的情节,但现在真…...

别再到处找瓦片服务地址了!手把手教你用OpenLayers 7.x集成天地图和高德地图(附完整代码)

OpenLayers 7.x实战:深度解析天地图与高德地图集成方案 第一次接触地图开发时,最让我头疼的不是写代码,而是找不到正确的瓦片服务地址。那些看似简单的URL背后,藏着各种参数玄机——为什么别人的地图能正常显示中文标注&#xff1…...

Cursor AI终极破解:免费解锁Pro功能的完整实战指南

Cursor AI终极破解:免费解锁Pro功能的完整实战指南 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached your trial …...

S2-Pro代码解释器效果展示:理解并调试复杂C语言程序

S2-Pro代码解释器效果展示:理解并调试复杂C语言程序 1. 效果亮点开场 最近在测试S2-Pro的代码解释能力时,遇到了一段让我印象深刻的C语言代码。这段代码涉及指针操作、动态内存分配和复杂逻辑判断,即使是经验丰富的开发者也需要花些时间才能…...

OpenClaw语音交互方案:Qwen3.5-9B对接Whisper实现语音指令控制

OpenClaw语音交互方案:Qwen3.5-9B对接Whisper实现语音指令控制 1. 为什么需要语音交互能力? 上周我在整理电脑文件时突然想到:既然OpenClaw能模拟人类操作电脑,为什么不给它加上耳朵呢?这个想法源于我经常双手沾满咖…...

Qwen-Image-2512-Pixel-Art-LoRA 持续集成:使用GitHub Actions自动化测试模型部署更新

Qwen-Image-2512-Pixel-Art-LoRA 持续集成:使用GitHub Actions自动化测试模型部署更新 最近在折腾一个像素艺术风格的AI图像生成项目,核心是那个Qwen-Image-2512-Pixel-Art-LoRA模型。每次更新模型权重或者调整一下推理服务的配置,都得手动重…...

初学者如何自学SEO优化

初学者如何自学SEO优化 在当今互联网时代,搜索引擎优化(SEO)已经成为了网站推广的核心手段。对于初学者来说,如何自学SEO优化可能看起来有些复杂,但只要掌握几个关键点,就能迅速上手。本文将带你深入了解如…...

Ollama+GPT-OSS-20B黄金组合:无需网络,随时可用的智能助手

OllamaGPT-OSS-20B黄金组合:无需网络,随时可用的智能助手 1. 为什么需要本地化AI助手 在当今AI技术快速发展的时代,云端AI服务虽然方便,但也存在诸多限制:网络依赖、隐私担忧、API费用高昂、响应延迟等问题。对于需要…...