windows C++-有效使用PPL(五)
如果可能,避免错误共享
当在不同处理器上运行的多个并发任务写入位于同一高速缓存行上的变量时,会发生错误共享。 当一个任务写入一个变量时,这两个变量的缓存行将会失效。 每当缓存行失效时,每个处理器必须重新加载缓存行。 因此,错误共享会导致应用程序中的性能降低。
以下基本示例介绍了两个并发任务,每个任务都增加了共享的计数器变量。
volatile long count = 0L;
concurrency::parallel_invoke([&count] {for(int i = 0; i < 100000000; ++i)InterlockedIncrement(&count);},[&count] {for(int i = 0; i < 100000000; ++i)InterlockedIncrement(&count);}
);
若要消除两个任务间的数据共享,可修改该示例以使用两个计数器变量。 任务完成后,此示例将计算最终的计数器值。 但此示例还说明了错误共享,因为变量 count1 和 count2 可能位于同一缓存行。
long count1 = 0L;
long count2 = 0L;
concurrency::parallel_invoke([&count1] {for(int i = 0; i < 100000000; ++i)++count1;},[&count2] {for(int i = 0; i < 100000000; ++i)++count2;}
);
long count = count1 + count2;
消除错误共享的一种方法是确保计数器变量位于不同的缓存行。 下面的示例将对齐 64 字节边界上的 count1 和 count2 变量。
__declspec(align(64)) long count1 = 0L;
__declspec(align(64)) long count2 = 0L;
concurrency::parallel_invoke([&count1] {for(int i = 0; i < 100000000; ++i)++count1;},[&count2] {for(int i = 0; i < 100000000; ++i)++count2;}
);
long count = count1 + count2;
此示例假定内存缓存的大小为 64 个或更少的字节。
当必须在任务之间共享数据时,我们建议使用 concurrency::combinable 类。 combinable 类以不太可能发生错误共享的方式创建线程本地变量。
确保变量在任务的整个生存期内有效
如果向任务组或并行算法提供 Lambda 表达式,capture 子句将指定 Lambda 表达式的主体是否通过值或引用访问封闭范围中的变量。 通过引用将变量传递到 Lambda 表达式时,必须保证该变量的生存期在任务完成之前一直保持。
请看下面的示例,该示例定义了 object 类和 perform_action 函数。 perform_action 函数创建 object 变量,并在该变量中以异步方式执行某项操作。 由于不能保证在 perform_action 函数返回前完成任务,因此,如果 object 变量在任务运行时被销毁,则程序将崩溃或发生未指定的行为。
// lambda-lifetime.cpp
// compile with: /c /EHsc
#include <ppl.h>using namespace concurrency;// A type that performs an action.
class object
{
public:void action() const{// TODO: Details omitted for brevity.}
};// Performs an action asynchronously.
void perform_action(task_group& tasks)
{// Create an object variable and perform some action on // that variable asynchronously.object obj;tasks.run([&obj] {obj.action();});// NOTE: The object variable is destroyed here. The program// will crash or exhibit unspecified behavior if the task// is still running when this function returns.
}
具体取决于应用程序的要求,可使用以下方法之一来保证变量在每项任务的整个生存期保持有效。
下面的示例通过值将 object 变量传入任务。 因此,任务可在自己的变量副本上进行操作。
// Performs an action asynchronously.
void perform_action(task_group& tasks)
{// Create an object variable and perform some action on // that variable asynchronously.object obj;tasks.run([obj] {obj.action();});
}
由于 object 变量通过值进行传递,因此,此变量发生的任何状态更改不会出现在原始副本。
以下示例使用 concurrency::task_group::wait 方法确保在 perform_action 函数返回以前完成任务。
// Performs an action.
void perform_action(task_group& tasks)
{// Create an object variable and perform some action on // that variable.object obj;tasks.run([&obj] {obj.action();});// Wait for the task to finish. tasks.wait();
}
由于函数返回前任务现在完成了,因此,perform_action 函数不再以异步方式进行。
下面的示例修改 perform_action 函数以获取对 object 变量的引用。 调用方必须保证 object 变量的生存期在任务完成前是有效的。
// Performs an action asynchronously.
void perform_action(object& obj, task_group& tasks)
{// Perform some action on the object variable.tasks.run([&obj] {obj.action();});
}
也可使用指针来控制传入任务组或并行算法的对象的生存期。
相关文章:
windows C++-有效使用PPL(五)
如果可能,避免错误共享 当在不同处理器上运行的多个并发任务写入位于同一高速缓存行上的变量时,会发生错误共享。 当一个任务写入一个变量时,这两个变量的缓存行将会失效。 每当缓存行失效时,每个处理器必须重新加载缓存行。 因此…...
【排序】——1.冒泡排序法(含优化)
冒泡排序 1.原理 左边大于右边交换一趟排下来最大的交换到右边来(接下来所以文章用升序举例) 从左到右,相邻元素进行比较。 每次比较一轮,就会找到序列中最大的一个(最小的一个——降序)。这个数就会从序列的最右边冒出来。 以…...
在MySQL中创建数据库和表
在MySQL中,创建数据库和表是数据库管理的基础操作。下面我将详细解释如何先创建一个数据库,然后在该数据库中创建一个或多个表。 ### 1. 创建数据库 首先,你需要登录到MySQL服务器。然后,使用CREATE DATABASE语句来创建一个新的…...
Hadoop 安装教程——单节点模式和分布式模式配置
文章目录 一、预备知识1.1 Hadoop 发行版本1.2 部署方式 二、预备条件2.1 环境准备2.2 创建新用户(可选)2.3 配置 SSH 无密码登录2.4 下载 Hadoop2.5 编辑 hadoop-env.sh 脚本2.6 编辑 dfs 和 yarn 脚本 三、单节点模式部署3.1 官方使用案例3.2 查看运行结果 四、伪分布模式部署…...
给c++小白的教程10:一维数组
好久不见!我又来更教程了。 升到初二,由于学业原因,更新速度减慢了,十分抱歉! 以后将恢复到一周一次的频率 作者只是个普通学生,做的教程多有不足,希望大家批评指正! 赫炎今天在一…...
【排序】3.希尔排序法
希尔排序(直接插入排序的优化) 1.分组思想 上图中gap为5,说明要分成5组。 这5组分别用了五种颜色的线条连接起来了。 第1组:9、4 第2组:1、8 第3组:2、6 第4组:5、3 第5组:7、5 2.缩…...
商品详情数据API接口概述(json数据格式返回参考)
商品详情数据API接口是指一种编程接口(API,Application Programming Interface),它允许开发者或系统以编程方式获取商品的详细信息。这些信息包括但不限于SKU的详细信息、商品图片、商品属性、价格、库存状态、用户评价等。当调用…...
Jmeter简介
基础介绍 Jmeter录制脚本的原始是配置一个HTTP代理,然后浏览器通过这个代理访问测试页面从而完成脚本录制。 一、下载安装 jmeter本身不需要安装,需要配置环境变量JDK,然后打开bin文件夹中的jmeter.vbs即可。建议jdk 1.7及以上版本。 基本祖…...
网页前端开发之HTML入门篇:标题标签 heading
标题标签 heading <h1>-<h6>是HTML的标题标签,其标签内容会呈现六个不同级别的字号, <h1>字号最大,<h6>字号最小。 示例 <html><body><h1>一级标题</h1><h2>二级标题</h2>&l…...
医院信息化与智能化系统(3)
医院信息化与智能化系统(3) 这里只描述对应过程,和可能遇到的问题及解决办法以及对应的参考链接,并不会直接每一步详细配置 如果你想通过文字描述或代码画流程图,可以试试PlantUML,告诉GPT你的文件结构,让他给你对应的…...
数据结构(线性表)
1线性表的定义与操作 1.1线性表的定义 线性表是一种基础的数据结构,其主要特点是:数据元素之间存在一种线性关系(一对一)。线性表的每一个数据元素都有一个唯一的前驱和后继,除了第一个元素没有前驱,最后…...
ArcGIS Pro SDK (十八)栅格
ArcGIS Pro SDK (十八)栅格 环境:Visual Studio 2022 + .NET6 + ArcGIS Pro SDK 3.0 栅格 1 在文件夹中打开栅格数据集 // 使用文件夹路径创建 FileSystemConnectionPath 对象。 FileSystemConnectionPath connectionPath = new FileSystemConnectionPath(new System...
c++ 对象作用域
在 C 中,对象的作用域(scope)指的是对象的生命周期以及对象在程序中可以访问的范围。作用域影响对象的创建、使用和销毁,主要有以下几种类型: 1. 局部作用域(Local Scope) 局部作用域的对象是…...
【无标题】海尔AI英语面试
1.自我介绍 Good morning. I am delighted to have this English interview. My name is fu guilin. I graduated from CDUT with a degree in Information engineering. During my university years, I have laid a solid foundation in my professional knowledge. I posses…...
软件设计模式------概述
一:简述 目的:为了可重用代码,代码更容易被他人理解,提高代码的可靠性。 定义:是一套被反复使用,多数人知晓,经过分类编目的,代码设计经验的总结。 (通俗来说…...
刷题/学习网站推荐
前言: 最近没怎么学习,荒芜生活,学不进去,太累了,就喜欢翻翻网站有没有好用的东西分享给大家,正好看到一些刷题的网站(其实也是学习的网站吧),相比学程序的很多都是力扣…...
OQE-OPTICAL AND QUANTUM ELECTRONICS
文章目录 一、征稿简介二、重要信息三、服务简述四、投稿须知五、联系咨询 一、征稿简介 二、重要信息 期刊官网:https://ais.cn/u/3eEJNv 三、服务简述 四、投稿须知 1.在线投稿:由艾思科蓝支持在线投稿,请将文章全文投稿至艾思科蓝投稿系…...
在 Spring MVC 应用程序中使用 WebMvcTest 注释有什么用处?
大家好,我是锋哥。今天分享关于【在 Spring MVC 应用程序中使用 WebMvcTest 注释有什么用处?】面试题?希望对大家有帮助; 在 Spring MVC 应用程序中使用 WebMvcTest 注释有什么用处? 1000道 互联网大厂Java工程师 精选…...
Chromium html<textarea>c++接口定义
<textarea>:文本区域元素 <textarea> HTML 元素是一个多行纯文本编辑控件,适用于允许用户输入大量自由格式文本的场景。 例子: <!DOCTYPE html> <html> <head> <meta charset"utf-8"> &l…...
OpenCV高级图形用户界面(13)选择图像中的一个矩形区域的函数selectROI()的使用
操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 允许用户在给定的图像上选择一个感兴趣区域(ROI)。 该功能创建一个窗口,并允许用户使用鼠标来选择一个 ROI。…...
工业自动化通信选型指南:为什么HSLCommunication比传统Modbus更适合你的项目?
工业自动化通信协议深度解析:HSLCommunication如何重塑设备互联标准 在工业4.0时代背景下,设备间的实时数据交互已成为智能制造系统的生命线。作为系统架构师,我曾参与多个大型自动化项目,亲眼见证过通信协议选型不当导致的产线瘫…...
基于R语言的自动数据收集:网络抓取和文本挖掘实用指南【1.2】
第2章 HTML在网络上浏览时,我们阅读和操作的几乎所有内容的背后都隐藏着一个标准:超文本标记语言(Hyper Text Markup Language,HTML)。不管是我们在维基百科上查找信息,在Google搜索站点,查看我…...
2024年流浪星球比赛
2024年暑假,我去到河北参加流浪星球比赛现场人很多,调试的人排队很长,不过调试很快60分钟的时间13分钟就弄完了。拿了国一比完赛后,我又去北京爬长城,长城的确难爬,道路已有些坑坑洼洼很多人不讲文明在墙上…...
TranslucentTB终极指南:Windows任务栏透明化专业解决方案
TranslucentTB终极指南:Windows任务栏透明化专业解决方案 【免费下载链接】TranslucentTB A lightweight utility that makes the Windows taskbar translucent/transparent. 项目地址: https://gitcode.com/gh_mirrors/tr/TranslucentTB TranslucentTB是一款…...
SLIC超像素分割实战:从原理到OpenCV代码实现(附完整示例)
SLIC超像素分割实战:从原理到OpenCV代码实现(附完整示例) 在计算机视觉领域,图像分割一直是个基础而关键的课题。想象一下,当你需要让计算机理解一张照片时,直接处理数百万个像素显然效率太低——这就好比…...
从67到89:我是如何用YOLO-MASK清洗COCO羊数据集提升模型精度的
从67到89:YOLO-MASK数据清洗实战与COCO羊数据集优化全记录 去年夏天,当我第一次在COCO羊数据集上训练YOLOv5模型时,那些徘徊在67%左右的mAP数值就像炎热的天气一样令人烦躁。作为一个长期从事计算机视觉项目的工程师,我深知数据质…...
终极PT资源管理工具:auto_feed_js实现100+站点一键转载的高效解决方案
终极PT资源管理工具:auto_feed_js实现100站点一键转载的高效解决方案 【免费下载链接】auto_feed_js PT站一键转载脚本 项目地址: https://gitcode.com/gh_mirrors/au/auto_feed_js 在PT资源分享的世界里,每一位爱好者都曾面临过重复填写资源信息…...
2025新版机器视觉软件开发框架|Halcon+WPF插件源码(含完整算子库)
温馨提示:文末有联系方式2025年度升级版机器视觉软件框架发布 全新适配工业AI检测趋势,本框架为面向实际产线部署优化的轻量级、模块化视觉开发平台,专为自动化检测、定位引导与尺寸测量等场景设计,代码结构清晰,便于二…...
快马平台快速构建gitbash工作流原型:可视化模拟git命令助手
最近在尝试用InsCode(快马)平台快速验证一个Git工作流助手的原型,整个过程意外地顺畅。作为一个经常需要教新人使用Git的开发者,一直想做个可视化工具来降低学习门槛,但传统开发要配环境、写前后端,往往还没开始就放弃了。这次用快…...
实战指南:利用快马平台,无需下载qoderwork即可构建Vue3库存管理系统
最近在做一个库存管理系统的需求,发现很多开发者都在找qoderwork这类代码生成工具。但实际用下来发现,这类工具生成的代码往往需要二次修改,而且下载安装过程也挺麻烦的。后来尝试了InsCode(快马)平台,发现它不仅能直接生成可运行…...
