当前位置：首页 > news >正文

windows C++-并行编程-并行算法(五) -选择排序算法

news 2026/5/18 21:03:31

并行模式库 (PPL) 提供了对数据集合并行地执行工作的算法。这些算法类似于 C++ 标准库提供的算法。并行算法由并发运行时中的现有功能组成。

在许多情况下，parallel_sort 会提供速度和内存性能的最佳平衡。但是，当您增加数据集的大小、可用处理器的数量或比较函数的复杂性时，parallel_buffered_sort 或 parallel_radixsort 性能更佳。确定在任何给定方案中使用哪种排序算法的最佳方式是：体验并度量在有代表性计算机配置下对典型数据排序需要多长时间。在选择排序策略时请遵循以下准则。

数据集的大小。在本文档中，小型数据集包含的元素少于 1,000 个，中型数据集包含的元素介于 10,000 和 100,000 个之间，而大型数据集包含的元素多于 100,000 个;
您的比较函数或哈希函数所执行的工作量;
可用计算资源的量;
数据集的特征。例如，一种算法对已完成近似排序的数据可能执行效果很好，但对完全未排序的数据执行效果就不那么好了;
区块的大小。可选的 _Chunk_size 参数将指定算法在将整体排序细分成较小工作单元时何时从并行排序实现切换为串行排序实现。例如，如果提供的是 512，算法会在工作单元包含 512 个或更少元素时切换到串行实现。串行实现可以提高整体性能，因为它消除了并行处理数据所需的开销;

以并行方式对小型数据集排序可能不值得，即使是在您拥有大量的可用计算资源或您的比较函数或哈希函数执行相对大量的工作时。可以使用 std::sort 函数对小型数据集排序。（当你指定的区块大小大于数据集时，parallel_sort 和 parallel_buffered_sort 会调用 sort；但是，parallel_buffered_sort 将必须分配 O(N) 空间，这样会因锁争用或内存分配而花费更多时间。）

如果您必须节省内存或您的内存分配器容易出现锁争用问题，请使用 parallel_sort 对中型数据集排序。 parallel_sort 不需要额外的空间；其他算法需要 O(N) 空间。

当你的应用程序能够满足额外的 O(N) 空间需求时，使用 parallel_buffered_sort 对中型数据集排序。当您拥有大量的计算资源或高开销的比较函数或哈希函数时，parallel_buffered_sort 尤其有用。

当你的应用程序能够满足额外的 O(N) 空间需求时，使用 parallel_radixsort 对大型数据集排序。当等效的比较操作开销较大或两种操作开销都很大时，parallel_radixsort 尤其有用。

好的哈希函数的实现要求你知道数据集范围以及数据集中的每个元素如何转换为对应的无符号值。由于哈希操作会处理无符号值，如果无法生成无符号哈希值，请考虑使用另外的排序策略。

下面的示例针对相同大小的随机数据集对 sort、parallel_sort、parallel_buffered_sort 和 parallel_radixsort 的性能进行比较。

// choosing-parallel-sort.cpp
// compile with: /EHsc
#include <ppl.h>
#include <random>
#include <iostream>
#include <windows.h>using namespace concurrency;
using namespace std;// Calls the provided work function and returns the number of milliseconds 
// that it takes to call that function.
template <class Function>
__int64 time_call(Function&& f)
{__int64 begin = GetTickCount();f();return GetTickCount() - begin;
}const size_t DATASET_SIZE = 10000000;// Create
// Creates the dataset for this example. Each call
// produces the same predefined sequence of random data.
vector<size_t> GetData()
{vector<size_t> data(DATASET_SIZE);generate(begin(data), end(data), mt19937(42));return data;
}int wmain()
{// Use std::sort to sort the data.auto data = GetData();wcout << L"Testing std::sort...";auto elapsed = time_call([&data] { sort(begin(data), end(data)); });wcout << L" took " << elapsed << L" ms." <<endl;// Use concurrency::parallel_sort to sort the data.data = GetData();wcout << L"Testing concurrency::parallel_sort...";elapsed = time_call([&data] { parallel_sort(begin(data), end(data)); });wcout << L" took " << elapsed << L" ms." <<endl;// Use concurrency::parallel_buffered_sort to sort the data.data = GetData();wcout << L"Testing concurrency::parallel_buffered_sort...";elapsed = time_call([&data] { parallel_buffered_sort(begin(data), end(data)); });wcout << L" took " << elapsed << L" ms." <<endl;// Use concurrency::parallel_radixsort to sort the data.data = GetData();wcout << L"Testing concurrency::parallel_radixsort...";elapsed = time_call([&data] { parallel_radixsort(begin(data), end(data)); });wcout << L" took " << elapsed << L" ms." <<endl;
} 
/* Sample output (on a computer that has four cores):Testing std::sort... took 2906 ms.Testing concurrency::parallel_sort... took 2234 ms.Testing concurrency::parallel_buffered_sort... took 1782 ms.Testing concurrency::parallel_radixsort... took 907 ms.
*/

本示例中假设在排序期间分配 O(N) 空间是可以接受的，parallel_radixsort 在此计算机配置下对这个数据集表现得最好。

windows C++-并行编程-并行算法(五) -选择排序算法

相关文章：

windows C++-并行编程-并行算法(五) -选择排序算法

【系统架构设计师-2014年真题】案例分析-答案及详解

windows C++-并行编程-并行算法(三)-分区工作

下载 llama2-7b-hf 全流程【小白踩坑记录】

Codeforces practice C++ 2024/9/11 - 2024/9/13

RabbitMQ创建交换机和队列——配置类注解

proteus+51单片机+AD/DA学习5

【Python机器学习】长短期记忆网络（LSTM）

【Go】使用Goland创建第一个Go项目

STM32学习笔记（一、使用DAP仿真器下载程序）

储能运维管理云平台解决方案EMS能量管理系统

网络药理学：16、速通流程版

P2515 [HAOI2010] 软件安装

51单片机快速入门之定时器和计数器

【计算机网络 - 基础问题】每日 3 题（一）

Unity全面取消Runtime费用安装游戏不再收版费

IDEA测试类启动报 “java: 常量字符串过长” 解决办法

计算机科学基础 -- 访存单元

Linux压缩、解压缩、查看压缩内容详解使用（tar、gzip、bzip2、xz、jar、war、aar）

StreamReader 和 StreamWriter提供自动处理字符编码的功能

B站缓存视频转换全攻略：3分钟学会m4s转MP4无损转换

如何在Windows平台上快速构建专业级词法语法分析器：WinFlexBison终极指南

3分钟掌握DeepMosaics：AI智能马赛克处理与图像修复的终极指南

超越基础扫描：实战解析Tessent ATPG中的Clock PO与RAM Sequential Patterns如何提升故障覆盖率

嵌入式音频开发避坑指南：如何用一颗模组搞定AEC、ANS与啸叫抑制

HS2-HF_Patch：3步完成Honey Select 2汉化去码与插件整合

一键封装成EXE！让Windows命令行像Linux一样直接敲‘binwalk’的懒人方案

Python锚点链接解析利器pyanchor：高效处理HTML/Markdown文档内部链接

从‘苹果落地’到‘参数更新’：用牛顿法迭代公式手写一个简单的神经网络优化器

告别模拟器：在Windows上直接安装Android应用的终极指南