当前位置：首页 > news >正文

go-zero(十三)使用MapReduce并发

news 2026/5/21 8:46:57

go zero 使用MapReduce并发

一、MapReduce 介绍

MapReduce 是一种用于并行计算的编程模型，特别适合在大规模数据处理场景中简化逻辑代码。

官方文档：

https://go-zero.dev/docs/components/mr

1. MapReduce 的核心概念

在 MapReduce 中，主要有以下三个核心步骤：
a. Generate (生成数据)：

数据的初始输入阶段。可以是一个简单的循环，也可以是从数据库、文件或其他来源加载数据。
b. Mapper (映射)：
将输入数据映射为中间结果。通常用来过滤、转换、查询或处理数据。
c. Reducer (归约)：
对映射后的数据进行汇总处理，生成最终的结果。

在 go zero 中，mr.MapReduce 的具体代码如下：


func MapReduce[T, U, V any](generate GenerateFunc[T], mapper MapperFunc[T, U], reducer ReducerFunc[U, V],opts ...Option) (V, error) {panicChan := &onceChan{channel: make(chan any)}source := buildSource(generate, panicChan)return mapReduceWithPanicChan(source, panicChan, mapper, reducer, opts...)
}

2. 为什么需要 MapReduce

在实际的业务场景中我们常常需要从不同的 rpc 服务中获取相应属性来组装成复杂对象。

比如要查询商品详情：

商品服务-查询商品属性
库存服务-查询库存属性
价格服务-查询价格属性
营销服务-查询营销属性

如果是串行调用的话响应时间会随着 rpc 调用次数呈线性增长，所以我们要优化性能一般会将串行改并行。

简单的场景下使用 WaitGroup 也能够满足需求，但是如果我们需要对 rpc 调用返回的数据进行校验、数据加工转换、数据汇总呢？继续使用 WaitGroup 就有点力不从心了.。

二、项目构建

接下来我们使用一个文章列表功能简单的演示下

1. article数据表

这是存储文章信息的表，包含标题、内容、作者、评论数等字段。

CREATE TABLE `article` (`id` BIGINT UNSIGNED NOT NULL AUTO_INCREMENT COMMENT '主键ID',`title` VARCHAR(255) NOT NULL DEFAULT '' COMMENT '标题' COLLATE 'utf8mb4_bin',`content` TEXT NOT NULL COMMENT '内容' COLLATE 'utf8_unicode_ci',`cover` VARCHAR(255) NOT NULL DEFAULT '' COMMENT '封面' COLLATE 'utf8mb4_bin',`description` VARCHAR(255) NOT NULL DEFAULT '' COMMENT '描述' COLLATE 'utf8mb4_bin',PRIMARY KEY (`id`)
);

2.article.api

在实际开发中，应该传入作者ID、游标、页码、排序方法等信息，这里为了方便演示就不传入参数了，API 定义如下：

syntax = "v1"type (ArticleInfo {ArticleId   int64  `json:"article_id"`Title       string `json:"title"`Content     string `json:"content"`Description string `json:"description"`Cover       string `json:"cover"`}ArticleListResponse {Articles []ArticleInfo `json:"articles"`}
)@server (prefix: /v1/article
)
service article-api {@handler Articlelisthandlerpost /list returns (ArticleListResponse)
}

三、使用 MapReduce

拉取库

go get github.com/zeromicro/go-zero/core/mr

1.实现文章列表

我们使用 MapReduce 来并行处理文章数据，

func (l *ArticlelistLogic) Articlelist() (resp *types.ArticleListResponse, err error) {// Step 1: Generate 数据//这里为了方便我使用了简单for循环产生文档IDgenerateFunc := func(source chan<- int) {for id := 1; id < 50; id++ { // 模拟文章 ID 数据source <- id}}articleModel := l.svcCtx.ArticleModel// Step 2: Mapper 映射处理mapperFunc := func(id int, writer mr.Writer[*types.ArticleInfo], cancel func(error)) {//使用产生id，查询文章详情one, err := articleModel.FindOne(l.ctx, uint64(id)) // 查找单篇文章if err != nil {return // 跳过错误}//FindOne返回的是 *model.Article类型，Mapper映射的类型为*types.ArticleInfo//所以需要转换一下articleInfo := &types.ArticleInfo{ArticleId:   int64(one.Id),Title:       one.Title,Content:     one.Content,Description: one.Description,Cover:       one.Cover,}writer.Write(articleInfo) // 写入中间结果}// Step 3: Reducer 汇总处理reduceFunc := func(pipe <-chan *types.ArticleInfo, writer mr.Writer[[]types.ArticleInfo], cancel func(error)) {var articleList []types.ArticleInfofor article := range pipe {articleList = append(articleList, *article) }writer.Write(articleList) // 写入最终结果}// 调用 MapReduce//mr.WithWorkers(5)  允许调用者自定义并发工作线程数。//如果不传入mr.WithWorkers ，默认Workers为16个reduce, err := mr.MapReduce(generateFunc, mapperFunc, reduceFunc, mr.WithWorkers(5))   if err != nil {return nil, err // 处理错误}// 返回结果return &types.ArticleListResponse{Articles: reduce,}, nil
}

在这里插入图片描述

2. 详细讲解

Step 1: Generate 数据
generateFunc 的作用是提供初始数据。在本例中，我们通过一个循环生成了文章的 ID：

generateFunc := func(source chan<- int) {for id := 1; id < 50; id++ {source <- id}
}

Step 2: Mapper 映射处理
mapperFunc 用于处理每一个文章 ID，并将其转换为 ArticleInfo。

使用 articleModel.FindOne 从数据库中获取文章数据。
如果获取失败，跳过该 ID。
将结果通过 writer.Write 写入到下一步。

mapperFunc := func(id int, writer mr.Writer[*types.ArticleInfo], cancel func(error)) {one, err := articleModel.FindOne(l.ctx, uint64(id))if err != nil {return}articleInfo := &types.ArticleInfo{ArticleId:   int64(one.Id),Title:       one.Title,Content:     one.Content,Description: one.Description,Cover:       one.Cover,}writer.Write(articleInfo)
}

Step 3: Reducer 汇总处理
reduceFunc 将 mapperFunc 的结果汇总为最终的 []types.ArticleInfo。

遍历管道中的每个 *types.ArticleInfo。
将解引用后的 ArticleInfo 添加到结果列表。

reduceFunc := func(pipe <-chan *types.ArticleInfo, writer mr.Writer[[]types.ArticleInfo], cancel func(error)) {var articleList []types.ArticleInfofor article := range pipe {articleList = append(articleList, *article)}writer.Write(articleList)
}

3. 测试运行

向 /v1/article/list 发送 POST 请求：

curl -X POST http://localhost:8888/v1/article/list

运行结果如下：

{"articles": [{"article_id": 1,"title": "标题1","content": "这是内容1","description": "描述1","cover": "封面1.jpg"},...]
}

4.效率对比

普通循环

为了更直观的对比效率，我们使用普通循环再次实现下文章列表：

func (l *ArticlelistLogic) Articlelist() (resp *types.ArticleListResponse, err error) {// todo: add your logic here and delete this linetime1 := time.Now()var articleList []types.ArticleInfoarticleModel := l.svcCtx.ArticleModelfor id := 1; id < 50; id++ {article, _ := articleModel.FindOne(l.ctx, uint64(id))articleInfo := types.ArticleInfo{ArticleId:   int64(article.Id),Title:       article.Title,Content:     article.Content,Description: article.Description,Cover:       article.Cover,}articleList = append(articleList, articleInfo)}time2 := time.Now()logx.Info("执行时间为：", time2.Sub(time1))return &types.ArticleListResponse{Articles: articleList,}, nil}

效率对比

这个执行时间可能每次都不一样，但是进过多次对比，使用mapreduce 效率是高于普通方法的

使用串行调用时间：
在这里插入图片描述

使用MapReduce消耗时间：

在这里插入图片描述

go-zero(十三)使用MapReduce并发

go zero 使用MapReduce并发一、MapReduce 介绍 MapReduce 是一种用于并行计算的编程模型，特别适合在大规模数据处理场景中简化逻辑代码。官方文档： https://go-zero.dev/docs/components/mr 1. MapReduce 的核心概念在 MapReduce 中，主…...

编程日记 2024/12/17 3:08:11

1 cgg带你建个工程如图不然你的pip baidu-aip 用不了先对图片进行一点处理 $ 灰度处理 $ 滤波处理参考 import cv2 import os def preprocess_images(input_folder, output_folder):# 确保输出文件夹存在if not os.path.exists(output_folder):os.makedirs(output_fol…...

编程日记 2024/12/17 3:06:09

java 导出word锁定且部分内容解锁可编辑

使用 Apache POI 创建带编辑限制的 Word 文档在日常工作中，我们可能需要生成一些带有编辑限制的 Word 文档，例如某些段落只能被查看，而其他段落可以自由编辑。本文介绍如何使用 Apache POI 创建这样的文档，并通过代码实现相应的…...

编程日记 2024/12/17 2:59:01

SQL 在线格式化 - 加菲工具

SQL 在线格式化打开网站加菲工具选择“SQL 在线格式化” 或者直接访问 https://www.orcc.online/tools/sql 输入sql，点击上方的格式化按钮即可输入框得到格式化后的sql结果...

编程日记 2024/12/17 2:58:00

大数据法律法规——《关键信息基础设施安全保护条例》（山东省大数据职称考试）

大数据分析应用-初级第一部分基础知识一、大数据法律法规、政策文件、相关标准二、计算机基础知识三、信息化基础知识四、密码学五、大数据安全六、数据库系统七、数据仓库. 第二部分专业知识一、大数据技术与应用二、大数据分析模型三、数据科学大数据法律法规…...

编程日记 2024/12/17 2:51:53

【CVE-2024-5660】ARM CPU漏洞：硬件页面聚合（HPA）安全通告

安全之安全(security)博客目录导读目录一、概述二、修改历史三、什么是硬件页面聚合？四、修复解决一、概述在一些基于arm的cpu中发现了一个问题，该问题可能允许修改的、不受信任的客户机操作系统...

编程日记 2024/12/17 2:49:51

数智读书笔记系列008 智人之上：从石器时代到AI时代的信息网络简史

书名:智人之上：从石器时代到AI时代的信息网络简史作者:［以］尤瓦尔赫拉利译者:林俊宏出版时间:2024-09-01 ISBN:9787521768527 中信出版集团制作发行作者信息尤瓦尔・赫拉利 1976 年出生于以色列海法，是牛津大学历史学…...

编程日记 2024/12/17 2:43:43

将 Ubuntu 22.04 LTS 升级到 24.04 LTS

Ubuntu 24.04 LTS 将支持 Ubuntu 桌面、Ubuntu 服务器和 Ubuntu Core 5 年，直到 2029 年 4 月。本文将介绍如何将当前 Ubuntu 22.04 系统升级到最新 Ubuntu 24.04 LTS版本。备份个人数据以防万一，把系统中的重要数据自己备份一下~ 安装配置SSH访问…...

编程日记 2024/12/17 2:39:40

【自动驾驶】Ubuntu20.04安装ROS1 Noetic

【自动驾驶】Ubuntu20.04安装ROS1 Noetic 方式一：官方教程方式二：鱼香ROS脚本安装ROS配置rosdep配置ROS环境测试ROS1 Noetic是否安装成功方式一：官方教程 https://wiki.ros.org/noetic/Installation/Ubuntu 方式二：鱼香ROS脚本 …...

编程日记 2024/12/17 2:34:34

（转，自阅，侵删）【LaTeX学习笔记】一文入门LaTeX（超详细）

【LaTeX学习笔记】一文入门LaTeX（超详细）-阿里云开发者社区LaTeX中主要分为导言区和正文区导言区通常用于定义文档的格式、语言等（全局设置）。常用的LaTex命令主要有\documentclass，\usepackage等。下面分别对几个常用…...

编程日记 2024/12/17 2:33:34

css的选择器有哪些？权重由大到小是怎么排序的？

CSS选择器有很多种，下面是常见的选择器类型，并按照其权重（即优先级）从高到低进行排序。 CSS选择器类型通用选择器 (*) （通配符选择器） 选择所有元素，权重最低。例如：* { color:…...

编程日记 2024/12/17 2:32:32

CTF知识集-PHP特性

title: CTF知识集-PHP特性写在开头可能会用到的提示 call_user_func 调用的函数可以不区分大小写preg_match过滤存在长度溢出，长度超过100w检测失效。str_repeat(‘show’,250000); 生成100w个字符preg_match是无法处理数组的，例如:preg_match( n u m…...

编程日记 2024/12/17 2:29:27

比特币是否会取代美元（以及其他主权货币）

上图是 Olivier Blanchard 宏观经济学第八版的英文版内容。这里用中文解释。 1. 背景与现状： 比特币的规模与美元相比仍然很小： 截至 2018 年 12 月，比特币的总流通量为 1730 万枚，每枚价值 $3,900，总市值约 $670 亿…...

编程日记 2024/12/17 2:27:25

WPF+MVVM案例实战与特效（三十七）- 实现带有水印和圆角的自定义 TextBox 控件

文章目录 1、概述2、案例实现1、基本功能2、代码实现3、控件应用4、案例效果4、总结1、概述在开发用户界面时，TextBox 是最常见的输入控件之一。为了提升用户体验，我们经常需要为 TextBox 添加一些额外的功能，例如显示提示文本（水印）和设置圆角边框。本文将详细介绍如何…...

编程日记 2024/12/17 2:26:24

深度学习训练参数之学习率介绍

学习率 1. 什么是学习率学习率是训练神经网络的重要超参数之一，它代表在每一次迭代中梯度向损失函数最优解移动的步长，通常用 η \eta η 表示。它的大小决定网络学习速度的快慢。在网络训练过程中，模型通过样本数据给出预测值&#xff0…...

编程日记 2024/12/17 2:23:18

导游现场面试需要注意的问题

今天给大家带来一些导游现场面试需要注意的问题，大部分的城市导游考试已经考完了，但是还有一些城市的十二月份才考，有需要的朋友们赶紧来看，有备无患。 01、做好充足准备认真准备做好每个景点的讲解介绍，不要抱有侥幸…...

编程日记 2024/12/17 2:21:16

Burp suite 3 （泷羽sec）

声明学习视频来自B站UP主泷羽sec,如涉及侵泷羽sec权马上删除文章。笔记只是方便各位师傅学习知识,以下网站只涉及学习内容,其他的都与本人无关,切莫逾越法律红线,否则后果自负这节课旨在扩大自己在网络安全方面的知识面，了解网络安全领域的见闻，了…...

编程日记 2024/12/17 2:19:14

LabVIEW前面板无法显示的常见原因

当 LabVIEW 前面板显示为白色或黑色时，可能由于控件可视性设置、显卡驱动问题、程序错误或 LabVIEW 设置不当引起。通过检查面板设置、更新驱动、重启程序等方式可有效解决此问题。遇到前面板无法显示或显示为白色/黑色的情况，可能有以下几种原因。可以…...

编程日记 2024/12/17 2:17:12

【Syncfusion系列】Diagram 杂谈第三篇序列化和反序列化

目录序列化保存C# 代码示例， 方式1 ：C# 代码示例， 方式2 ： 反序列化加载C# 代码示例, 方式1：C# 代码示例, 方式2： **如何序列化自定义属性**序列化和反序列化都存在的一个问题解决方式图表是否已修改&…...

编程日记 2024/12/17 2:14:08

Apache APISIX快速入门

本文将介绍Apache APISIX，这是一个开源API网关，可以处理速率限制选项，并且可以轻松地完全控制外部流量对内部后端API服务的访问。我们将看看是什么使它从其他网关服务中脱颖而出。我们还将详细讨论如何开始使用Apache APISIX网关。在深入讨…...

编程日记 2024/12/17 2:12:05

贪吃蛇游戏设计-7.完整系统

7.完整系统完整系统Snake代码太多，另有源码。一个基于 HarmonyOS ArkTS 开发的经典贪吃蛇游戏，适合作为 ArkTS 开发的学习项目。功能特性 🎮 经典贪吃蛇玩法 📊 实时分数显示 🏆 最高分记录 📝 玩家姓名输入与成绩保存 📋 排行榜展示 🗑️ 排行榜滑动删除功…...

编程新知 2026/5/21 8:28:40

Windows右键菜单终极清理教程：ContextMenuManager免费工具帮你告别臃肿与卡顿

Windows右键菜单终极清理教程：ContextMenuManager免费工具帮你告别臃肿与卡顿【免费下载链接】ContextMenuManager 🖱️ 纯粹的Windows右键菜单管理程序项目地址: https://gitcode.com/gh_mirrors/co/ContextMenuManager 你的Windows右键菜单是…...

编程新知 2026/5/21 7:43:28

HCCL 集合通信：昇腾集群的参数同步引擎

大模型训练的本质是将一个超大矩阵乘法拆到多张 NPU 上并行计算，每张卡算完自己的分片后把梯度合并。合并操作就是集合通信。 HCCL（Huawei Collective Communication Library）是 CANN 的集合通信库，对应 NVIDIA NCCL。它不参与模…...

编程新知 2026/5/21 7:28:32

RK3588+ZYNQ+ROS2 机器人 “强实时控制 + AI 感知 + 边缘计算” 三位一体核心控制器

一、方案总览：为什么是 RK3588ZYNQ7045（国产替代用复旦微 FMQL45T900）RK3588（8nm，瑞芯微）：主 AI 业务中枢，6TOPS NPU、8 核 CPU（4A764A55）、8K 编解码、丰富…...

编程新知 2026/5/21 6:51:49

从推荐逻辑到库存架构：木鸟民宿、携程民宿、爱彼迎场景化服务技术对比

摘要从技术和产品设计的角度看，木鸟民宿、携程民宿、爱彼迎三家平台在场景化服务上究竟走了怎样不同的技术路径？各自用了哪些手段把“住宿”这件事匹配到用户真实的生活场景里？三家平台在技术落地上各有侧重。木鸟民宿主打“标签化即时确认”…...

编程新知 2026/5/21 6:40:50

从AT24C02 EEPROM的I2C时序出发，手把手调试你的蓝桥杯单片机存储模块

从AT24C02 EEPROM的I2C时序出发，手把手调试你的蓝桥杯单片机存储模块在蓝桥杯单片机竞赛中，AT24C02 EEPROM存储模块的稳定读写是基本功，但真正的高手往往能在底层通信协议层面发现问题、解决问题。本文将带你从I2C时序的微观视角&#xff0c…...

编程新知 2026/5/21 6:06:18

告别FreeRTOS：在乐鑫ESP32-C3上为RT-Thread打上‘内核补丁’的完整指南

从FreeRTOS到RT-Thread：ESP32-C3内核替换的工程实践在嵌入式开发领域，操作系统的选择往往决定了项目的技术栈和生态边界。对于习惯了ESP-IDF和FreeRTOS的开发者来说，RT-Thread以其模块化设计和丰富的中间件支持正成为颇具吸引力的替代方案。…...

编程新知 2026/5/21 5:45:33

服务器电源、电机驱动、UPS：IRLR3636TRPBF的60V功率MOSFET应用版图

IRLR3636TRPBF：DPAK封装60V/50A N沟道功率MOSFET的大电流开关应用解析在大功率开关电源、不间断电源以及直流电机驱动等领域，功率MOSFET的导通损耗直接影响系统的温升和能效等级。当设计需要在60V电压平台上处理50A级别的大电流时，导通电阻和…...

编程新知 2026/5/21 2:18:03

拒绝“拍脑袋“备货：武汉丝路云如何利用Flink实时计算打造跨境供应链的“数据大脑“？

前言在之前的文章中（如《揭秘跨境供应链的高并发架构》），我们探讨了如何通过微服务架构保证系统在"黑五"大促时不崩溃。但很多客户反馈了一个更深层的问题： "系统确实不崩了，但库存还是积压。要么备货…...

编程新知 2026/5/21 1:50:20

学习刷题公众号管理系统

功能特点支持视频、音频、图文三种课程形式，按知识点分类管理，支持自由添加和编辑课程章节。课程可设置为免费或付费模式，支持VIP会员免费学习权限设置。提供智能组卷功能，学员可按知识点自主组卷，系统从题库中随机抽题…...

编程新知 2026/5/21 1:27:47