当前位置: 首页 > article >正文

Node.js 流处理:高效处理大数据的艺术

Node.js 流处理高效处理大数据的艺术什么是流在 Node.js 中流Stream是处理大量数据的抽象接口。它允许我们逐块读取或写入数据而不需要一次性将全部数据加载到内存中。为什么需要流想象一下处理一个 10GB 的日志文件如果使用fs.readFile会将整个文件加载到内存中可能导致内存溢出使用流可以逐块读取每处理完一块就释放内存流的四种类型1. Readable可读流用于读取数据例如从文件或网络读取。const fs require(fs); const readable fs.createReadStream(large-file.txt); readable.on(data, (chunk) { console.log(Received ${chunk.length} bytes); }); readable.on(end, () { console.log(Finished reading); });2. Writable可写流用于写入数据例如写入文件或发送到网络。const fs require(fs); const writable fs.createWriteStream(output.txt); writable.write(Hello, ); writable.write(World!); writable.end();3. Duplex双工流既可以读取也可以写入例如 TCP socket。const net require(net); const server net.createServer((socket) { socket.write(Hello from server); socket.on(data, (data) { console.log(Received: ${data}); }); });4. Transform转换流在读取和写入之间进行数据转换例如压缩、加密。const { Transform } require(stream); const upperCase new Transform({ transform(chunk, encoding, callback) { this.push(chunk.toString().toUpperCase()); callback(); } });流的核心概念背压Backpressure当写入速度慢于读取速度时数据会在内存中堆积导致内存溢出。流自动处理背压问题。readable.on(data, (chunk) { if (!writable.write(chunk)) { readable.pause(); } }); writable.on(drain, () { readable.resume(); });Pipe管道使用pipe方法可以自动处理背压是推荐的数据传输方式。const fs require(fs); const zlib require(zlib); fs.createReadStream(input.txt) .pipe(zlib.createGzip()) .pipe(fs.createWriteStream(input.txt.gz));实战创建自定义流创建自定义可读流const { Readable } require(stream); class NumberStream extends Readable { constructor(max) { super({ objectMode: true }); this.max max; this.current 1; } _read() { if (this.current this.max) { this.push(this.current); } else { this.push(null); } } } const stream new NumberStream(5); stream.on(data, (num) console.log(num));创建自定义转换流const { Transform } require(stream); class JSONParser extends Transform { constructor() { super({ readableObjectMode: true }); this.buffer ; } _transform(chunk, encoding, callback) { this.buffer chunk; let index; while ((index this.buffer.indexOf(\n)) ! -1) { const line this.buffer.slice(0, index); this.buffer this.buffer.slice(index 1); try { this.push(JSON.parse(line)); } catch (e) { console.error(Invalid JSON:, line); } } callback(); } _flush(callback) { if (this.buffer) { try { this.push(JSON.parse(this.buffer)); } catch (e) { console.error(Invalid JSON:, this.buffer); } } callback(); } }流的高级用法并发流处理const { pipeline, Transform } require(stream); const fs require(fs); const processor new Transform({ transform(chunk, encoding, callback) { const result processChunk(chunk); callback(null, result); } }); pipeline( fs.createReadStream(input.txt), processor, fs.createWriteStream(output.txt), (err) { if (err) { console.error(Pipeline failed:, err); } else { console.log(Pipeline succeeded); } } );流与 Promise 结合const { pipeline } require(stream/promises); const fs require(fs); async function processFile() { try { await pipeline( fs.createReadStream(input.txt), fs.createWriteStream(output.txt) ); console.log(Processing complete); } catch (err) { console.error(Error:, err); } }流在实际项目中的应用场景一日志处理const fs require(fs); const { createInterface } require(readline); const rl createInterface({ input: fs.createReadStream(access.log), crlfDelay: Infinity }); rl.on(line, (line) { const log parseLog(line); if (log.statusCode 400) { console.log(Error:, line); } });场景二数据转换const csv require(csv-parser); const fs require(fs); fs.createReadStream(data.csv) .pipe(csv()) .on(data, (row) { const json transformRow(row); writeToDatabase(json); }) .on(end, () { console.log(CSV parsing complete); });场景三HTTP 响应流const http require(http); const fs require(fs); http.createServer((req, res) { const stream fs.createReadStream(large-file.zip); res.writeHead(200, { Content-Type: application/zip }); stream.pipe(res); }).listen(3000);性能优化建议1. 使用适当的 highWaterMarkconst stream fs.createReadStream(file.txt, { highWaterMark: 64 * 1024 // 64KB });2. 避免不必要的数据转换尽可能在流中直接处理数据避免多次转换。3. 使用对象模式对于非二进制数据使用objectMode: true可以提高可读性。总结Node.js 流是处理大数据的利器掌握流的使用能够显著降低内存占用提高处理速度实现高效的数据管道从日志分析到文件处理从数据转换到 HTTP 响应流的应用无处不在。深入理解流的原理和用法将使你成为更优秀的 Node.js 开发者。

相关文章:

Node.js 流处理:高效处理大数据的艺术

Node.js 流处理:高效处理大数据的艺术 什么是流? 在 Node.js 中,流(Stream)是处理大量数据的抽象接口。它允许我们逐块读取或写入数据,而不需要一次性将全部数据加载到内存中。 为什么需要流? 想…...

解锁AMD Ryzen潜力:SMUDebugTool硬件调试完全指南

解锁AMD Ryzen潜力:SMUDebugTool硬件调试完全指南 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://gitcod…...

ComfyUI Manager完全指南:AI绘画插件管理从未如此简单

ComfyUI Manager完全指南:AI绘画插件管理从未如此简单 【免费下载链接】ComfyUI-Manager ComfyUI-Manager is an extension designed to enhance the usability of ComfyUI. It offers management functions to install, remove, disable, and enable various custo…...

别再死记硬背公式了!用Python实战SCS模型,5分钟搞定城市降雨径流估算

用Python实战SCS模型:5分钟自动化城市降雨径流分析 水文工程师们是否厌倦了手动查表计算CN值?环境分析师是否还在为重复的径流公式推导头疼?今天我们将用Python彻底改变传统工作流——无需记忆复杂公式,只需5行核心代码即可完成从…...

别再死记硬背了!用C++邻接矩阵手搓Dijkstra算法,我连路径打印都给你讲明白了

从零实现Dijkstra算法:邻接矩阵实战与路径回溯详解 在计算机科学的世界里,寻找两点之间最短路径的问题就像现代都市中的导航系统——我们需要在错综复杂的道路网络中找到最优解。Dijkstra算法作为解决单源最短路径问题的经典方法,其重要性不…...

告别Wi-Fi卡顿!手把手教你读懂802.11ax的BSR机制,优化家庭网络上行体验

告别Wi-Fi卡顿!手把手教你读懂802.11ax的BSR机制,优化家庭网络上行体验 你是否经历过这样的场景:视频会议时画面突然卡成马赛克,游戏团战时操作延迟飙升,或是上传文件进度条像蜗牛爬行?这些恼人的问题往往源…...

告别复制粘贴!手把手教你封装可复用的Echarts-for-weixin图表组件

微信小程序Echarts组件化实战:打造高复用图表解决方案 在数据驱动的产品设计中,图表可视化已成为微信小程序不可或缺的组成部分。面对多页面复用、动态数据更新等实际需求,直接使用原生ec-canvas组件往往会导致代码冗余和维护困难。本文将分享…...

一键找回青春记忆:GetQzonehistory让QQ空间历史说说永久保存

一键找回青春记忆:GetQzonehistory让QQ空间历史说说永久保存 【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说 项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 还在为那些年发过的QQ空间说说可能丢失而担忧吗?Get…...

Gofile下载神器:5分钟快速上手的高效命令行工具

Gofile下载神器:5分钟快速上手的高效命令行工具 【免费下载链接】gofile-downloader Download files from https://gofile.io 项目地址: https://gitcode.com/gh_mirrors/go/gofile-downloader 你是否经常需要从Gofile.io下载大量文件,却厌倦了手…...

终极碧蓝航线自动化脚本:Alas智能辅助工具完整指南

终极碧蓝航线自动化脚本:Alas智能辅助工具完整指南 【免费下载链接】AzurLaneAutoScript Azur Lane bot (CN/EN/JP/TW) 碧蓝航线脚本 | 无缝委托科研,全自动大世界 项目地址: https://gitcode.com/gh_mirrors/az/AzurLaneAutoScript AzurLaneAuto…...

Ai会不会让越来越多的开发者失去工作机会?

我不知道写这篇Log会不会太激进,可能会让人浮想联翩,对号入座。想想还是要写的,咱们不聊别的,仅仅是讨论一下AI是否真的会让我们这些写了20多年的代码的开发者失业,这还真是一个“悲伤”的讨论。朋友跟我说&#xff1a…...

做了二十一年程序员,我终于活成了“搞钱不丢人”的大叔

昨晚十二点半,我关掉了 IntelliJ IDEA。窗外的小区已经安静得只剩下路灯了,我起身活动了一下僵硬的颈椎,发出一声轻微的脆响。二十一年前,我还是个刚毕业、只会用 C 语言打印九九乘法表的小伙子;二十一年后&#xff0c…...

贪吃蛇游戏设计-7.完整系统

7.完整系统 完整系统Snake代码太多,另有源码。 一个基于 HarmonyOS ArkTS 开发的经典贪吃蛇游戏,适合作为 ArkTS 开发的学习项目。 功能特性 🎮 经典贪吃蛇玩法 📊 实时分数显示 🏆 最高分记录 📝 玩家姓名输入与成绩保存 📋 排行榜展示 🗑️ 排行榜滑动删除功…...

如何免费突破网盘限速?8大平台直链下载终极指南

如何免费突破网盘限速?8大平台直链下载终极指南 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云盘 /…...

Gofile高效下载命令行工具完全指南:解锁批量下载与断点续传的终极解决方案

Gofile高效下载命令行工具完全指南:解锁批量下载与断点续传的终极解决方案 【免费下载链接】gofile-downloader Download files from https://gofile.io 项目地址: https://gitcode.com/gh_mirrors/go/gofile-downloader 在当今数字资源共享的时代&#xff0…...

深入解析Godot PCK解包技术:从二进制黑盒到可编辑资源的完整指南

深入解析Godot PCK解包技术:从二进制黑盒到可编辑资源的完整指南 【免费下载链接】godot-unpacker godot .pck unpacker 项目地址: https://gitcode.com/gh_mirrors/go/godot-unpacker 还在为Godot引擎生成的PCK文件无法访问而烦恼吗?想要深入分析…...

三个00后给母校捐了“20亿”,全网炸了——结果这20亿可能就值几百块?

整件事最魔幻的地方在于:你第一眼看到“20亿”,脑子里自动补上的单位是“人民币”。然后一算账,发现可能连捐的那个展示牌都不如。这事到底是怎么回事?前几天,郑州西亚斯学院搞了一场挺隆重的捐赠仪式。三个00后校友—…...

【为风光储一体化系统注入精准“心跳”的隐形力量】

在“双碳”战略目标的宏伟蓝图下,构建以新能源为主体的新型电力系统已成为时代命题。风光储一体化,作为平滑新能源波动、提升电网消纳能力的关键路径,正迎来前所未有的发展机遇。在这一变革性的能源体系中,每一处精密的控制与高效…...

深度工程判断力 × Claude Code:老法师怎么用全链路 AI 原生开发把 5 人 2 个月的交付,1 个人 30 天做完

去年,如果一家公司说:“我们 80% 的代码是 AI 写的。” 你大概会点点头,心里想:行,PPT 先收一下,投资人已经在路上了。 但今天再听到这句话,反应变了:才 80%?为什么还有 …...

ViGEmBus终极指南:如何在Windows上轻松实现游戏手柄兼容性

ViGEmBus终极指南:如何在Windows上轻松实现游戏手柄兼容性 【免费下载链接】ViGEmBus Windows kernel-mode driver emulating well-known USB game controllers. 项目地址: https://gitcode.com/gh_mirrors/vi/ViGEmBus ViGEmBus是一个开源的Windows内核模式…...

从硬件小白到Ryzen调优专家:SMUDebugTool实战进阶指南

从硬件小白到Ryzen调优专家:SMUDebugTool实战进阶指南 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://gi…...

从PubMed到VOSviewer:手把手教你用MeSH词表做更精准的医学文献关键词共现分析

从PubMed到VOSviewer:解锁MeSH词表在医学文献分析中的精准力量 医学研究者常面临海量文献的筛选难题——如何从数万篇论文中快速识别核心研究方向?传统的关键词共现分析往往被"aged"、"female"等高频但低区分度的词汇干扰&#xff0…...

实战解析:如何用Qualcomm AI Engine Direct的OpPackage机制为你的AI模型添加自定义算子

深度实战:利用Qualcomm AI Engine Direct的OpPackage机制实现自定义算子全流程开发 在移动端AI模型部署的实践中,我们常常会遇到一个关键挑战:当模型包含特殊算子或自研算法时,如何在不修改底层框架的前提下实现高效执行&#xff…...

如何快速下载Steam创意工坊壁纸:Wallpaper Engine下载器完全指南

如何快速下载Steam创意工坊壁纸:Wallpaper Engine下载器完全指南 【免费下载链接】Wallpaper_Engine 一个便捷的创意工坊下载器 项目地址: https://gitcode.com/gh_mirrors/wa/Wallpaper_Engine 你是否曾在Steam创意工坊中发现心仪的动态壁纸,却因…...

孤胆英雄的黄昏,社会化智能的黎明:一文看透 Multi-Agent 架构底层逻辑

在过去的一两年里,我们见证了单体大语言模型(LLM)的疯狂进化。我们给它穿上基建外骨骼(Harness),给它挂载无数的函数工具(Skills),试图把它打造成一个无所不能的“全栈超…...

告别手动!用Windows批处理脚本批量重命名MKV音轨(MkvToolnix v73实战)

告别手动!用Windows批处理脚本批量重命名MKV音轨(MkvToolnix v73实战) 每次整理下载的剧集资源时,最让人头疼的莫过于音轨信息错乱——明明视频是国语配音,音轨标签却显示为日语。手动修改不仅效率低下,还容…...

3分钟上手ncmdumpGUI:网易云音乐NCM文件轻松转换的完整指南

3分钟上手ncmdumpGUI:网易云音乐NCM文件轻松转换的完整指南 【免费下载链接】ncmdumpGUI C#版本网易云音乐ncm文件格式转换,Windows图形界面版本 项目地址: https://gitcode.com/gh_mirrors/nc/ncmdumpGUI 还在为网易云音乐的NCM格式文件无法在其…...

告别协议地狱!用HTTP服务搞定Fanuc、西门子等主流数控机床数据采集(Java开发者福音)

工业4.0时代:Java开发者如何用HTTP服务打通数控机床数据孤岛 在智能制造浪潮席卷全球的今天,MES/ERP系统与生产设备的无缝对接已成为数字化工厂的标配需求。然而,当Java开发者面对Fanuc、西门子等数控系统封闭的协议生态时,往往会…...

Kubernetes调度器优化:提升Pod调度效率

Kubernetes调度器优化:提升Pod调度效率 一、Kubernetes调度器概述 1.1 调度器的角色 Kubernetes调度器是Kubernetes集群的核心组件,负责将Pod调度到合适的节点上运行。它根据节点资源、Pod需求和调度策略,做出最优的调度决策。 1.2 调度器优化…...

Perplexity名言警句搜索深度解析(2024年Q2最新API行为逆向实测报告)

更多请点击: https://intelliparadigm.com 第一章:Perplexity名言警句搜索深度解析(2024年Q2最新API行为逆向实测报告) Perplexity 在 2024 年第二季度对 /search 端点实施了细粒度的请求签名验证与上下文指纹绑定机制&#xff0…...