当前位置: 首页 > article >正文

DOMPurify实战:如何在Node.js后端安全处理用户HTML输入(附最新jsdom配置)

DOMPurify实战如何在Node.js后端安全处理用户HTML输入附最新jsdom配置当用户提交的HTML内容直接进入数据库时就像给黑客开了扇后门。去年某知名博客平台因未过滤富文本评论导致攻击者通过精心构造的img srcx onerrorstealCookies()标签窃取了数百万用户数据。这正是后端工程师需要DOMPurify的原因——它不仅是前端的安全卫士更是后端数据入库前的最后一道防线。1. 为什么后端更需要HTML净化前端过滤可以被绕过这是安全领域的基本常识。攻击者完全可以使用Postman等工具直接向后端接口发送恶意负载。我在处理一个电商平台的商品详情页漏洞时发现即使前端完美过滤了所有XSS标签攻击者依然能通过修改API请求在商品描述中注入恶意脚本。后端净化有三大不可替代性数据源头控制确保存入数据库的内容绝对干净多端一致性同一套净化规则适用于Web/App/API所有渠道审计便利性在服务端可以记录完整的原始输入和净化过程重要提示永远不要相信前端已经过滤过了这种假设。后端必须有自己的净化层这是防御纵深策略的核心要求。2. 现代Node.js环境下的DOMPurify配置最新版的DOMPurify(3.0.8)与jsdom(22.1.0)的组合提供了最安全的净化能力。以下是经过实战检验的配置模板const createDOMPurify require(dompurify); const { JSDOM } require(jsdom); // 创建安全的DOM环境 const dom new JSDOM(, { runScripts: dangerously, // 必须明确允许才能执行脚本 resources: usable, pretendToBeVisual: true }); const DOMPurify createDOMPurify(dom.window); const securityConfig { ALLOWED_TAGS: [p, br, strong, em, ul, ol, li], ALLOWED_ATTR: [class, style], FORBID_TAGS: [style, script, iframe], FORBID_ATTR: [onerror, onload], RETURN_TRUSTED_TYPE: true }; function sanitizeHTML(dirty) { try { return DOMPurify.sanitize(dirty, securityConfig); } catch (err) { console.error(净化失败: ${err.message}); return ; // 失败时返回空字符串 } }关键配置参数说明参数类型安全建议值作用ALLOWED_TAGSstring[]仅业务必需标签白名单标签集RETURN_TRUSTED_TYPEbooleantrue返回TrustedHTML对象SANITIZE_DOMbooleanfalse是否净化整个DOM树WHOLE_DOCUMENTbooleanfalse是否处理完整HTML文档3. 与Express/NestJS的深度集成在中间件层实现全局净化是最佳实践。以下是Express中的实现方案// express-sanitizer.js const DOMPurify require(./dompurify-config); // 上文配置 const htmlSanitizer (req, res, next) { const sanitize (obj) { if (!obj) return; Object.keys(obj).forEach(key { if (typeof obj[key] string) { obj[key] DOMPurify.sanitize(obj[key]); } else if (typeof obj[key] object) { sanitize(obj[key]); } }); }; [body, query, params].forEach(prop { if (req[prop]) sanitize(req[prop]); }); next(); }; module.exports htmlSanitizer;在NestJS中我们可以创建自定义装饰器实现更精细的控制// sanitize.decorator.ts import { createParamDecorator, ExecutionContext } from nestjs/common; import * as DOMPurify from ../config/dompurify-config; export const Sanitized createParamDecorator( (data: string, ctx: ExecutionContext) { const request ctx.switchToHttp().getRequest(); const value data ? request.body[data] : request.body; return typeof value string ? DOMPurify.sanitize(value) : value; } ); // 使用示例 Post(comment) createComment(Sanitized(content) content: string) { // content已经是净化后的安全内容 }4. 富文本编辑器的特殊处理当业务需要保留部分HTML样式时安全配置变得更具挑战性。以下是CKEditor 5的兼容方案const ckeditorConfig { ALLOWED_TAGS: [ p, h1, h2, h3, h4, h5, h6, strong, em, u, s, blockquote, ol, ul, li, a ], ALLOWED_ATTR: [ href, target, rel, class, style, data-* ], ADD_ATTR: [target, rel], ADD_TAGS: [iframe], FORCE_BODY: true, ALLOW_DATA_ATTR: false }; // 处理iframe白名单 DOMPurify.addHook(uponSanitizeElement, (node, data) { if (data.tagName iframe) { const src node.getAttribute(src) || ; if (!src.startsWith(https://trusted.video.com)) { return node.parentNode?.removeChild(node); } } });常见富文本风险元素处理方案表格建议转换为纯文本或严格限制colspan/rowspanSVG禁用或彻底过滤script和事件处理器MathML需要特别检查命名空间注入漏洞5. 性能优化与监控在大流量场景下HTML净化可能成为性能瓶颈。我们通过以下策略保证安全性的同时提升性能1. 缓存净化实例const purifyCache new WeakMap(); function getCachedPurifier(html) { if (!purifyCache.has(html)) { purifyCache.set(html, DOMPurify.sanitize(html)); } return purifyCache.get(html); }2. 异步批处理async function batchSanitize(htmlArray) { const worker new Worker(./sanitize-worker.js); return new Promise((resolve) { worker.onmessage (e) resolve(e.data); worker.postMessage(htmlArray); }); }3. 监控异常输入DOMPurify.addHook(afterSanitizeAttributes, (node) { if (node.hasAttribute(data-malicious)) { securityLogger.log(发现可疑属性, { ip: req.ip, userAgent: req.headers[user-agent], rawInput: node.outerHTML }); } });性能对比数据处理1000个HTML片段方案平均耗时内存占用适用场景基础方案1200ms45MB开发环境缓存优化400ms62MB常规生产环境Worker并行280ms85MB高并发场景6. 测试策略与漏洞防护完整的测试方案应该包含以下层次1. 单元测试样例const xssTestCases [ { input: scriptalert(1)/script, expected: }, { input: img srcx onerroralert(1), expected: img srcx }, { input: a hrefjavascript:alert(1)click/a, expected: aclick/a } ]; xssTestCases.forEach(({input, expected}) { test(should sanitize ${input}, () { expect(DOMPurify.sanitize(input)).toBe(expected); }); });2. 模糊测试配置const fuzz require(fuzz-html); const maliciousSamples fuzz.generate(1000); // 生成1000个变异XSS样本 maliciousSamples.forEach(sample { const clean DOMPurify.sanitize(sample); expect(clean).not.toMatch(/script|onerror|javascript:/i); });3. 实时防护建议对连续提交恶意内容的IP实施速率限制对净化前后差异过大的内容进行人工审核定期更新DOMPurify和jsdom到最新版本

相关文章:

DOMPurify实战:如何在Node.js后端安全处理用户HTML输入(附最新jsdom配置)

DOMPurify实战&#xff1a;如何在Node.js后端安全处理用户HTML输入&#xff08;附最新jsdom配置&#xff09; 当用户提交的HTML内容直接进入数据库时&#xff0c;就像给黑客开了扇后门。去年某知名博客平台因未过滤富文本评论&#xff0c;导致攻击者通过精心构造的<img srcx…...

使用LaTeX撰写基于Lingbot-Depth-Pretrain-VitL-14的学术论文:图表与算法排版

使用LaTeX撰写基于Lingbot-Depth-Pretrain-VitL-14的学术论文&#xff1a;图表与算法排版 写学术论文&#xff0c;尤其是涉及深度学习和计算机视觉模型的&#xff0c;比如你正在研究的Lingbot-Depth-Pretrain-VitL-14&#xff0c;最头疼的往往不是实验本身&#xff0c;而是如何…...

如何用PlugY实现暗黑破坏神2单机体验增强

如何用PlugY实现暗黑破坏神2单机体验增强 【免费下载链接】PlugY PlugY, The Survival Kit - Plug-in for Diablo II Lord of Destruction 项目地址: https://gitcode.com/gh_mirrors/pl/PlugY 在暗黑破坏神2的单机冒险中&#xff0c;玩家常常面临储物空间不足、角色加点…...

Legacy iOS Kit终极指南:让旧款iOS设备重获新生的完整解决方案

Legacy iOS Kit终极指南&#xff1a;让旧款iOS设备重获新生的完整解决方案 【免费下载链接】Legacy-iOS-Kit An all-in-one tool to restore/downgrade, save SHSH blobs, jailbreak legacy iOS devices, and more 项目地址: https://gitcode.com/gh_mirrors/le/Legacy-iOS-K…...

告别Transformer高开销:用频域注意力(FMNet思路)为你的轻量化模型注入全局感知能力

频域注意力革命&#xff1a;如何在轻量化模型中实现全局感知而不牺牲效率 引言&#xff1a;轻量化模型的困境与突破 在移动端AI和边缘计算领域&#xff0c;模型轻量化一直是个永恒的话题。开发者们不断在模型精度和计算资源之间寻找平衡点&#xff0c;而传统CNN模型虽然计算效…...

OpenClaw技能开发入门:千问3.5-9B定制天气查询

OpenClaw技能开发入门&#xff1a;千问3.5-9B定制天气查询 1. 为什么需要自定义技能&#xff1f; 去年冬天&#xff0c;我经常需要同时查看多个城市的天气情况来安排出差行程。每次手动打开天气网站、输入城市名、截图保存的操作让我不胜其烦。直到发现OpenClaw支持自定义技能…...

用STM32CubeMX和TMC260驱动步进电机,这份PWM频率配置指南帮你避开新手常见坑

STM32CubeMX与TMC260步进电机驱动实战&#xff1a;PWM频率配置的黄金法则 第一次用STM32CubeMX配置TMC260驱动步进电机时&#xff0c;我盯着屏幕上那一堆定时器参数发愣——Prescaler、Period、Counter Mode...这些看似简单的数字背后&#xff0c;藏着让电机平稳运转或是疯狂抖…...

开关电源拓扑结构解析:从反激到正激的实战应用

1. 开关电源拓扑结构入门指南 第一次接触开关电源设计时&#xff0c;我被各种拓扑结构搞得晕头转向。直到有次把电源板烧冒烟了才明白&#xff0c;选错拓扑就像用菜刀砍柴——不是不能用&#xff0c;但效率低还危险。开关电源拓扑结构决定了电能转换的基本框架&#xff0c;就像…...

ADS工程化实践:AEL自定义函数库的创建与集成

1. 为什么需要AEL自定义函数库&#xff1f; 在射频电路设计中&#xff0c;我们经常会遇到重复计算的场景。比如计算微带线阻抗、滤波器参数、噪声系数等&#xff0c;每次都要重新输入公式不仅效率低&#xff0c;还容易出错。我刚开始用ADS时&#xff0c;就经常因为手误输错公式…...

IM1281B电量计模块避坑指南:从接线到数据解析的全流程实战

IM1281B电量计模块实战全解析&#xff1a;从硬件对接到数据处理的完整解决方案 在智能电表、能耗监测和物联网设备开发中&#xff0c;精确测量电能消耗是核心需求之一。IM1281B作为一款高性价比的单相电能计量模块&#xff0c;以其Modbus通信协议和直接电能脉冲输出功能&#x…...

Android购物商城APP实战:从零到一构建核心功能模块

1. 项目功能模块拆解与实现路径 一个完整的购物商城APP通常包含四大核心模块&#xff1a;用户系统、商品展示、购物车管理和订单处理。这就像搭建一个实体商店&#xff0c;需要先规划好门面&#xff08;登录注册&#xff09;、货架&#xff08;商品展示&#xff09;、购物篮&am…...

发动机阀系系统设计避坑指南:AVL-Excite中这10个元素配置最容易出错

发动机阀系系统设计避坑指南&#xff1a;AVL-Excite中这10个元素配置最容易出错 在发动机阀系系统的仿真建模中&#xff0c;AVL-Excite作为行业标杆工具&#xff0c;其强大的功能背后也隐藏着诸多配置陷阱。许多工程师在完成基础建模后&#xff0c;往往会在看似简单的参数设置上…...

PyTorch 2.8镜像精彩案例分享:使用AnimateDiff生成动漫风格短视频合集

PyTorch 2.8镜像精彩案例分享&#xff1a;使用AnimateDiff生成动漫风格短视频合集 1. 开箱即用的高性能深度学习环境 PyTorch 2.8深度学习镜像为创作者和开发者提供了一个强大的工具箱&#xff0c;特别适合需要生成高质量视频内容的场景。这个经过深度优化的环境基于RTX 4090…...

汇川PLC与IS620N伺服驱动实战:手把手教你完成EtherCAT网络配置与电机命名

汇川PLC与IS620N伺服驱动深度配置指南&#xff1a;从EtherCAT组态到电机精准控制 在工业自动化领域&#xff0c;伺服系统的稳定性和响应速度直接决定了设备性能的上限。汇川AM600系列PLC搭配IS620N伺服驱动组成的EtherCAT网络&#xff0c;正成为越来越多自动化工程师的首选方案…...

Windows 11终极优化指南:用Win11Debloat实现系统加速51%的免费方案

Windows 11终极优化指南&#xff1a;用Win11Debloat实现系统加速51%的免费方案 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to decl…...

【HTTP】HTTP协议核心体系:请求方法与状态码全结构化解析(附《思维导图》)

文章目录HTTP协议核心体系&#xff1a;请求方法与状态码全结构化解析一、核心基础概念1.1 HTTP方法的两大核心属性&#xff08;规范级定义&#xff09;1.2 HTTP状态码分类规则二、HTTP请求方法2.1 标准核心方法&#xff08;RFC 7231 定义&#xff09;2.1.1 只读类方法&#xff…...

提升openclaw开发效率:用快马一键生成算法调试与可视化工具

最近在优化openclaw机械爪控制算法时&#xff0c;发现调试过程特别耗时。每次修改参数后&#xff0c;都要重新编译代码、运行测试&#xff0c;还要手动记录数据。为了提升效率&#xff0c;我用InsCode(快马)平台快速搭建了一个可视化调试工具&#xff0c;效果出乎意料的好。分享…...

技术难题攻克指南:Retrieval-based-Voice-Conversion-WebUI常见问题全景解析

技术难题攻克指南&#xff1a;Retrieval-based-Voice-Conversion-WebUI常见问题全景解析 【免费下载链接】Retrieval-based-Voice-Conversion-WebUI Easily train a good VC model with voice data < 10 mins! 项目地址: https://gitcode.com/GitHub_Trending/re/Retrieva…...

Fastboot Enhance:高效Android刷机工具与Payload管理平台

Fastboot Enhance&#xff1a;高效Android刷机工具与Payload管理平台 【免费下载链接】FastbootEnhance A user-friendly Fastboot ToolBox & Payload Dumper for Windows 项目地址: https://gitcode.com/gh_mirrors/fa/FastbootEnhance 价值定位&#xff1a;重新定…...

从移动平均到IIR滤波:用Matlab filter函数实现数据降噪的完整指南(附对比实验)

从移动平均到IIR滤波&#xff1a;用Matlab filter函数实现数据降噪的完整指南&#xff08;附对比实验&#xff09; 在数据分析与信号处理领域&#xff0c;噪声污染是影响结果准确性的常见挑战。无论是来自传感器的物理干扰&#xff0c;还是数据传输过程中的随机波动&#xff0c…...

NSC_BUILDER:全能Switch文件处理工具的深度应用指南

NSC_BUILDER&#xff1a;全能Switch文件处理工具的深度应用指南 【免费下载链接】NSC_BUILDER Nintendo Switch Cleaner and Builder. A batchfile, python and html script based in hacbuild and Nuts python libraries. Designed initially to erase titlerights encryption…...

智慧树网课助手:智能化学习效率提升解决方案

智慧树网课助手&#xff1a;智能化学习效率提升解决方案 【免费下载链接】zhihuishu 智慧树刷课插件&#xff0c;自动播放下一集、1.5倍速度、无声 项目地址: https://gitcode.com/gh_mirrors/zh/zhihuishu 一、问题诊断&#xff1a;在线学习的效率困境与技术破局 1.1 …...

【毕业设计】微信小程序文创商城-从真实支付到模拟支付的实现与优化

1. 微信小程序文创商城支付功能概述 做毕业设计选择微信小程序文创商城是个不错的选题&#xff0c;尤其是支付功能的实现&#xff0c;既能锻炼技术能力&#xff0c;又很实用。我去年指导过几个类似的项目&#xff0c;发现学生们最头疼的就是支付模块。真实支付需要营业执照和公…...

Ubuntu20.04下QGroundControl开发环境搭建全攻略(含常见错误解决方案)

Ubuntu 20.04下QGroundControl开发环境搭建全攻略&#xff08;含常见错误解决方案&#xff09; 在无人机和机器人开发领域&#xff0c;QGroundControl作为一款开源的飞行控制地面站软件&#xff0c;已经成为开发者不可或缺的工具。本文将带你从零开始&#xff0c;在Ubuntu 20.0…...

别再傻傻编译整个内核了!香橙派3B (rk3566) 快速修改和测试设备树节点的正确姿势

香橙派3B设备树节点高效调试指南&#xff1a;从编译优化到实战技巧 每次修改设备树节点都要重新编译整个内核&#xff1f;等待十几分钟甚至更久只为了验证一个小改动&#xff1f;对于香橙派3B(rk3566)开发者来说&#xff0c;这种低效的工作流程已经成为过去。本文将揭示一套经…...

高速ADC采样时钟不准?手把手教你理解时钟占空比校正(DCC)电路的核心原理

高速ADC采样时钟不准&#xff1f;手把手教你理解时钟占空比校正&#xff08;DCC&#xff09;电路的核心原理 当你在调试一块高速ADC板卡时&#xff0c;发现ENOB&#xff08;有效位数&#xff09;始终比规格书低2-3位&#xff0c;频谱分析显示谐波失真异常。这种困扰可能来自一…...

Python到Android的终极桥梁:如何用python-for-android将Python应用无缝转换为原生APK

Python到Android的终极桥梁&#xff1a;如何用python-for-android将Python应用无缝转换为原生APK 【免费下载链接】python-for-android Turn your Python application into an Android APK 项目地址: https://gitcode.com/gh_mirrors/py/python-for-android 在移动应用开…...

技术深度解析:logitech-pubg项目实现PUBG后坐力控制的Lua脚本架构设计

技术深度解析&#xff1a;logitech-pubg项目实现PUBG后坐力控制的Lua脚本架构设计 【免费下载链接】logitech-pubg PUBG no recoil script for Logitech gaming mouse / 绝地求生 罗技 鼠标宏 项目地址: https://gitcode.com/gh_mirrors/lo/logitech-pubg 在竞技射击游戏…...

好写作AI|避免“AI味”过重:硕士初稿中的人机协同写作技巧

家人们&#xff0c;谁懂啊&#xff1f; 你兴冲冲地把用AI写的初稿交给导师&#xff0c;结果导师只看了一页&#xff0c;就皱起眉头&#xff1a; “这段是你自己写的还是AI写的&#xff1f;” 你心里咯噔一下&#xff0c;强装镇定&#xff1a;“我自己写的啊……” 导师&#xf…...

微信小程序uView实战:u-picker三级联动避坑指南(附完整代码)

uView框架下u-picker三级联动的深度实践与性能优化 在微信小程序开发中&#xff0c;地区选择器几乎是每个涉及用户地址功能的必备组件。uView作为一款优秀的小程序UI框架&#xff0c;其u-picker组件提供了强大的多级联动功能&#xff0c;但在实际开发中&#xff0c;不少开发者会…...