当前位置: 首页 > article >正文

数据标准化(拟合的时候使用非常重要)

一、函数作用这个函数是数据标准化Z-Score 标准化函数专门对两组数据x_raw自变量做标准化处理并返回标准化后的数据 记录标准化参数的对象。具体做了这 4 件事计算x_raw的均值和标准差用 Z-Score 公式对两组数据分别标准化标准化值 (原始值 - 均值) / 标准差处理标准差为 0的极端情况避免除以 0 报错返回标准化后的 x、标准化后的 beta、标准化信息对象保存均值 / 标准差方便后续还原数据二、核心好处为什么要写这个函数1. 避免除以 0 错误鲁棒性强代码里做了关键防护python运行x_scale float(np.std(x_raw)) or 1.0 if x_scale 1e-12: x_scale 1.0如果数据全是同一个数标准差 0直接把分母设为 1.0不会崩溃、不会产生无穷大数值这是工程化代码必备的容错处理2. 数据同步标准化保持一致性同时标准化x和beta适合回归模型、拟合、机器学习场景保证输入和系数在同一量纲体系下计算结果更稳定3. 保留标准化参数支持逆标准化x 的均值、x 的标准差beta 的均值、beta 的标准差自定义 u 值用途后续你可以用这些参数把标准化后的数据还原成原始数据这在模型预测、结果展示时必须用到。4. 统一量纲提升模型 / 计算效果标准化最核心的价值消除单位不同比如米和千克、数值量级差距大比如 1 和 10000的影响让梯度下降、回归、优化算法收敛更快、更稳定避免大数值变量 “主导” 计算结果5. 代码复用、简洁规范把标准化逻辑封装成函数不用重复写均值、标准差计算一处修改全局生效可读性强团队协作更方便三、适用场景这个函数最常用在线性回归 / 多项式拟合机器学习模型训练前的数据预处理数值优化、方程求解需要对输入和系数同时归一化的科学计算四、总结核心一句话这是一个安全、健壮、可还原的双变量 Z-Score 标准化函数专门用于预处理数据让计算更稳定、模型效果更好同时避免程序崩溃。关键优点防除零错误代码鲁棒性拉满同步标准化两组数据保持一致性保存标准化参数支持数据还原统一量纲优化模型 / 数值计算效果封装复用代码简洁规范五、测试import numpy as np # 定义一个简单的类用来保存标准化信息方便后续还原数据 import numpy as np # 标准化信息类保存均值、标准差方便后续还原数据 class NormalizationInfo: def __init__(self, data_mean, data_std, custom_value0.0): self.data_mean data_mean # 原始数据的均值一看就懂 self.data_std data_std # 原始数据的标准差一看就懂 self.custom_value custom_value # 自定义额外参数 def normalize_data(original_data, custom_value0.0): 【单变量数据标准化】Z-Score 标准化 作用把数据变成 均值0标准差1 的标准分布消除量纲影响 自动防止除以0错误非常稳定 参数 original_data: 原始数据列表 或 numpy数组 custom_value: 可选自定义额外值 返回 标准化后的数据 标准化信息对象 # 计算原始数据的均值和标准差 mean_val np.mean(original_data) std_val np.std(original_data) # 安全处理如果标准差接近0就设为1避免除以0报错 if std_val 1e-12: std_val 1.0 # 标准化核心公式 standardized_data (original_data - mean_val) / std_val # 返回标准化结果 记录均值和标准差用于还原数据 return standardized_data, NormalizationInfo(mean_val, std_val, custom_value) # 示例使用 if __name__ __main__: # 测试用的原始数据 test_data np.array([1, 2, 3, 4, 5]) # 执行标准化 data_after_standard, standard_info normalize_data(test_data) # 输出结果 print(原始数据, test_data) print(标准化后, np.round(data_after_standard, 4)) print(\n标准化用到的参数) print(f原始数据均值 {standard_info.data_mean:.4f}) print(f原始数据标准差 {standard_info.data_std:.4f})

相关文章:

数据标准化(拟合的时候使用非常重要)

一、函数作用这个函数是数据标准化(Z-Score 标准化) 函数,专门对两组数据 x_raw(自变量)做标准化处理,并返回标准化后的数据 记录标准化参数的对象。具体做了这 4 件事:计算 x_raw 的均值和标准…...

2025最权威的AI辅助写作助手推荐榜单

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek AI辅助写作工具正深刻改变着学术研究的传统范式,这是随着人工智能技术飞快发展而…...

告别手动复制粘贴!用Matlab脚本一键搞定A2L与ELF文件合并(附完整.m文件)

汽车电控标定工程师的自动化利器:Matlab脚本实现A2L与ELF文件智能合并 在汽车电子控制单元(ECU)开发过程中,标定工作是不可或缺的关键环节。传统的手动操作方式不仅效率低下,还容易引入人为错误。本文将详细介绍如何利…...

Obsidian Image Toolkit:终极图像管理解决方案

Obsidian Image Toolkit:终极图像管理解决方案 【免费下载链接】obsidian-image-toolkit An Obsidian plugin for viewing an image. 项目地址: https://gitcode.com/gh_mirrors/ob/obsidian-image-toolkit Obsidian Image Toolkit 是一款专为 Obsidian 用户…...

量子强化学习与混合架构在工业控制与缺陷检测中的实践

1. 量子强化学习在工业控制中的实践突破量子强化学习(QRL)作为传统强化学习的量子化延伸,正在工业自动化领域展现出独特优势。以移动通信基站天线选择为例,传统方法需要精确追踪手机运动轨迹,而QRL通过训练智能体基于历…...

Hyper-V DDA图形工具:告别PowerShell命令行的设备直通新时代

Hyper-V DDA图形工具:告别PowerShell命令行的设备直通新时代 【免费下载链接】DDA 实现Hyper-V离散设备分配功能的图形界面工具。A GUI Tool For Hyper-Vs Discrete Device Assignment(DDA). 项目地址: https://gitcode.com/gh_mirrors/dd/DDA 还在为Hyper-…...

进化智能体实战:从基因编码到种群优化的完整实现指南

1. 项目概述:从蓝图到智能体,一次开源协作的深度实践最近在开源社区里,一个名为planck-lab/hermes-evolving-agents-public-blueprint的项目引起了我的注意。乍一看这个标题,它像是一个技术蓝图或公开的设计文档,但深入…...

3步搞定Linux启动盘:Deepin Boot Maker完全使用指南

3步搞定Linux启动盘:Deepin Boot Maker完全使用指南 【免费下载链接】deepin-boot-maker 项目地址: https://gitcode.com/gh_mirrors/de/deepin-boot-maker 在Linux系统安装和维护过程中,启动盘制作是一个看似简单却充满挑战的环节。传统命令行工…...

【NotebookLM企业级权限治理白皮书】:为什么87%的AI协作项目在上线30天内遭遇越权访问?

更多请点击: https://intelliparadigm.com 第一章:NotebookLM企业级权限治理的底层逻辑 NotebookLM 的企业级权限治理并非简单叠加 RBAC(基于角色的访问控制),而是构建在「数据主权可追溯、策略执行零信任、上下文感知…...

数字家谱系统架构设计:从关系数据库到可视化交互的完整实现

1. 项目概述:从“家谱”到“数字家谱”的跨越最近在GitHub上看到一个挺有意思的项目,叫qiaoshouqing/familytree。光看名字,你可能会觉得,这不就是个家谱吗?没错,它的核心确实是家谱,但如果你把…...

Arm Corstone SSE-300内存架构与安全设计解析

1. Arm Corstone SSE-300内存架构深度解析在嵌入式系统设计中,内存映射是连接软件与硬件的关键纽带。作为Arm最新推出的子系统解决方案,Corstone SSE-300通过精心设计的内存架构,为开发者提供了高性能、高安全性的开发平台。我在实际项目中使…...

别死记硬背!用‘小明小红在操场’的JavaScript题,彻底搞懂this、call和箭头函数

从操场运动到代码执行:用生活场景拆解JavaScript的this与箭头函数 操场上的小明和小红正在运动,这个看似简单的场景却暗藏JavaScript中this指向的玄机。当我们把人物动作转化为代码时,this的指向问题往往成为初学者的"绊脚石"。本文…...

紧急通知:NotebookLM v2.3将移除手动标签覆盖功能!立即执行这5项存量标签加固操作,否则知识链永久断裂

更多请点击: https://intelliparadigm.com 第一章:NotebookLM标签管理方法 NotebookLM 原生不提供显式的“标签(Tags)”UI 控件,但可通过其底层的 source 元数据机制实现语义化标签管理。核心思路是将标签作为自定义…...

Pearcleaner深度清理工具:为你的Mac找回丢失的存储空间

Pearcleaner深度清理工具:为你的Mac找回丢失的存储空间 【免费下载链接】Pearcleaner A free, source-available and fair-code licensed mac app cleaner 项目地址: https://gitcode.com/gh_mirrors/pe/Pearcleaner 你是否曾经计算过,那些看似已…...

狼来了?如果我们正处于AI泡沫中会怎样?

AI 热潮真正的风险,不在模型神话,而在算力账单和 ROI 清算。 原文链接:AI 小老六 每天,我们都能在网络上看到各种关于 AI 未来 的离谱预测。 有人说:“GPT-7 马上就要出来了,它会吞噬所有的软件&#xff0…...

Proxmark3GUI图形化工具:5分钟学会RFID卡片分析与数据管理

Proxmark3GUI图形化工具:5分钟学会RFID卡片分析与数据管理 【免费下载链接】Proxmark3GUI A cross-platform GUI for Proxmark3 client | 为PM3设计的跨平台图形界面 项目地址: https://gitcode.com/gh_mirrors/pr/Proxmark3GUI Proxmark3GUI是一款为Proxmar…...

3分钟告别浏览器Markdown阅读困境:这款扩展如何重塑你的技术文档体验

3分钟告别浏览器Markdown阅读困境:这款扩展如何重塑你的技术文档体验 【免费下载链接】markdown-viewer Markdown Viewer / Browser Extension 项目地址: https://gitcode.com/gh_mirrors/ma/markdown-viewer 你是否曾面对浏览器中杂乱的Markdown源代码感到困…...

终极装备管家:TQVaultAE如何彻底解决《泰坦之旅》仓库爆满难题

终极装备管家:TQVaultAE如何彻底解决《泰坦之旅》仓库爆满难题 【免费下载链接】TQVaultAE Extra bank space for Titan Quest Anniversary Edition 项目地址: https://gitcode.com/gh_mirrors/tq/TQVaultAE 还在为《泰坦之旅》中堆积如山的传奇装备无处安放…...

【AI Agent软件直控革命】:20年架构师亲授5大落地陷阱与3步安全接入法

更多请点击: https://intelliparadigm.com 第一章:AI Agent软件直控革命:从概念到产业拐点 AI Agent 已不再停留于对话式助手或任务调度器的初级形态,正加速演进为具备环境感知、自主决策与系统级直控能力的“数字执行体”。其核…...

Hackintool:黑苹果配置不再复杂,这款工具让你轻松搞定所有难题

Hackintool:黑苹果配置不再复杂,这款工具让你轻松搞定所有难题 【免费下载链接】Hackintool The Swiss army knife of vanilla Hackintoshing 项目地址: https://gitcode.com/gh_mirrors/ha/Hackintool 还在为黑苹果的配置问题头疼吗?…...

终极指南:3步彻底解决腾讯游戏ACE-Guard卡顿,免费提升游戏性能

终极指南:3步彻底解决腾讯游戏ACE-Guard卡顿,免费提升游戏性能 【免费下载链接】sguard_limit 限制ACE-Guard Client EXE占用系统资源,支持各种腾讯游戏 项目地址: https://gitcode.com/gh_mirrors/sg/sguard_limit 你是否在玩《英雄联…...

高效检索句子:基于 SQLite FTS5 的关键词快速匹配方案

std::filesystem::replace_extension 仅修改路径对象的逻辑表示,不更改磁盘文件;真正改后缀需配合 fs::rename,且须检查目标是否存在、文件是否为常规文件,并注意跨卷、文件占用等系统限制。std::filesystem::replace_extension 为…...

CNN在卷什么:五大组件详解,一文讲透卷积神经网络,从LeNet到ResNet,为什么这5个组件是CNN的标配

CNN在卷什么:五大组件详解,一文讲透卷积神经网络 副标题: 从LeNet到ResNet,为什么这5个组件是CNN的标配 痛点:CNN的五大组件是什么? 学CNN的时候,你是不是分不清这些概念? 卷积层 vs 池化层:都是"滑动",有什么区别? BatchNorm 到底在做什么?为什么需要它…...

Golang怎么实现HTTP请求取消_Golang如何用context取消正在进行的HTTP请求【实战】

HTTP客户端默认不取消请求是设计选择,需显式通过context.Context传递取消信号;必须用NewRequestWithContext、禁用Client.Timeout、确保Transport组件响应同一ctx。为什么 http.Client 默认不取消请求?Go 的 http.Client 本身不自动响应外部中…...

ECU软件刷写核心:拆解UDS的34/36/37服务,如何像拷贝文件一样传输数据?

ECU软件刷写核心:拆解UDS的34/36/37服务,如何像拷贝文件一样传输数据? 想象一下,你需要将一部高清电影从电脑传输到手机——这个过程需要稳定的连接、合理的分块大小和可靠的数据校验。在汽车电子领域,ECU软件刷写同样…...

FanControl终极指南:告别噪音,掌控你的PC风扇控制

FanControl终极指南:告别噪音,掌控你的PC风扇控制 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Tren…...

STAR-CCM+物理场全览:从基础流动到前沿多物理场耦合

1. 流体与传热:STAR-CCM的仿真基石 流动与传热仿真是工程模拟中最基础也最常用的功能。在STAR-CCM中,这两个物理场就像盖房子的地基,后续所有高级功能都建立在这个基础之上。我刚开始接触CFD时,花了整整三个月时间专门研究这两个模…...

BOX工控机在无人机机载系统中有什么优势?这 3 点是普通工控机比不了的

现在的无人机机载系统,越来越多的人选择用 BOX工控机。很多人问我,BOX工控机到底是什么?它和普通的工控机有什么区别?为什么大家都在用它?今天我就跟大家好好聊聊这个话题。我会从一个 17 年工控人的角度,给大家讲透 BOX工控机在无人机机载…...

终极免费音频智能分割工具:快速解放你的音频处理工作流

终极免费音频智能分割工具:快速解放你的音频处理工作流 【免费下载链接】audio-slicer A simple GUI application that slices audio with silence detection 项目地址: https://gitcode.com/gh_mirrors/aud/audio-slicer 还在为处理长音频文件而烦恼吗&…...

2025年Mac菜单栏革命:Ice如何重塑你的桌面工作流

2025年Mac菜单栏革命:Ice如何重塑你的桌面工作流 【免费下载链接】Ice Powerful menu bar manager for macOS 项目地址: https://gitcode.com/GitHub_Trending/ice/Ice 你是否曾因Mac菜单栏上的图标拥挤不堪而感到困扰?Wi-Fi、电池、时间等关键信…...