当前位置：首页 > news >正文

利用字典对归一化后的数据0误差还原

news 2026/5/18 19:39:58

假设我对精度要求很高，高到无法容忍有任何误差，那么我先将x按照大小排序，然后归一化，用字典将归一化前后的x存储下来，在深度学习时使用归一化后的x进行处理，但是最后画图等处理时，我用字典取出归一化之前对应的值。

思路：x = [3, 4, 5, 1, 2, 3]，先排序，然后用scaler = StandardScaler()
x_scaled = scaler.fit_transform(x.reshape(-1, 1))
这种方法归一化得到结果, 然后采用1个字典，能存储归一化之后的值：归一化之前的值，这种字典，以及归一化之前的值：归一化之后的值这种字典。

首先，将 x 数组排序并使用 StandardScaler 进行归一化。接着，创建两个字典：

归一化后的值：归一化之前的值（scaled_to_original）
归一化之前的值：归一化之后的值（original_to_scaled）

下面是实现的示例代码：

import numpy as np
from sklearn.preprocessing import StandardScaler# 原始数据
x = np.array([3, 4, 5, 1, 2, 3])# 排序数据
x_sorted = np.sort(x)# 使用 StandardScaler 进行归一化
scaler = StandardScaler()
x_scaled = scaler.fit_transform(x_sorted.reshape(-1, 1)).flatten()# 创建字典存储归一化值到原始值的映射
scaled_to_original = {scaled: original for scaled, original in zip(x_scaled, x_sorted)}# 创建字典存储原始值到归一化值的映射
original_to_scaled = {original: scaled for original, scaled in zip(x_sorted, x_scaled)}# 打印结果
print("归一化后的值：归一化之前的值 字典:", scaled_to_original)
print("归一化之前的值：归一化后的值 字典:", original_to_scaled)# 示例：使用归一化值查找原始值
example_scaled_value = x_scaled[0]
example_original_value = scaled_to_original[example_scaled_value]
print(f"归一化值 {example_scaled_value} 对应的原始值: {example_original_value}")# 示例：使用原始值查找归一化值
example_original_value = 3
example_scaled_value = original_to_scaled[example_original_value]
print(f"原始值 {example_original_value} 对应的归一化值: {example_scaled_value}")

代码说明

数据排序：x_sorted = np.sort(x) 会将 x 中的元素排序。
归一化：scaler.fit_transform() 方法对排序后的数据进行标准化，返回标准化后的结果。
字典生成：
- scaled_to_original 字典将归一化后的值作为键，原始值作为值。
- original_to_scaled 字典将原始值作为键，归一化后的值作为值。

运行结果

当运行上述代码时，输出结果会显示两个字典的内容，并且可以通过这两个字典进行值的查找。

示例输出

输出结果：

归一化后的值：归一化之前的值 字典: {-1.5491933384829668: 1, -0.7745966692414834: 2, 0.0: 3, 0.7745966692414834: 4, 1.5491933384829668: 5}
归一化之前的值：归一化后的值 字典: {1: -1.5491933384829668, 2: -0.7745966692414834, 3: 0.0, 4: 0.7745966692414834, 5: 1.5491933384829668}
归一化值 -1.5491933384829668 对应的原始值: 1
原始值 3 对应的归一化值: 0.0

由于 3 在 x 中出现了两次，因此在字典中将其映射到的归一化值是相同的。

一个宽松的版本

使用插值方法：可以使用线性插值来获取最接近的原始值，而不是严格寻找对应的值。
确保预测值在范围内：确保生成的 predicted_normalized 值确实在归一化范围内。

以下是采用线性插值的实现方式：

示例代码

import numpy as np
from sklearn.preprocessing import MinMaxScaler
from scipy.interpolate import interp1d# 生成数据
x = np.random.rand(100) * 100  # 生成100个随机数，范围在0到100之间# 创建 MinMaxScaler 对象
scaler = MinMaxScaler()# 对数据进行排序
x_sorted = np.sort(x)# 归一化数据
x_normalized = scaler.fit_transform(x_sorted.reshape(-1, 1)).flatten()# 创建字典存储原始值与归一化值的对应关系
value_map = {original: normalized for original, normalized in zip(x_sorted, x_normalized)}# 深度学习模型处理（示例代码省略）# 假设预测的归一化值为 predicted_normalized
predicted_normalized = np.random.rand(10)  # 示例：10个随机生成的归一化值# 使用插值来反归一化
# 创建插值函数
interp_function = interp1d(x_normalized, x_sorted, bounds_error=False, fill_value="extrapolate")# 获取对应的原始值
predicted_original = interp_function(predicted_normalized)print("归一化后的预测值:", predicted_normalized)
print("对应的原始值:", predicted_original)

输出

归一化后的预测值: [0.01215447 0.96987883 0.04315991 0.89114311 0.52770111 0.99296480.07379656 0.55385428 0.96930254 0.52309784]
对应的原始值: [ 2.27449952 96.09964077  5.31200141 88.38615894 52.78092728 98.361298158.31337469 55.34306884 96.04318341 52.32996038]

说明

插值函数：interp1d 从 scipy.interpolate 中导入，可以根据归一化值计算相应的原始值。通过设置 bounds_error=False 和 fill_value="extrapolate"，可以处理在 value_map.values() 中找不到的值（即插值和外推）。通过使用插值技术，可以避免在查找字典中直接索引可能不存在的归一化值，从而确保代码的健壮性和有效性。
适用性：这种方法适用于在归一化数据中查找最接近的原始值，确保获得合理的输出，而不是直接找不到值时导致错误。

利用字典对归一化后的数据0误差还原

假设我对精度要求很高，高到无法容忍有任何误差，那么我先将x按照大小排序，然后归一化，用字典将归一化前后的x存储下来，在深度学习时使用归一化后的x进行处理，但是最后画图等处理时，我用字典取出归…...

编程日记 2024/11/3 2:11:11

HarmonyOS：UIAbility组件概述

一、概述 UIAbility组件是一种包含UI的应用组件，主要用于和用户交互。 UIAbility的设计理念： 原生支持应用组件级的跨端迁移和多端协同。支持多设备和多窗口形态。 UIAbility划分原则与建议： UIAbility组件是系统调度的基本单元&#xff0c…...

编程日记 2024/11/3 2:10:10

12寸半导体厂说的华夫区是什么意思

1\什么是华夫板在半导体行业中，“华夫区”通常指的是“华夫板”（Waffle Slab），这是一种特殊设计的楼板，其表面具有许多均匀分布的孔洞，这些孔洞形成了回风通道，用于电子芯片厂房等对空气洁净度有极高要求的环境。华夫板的设计和施工对于保证洁净室的功能发挥至关重要。…...

编程日记 2024/11/3 2:07:06

数据结构之链式结构二叉树的实现（进阶版）

本篇文章主要讲解链式二叉树的层序遍历以及判断是否为一棵完全二叉树二者将会用到之前学过的队列知识，是将队列和二叉树的整合一、如何将之前已经写好的文件加入当前的编译界面如图所示，打开我们需要加入文件所在的文件夹，找到我们要加…...

编程日记 2024/11/3 2:06:04

【高等数学】3-2多元函数积分学

1. 二重积分可以想象你有一块不规则的平面薄板，它在一个平面区域上。二重积分就是用来求这个薄板的质量（假设薄板的面密度函数是）。把区域划分成许多非常小的小方块（类似于把一块地划分成很多小格子），在每个小方块上，密度近似看成是一个常数，然后把每个小方块的质量加…...

编程日记 2024/11/3 2:03:02

【传知代码】智慧医疗：纹理特征VS卷积特征

🍑个人主页：Jupiter. 🚀 所属专栏：传知代码欢迎大家点赞收藏评论😊 目录论文概述纹理特征和深度卷积特征算法流程数据预处理方法纹理特征提取深度卷积特征提取分类网络搭建代码复现BLS_Model.py文件——分类器搭建py…...

编程日记 2024/11/3 2:01:00

Python-创建并调用自定义文件中的模块/函数

背景：在Python编程中，我们常常需要创建自己的专属文件，以便帮助我们更高效，快捷地完成任务。那么在Python中我们怎么创建并调用自己文件中的模块/函数呢? 在Python中调用自定义文件，通常是指调用自己编写的Python模块…...

编程日记 2024/11/3 1:59:56

Kali Linux

起源与背景 Kali Linux是一个基于Debian的开源Linux发行版，专门为信息安全工作者和渗透测试员设计。它是由Offensive Security Ltd.开发和维护的，作为BackTrack的继承者而诞生。BackTrack是一个流行的安全测试发行版，但为了提供更好的支持和…...

编程日记 2024/11/3 1:57:53

DiffusionDet: Diffusion Model for Object Detection—用于对象检测的扩散模型论文解析

DiffusionDet: Diffusion Model for Object Detection—用于对象检测的扩散模型论文解析这是一篇发表在CVPR 2023的一篇论文，因为自己本身的研究方向是目标跟踪，之前看了一点使用扩散模型进行多跟踪的论文，里面提到了DiffusionDet因此学习一…...

编程日记 2024/11/3 1:56:51

深度学习基础知识-编解码结构理论超详细讲解

编解码结构（Encoder-Decoder）是一种应用广泛且高效的神经网络架构，最早用于序列到序列（Seq2Seq）任务，如机器翻译、图像生成、文本生成等。随着深度学习的发展，编解码结构不断演变出多种模型变体…...

编程日记 2024/11/3 1:55:51

探讨Java深搜算法的学习笔记

大家好，我是 V 哥。深度优先搜索（DFS）是一种图遍历算法，它优先深入到某条路径的尽头，再回溯到前一个节点继续探索其他路径，直到找到目标或遍历完整个图。DFS的应用场景广泛，可以用于路径搜索、连…...

编程日记 2024/11/3 1:53:49

408——操作系统（持续更新）

文章目录一、操作系统的概念及特征1.1 计算机系统的概念1.2 操作系统的基本特征二、操作系统的功能和接口2.1 操作系统作为计算机资源的管理者2.2 操作系统作为用户和计算机硬件系统之间的接口2.3 操作系统实现对计算机资源的扩充三、操作系统的发展和分类四、操作系统的运行…...

编程日记 2024/11/3 1:52:47

架构师之路-学渣到学霸历程-37

Nginx的热部署实验本次分享的就是nginx的升级以及降级，实验中其实很多操作都需要理解，实际操作不难，但是需要全面理解这个动作，敲这个命令是用来干什么的？借着这个笔记可以试一下；go~！ 1、ng…...

编程日记 2024/11/3 1:51:47

CSRF与SSRF

csrf(跨站请求伪造)的原理: csrf全称是跨站请求伪造(cross-site request forgery)，也被称为one-click attack 或者 session riding scrf攻击利用网站对于用户网页浏览器的信任，劫持用户当前已登录的web应用程序，去执行分用户本意的操作。利…...

编程日记 2024/11/3 1:49:44

RabbitMQ 存储机制

一、消息存储机制不管是持久化的消息还是非持久化的消息都可以被写入到磁盘。持久化的消息在到达队列时就被写入到磁盘，非持久化的消息一般只保存在内存中，在内存吃紧的时候会被换入到磁盘中，以节省内存空间。这两种类型的消息的落盘处理都…...

编程日记 2024/11/3 1:44:39

【Java SE】类型转换

类型转换是将一个值从一种类型转换为另一种类型的过程。该过程如果从低精度数据类型转为高精度数据类型，则不会发生溢出并且总能成功，如果从高精度数据类型转为低精度数据类型，则会有信息丢失且可能失败。类型转换又可分为隐式转换和显式转换…...

编程日记 2024/11/3 1:43:34

JAVA：常见 JSON 库的技术详解

1、简述在现代应用开发中，JSON（JavaScript Object Notation）已成为数据交换的标准格式。Java 提供了多种方式将对象转换为 JSON 或从 JSON 转换为对象，常见的库包括 Jackson、Gson 和 org.json。本文将介绍几种常用的 JSON 处理…...

编程日记 2024/11/3 1:42:31

Redis缓存击穿、雪崩、穿透解决方案

Redis 缓存击穿、雪崩、穿透解决方案 1、首先看看逻辑方面是否还有优化空间，正常流程查询redis中获取不到数据，则去数据库获取，但数据库查询并返回时，调用异步方法，将该数据存储进redis中，并设置一个较短的…...

编程日记 2024/11/3 1:41:29

C++ 优先算法——盛最多水的容器（双指针）

目录题目：盛最多水的容器 1. 题目解析 2. 算法原理 3. 代码实现题目：盛最多水的容器 1. 题目解析题目截图: 如图所示： 水的高度一定是由较低的那条线的高度决定的：例1图中，是由7决定的，然后求出…...

编程日记 2024/11/3 1:40:27

blender 小车建模建模学习笔记

一、学习blender视频教程链接案例4：狂奔的小车_建模_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1Bt4y1E7qn?p14&spm_id_from333.788.videopod.episodes&vd_sourced0ea58f1127eed138a4ba5421c577eb1 二、开始建模 （1）创…...

编程日记 2024/11/3 1:39:26

OpenVort开源文本嵌入引擎：本地化部署与语义搜索实战指南

1. 项目概述与核心价值最近在折腾一些需要处理大量文本数据的项目，比如日志分析、文档摘要生成，或者是想给自己的应用加个智能问答功能，总是绕不开一个核心环节：如何高效、准确地将非结构化的文本转换成机器能理解的向量。这个“向…...

编程新知 2026/5/18 17:56:38

期权量化交易基础库：模块化设计与回测实战指南

1. 项目概述：一个为期权交易者打造的“地基” 如果你在量化交易或者期权策略开发领域摸爬滚打过一段时间，大概率会和我有同样的感受：每次想测试一个新想法，都得从零开始搭建数据接口、计算希腊字母、管理仓位、回测框架……这些重…...

编程新知 2026/5/18 15:16:23

长期使用Taotoken Token Plan套餐对项目开发成本的实际影响

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度长期使用Taotoken Token Plan套餐对项目开发成本的实际影响 1. 从按需付费到固定预算的转变在项目开发中引入大模型能力&#xf…...

编程新知 2026/5/18 14:51:28

学一下PLC2--软件PLC（TODO）

既然你手头有 Raspberry Pi Pico，你甚至不需要买任何新的 PLC 硬件，可以直接把它变成一个标准的工业 PLC！ 实现原理： OpenPLC 是一个开源的符合 IEC 61131-3 国际标准的 PLC 软件系统。它完美支持 Raspberry Pi Pico (RP2040)。…...

编程新知 2026/5/18 13:56:16

Python 开发者五分钟接入 Taotoken 调用 GPT 与 Claude 模型

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度 Python 开发者五分钟接入 Taotoken 调用 GPT 与 Claude 模型对于需要在项目中集成大语言模型的 Python 开发者而言，逐…...

编程新知 2026/5/18 13:17:51

如何将AI 3D模型生成工具集成到你的开发工作流【免费下载链接】Unique3D [NeurIPS 2024] Unique3D: High-Quality and Efficient 3D Mesh Generation from a Single Image 项目地址: https://gitcode.com/gh_mirrors/un/Unique3D 在当今快速发展的数字内容创作领域&…...

编程新知 2026/5/18 12:36:50

电赛小白也能搞定的二维云台：用K210+舵机实现色块追踪（附完整代码）

电赛入门实战：K210舵机构建高响应色块追踪云台第一次参加电子设计竞赛时，面对复杂的视觉控制项目总有种无从下手的感觉。直到发现用K210开发板配合普通舵机就能搭建出反应灵敏的二维云台系统，整个过程就像拼乐高一样充满乐趣。本文将带你从零…...

编程新知 2026/5/18 12:34:48

从“玩原神不”到AC：手把手教你用概率DP解决湘潭邀请赛F题（期望计算避坑指南）

从队友闲聊到AC代码：概率DP在算法竞赛中的实战拆解 "玩原神不~"——这句看似随意的队友闲聊，竟成了解决湘潭邀请赛F题的关键灵感。在算法竞赛中，概率与期望DP问题往往让选手望而生畏，但通过这道题的完整解析&#xff0…...

编程新知 2026/5/18 11:43:52

告别Vivado卡顿！用VCS2018+Verdi独立仿真Xilinx IP核的保姆级流程（附Makefile模板）

高效FPGA仿真实践：VCS与Verdi协同验证Xilinx IP核全流程指南在FPGA开发过程中，仿真验证环节往往占据整个项目周期的60%以上时间。传统Vivado集成环境虽然提供了一站式解决方案，但随着设计规模扩大，其启动缓慢、资源占用高的问题…...

编程新知 2026/5/18 11:35:02

FigmaCN：设计师的终极中文界面解决方案

FigmaCN：设计师的终极中文界面解决方案【免费下载链接】figmaCN 中文 Figma 插件，设计师人工翻译校验项目地址: https://gitcode.com/gh_mirrors/fi/figmaCN 还在为Figma的全英文界面而苦恼吗？FigmaCN是专为中文用户打造的专业级本地…...

编程新知 2026/5/18 11:03:03

代码说明

运行结果

示例输出

示例代码

说明

相关文章：