当前位置: 首页 > news >正文

【深度学习】实验03 特征处理

文章目录

  • 特征处理
    • 标准化
    • 归一化
    • 正则化

特征处理

标准化

# 导入标准化库
from sklearn.preprocessing import StandardScalerfrom matplotlib import gridspec
import numpy as np
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings("ignore")
# 随机生成0到100的整数,100行2列
data = np.random.randint(0, 100, (100, 2))
data

array([[ 7, 84],
[43, 81],
[22, 84],
[ 7, 61],
[51, 74],
[95, 94],
[80, 92],
[58, 35],
[88, 15],
[61, 42],
[75, 95],
[87, 64],
[18, 77],
[13, 60],
[18, 51],
[61, 12],
[32, 11],
[ 6, 77],
[85, 44],
[87, 10],
[84, 10],
[ 1, 28],
[76, 87],
[61, 0],
[ 9, 25],
[83, 75],
[ 7, 60],
[80, 73],
[62, 58],
[71, 84],
[78, 6],
[92, 54],
[92, 50],
[28, 57],
[73, 80],
[97, 86],
[84, 78],
[ 9, 29],
[90, 64],
[ 8, 32],
[98, 62],
[45, 93],
[73, 72],
[97, 11],
[21, 66],
[32, 9],
[65, 59],
[30, 36],
[19, 37],
[75, 43],
[90, 55],
[53, 8],
[73, 25],
[73, 82],
[84, 76],
[49, 97],
[29, 64],
[69, 37],
[72, 90],
[10, 87],
[19, 70],
[49, 53],
[56, 24],
[61, 16],
[58, 23],
[28, 31],
[37, 49],
[67, 25],
[31, 99],
[38, 84],
[55, 53],
[27, 89],
[83, 50],
[73, 86],
[67, 11],
[61, 72],
[17, 88],
[82, 67],
[56, 51],
[18, 59],
[73, 44],
[ 8, 86],
[ 6, 20],
[32, 12],
[15, 4],
[91, 17],
[21, 78],
[67, 63],
[12, 32],
[45, 76],
[41, 29],
[75, 64],
[75, 19],
[ 1, 76],
[17, 18],
[13, 47],
[80, 48],
[88, 76],
[29, 63],
[21, 95]])

# 标准化
ss = StandardScaler()
std_data = ss.fit_transform(data)
std_data

array([[-1.50234381, 1.09430096],
[-0.28120186, 0.98577525],
[-0.99353466, 1.09430096],
[-1.50234381, 0.26227048],
[-0.00983698, 0.73254858],
[ 1.48266985, 1.45605335],
[ 0.97386071, 1.38370287],
[ 0.22760729, -0.67828572],
[ 1.24522559, -1.40179049],
[ 0.32936912, -0.42505905],
[ 0.80425766, 1.49222858],
[ 1.21130498, 0.37079619],
[-1.1292171 , 0.84107429],
[-1.29882015, 0.22609524],
[-1.1292171 , -0.09948191],
[ 0.32936912, -1.5103162 ],
[-0.65432856, -1.54649144],
[-1.53626442, 0.84107429],
[ 1.14346376, -0.35270857],
[ 1.21130498, -1.58266668],
[ 1.10954315, -1.58266668],
[-1.70586747, -0.93151239],
[ 0.83817827, 1.20282668],
[ 0.32936912, -1.94441906],
[-1.43450259, -1.0400381 ],
[ 1.07562254, 0.76872382],
[-1.50234381, 0.22609524],
[ 0.97386071, 0.69637334],
[ 0.36328973, 0.15374476],
[ 0.66857522, 1.09430096],
[ 0.90601949, -1.72736763],
[ 1.38090802, 0.00904381],
[ 1.38090802, -0.13565714],
[-0.790011 , 0.11756952],
[ 0.73641644, 0.94960001],
[ 1.55051107, 1.16665144],
[ 1.10954315, 0.87724953],
[-1.43450259, -0.89533715],
[ 1.3130668 , 0.37079619],
[-1.4684232 , -0.78681143],
[ 1.58443168, 0.29844572],
[-0.21336064, 1.41987811],
[ 0.73641644, 0.6601981 ],
[ 1.55051107, -1.54649144],
[-1.02745527, 0.44314667],
[-0.65432856, -1.61884192],
[ 0.46505156, 0.18992 ],
[-0.72216978, -0.64211048],
[-1.09529649, -0.60593524],
[ 0.80425766, -0.38888381],
[ 1.3130668 , 0.04521905],
[ 0.05800424, -1.65501716],
[ 0.73641644, -1.0400381 ],
[ 0.73641644, 1.02195048],
[ 1.10954315, 0.80489905],
[-0.0776782 , 1.56457906],
[-0.75609039, 0.37079619],
[ 0.600734 , -0.60593524],
[ 0.70249583, 1.31135239],
[-1.40058198, 1.20282668],
[-1.09529649, 0.58784762],
[-0.0776782 , -0.02713143],
[ 0.15976607, -1.07621334],
[ 0.32936912, -1.36561525],
[ 0.22760729, -1.11238858],
[-0.790011 , -0.82298667],
[-0.48472551, -0.17183238],
[ 0.53289278, -1.0400381 ],
[-0.68824917, 1.63692954],
[-0.4508049 , 1.09430096],
[ 0.12584546, -0.02713143],
[-0.82393161, 1.27517715],
[ 1.07562254, -0.13565714],
[ 0.73641644, 1.16665144],
[ 0.53289278, -1.54649144],
[ 0.32936912, 0.6601981 ],
[-1.16313771, 1.23900191],
[ 1.04170193, 0.47932191],
[ 0.15976607, -0.09948191],
[-1.1292171 , 0.18992 ],
[ 0.73641644, -0.35270857],
[-1.4684232 , 1.16665144],
[-1.53626442, -1.2209143 ],
[-0.65432856, -1.5103162 ],
[-1.23097893, -1.79971811],
[ 1.34698741, -1.32944001],
[-1.02745527, 0.87724953],
[ 0.53289278, 0.33462096],
[-1.33274076, -0.78681143],
[-0.21336064, 0.80489905],
[-0.34904307, -0.89533715],
[ 0.80425766, 0.37079619],
[ 0.80425766, -1.25708953],
[-1.70586747, 0.80489905],
[-1.16313771, -1.29326477],
[-1.29882015, -0.24418286],
[ 0.97386071, -0.20800762],
[ 1.24522559, 0.80489905],
[-0.75609039, 0.33462096],
[-1.02745527, 1.49222858]])

# 作图
gs = gridspec.GridSpec(5,5)
fig = plt.figure()
ax1 = fig.add_subplot(gs[0:2, 1:4])
ax2 = fig.add_subplot(gs[3:5, 1:4])ax1.scatter(data[:, 0], data[:, 1])
ax2.scatter(std_data[:, 0], std_data[:, 1])plt.show()

1

归一化

# 导入归一化库
from sklearn.preprocessing import MinMaxScaler
import numpy as npdata = np.random.uniform(0, 100, 10)[:, np.newaxis]
mm = MinMaxScaler()
mm_data = mm.fit_transform(data)
origin_data = mm.inverse_transform(mm_data)
print('data is ',data)
print('after Min Max ',mm_data)
print('origin data is ',origin_data)

data is [[67.74476271]
[10.2077285 ]
[27.34037799]
[24.72236105]
[68.67245127]
[91.11026437]
[51.92345696]
[92.05191865]
[16.9495692 ]
[94.18851495]]
after Min Max [[0.6851214 ]
[0. ]
[0.20400678]
[0.17283278]
[0.69616784]
[0.96334578]
[0.49672943]
[0.97455851]
[0.08027837]
[1. ]]
origin data is [[67.74476271]
[10.2077285 ]
[27.34037799]
[24.72236105]
[68.67245127]
[91.11026437]
[51.92345696]
[92.05191865]
[16.9495692 ]
[94.18851495]]

正则化

# 导入L1正则化库
from sklearn.preprocessing import Normalizer# 导入L2正则化库
from sklearn.preprocessing import normalizeX = [[1, -1, 2],[2, 0, 0],[0, 1, -1]]normalizerl1 = Normalizer(norm='l1')
l1 = normalizerl1.fit_transform(X)
print('l1:', l1)l2 = normalize(X, norm='l2')
print('l2:', l2)
l1: [[ 0.25 -0.25  0.5 ][ 1.    0.    0.  ][ 0.    0.5  -0.5 ]]
l2: [[ 0.40824829 -0.40824829  0.81649658][ 1.          0.          0.        ][ 0.          0.70710678 -0.70710678]]

相关文章:

【深度学习】实验03 特征处理

文章目录 特征处理标准化归一化正则化 特征处理 标准化 # 导入标准化库 from sklearn.preprocessing import StandardScalerfrom matplotlib import gridspec import numpy as np import matplotlib.pyplot as plt import warnings warnings.filterwarnings("ignore&quo…...

基于Dpabi的功能连接

1.预处理 这里预处理用Gretna软件进行,共分为以下几步: (1)DICOM转NIfTI格式 (2)去除前10个时间点(Remove first 10 times points):由于机器刚启动、被试刚躺进去也还需适应环境,导致刚开始扫描的数据很…...

在React项目是如何捕获错误的?

文章目录 react中的错误介绍解决方案后言 react中的错误介绍 错误在我们日常编写代码是非常常见的 举个例子,在react项目中去编写组件内JavaScript代码错误会导致 React 的内部状态被破坏,导致整个应用崩溃,这是不应该出现的现象 作为一个框架…...

基于内存池的 简单高效的数据库 SDK简介

基于内存池的 简单高效的数据库 SDK简介 下载地址: https://gitee.com/tankaishuai/powerful_sdks/tree/master/shm_alloc_db_heap shm_alloc_db_heap 是一个基于内存池实现的简单高效的文件型数据存储引擎,利用它可以轻松地像访问内存块一样读、写、增…...

python实例方法,类方法和静态方法区别

为python中的装饰器 实例方法 实例方法时直接定义在类中的函数,不需要任何修饰。只能通过类的实例化对象来调用。不能通过类名来调用。 类方法 类方法,是类中使用classmethod修饰的函数。类方法在定义的时候需要有表示类对象的参数(一般命名为cls&#…...

Pyecharts教程(四):使用pyecharts绘制3D折线图

Pyecharts教程(四):使用pyecharts绘制3D折线图 作者:安静到无声 个人主页 目录 Pyecharts教程(四):使用pyecharts绘制3D折线图准备工作数据准备绘制3D折线图推荐专栏在这篇文章中,我们将学习如何使用pyecharts库来绘制一个3D折线图。pyecharts是一个用于生成Echarts图表的…...

【stable-diffusion使用扩展+插件和模型资源(下)】

插件模型魔法图片等资源:https://tianfeng.space/1240.html 书接上文:(上) 插件推荐 1.lobe theme lobe theme是一款主题插件,直接可以在扩展安装 界面进行了重新布局,做了一些优化,有兴趣的…...

一文了解SpringBoot中的Aop

目录 1.什么是Aop 2.相关概念 3.相关注解 4.为什么要用Aop 5.Aop使用案例 1.什么是Aop AOP:Aspect Oriented Programming,面向切面,是Spring三大思想之一,另外两个是 IOC-控制反转 DI-依赖注入 (Autowired、Qualifier、Re…...

android系统启动流程之zygote如何创建SystemServer进程

SystemServer:是独立的进程,主要工作是管理服务的,它将启动大约90种服务Services. 它主要承担的职责是为APP的运行提供各种服务,像AMS,WMS这些服务并不是一个独立的进程, 它们其实都是SystemServer进程中需要管理的的众多服务之一…...

【awd系列】Bugku S3 AWD排位赛-9 pwn类型

文章目录 二进制下载检查分析运行二进制ida分析解题思路exp 二进制下载 下载地址:传送门 检查分析 [rootningan 3rd]# file pwn pwn: ELF 64-bit LSB executable, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/ld-linux-x86-64.so.2, for …...

vcomp140.dll丢失的修复方法分享,电脑提示vcomp140.dll丢失修复方法

今天,我的电脑出现了一个奇怪的问题,打开某些程序时总是提示“找不到vcomp140.dll文件”。这个问题让我非常头疼,因为我无法正常使用电脑上的一些重要软件。为了解决这个问题,我在网上查找了很多资料,并尝试了多种方法…...

Docker file解析

文章目录 简介构建的三步骤Docker执行Dockerfile的大致流程DockerFile常用保留字指令创建第一个Dockerfile镜像的缓存特性 Docker file 解析 简介 Dockerfile是用来构建Docker镜像的文本文件,是由一条条构建镜像所需的指令和参数构成的脚本,记录了镜像构…...

工作与身体健康之间的平衡

大厂裁员,称35岁以后体能下滑,无法继续高效率地完成工作;体重上涨,因为35岁以后新陈代谢开始变慢;甚至坐久了会腰疼、睡眠困扰开始加重,在众多的归因中,仿佛35岁的到来,会为一切的焦…...

算法和数据结构

STL 【C】蓝桥杯必备 算法竞赛常用STL万字总结_蓝桥杯算法竞赛_Cpt1024的博客-CSDN博客 day1 1:正确 力扣(LeetCode)官网 - 全球极客挚爱的技术成长平台 // 中序遍历一遍二叉树,并统计节点数目 class Solution { public:int c…...

商城-学习整理-集群-K8S-集群环境部署(二十四)

目录 一、MySQL集群1、mysql集群原理2、Docker安装模拟MySQL主从复制集群1、下载mysql镜像2、创建Master实例并启动3、创建 Slave 实例并启动4、为 master 授权用户来同步数据1、进入 master 容器2、进入 mysql 内部 (mysql –uroot -p)3、查看 master 状…...

利用多种机器学习方法对爬取到的谷歌趋势某个关键词的每日搜索次数进行学习

大家好,我是带我去滑雪! 前一期利用python爬取了谷歌趋势某个关键词的每日搜索次数,本期利用爬取的数据进行多种机器学习方法进行学习,其中方法包括:随机森林、XGBOOST、决策树、支持向量机、神经网络、K邻近等方法&am…...

ARL资产侦察灯塔 指纹增强

项目:https://github.com/loecho-sec/ARL-Finger-ADD 下载项目后运行 python3 ARl-Finger-ADD.py https://你的vpsIP:5003/ admin password该项目中的finger.json可以自己找到其他的指纹完善,然后运行脚本添加指纹。...

javaee spring 自动注入,如果满足条件的类有多个如何区别

如图IDrinkDao有两个实现类 方法一 方法二 Resource(name“对象名”) Resource(name"oracleDrinkDao") private IDrinkDao drinkDao;...

sql语句中的ddl和dml

操作数据库:CRUD C(create) 创建 *数据库创建出来默认字符集为utf8 如果要更改字符集就 Create database 名称 character set gbk(字符集) *创建数据库:create database 名称 *先检查是否有该数据库在…...

学习JAVA打卡第四十一天

字符串与字符数组、字节数组 ⑴字符串与字符数组 String类的构造方法String(char a[])和String(char a[]),int offset,int length,分别用数组a中的全部字符和部分字符创建string对象。 String类也提供将string对象的字符序列存…...

Java 8 Stream API 入门到实践详解

一、告别 for 循环&#xff01; 传统痛点&#xff1a; Java 8 之前&#xff0c;集合操作离不开冗长的 for 循环和匿名类。例如&#xff0c;过滤列表中的偶数&#xff1a; List<Integer> list Arrays.asList(1, 2, 3, 4, 5); List<Integer> evens new ArrayList…...

QMC5883L的驱动

简介 本篇文章的代码已经上传到了github上面&#xff0c;开源代码 作为一个电子罗盘模块&#xff0c;我们可以通过I2C从中获取偏航角yaw&#xff0c;相对于六轴陀螺仪的yaw&#xff0c;qmc5883l几乎不会零飘并且成本较低。 参考资料 QMC5883L磁场传感器驱动 QMC5883L磁力计…...

深入浅出:JavaScript 中的 `window.crypto.getRandomValues()` 方法

深入浅出&#xff1a;JavaScript 中的 window.crypto.getRandomValues() 方法 在现代 Web 开发中&#xff0c;随机数的生成看似简单&#xff0c;却隐藏着许多玄机。无论是生成密码、加密密钥&#xff0c;还是创建安全令牌&#xff0c;随机数的质量直接关系到系统的安全性。Jav…...

Java-41 深入浅出 Spring - 声明式事务的支持 事务配置 XML模式 XML+注解模式

点一下关注吧&#xff01;&#xff01;&#xff01;非常感谢&#xff01;&#xff01;持续更新&#xff01;&#xff01;&#xff01; &#x1f680; AI篇持续更新中&#xff01;&#xff08;长期更新&#xff09; 目前2025年06月05日更新到&#xff1a; AI炼丹日志-28 - Aud…...

精益数据分析(97/126):邮件营销与用户参与度的关键指标优化指南

精益数据分析&#xff08;97/126&#xff09;&#xff1a;邮件营销与用户参与度的关键指标优化指南 在数字化营销时代&#xff0c;邮件列表效度、用户参与度和网站性能等指标往往决定着创业公司的增长成败。今天&#xff0c;我们将深入解析邮件打开率、网站可用性、页面参与时…...

优选算法第十二讲:队列 + 宽搜 优先级队列

优选算法第十二讲&#xff1a;队列 宽搜 && 优先级队列 1.N叉树的层序遍历2.二叉树的锯齿型层序遍历3.二叉树最大宽度4.在每个树行中找最大值5.优先级队列 -- 最后一块石头的重量6.数据流中的第K大元素7.前K个高频单词8.数据流的中位数 1.N叉树的层序遍历 2.二叉树的锯…...

AspectJ 在 Android 中的完整使用指南

一、环境配置&#xff08;Gradle 7.0 适配&#xff09; 1. 项目级 build.gradle // 注意&#xff1a;沪江插件已停更&#xff0c;推荐官方兼容方案 buildscript {dependencies {classpath org.aspectj:aspectjtools:1.9.9.1 // AspectJ 工具} } 2. 模块级 build.gradle plu…...

GitHub 趋势日报 (2025年06月06日)

&#x1f4ca; 由 TrendForge 系统生成 | &#x1f310; https://trendforge.devlive.org/ &#x1f310; 本日报中的项目描述已自动翻译为中文 &#x1f4c8; 今日获星趋势图 今日获星趋势图 590 cognee 551 onlook 399 project-based-learning 348 build-your-own-x 320 ne…...

【MATLAB代码】基于最大相关熵准则(MCC)的三维鲁棒卡尔曼滤波算法(MCC-KF),附源代码|订阅专栏后可直接查看

文章所述的代码实现了基于最大相关熵准则(MCC)的三维鲁棒卡尔曼滤波算法(MCC-KF),针对传感器观测数据中存在的脉冲型异常噪声问题,通过非线性加权机制提升滤波器的抗干扰能力。代码通过对比传统KF与MCC-KF在含异常值场景下的表现,验证了后者在状态估计鲁棒性方面的显著优…...

libfmt: 现代C++的格式化工具库介绍与酷炫功能

libfmt: 现代C的格式化工具库介绍与酷炫功能 libfmt 是一个开源的C格式化库&#xff0c;提供了高效、安全的文本格式化功能&#xff0c;是C20中引入的std::format的基础实现。它比传统的printf和iostream更安全、更灵活、性能更好。 基本介绍 主要特点 类型安全&#xff1a…...