当前位置: 首页 > news >正文

【machine learning-14-特征缩放-归一化】

特征缩放是提升线性回归收敛速度的技巧,什么是特征缩放? 又是什么场景下需要特征缩放,有哪些特征缩放的方法呢?

特征值差异

我们还是以之前房间预测为例:
在这里插入图片描述

这里面是特征房屋大小 房间数目 与房价的关系

本文为简化,只用房屋面积和房间数目来举例, 预测房价的线性回归函数:

f(x) = w1 * x1 + w2 * x2 + b, 其中x1和x2分别是房屋面积和房间数目特征

显而易见的是,x1特征的数值相对大,而x2的数值相对小,这种情况下,w1和w2的不同选择会导致什么情况呢?
假设此时x1 = 2000, x2 = 5,房价500k:

  • 如果w1 = 50 w2 = 0.1 b = 50,此时房价计算出来为100050.5k,显然此时房价天价,预测的房价不合理
  • 反过来 w1 = 0.1 w2 = 50 b = 50 此时预测房价500k,刚好真实结果相同

这跟梯度下降有什么关系呢?

梯度下降

我们画一张特征的散点图就会发现,房屋面积的这个特征值的范围相对 房屋个数这个特征值大的多,散点就集中很矮的一个区域,这就会导致损失函数等高图形式像下面右图一样,
在这里插入图片描述
损失函数是一种瘦高的形式,这种形式带来的坏处就是:
w1 变化很小,损失变动就会很大,因为w1会乘上一个很大的数字
而反过来w2则需要变更很大损失才会有变化。
如果我们用原样的数据,那么这时候损失就会来回震荡,直到很久才能找到最小值,也就是梯度下降很慢,收敛慢,这种情况下,我们可以用的一个方法就是特征缩放

特征缩放

特征缩放的目的就是把特征值都缩放在相差不大的范围,这时候x1和x2分布就会比较均衡,损失函数J就会像下面这样,接近一个圆形:
在这里插入图片描述

归一化

怎么做到让x1和x2缩放到区间差别不大的范围上呢?
方法有很多,如下:

  1. 除以最大值。比如x1最大值是5,那么x1就变更成x1/5
  2. 均值归一化。重新缩放到-1到1之间。方法就是减去均值后除以最大和最小值的差值,如下x1举例:

在这里插入图片描述
3. z-score 归一化。x1的原值减去均值除以标准差,如下X1举例:
在这里插入图片描述

相关文章:

【machine learning-14-特征缩放-归一化】

特征缩放是提升线性回归收敛速度的技巧,什么是特征缩放? 又是什么场景下需要特征缩放,有哪些特征缩放的方法呢? 特征值差异 我们还是以之前房间预测为例: 这里面是特征房屋大小 房间数目 与房价的关系 本文为简化…...

二叉树堆的建立与排序

在数据结构中,二叉树是非常好用的一种数据结构,这节暂时按下不表。这节课主要介绍堆的建立与使用。 堆,是二叉树中一种很特殊的结构,首先,他必须是满二叉树,也就是除了最后一层以外,其他层都是…...

【软件测试】Bug 篇

哈喽,哈喽,大家好~ 我是你们的老朋友:保护小周ღ 今天给大家带来的是 【软件测试】Bug 篇,首先了解, 什么是Bug, 如何定义一个Bug, 如何描述一个 Bug, Bug的级别, 和 Bug 的生命周期, 以及测试人员跟开发人员产生争执如何处理,…...

oracle 多表查询

3.6多表查询 当查询的数据并不是来源一个表时,需要使用多表连接操作完成查询。多表连接查询通过表之间的关联字段,一次查询出多个表的数据。 3.6.1等值连接 等值连接也称为简单连接(Simple Joins)或者内连接(Inner Join)。通过等号来判断连接条件中的数据…...

layui 可以使点击图片放大

layui可以使图片点击放大&#xff0c;不用在写jquyery了真是很方便。 操作示例 引入 <link rel"stylesheet" href"https://cdn.jsdelivr.net/npm/layui-layer3.1.1/dist/layui.css" /> <script src"https://cdn.bootcdn.net/ajax/libs/jqu…...

制作网上3D展馆需要什么技术并投入多少费用?

制作网上3D展览馆项目&#xff0c;需要考虑以下技术和预算方面的信息&#xff1a; 技术需求&#xff1a; 1、三维建模技术&#xff1a;利用3D软件&#xff08;3ds max、maya、blender、c4d等&#xff09;制作展馆和展品的3D模型 2、Web3D技术&#xff1a;如WebGL&#xff0c…...

C++标准库容器类——string类

引言 在c中&#xff0c;string类的引用极大地简化了字符串的操作和管理&#xff0c;相比 C 风格字符串&#xff08;char*或cahr[]&#xff09;&#xff0c;std::string 提供了更高效和更安全的字符串操作。接下来让我们一起来深入学习string类吧&#xff01; 1.string 的构造…...

Qt --- 常用控件的介绍 --- 其他控件

一、QPushButton QWidget中设计到的各种属性/函数/使用方法&#xff0c;针对接下来要介绍的Qt的各种控件都是有效的。 使用QPushButton表示一个按钮&#xff0c;这也是当前我们最熟悉的一个控件了。这个类继承了QAbstractButton&#xff0c;这个类是一个抽象类&#xff0c;是…...

spark读取数据性能提升

1. 背景 spark默认的jdbc只会用单task读取数据&#xff0c;读取大数据量时&#xff0c;效率低。 2. 解决方案 根据分区字段&#xff0c;如日期进行划分&#xff0c;增加task数量提升效率。 /*** 返回每个task按时间段划分的过滤语句* param startDate* param endDate* param …...

一次使用threading.Thread来实现Pytorch多个模型并发运行的失败案例

文章目录 背景我的做法&#xff08;但证明不起效果&#xff09; 背景 我有多个pytorch GPU模型&#xff0c;他们有不同的参数&#xff08;也就是说不是共享的&#xff09;&#xff0c;但是相同的数据输入&#xff0c;想要并发运行。 不并发运行&#xff0c;当然就是循环喽。 …...

HashMap源码

简介 HashMap 是一种基于哈希表的 Map 接口实现&#xff0c;它存储键值对&#xff08;key-value pairs&#xff09;&#xff0c;并允许使用键来快速检索值。在 Java 中&#xff0c;HashMap 是 java.util 包的一部分&#xff0c;它不是同步的&#xff0c;这意味着它不是线程安全…...

探索 Web Speech API:实现浏览器语音识别与合成

引言 Web Speech API 是一项由 W3C 开发的 Web 标准&#xff0c;为开发者提供了在 Web 应用程序中实现语音识别和语音合成的能力。通过 Web Speech API&#xff0c;我们可以让网页与用户进行语音交互&#xff0c;实现更加智能化和便捷的用户体验。本文将深入探讨 Web Speech A…...

python基础题练习

1.可否定义一个sum函数呢&#xff1f;返回指定区间的值的和&#xff1f;例如&#xff0c;区间[1,4]的和为123410返回指定区间值的平方的和呢&#xff1f;立方呢&#xff1f; 代码&#xff1a; # 计算从start到end&#xff08;包括end&#xff09;的所有整数的和。 def sum_ra…...

工业交换机如何保证数据的访问安全

在现代工业自动化环境中&#xff0c;工业交换机作为关键的网络设备&#xff0c;扮演着数据传输和信息交互的重要角色。为了确保数据的访问安全&#xff0c;工业交换机不仅具备高效的转发性能&#xff0c;还集成了多层次的安全防护机制&#xff0c;以抵御各种潜在的网络威胁。 首…...

jmeter得到的文档数据处理

通过前面jmeter得到的输出文档&#xff0c;这里是txt文档&#xff0c;里面包含了很多条数据&#xff0c;每条数据的结构如下&#xff1a; 【request】 uuid&#xff1a;xxxxxxx timestamp&#xff1a;xxxxxxxx No.x question&#xff1a;xxxxxxx 【response】 code&#…...

12- 【JavaWeb】校园快递管理系统-数据库建设

项目概述 开发一个Javaweb校园快递管理系统&#xff0c;包含以下功能&#xff1a; 数据库设计 首先,我们需要设计数据库的表结构。主要包括以下表: 学生表: 存储学生的基本信息&#xff0c;姓名、手机号。快递表: 存储快递的信息&#xff0c;快递单号、收件人、收件人手机号、…...

Windows本地连接远程服务器并创建新用户详细记录

前提可知&#xff1a; &#xff08;1&#xff09;服务器IP地址&#xff1a;x.x.x.x &#xff08;2&#xff09;服务器名称&#xff1a;root&#xff08;一般默认为root&#xff0c;当然也有别的名称&#xff09; &#xff08;3&#xff09;服务器登陆密码&#xff1a;**** 一、…...

【kaggle竞赛】毒蘑菇的二元预测题目相关信息和思路求解代码

毒蘑菇的二元预测 您提供了很多关于不同二元分类任务的资源和链接&#xff0c;看起来这些都是Kaggle竞赛中的参考资料和高分解决方案。为了帮助您更好地利用这些资源&#xff0c;这里是一些关键点的总结&#xff1a; Playground Season 4 Episode 8 主要关注的竞赛: 使用银行…...

Pytest-allure如何在测试完成后自动生成完整报告?

一、完整步骤 常规allure报告的生成方法是在pytest全部用例执行完成后&#xff0c;手动在命令行执行如 allure generate ./temps -o ./report --clean每次用例执行完成后都要重复如此的操作&#xff0c;十分繁琐。 可以使用如下方式让用例执行完成后自动生成报告到当前目录下…...

数据结构-树(基础,分类,遍历)

数据结构-树 1.什么是树&#xff1f; 在计算机科学中&#xff0c;树是一种常用的非线性数据结构&#xff0c;用于表示具有层次关系的数据。与线性数据结构&#xff08;如数组和链表&#xff09;不同&#xff0c;树结构以节点&#xff08;Nodes&#xff09;和边&#xff08;Ed…...

AI Agent落地元年:从对话交互到自主工作流的技术演进与落地实践

2026年被行业公认为AI Agent落地元年&#xff0c;生成式AI彻底告别单纯的参数内卷与对话式交互&#xff0c;进入自主决策、自动执行、闭环迭代的全新阶段。相较于传统大模型被动响应的工作模式&#xff0c;AI Agent凭借感知、规划、执行、复盘的完整闭环能力&#xff0c;成为企…...

2026最权威一键生成论文工具榜单:这些被高校和导师偷偷推荐的软件你用了吗

一键生成论文工具正在重塑学术写作的效率与质量。随着AI技术的不断突破&#xff0c;越来越多高校、导师及科研机构开始关注并推荐这些高效、合规的智能写作助手。依托权威检测平台数据、多所高校实测反馈及用户真实评价&#xff0c;本文将为您揭晓2026年最值得信赖的一键生成论…...

b3dkit 生成连接器

from build123d import * from b3dkit import dovetail from b3dkit import Pointdef split_with_b3dkit_point():# 创建零件part Part() Box(100, 50, 30)# 使用 b3dkit 的 Point 类start_point Point(0, -25)end_point Point(0, 25)try:# 所以需要额外指定 Z 范围或者使用…...

从用户一句话到任务完成:Hermes Agent 一次请求完整链路详解

一、先说结论&#xff1a;Hermes 不是“问一句答一句”的普通聊天框很多人理解 AI 应用时&#xff0c;会把它想成一个 Chatbot&#xff1a;用户发一句话&#xff0c;模型回一句话。但 Hermes Agent 的请求链路更像一个“任务操作系统”。用户的一句话进入系统后&#xff0c;Her…...

谷歌 I/O 开发者大会亮点多:Gemini Spark、YouTube 搜索等新功能来袭!

谷歌 I/O 开发者大会拉开帷幕 谷歌年度 I/O 开发者大会于周二在加利福尼亚州山景城拉开帷幕&#xff0c;会上发布了众多新的 AI 功能、硬件和工具。记者在现场通过 CNET 的实时博客报道了每一项更新。以下是一些亮点回顾。 Gemini Spark 任务自动化 AI 是今年谷歌 I/O 大会的核…...

深度解析:光引擎、光模块、光器件之间的关系和区别?

随着AI大模型加速迭代&#xff0c;算力集群正从“千卡”向“万卡”“十万卡”规模迈进&#xff0c;光通信作为连接算力的“血管”&#xff0c;其内部层级关系变得愈发关键。然而&#xff0c;光器件、光模块、光引擎这三者并非同一概念&#xff0c;而是产业链中层层递进的“铁三…...

JMeter接口测试实战:从登录闭环到分布式压测

1. 为什么接口测试不能只靠“点点点”——从一个被忽略的500错误说起我第一次在客户现场接手一个电商后台系统时&#xff0c;开发说“所有接口都测过了&#xff0c;Postman跑了一遍&#xff0c;没问题”。上线前夜&#xff0c;支付回调接口突然返回500&#xff0c;日志里只有一…...

蒙古语AI语音落地难?ElevenLabs最新v3.2模型支持率提升至98.7%,但90%开发者忽略这5个编码陷阱

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;蒙古语AI语音落地的现实困境与技术拐点 蒙古语作为中国少数民族语言中使用人口较多、语法高度黏着、音系复杂的阿尔泰语系代表&#xff0c;其AI语音技术长期受限于低资源特性——标准语音数据集不足50小…...

如何用openpilot升级你的驾驶体验:让300+车型秒变智能座驾

如何用openpilot升级你的驾驶体验&#xff1a;让300车型秒变智能座驾 【免费下载链接】openpilot openpilot is an operating system for robotics. Currently, it upgrades the driver assistance system on 300 supported cars. 项目地址: https://gitcode.com/GitHub_Tren…...

抖音批量下载解决方案:模块化架构与智能降级策略

抖音批量下载解决方案&#xff1a;模块化架构与智能降级策略 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback support. 抖…...