当前位置: 首页 > article >正文

机器学习-线性回归(对于f(x;w)=w^Tx+b理解)

一、𝑓(𝒙;𝒘) = 𝒘T𝒙的推导

学习线性回归,我们那先要对于线性回归的表达公示,有所认识。

我们先假设空间是一组参数化的线性函数:

其中权重向量𝒘 ∈ R𝐷 和偏置𝑏 ∈ R都是可学习的参数,函数𝑓(𝒙;𝒘,𝑏) ∈ R也称为线性模型。

不失一般性, 在本章后面的描述中我们采用简化的表示方法, 直接用 𝒘和 𝒙 分别表示增广权重向量和增广特征向量. 这样, 线性回归的模型简写为 𝑓(𝒙;𝒘) = 𝒘T𝒙.

这就是题目中提到的线性回归模型的推导由来。

这里为了更好的学习线性回归模型,这里我们普及一下大学时线性代数的一些概念。

二、向量、增广向量、增广权重向量、增广特征向量的概念:

1. 向量(Vector)

定义:
向量是一组有序排列的数,表示空间中的点、数据样本或特定属性的集合。

示例:
假设我们有一个人的身体数据,包括身高和体重,我们可以用一个向量表示:

这个向量表示身高 180 cm,体重 75 kg。

常见类型:

  • 列向量(常用): n×1 维,如上例。
  • 行向量: 1×n,例如: x=[180,75]。

应用:

  • 在机器学习中,向量用来表示数据样本(输入特征)、模型参数等。
  • 在物理中,向量用来表示力、速度等有大小和方向的量。

2. 增广向量(Augmented Vector)

定义:
增广向量是在普通向量的基础上,增加一个额外的常数(通常是 1),以便于在数学计算中引入偏置项(Intercept/Bias)。

示例:
假设我们有一个特征向量:

增广后:

为什么要加 1?
在机器学习的线性回归公式中:

y = w_1 x_1 + w_2 x_2 + b

如果将 b 视为 w_3 并将增广向量 x 扩展为:

y = w_1 x_1 + w_2 x_2 + w_3 ⋅1

这时,增广后的矩阵运算更为简洁,公式变为:

应用:

  • 机器学习: 在回归、分类等问题中,引入偏置项。
  • 计算机视觉: 处理图像坐标变换(如平移操作)。
  • 信号处理: 统一矩阵运算,减少额外计算。

3. 增广权重向量(Augmented Weight Vector)

定义:
增广权重向量是在普通权重向量的基础上,增加一个额外的偏置项 b,以与增广输入向量匹配。

示例:
假设我们有普通的权重向量:

增广后:

这样,使用增广权重向量,计算目标值时,可以与增广向量配合使用:

应用:

  • 机器学习: 简化计算,避免单独处理偏置项。
  • 神经网络: 统一偏置与权重的管理,提高计算效率。

4. 增广特征向量(Augmented Eigenvector)

定义:
增广特征向量是在线性代数的特征值分解问题中,在特征向量的基础上,附加额外的约束条件或辅助信息,以便解决某些特定问题。

特征向量的基本公式:

给定矩阵 A,特征向量满足:

Av=λv

如果原始特征向量是:

增广后:

为什么要增广?

  • 在控制系统、信号处理等领域,增广特征向量可以用于增加额外信息,如系统约束或观测量。
  • 在奇异值分解(SVD)、PCA等方法中,增加维度可以提高数值稳定性或处理特殊边界条件。

应用:

  • 控制工程:增广状态向量来处理观测噪声。
  • 计算机视觉:在3D变换中加入齐次坐标(如在2D坐标 (x,y)增广为 (x,y,1))。

5. 总结:区别与联系

名称定义增加的元素作用例子
向量一组数,表示数据或坐标描述特征或数据点[180,75][180, 75]
增广向量在向量后加 1,使计算更方便1统一计算偏置项[180,75,1][180, 75, 1]
增广权重向量在权重后加偏置项 bb 以匹配增广向量1使得矩阵运算统一,减少额外处理[0.5,1.2,20][0.5, 1.2, 20]
增广特征向量在特征向量后加常数或约束1 或更多处理约束问题、增加系统观测能力[2,3,1][2, 3, 1]

它们之间的联系:

  • 增广向量和增广权重向量通常一起使用,用于机器学习中的线性模型。
  • 增广特征向量更偏向于线性代数的特征值分解和矩阵分析,并不直接用于机器学习的建模中。

三、这里思考一个问题:空间可以由线性模型表示吗?

答案是yes,空间可以在一定条件下用线性模型来表示,特别是在欧几里得空间特征空间中,线性模型可以用于描述点、方向、平面和超平面等几何对象。

1. 线性模型的基本形式

线性模型的一般数学形式是:

在向量形式下可以表示为:

其中:

  • x 表示输入向量,描述空间中的点或特征。
  • w 是权重向量,表示空间中的方向或特定超平面的法向量。
  • b 是偏置,表示超平面与原点的距离。

2. 用线性模型表示几何空间的例子

例 1:平面在三维空间中的表示

假设我们在三维空间中有一个平面,其方程可以写成:

2x+3y−z+5=0

将其改写成线性模型的形式:

z=2x+3y+5z

这实际上是一个线性回归模型,其中:

  • x1=x, x2=y,y=z。
  • 权重 w=[2,3]。
  • 偏置 b=5。

解释:

  • 这个线性方程表示三维空间中的一个平面,线性模型可以表示任意方向的平面。
  • 平面的法向量 (2,3,−1)代表其朝向。
例 2:二维平面上的直线

假设我们要表示一个 2D 平面上的直线:

y=4x+2

这里:

  • x 是输入变量,y 是输出。
  • 斜率 w1=4,偏置 b=2。

这条直线可以看作是一个 2D 空间中的线性模型,描述输入 x 和输出 y 之间的线性关系。

解释:

  • 该直线分割了平面空间,表示空间中的一个一维子空间。
  • 例如,在分类问题中,它可以用来将数据点分成两个类别。
例 3:超平面在高维空间中的表示(机器学习中的决策边界)

在机器学习中,支持向量机(SVM)和线性回归模型使用超平面来表示数据分布。例如,假设在 3D 空间中,数据点属于两个类别,我们可以用一个线性模型来区分它们:

w1x1+w2x2+w3x3+b=0

这个方程描述的是三维空间中的一个超平面,它可以将空间划分成两部分。

解释:

  • 在 n 维空间中,线性方程表示的是一个 (n−1)维的超平面。
  • 例如,在二维空间中,线性方程表示一条直线,在三维空间中,表示一个平面。
例 4:主成分分析(PCA)用于空间降维

在高维空间中,主成分分析(PCA)是一种常见的线性方法,用于找到数据的最佳投影方向。例如,给定一组三维点 (x1,x2,x3),PCA 试图找到一个最佳的线性方向来表示这些点,从而将其降维到一个平面或直线。

PCA 线性模型通常可以写作:

其中:

  • W 是投影矩阵,定义了降维后的新坐标轴。
  • 这个模型可以找到数据所在的低维子空间。

3. 线性模型表示空间的局限性

尽管线性模型可以表示许多几何对象,但也存在局限:

  • 无法表示非线性空间结构: 如果数据存在曲面或复杂的非线性关系,线性模型无法准确表示。
  • 只能描述平直的结构: 例如圆、球等非线性空间无法用简单的线性方程来表示。
  • 需要特征变换: 为了处理复杂空间,通常需要使用特征工程(如多项式特征扩展)或非线性映射(如核方法)。

4. 非线性空间如何用线性模型处理?

如果数据或空间具有非线性特征,可以通过以下方式将其转换为线性模型:

  1. 特征变换(Feature Engineering)

    通过增加维度,空间变得线性。

  2. 核方法(Kernel Methods)

    • 在支持向量机(SVM)中,核函数(如高斯核)将数据映射到高维线性可分空间。
  3. 神经网络(Deep Learning)

    • 通过多层非线性激活函数,神经网络可以近似任意复杂的空间映射。

5. 结论

  • 线性模型可以表示许多常见的空间,如直线、平面和高维超平面。
  • 对于更复杂的空间结构,需要进行特征变换或使用非线性方法来补充线性模型的局限性。
  • 在机器学习、数据分析和几何处理中,线性模型是非常重要的基础工具。

相关文章:

机器学习-线性回归(对于f(x;w)=w^Tx+b理解)

一、𝑓(𝒙;𝒘) 𝒘T𝒙的推导 学习线性回归,我们那先要对于线性回归的表达公示,有所认识。 我们先假设空间是一组参数化的线性函数: 其中权重向量𝒘 ∈ R𝐷 …...

RAG与GraphRAG的区别

文章目录 前言RAG 的特点核心思想数据结构优势局限性应用场景 GraphRAG 的特点核心思想数据结构优势局限性应用场景 如何选型示例场景多跳推理问题推荐系统中的复杂关系社交网络中的影响力分析 总结 前言 RAG (Retrieval-Augmented Generation) 和 GraphRAG (Graph-Based Retr…...

Ubuntu环境通过Ollama部署DeepSeek-R1模型教程

Ollama 是一个专注于简化模型部署和推理的工具,特别适合在生产环境中快速部署和运行模型。 以下是如何使用 Ollama 来安装、部署和使用模型的步骤: 一. 安装 Ollama 首先,你需要安装 Ollama。Ollama 通常支持多种平台(如 Linux、…...

使用Ollama 在Ubuntu运行deepseek大模型:以deepseek-r1为例

deepseek大模型上热搜啦! 咱们来亲身感受下DeepSeek模型的魅力吧! 整个操作流程非常简单方便,只需要2步,先安装Ollama,然后执行大模型即可。 支持的deepseek-r1模型 deepseek-r1 DeepSeek-R1-Distill-Qwen-1.5B …...

【中间件快速入门】什么是Redis

现在后端开发会用到各种中间件,一不留神项目可能在哪天就要用到一个我们之前可能听过但是从来没接触过的中间件,这个时候对于开发人员来说,如果你不知道这个中间件的设计逻辑和使用方法,那在后面的开发和维护工作中可能就会比较吃…...

poi在word中打开本地文件

poi版本 5.2.0 方法1:使用XWPFFieldRun(推荐) 比如打开当前相对路径的aaaaa.docx XWPFFieldRun run paragraph.createFieldRun();CTRPr ctrPr run.getCTR().addNewRPr();CTFonts font ctrPr.addNewRFonts();// 设置字体font.setAscii(&quo…...

27. C语言 强制类型转换详解

本章目录: 前言强制类型转换(Type Casting)强制类型转换的语法示例1:将整数转换为浮点数输出结果: 代码解析: 整数提升(Integer Promotion)示例2:整数提升输出结果: 代码…...

【1】阿里面试题整理

[1]. Kafka如何保证数据一致性? Kafka主要通过副本机制、ISR机制、持久化机制以及事务机制等多种方式共同保证了数据的一致性。副本机制是Kafka确保数据一致性的基础,使用ISR(In-Sync Replica)机制来处理副本之间的同步,将消息持久化到硬盘中…...

MySQL知识点总结(十三)

执行逻辑备份要具备哪些条件,其优缺点在哪。 逻辑备份是温备,创建逻辑备份文件时,MySQL服务器必须处于运行状态,其他应用程序在逻辑备份期间不能修改但可以执行读取操作。逻辑备份会把表结构和数据转换为SQL语句保存。 逻辑备份…...

linux 环境安装 dlib 的 gpu 版本

默认使用 pip 安装的 dlib 是不使用 gpu 的 在国内社区用百度查如何安装 gpu 版本的 dlib 感觉信息都不太对,都是说要源码编译还有点复杂 还需要自己安装 cuda 相关的包啥的,看着就头大 于是想到这个因该 conda 自己就支持了吧,然后查了一下…...

Meta 计划 2025 年投资 650 亿美元推动 AI 发展

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…...

第05章 12 可视化热量流线图一例

下面是一个使用VTK(Visualization Toolkit)和C编写的示例代码,展示如何在一个厨房模型中可视化热量流线图,并按照热量传递速度着色显示。这个示例假设你已经安装了VTK库,并且你的开发环境已经配置好来编译和运行VTK程序…...

微信小程序压缩图片

由于wx.compressImage(Object object) iOS 仅支持压缩 JPG 格式图片。所以我们需要做一下特殊的处理: 1.获取文件,判断文件是否大于设定的大小 2.如果大于则使用canvas进行绘制,并生成新的图片路径 3.上传图片 async chooseImage() {let …...

2025_1_27 C语言内存,递归,汉诺塔问题

1.c程序在内存中的布局 代码段(Code Segment) 位置:通常位于内存的最低地址。 用途:存储程序的可执行指令。 特点:只读,防止程序运行时被修改。数据段(Data Segment) 位置&#xf…...

K8s运维管理平台 - xkube体验:功能较多

目录 简介Lic安装1、需要手动安装MySQL,**建库**2、启动命令3、[ERROR] GetNodeMetric Fail:the server is currently unable to handle the request (get nodes.metrics.k8s.io qfusion-1) 使用总结优点优化 补充1:layui、layuimini和beego的详细介绍1.…...

舆情系统的情报搜索功能

引言 随着信息技术的发展和网络媒体的快速发展,舆情监测已成为各行各业不可或缺的工具。舆情系统中的情报搜索功能,作为其核心组成部分,能够帮助用户迅速、全面地捕捉互联网、社交平台、新闻媒体等渠道中的各类信息和舆论动态。情报搜索不仅提…...

简易CPU设计入门:控制总线的剩余信号(二)

项目代码下载 请大家首先准备好本项目所用的源代码。如果已经下载了,那就不用重复下载了。如果还没有下载,那么,请大家点击下方链接,来了解下载本项目的CPU源代码的方法。 CSDN文章:下载本项目代码 上述链接为本项目…...

[创业之路-270]:《向流程设计要效率》-2-企业流程架构模式 POS架构(规划、业务运营、支撑)、OES架构(业务运营、使能、支撑)

目录 一、POS架构 二、OES架构 三、POS架构与OES架构的差异 四、各自的典型示例 POS架构典型示例 OES架构典型示例 示例分析 五、各自的典型企业 POS架构典型企业 OES架构典型企业 分析 六、各自典型的流程 POS架构的典型流程 OES架构的典型流程 企业流程架构模式…...

9【如何面对他人学习和生活中的刁难】

我们在学习的过程中,会遇到很多来自于他人的刁难与嘲讽,如果处理不好,这会大大影响我们的心情,从而影响学习的效率 我建议,如果你学习或生活中也遇到了类似的问题,不要去生气,更不要发生冲突&a…...

脚本/编译安装nginx1.11.10

1、通过脚本安装nginx1.11.10 在保证yum源正常(国内源)的情况下,这个脚本是可以正常安装的–with-pcre/usr/src/pcre-8.12/ # 如果自带的pcre无效就使用这个自定义pcre的路径(pcre安装在第3步骤) #!/bin/bash#安装nginx所需依赖包 yum -y install pcre* pcre-dev…...

基于迁移学习的ResNet50模型实现石榴病害数据集多分类图片预测

完整源码项目包获取→点击文章末尾名片! 番石榴病害数据集 背景描述 番石榴 (Psidium guajava) 是南亚的主要作物,尤其是在孟加拉国。它富含维生素 C 和纤维,支持区域经济和营养。不幸的是,番石榴生产受到降…...

基于PostgreSQL的自然语义解析电子病历编程实践与探索(上)

一、引言 1.1研究目标与内容 本研究旨在构建一个基于 PostgreSQL 的自然语义解析电子病历编程体系,实现从电子病历文本中提取结构化信息,并将其存储于 PostgreSQL 数据库中,以支持高效的查询和分析。具体研究内容包括: 电子病历的预处理与自然语言处理:对电子病历文本进…...

5.1.3 软件过程评估

文章目录 软件能力成熟度模型CMM能力成熟度模型集成 软件能力成熟度模型CMM 软件能力成熟度模型是用于评价软件承接方能力的方法,通过评价,也可以让承接方看到自身缺陷,不断改进和提升软件过程能力。分为5个成熟度等级,初始级、可…...

【JavaEE】Spring(5):Mybatis(上)

一、什么是Mybatis Mybatis是一个持久层的框架,它用来更简单的完成程序和数据库之间的交互,也就是更简单的操作和读取数据库中的数据 在讲解Mybatis之前,先要进行一些准备工作: 1. 为项目添加 Mybatis 相关依赖 2. 创建用户表以…...

记录 | MaxKB创建本地AI智能问答系统

目录 前言一、重建MaxKBStep1 复制路径Step2 删除MaxKBStep3 创建数据存储文件夹Step4 重建 二、创建知识库Step1 新建知识库Step2 下载测试所用的txtStep3 上传本地文档Step4 选择模型补充智谱的API Key如何获取 Step5 查看是否成功 三、创建应用Step1 新建应用Step2 配置AI助…...

【Spring】Spring启示录

目录 前言 一、示例程序 二、OCP开闭原则 三、依赖倒置原则DIP 四、控制反转IOC 总结 前言 在软件开发的世界里,随着项目的增长和需求的变化,如何保持代码的灵活性、可维护性和扩展性成为了每个开发者必须面对的问题。传统的面向过程或基于类的设计…...

八股——Java基础(四)

目录 一、泛型 1. Java中的泛型是什么 ? 2. 使用泛型的好处是什么? 3. Java泛型的原理是什么 ? 什么是类型擦除 ? 4.什么是泛型中的限定通配符和非限定通配符 ? 5. List和List 之间有什么区别 ? 6. 可以把List传递给一个接受List参数的方法吗? 7. Arra…...

游戏策划的分类

游戏策划是一个复杂而多面的领域,涉及游戏设计、玩法创新、故事叙述等多个方面。根据不同的职责和工作内容,游戏策划可以分为以下几类: 1. 系统策划 • 职责:负责游戏的整体系统设计,包括角色系统、技能系统、装备系统…...

面试场景问题集合

文章目录 项目地址一、1. 电商平台中订单未支付过期如何实现自动关单?2. 如果你的系统的 QPS 突然提升 10 倍你会怎么设计? 项目地址 教程作者:教程地址: 代码仓库地址: 所用到的框架和插件: dbt airflo…...

观察者模式 - 观察者模式的应用场景

引言 观察者模式(Observer Pattern)是设计模式中行为型模式的一种,它定义了对象之间的一对多依赖关系,使得当一个对象的状态发生改变时,所有依赖于它的对象都会自动收到通知并更新。观察者模式广泛应用于事件处理系统…...