当前位置: 首页 > article >正文

机器学习线性代数--(1)核心思想

线性代数是数学中非常优美且实用的一门学科它研究的是线性关系——一种最简单、最基础的关系。你可能已经在生活中不知不觉地用到它的思想了。比如在平面上移动一个点、解方程组、或者处理图像旋转背后都是线性代数。1.1 什么是“线性”“线性”这个词直观理解就是像直线一样。在数学中线性关系有两个关键性质可加性如果输入x xx得到输出f ( x ) f(x)f(x)输入y yy得到f ( y ) f(y)f(y)那么输入x y xyxy就应该得到f ( x ) f ( y ) f(x)f(y)f(x)f(y)。简单说整体等于部分之和。齐次性如果输入x xx得到f ( x ) f(x)f(x)那么把输入放大c cc倍c ⋅ x c\cdot xc⋅x输出也应该放大同样的倍数f ( c ⋅ x ) c ⋅ f ( x ) f(c\cdot x) c\cdot f(x)f(c⋅x)c⋅f(x)。举个例子比如“价格 单价 × 数量”就是线性的。买两个苹果的钱等于买一个苹果的钱的两倍齐次性买一个苹果和一个香蕉的总价等于各自价格之和可加性。而“邮费 首重 续重”就不是线性的因为有固定成本。线性代数研究的就是这种简单而普遍的关系。它的核心工具是向量和矩阵。1.2 向量把数据组织起来向量是线性代数的基本元素。你可以把它想象成一组有序的数字比如[ 2 , 3 ] [2, 3][2,3]可以表示平面上的一个点也可以表示从原点到这个点的箭头。更抽象地向量可以表示任何能用一组数描述的事物一个学生的成绩语文、数学、英语、一张图片的像素值、一部电影的特征时长、评分、年份。向量有两个基本运算加法把对应位置的数字相加。比如[ 1 , 2 ] [ 3 , 4 ] [ 4 , 6 ] [1,2] [3,4] [4,6][1,2][3,4][4,6]。几何上这相当于两个箭头首尾相接。数乘用一个数乘以向量的每个分量。比如2 × [ 1 , 2 ] [ 2 , 4 ] 2 \times [1,2] [2,4]2×[1,2][2,4]。几何上这相当于把箭头拉长或缩短。所有可能向量的集合比如整个平面就构成了一个向量空间。这个空间必须对加法和数乘封闭——即运算结果仍在这个空间里。1.3 线性变换如何操作向量线性变换是作用在向量上的“函数”它把向量变成另一个向量并且保持上面说的可加性和齐次性。比如旋转整个平面、拉伸某个方向、投影到一条直线上都是线性变换。那么如何描述一个线性变换呢我们只需要知道它如何作用于一组基向量就够了。比如在二维平面中我们取两个基向量i [ 1 , 0 ] \mathbf{i}[1,0]i[1,0]指向x轴正方向和j [ 0 , 1 ] \mathbf{j}[0,1]j[0,1]指向y轴正方向。如果知道变换后i \mathbf{i}i和j \mathbf{j}j变成了什么那么任意向量a i b j a\mathbf{i}b\mathbf{j}aibj的变换结果就是a ⋅ ( 变换后的 i ) b ⋅ ( 变换后的 j ) a\cdot(\text{变换后的}\mathbf{i}) b\cdot(\text{变换后的}\mathbf{j})a⋅(变换后的i)b⋅(变换后的j)。于是我们可以把变换后的i \mathbf{i}i和j \mathbf{j}j作为列拼成一个数字表格这就是矩阵。例如变换后i \mathbf{i}i变成[ p , q ] [p,q][p,q]j \mathbf{j}j变成[ r , s ] [r,s][r,s]那么矩阵就是[ p r q s ] \begin{bmatrix} p r \\ q s \end{bmatrix}[pq​rs​]。矩阵就像一个指令集告诉你怎么把旧坐标变成新坐标。1.4 矩阵乘法复合变换与方程组当你对一个向量连续施加两个线性变换就相当于把它们对应的矩阵乘起来。矩阵乘法的定义左行乘右列正是为了保证这个复合效果。反过来解线性方程组A x b A\mathbf{x}\mathbf{b}Axb可以看作寻找一个向量x \mathbf{x}x使得经过矩阵A AA代表的变换后恰好得到目标b \mathbf{b}b。这就像在问哪个输入经过这个变换会得到这个输出1.5 核心概念特征值与特征向量在许多应用中我们关心一个变换的“不动方向”——那些经过变换后方向不变、只被拉伸或压缩的向量。这些向量叫做特征向量拉伸倍数叫做特征值。比如一个旋转操作通常没有特征向量因为方向都变了而一个拉伸操作则有很多特征向量沿着拉伸方向。特征值和特征向量能帮我们理解变换的本质比如在图像压缩中我们保留特征值大的部分丢弃小的部分。1.6 为什么重要线性代数的思想无处不在计算机图形学旋转、缩放、平移物体全靠矩阵。数据科学主成分分析PCA用特征向量降维。机器学习神经网络中的每一层都是线性变换加激活函数。物理量子力学中用向量表示状态矩阵表示观测。1.7 总结三个核心思想向量是数据的基本单元可以相加和缩放。矩阵是描述线性变换的工具它把向量映射到新向量。特征分析揭示了变换的内在结构找到“不变的方向”。初学者可以先从几何直观入手想象二维平面上的箭头和网格然后慢慢扩展到高维抽象空间。记住线性代数就是研究“线性”这个简单性质的数学而正是这种简单性让它成为描述世界的强大语言。下一章机器学习线性代数–(2)向量究竟是什么

相关文章:

机器学习线性代数--(1)核心思想

线性代数是数学中非常优美且实用的一门学科,它研究的是线性关系——一种最简单、最基础的关系。你可能已经在生活中不知不觉地用到它的思想了。比如,在平面上移动一个点、解方程组、或者处理图像旋转,背后都是线性代数。 1.1 什么是“线性”…...

[Redis小技巧15]Redis AOF 重写与混合持久化深度解析:从原理到生产实践

如果说 RDB 快照是 Redis 持久化的“快照相机”,那么 AOF(Append-Only File)就是它的“操作录像机”。 AOF 通过记录每个写命令,提供了近乎实时的数据持久化能力。然而,随着写入量增长,AOF 文件会不断膨胀&…...

Protobuf入门:高效数据交换利器

初识Protobuf:高效的数据交换格式 Protocol Buffers(简称Protobuf)是一种轻量高效的结构化数据存储格式,由Google开发并开源。它可用于序列化结构化数据,适用于网络通信和数据存储场景。相比JSON和XML,Prot…...

MySQL高级优化技巧全解析

MySQL 高级问题及解答(三) 索引优化与失效场景 MySQL 索引是提高查询性能的关键工具,但在某些情况下索引会失效。常见的索引失效场景包括: 使用 LIKE 以通配符开头(如 LIKE %abc)。对索引列进行函数操作&am…...

C标准库float.h详解

C 标准库 <float.h> 概述 <float.h> 是 C 标准库中定义浮点数特性的头文件&#xff0c;提供了与浮点类型相关的宏常量。这些宏描述了编译器实现的浮点数的特性&#xff0c;包括精度、范围、舍入方式等。通过 <float.h>&#xff0c;开发者可以编写可移植的代码…...

TDengine IFNULL函数使用全攻略

TDengine IFNULL 函数详解 IFNULL 是 TDengine 中常用的比较函数之一&#xff0c;用于处理 NULL 值。该函数接受两个参数&#xff0c;如果第一个参数不为 NULL&#xff0c;则返回第一个参数的值&#xff1b;如果第一个参数为 NULL&#xff0c;则返回第二个参数的值。这在数据清…...

Python攻防战:数据前锋VS创新球门

Python开发者的创意攻防战&#xff1a;数据前锋与创新球门的战术板 在AI技术高速发展的时代&#xff0c;Python开发者面临的核心挑战是如何在数据驱动的进攻&#xff08;“数据前锋”&#xff09;与创新保护&#xff08;“创新球门”&#xff09;之间找到平衡。以下从技术实践角…...

卡梅德生物CA242(MUC1):双靶点协同机制与药物研发前沿解析

在生物医药研发领域&#xff0c;MUC1及其糖基化修饰产物CA242作为重要的生物标志物&#xff0c;近年来在抗体药物开发与诊断试剂研究中备受关注。两者在细胞表面的协同表达模式&#xff0c;为针对上皮源性异常状态的精准干预提供了独特的分子基础。本文旨在从分子机制、现有药物…...

论文阅读:ICLR 2026 Breaking and Fixing Defenses Against Control-Flow Hijacking in Multi-Agent Systems

总目录 大模型安全研究论文整理 2026年版&#xff1a;https://blog.csdn.net/WhiffeYF/article/details/159047894 https://openreview.net/forum?idPNU9Rj5RDQ https://arxiv.org/pdf/2510.17276 【ICLR 2026】多智能体系统被“夺舍”&#xff1f;一文看懂控制流劫持攻击与…...

机器学习——聚类kmeans算法详解

坚持自己的信念&#xff0c;不被外界干扰&#xff0c;心中有光&#xff0c;生活就会因此而美好&#xff0c;让每一天都充满希望与活力。成长的过程如同诗篇&#xff0c;需用心去书写&#xff0c;只有这样&#xff0c;才能在岁月的长河中留下自己真实的印记。梦想的实现源于每一…...

Qwen3-Coder 实战:从 0 到 1 开发商业级 API 平台,过程开源!

珍惜和善待身边的人&#xff0c;心中有爱&#xff0c;生活才会因此而变得温暖&#xff0c;感受到彼此的期许与关怀。在这个瞬息万变的世界中&#xff0c;把握住自己的方向&#xff0c;沿着自己的道路走下去&#xff0c;才能迎接更多精彩。生命中的每一次努力都是对未来的美好期…...

KVM Web管理界面安装指南(Cockpit 方案)

每一次的失败都是通往成功的试金石&#xff0c;坚信自己&#xff0c;勇敢迈出下一步&#xff0c;让梦想慢慢成为现实。不惧风雨&#xff0c;让梦想在心中生根发芽&#xff0c;时刻保持勇敢与坚定&#xff0c;方能在生命的旅途中迎接曙光。走出舒适圈&#xff0c;去迎接未知的挑…...

预测准了却躲不掉?从牛津实盘实验看做市商的“物理与结构极限”

之前我们发过一篇《成交越多越亏&#xff1a;做市商的“成交困境”&#xff0c;以及逆向选择的那层真相》&#xff0c;聊了做市商如何通过微观结构预测来规避逆向选择。逻辑很直白&#xff1a;既然高填单率往往绑定着逆向选择&#xff0c;那当我们预测到接下来的价格漂移时&…...

Babylon.js WebGPU Ocean Demo — 完整踩坑记录

换成军舰后的图片 源码运行后效果 最后代码正常启动 Babylon.js WebGPU Ocean Demo 本地运行踩坑全记录 环境 Chrome 145Babylon.js 6.26.0Windows 10 问题一&#xff1a;depth24unorm-stencil8 类型错误 报错&#xff1a; TS2322: Type "depth24unorm-stencil8"…...

光伏三相并网仿真之旅:从理论到实践

光伏控制器&#xff0c;光伏三相并网仿真。 带说明文件&#xff0c;参考文献。 模型内容&#xff1a; 1.光伏MPPT控制两级式并网逆变器&#xff08;boost三相桥式逆变&#xff09; 2.坐标变换锁相环dq功率控制解耦控制电流内环电压外环控制spwm调制 3.LCL滤波 仿真结果&#xf…...

放弃 Python 脚本吧!OpenClaw 狂飙 30 万 Star 背后,跨境电商“一人公司”如何靠实在 Agent 真正落地?

摘要&#xff1a; 我是老王。最近跨境电商圈子疯了&#xff0c;开源 Agent 框架 OpenClaw&#xff08;大龙虾&#xff09;在一周内 GitHub Star 突破 30.8 万&#xff0c;甚至连 GPT-5.4 和 Gemini 3.1 Flash 都原生适配了。大家都在高喊“一人公司”时代降临&#xff0c;仿佛只…...

ACSM代谢公式是手环估算VO2 Max的核心物理模型

华为的手环估算VO2也是基于ACSM代谢公式来实现的功能。ACSM代谢公式是由美国运动医学会&#xff08;American College of Sports Medicine&#xff09;发布的用于估算运动时能量消耗和摄氧量的经验公式。这些公式建立在大量实验室测量的基础上&#xff0c;通过运动速度、坡度等…...

Java定时器Timer源码深度解析

Java定时器Timer源码详解 Java中的Timer类是一个用于调度任务在后台线程中执行的工具。它允许安排任务在未来的某个时间点执行一次或定期重复执行。Timer类位于java.util包中&#xff0c;是Java标准库的一部分。 Timer的基本用法 Timer类提供了多种调度任务的方法&#xff0c;包…...

FluentMigrator 数据库迁移全解析

FluentMigrator 的核心概念与架构 FluentMigrator 是一个基于 .NET 平台的数据库迁移框架&#xff0c;采用纯代码方式管理数据库结构变更。其核心思想是通过版本控制的迁移脚本实现数据库架构的迭代演进。框架采用约定优于配置的原则&#xff0c;迁移类需继承 Migration 基类并…...

华为AC+AP无线组网全攻略

华为ACAP无线网络组网与配置指南 华为AC&#xff08;Access Controller&#xff09;AP&#xff08;Access Point&#xff09;无线网络解决方案广泛应用于企业、校园、酒店等场景&#xff0c;提供高性能、高可靠的无线覆盖。以下从组网设计、配置步骤、代码示例等方面展开说明。…...

2025年AI双轮驱动:技术突破赋能产业

2025 AI 发展双轮驱动&#xff1a;技术突破与产业赋能的深度实践 人工智能&#xff08;AI&#xff09;在2025年将迎来关键转折点&#xff0c;技术突破与产业赋能的双轮驱动模式将成为核心发展方向。技术层面&#xff0c;大模型、多模态学习、强化学习等领域的突破将推动AI能力边…...

华为光模块命名规则全解析

华为光模块命名规则解析 华为光模块的命名规则遵循一套严格的编码体系&#xff0c;旨在通过名称直观反映模块的类型、速率、封装、传输距离等关键参数。这套规则对网络工程师和采购人员具有重要参考价值&#xff0c;能够快速识别模块的兼容性和应用场景。 命名结构分解 华为光模…...

解密约瑟夫问题:高效解法全解析

约瑟夫问题简介 约瑟夫问题&#xff08;Josephus Problem&#xff09;是一个经典的数学问题&#xff0c;描述如下&#xff1a;有n个人围成一圈&#xff0c;编号为1到n。从编号为1的人开始报数&#xff0c;数到k的人出列&#xff0c;然后从下一个人重新开始报数&#xff0c;直到…...

微服务保护详解:黑马商城实战

《黑马商城》微服务保护-详细介绍【简单易懂注释版】 梦想的实现需要时间的沉淀&#xff0c;学会耐心等待&#xff0c;在每一个每一天的坚持中&#xff0c;积累未来的辉煌。每一次失败都是成长的机会&#xff0c;只有经历过风雨&#xff0c;才能收获艳丽的阳光与生命的希望。每…...

OpenSSL 3.0加密限制与应对方案

OpenSSL 3.0 对加密算法的限制与应对措施 OpenSSL 3.0 是一次重大版本更新&#xff0c;引入了多项安全改进和架构调整。其中&#xff0c;对某些加密算法的限制是开发者需要重点关注的变化之一。这些限制主要出于安全考虑&#xff0c;淘汰了一些弱算法或存在潜在风险的实现方式。…...

华为openEuler部署Dillinger全攻略

基于华为openEuler部署Dillinger个人文本编辑器 环境准备与系统配置 确保系统已安装openEuler 20.03 LTS或更高版本&#xff0c;并配置好网络连接。更新系统软件包至最新状态&#xff1a; sudo dnf update -y安装必要的依赖工具链&#xff0c;包括Node.js运行时、Git版本控制…...

JVM内存模型以及类加载过程分析

写在前面 JVM内存模型可以说是面试中常客了&#xff0c;足见其重要性&#xff0c;本文就一起来看下&#xff0c;以求下次遇到这样的面试题可以把面试官按在地上摩擦&#xff0c;摩擦&#xff0c;我的滑板鞋&#xff0c;霍霍&#xff01;&#xff01;&#xff01; 1&#xff1a;…...

IT行业新风向!卷运维不如卷网络安全

在网络安全行业摸爬滚打这么多年&#xff0c;亲历了数不尽的技术面试&#xff0c;同时也见证了同行们职业生涯的起起伏伏&#xff0c;特别是运维领域。我发现最近很多从事运维的选择了辞职&#xff0c;转行到了网络安全这个发展路线。 运维&#xff0c;顾名思义就是运营和维护…...

PHP扩展管理新革命:PIE替代PECL

告别PECL&#xff0c;拥抱PIE&#xff1a;像Composer一样管理PHP扩展 PHP扩展的传统管理方式依赖PECL&#xff08;PHP Extension Community Library&#xff09;&#xff0c;但PECL存在依赖管理混乱、版本控制困难等问题。PIE&#xff08;PHP Extension Installer&#xff09;作…...

最长连续序列:O(n)最优解法详解

最长连续序列问题概述 给定一个未排序的整数数组&#xff0c;找出数字连续的最长序列&#xff08;不要求序列元素在原数组中连续&#xff09;的长度。要求算法的时间复杂度为 O(n)。 示例&#xff1a; 输入&#xff1a;nums [100,4,200,1,3,2] 输出&#xff1a;4 解释&#xf…...