当前位置：首页 > news >正文

机器学习 | 线性回归（单变量）

news 2026/2/10 11:58:01

前文回顾：机器学习概述

📚线性回归概念

我们要使用一个数据集，数据集包含俄勒冈州波特兰市的住房价格。在这里，我要根据不同房屋尺寸所售出的价格，画出我的数据集。比方说，如果你朋友的房子是 1250 平方尺大小，你要告诉他们这房子能卖多少钱。那么，你可以做的一件事就是构建一个模型，也许是条直线，从这个数据模型上来看，也许你可以告诉你的朋友，他能以大约 220000(美元)左右的价格卖掉这个房子。这就是监督学习算法的一个例子。

它被称作监督学习是因为对于每个数据来说，我们给出了“正确的答案”，即告诉我们：根据我们的数据来说，房子实际的价格是多少，而且，更具体来说，这是一个回归问题。

线性回归：一种通过属性的线性组合来进行预测的线性模型，其目的是找到一条直线或者一个平面或者更高维的超平面，使得预测值与真实值之间的误差最小化。

🐇符号约定

这里x/y的上标指的是索引，表示第几行/第几列

🐇算法流程

损失函数：度量单样本预测的错误程度，损失函数值越小，模型就越好。
代价函数：度量全部样本集的平均误差。
目标函数：代价函数和正则化函数，最终要优化的函数。

📚单变量回归

下式为一种可能的表达式，因为只有一个输入变量，因此这样的问题叫做单变量线性回归问题。

🐇代价函数

通过训练集我们可以得到假设函数h即我们建立的模型，y是测试集。

通过输入测试集的自变量向函数h和y,得出预测出来的结果与实际的结果，让两者相减得到误差。

通过误差可以看出我们预测的结果好还是不好，如果误差小于某一个极小数时，我们可以认为我们建立的模型非常成功，反之则是失败。

求和的目的是把所有预测值的误差加起来，平方的目的是保证求和的时候误差是正数，除以m是求平均误差，除以2是为了计算方便，有没有这个2最后所求出的最小代价对应的假设函数都是一样的。

💡假设函数与代价函数的关系

🐇梯度下降

梯度下降的目的即求代价函数的最小值。且梯度下降有种“动态规划”的意思。

理解“梯度下降”:我们把它想象成“下山”的场景。
如何从山上尽快下山❓以我们所在的位置为基准，寻找该位置最陡峭(即变化最快)的方向，然后沿该方向走一段路程，并且每走一段路程，都要重新寻找当前位置最陡峭(即变化最快)的方向，然后沿新的方向再走一段路程，反复采用以上的方法，就能以最快的速度走到山脚下。

💡背后的数学原理

💡梯度下降的直观感受

在梯度下降法中，当我们接近局部最低点时，梯度下降法会自动采取更小的幅度，这是因为当我们接近局部最低点时，很显然在局部最低点时导数等于0，所以当我们接近局部最低时，导数值会自动变得越来越小，所以梯度下降将采取较小的幅度，这就是梯度下降的做法，所以实际上没有必要再另外减小α。

🐇线性回归的梯度下降

我们将梯度下降和代价函数结合，将其应用于具体的拟合直线的线性回归算法里。

梯度下降算法和线性回归算法

对我们之前的线性回归问题运用梯度下降法，关键在于求出代价函数的导数，即：

在下山的过程中，我们每走一段路，就要确定新的方向，不断确定新的方向意味着代价函数的参数不断在变化，而新的参数又在已知旧的参数的基础上获得。在梯度下降的每一步中，我们都用到了所有的训练样本，我们需要不断重复更新参数的过程是批量梯度下降。

参考学习链接：【中英字幕】吴恩达机器学习系列课程，本篇对应2.1-2.7

😢富文本编辑器电脑里头的LaTeX公式在手机平板看就错行，只能额外加一步截图——不乐。

😢电脑富文本编辑器里头，引用里边不能插图片——不乐。

😢电脑富文本编辑器里开的草稿在手机平板内容编辑里都会出现混乱，打开的总是别的文章——不乐。

机器学习 | 线性回归（单变量）

前文回顾：机器学习概述📚线性回归概念我们要使用一个数据集，数据集包含俄勒冈州波特兰市的住房价格。在这里，我要根据不同房屋尺寸所售出的价格，画出我的数据集。比方说，如果你朋友的房子是 1250 平方尺大小…...

编程日记 2023/3/2 12:05:07

C++基础知识【3】控制语句

目录前言一、条件语句 1.1、if 语句 1.2、if-else 语句 1.3、switch 语句二、循环语句 2.1、while 循环 2.2、do-while 循环 2.3、for 循环三、跳转语句 3.1、break语句 3.2、continue语句 3.3、goto语句四、一些新特性 4.1、if 语句和 switch 语句…...

编程日记 2023/3/2 12:04:01

ImportError: Can not find the shared library: libhdfs3.so解决方案

大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理…...

编程日记 2023/3/2 12:02:54

Qt插件开发总结5--主界面嵌入插件UI

文章目录一、前言二、效果展示三、嵌入插件UI1、插件接口文件添加UI指针2、插件子项目工程建立UI类3、插件类中创建UI类、使UI指针指向创建的UI类4、插件元信息中添加widget键值对，指示插件UI嵌入主界面中的位置5、主界面中预留接入点tabWidget6、插件管理器中元数据…...

编程日记 2023/3/2 12:01:50

一些关于linux process 和python process的记录

python mulprocess 主要用来生成另一个进程并运行 def func(i):print(helloworld)from multiprocessing import Process p Process(targetfunc,args(i, )) p.start()如果想要调用shell命令，可以采用os.popen 或者是 subprocess.run 但是前者只能执行命令并获取输…...

编程日记 2023/3/2 12:00:44

卡尔曼滤波——一种基于滤波的时序状态估计方法

文章目录1. Kalman滤波及其应用2. Kalman原理公式推导：Step 1：模型建立Step 2：开始Kalman滤波Step 3：迭代滤波本文是对 How a Kalman filter works, in pictures一文学习笔记，主要是提炼核心知识，方便作者快…...

编程日记 2023/3/2 11:59:37

什么是X6CrMo17-1

X6CrMo17-1X6CrMo17-1是在430的基礎上加入了鉬，提高鋼的耐點蝕、耐縫隙腐蝕性及強度等，比430鋼抗鹽溶液體性強。一、X6CrMo17-1對應牌號：1、國標GB-T標準：數字牌號：S11790、新牌號：10Cr17Mo、舊牌號&#x…...

编程日记 2023/3/2 11:58:31

软件测试是个人就能做？恕我直言，你可能是个“纯粹”的测试工具人，BUG收集器

作为过来人的我和你说说软件测试的真正情况。前言一个软件做出来，最不能少的是谁？毫无疑问是开发，开发是最了解软件运作的那个人，早期就有不少一人撸网站或者APP的例子，相当于一个人同时是产品、研发、测试、运维等…...

编程日记 2023/3/2 11:56:24

递归算法（recursion algorithm）

递归算法什么是递归算法在过程或者函数里调用自身的算法； 递归算法（recursion algorithm），通过重复将问题分解为同类的子问题而解决问题的方法， Java中函数可以通过调用自身来进行递归，大多数编程语句…...

编程日记 2023/3/2 11:55:19

VScode下 ESP32 下载程序

ESP32-S3 下载方式可以通过UART0 下载,USB 下载，JTAG下载,还可以使用WIFI进行远程OTA升级程序。插件底栏按键介绍：①选择串口端口号，如COM3； ②选择芯片型号； ③工程idf设置，相当于menuconfig； …...

编程日记 2023/3/2 11:54:12

黑苹果日历

黑果日历 2023/2/27 总结安装流程制作启动U盘2017年，本来去当兵，结果近视👓没验上。父母我还想学什么？我想到了黑客操作电脑的画面，感觉特别酷。 2017年有了第一台自己的笔记本，是小米游戏本&#xff0…...

编程日记 2023/3/2 11:53:05

python+pytest接口自动化框架(5)-requests发送post请求

在HTTP协议中，与get请求把请求参数直接放在url中不同，post请求的请求数据需通过消息主体(request body)中传递。且协议中并没有规定post请求的请求数据必须使用什么样的编码方式，所以其请求数据可以有不同的编码方式，服务端通过请…...

编程日记 2023/3/2 11:51:58

Linux 进程：进程控制

目录一、进程创建1.fork2.vfork二、进程终止三、进程等待四、进程替换1.理解程序替换2.子进程在程序替换中的作用Linux的进程控制分为四部分： 进程创建进程终止进程等待进程替换一、进程创建常见的创建进程的函数有两个： pid_t fork(void)pid_t vf…...

编程日记 2023/3/2 11:49:50

过滤器的创建和执行顺序

过滤器的创建和执行顺序 8.1.1创建并配置过滤器 P143 重点是如何创建并配置（xml） 1.创建 public class EncodingFilter implements Filter {Overridepublic void init(FilterConfig filterConfig) throws ServletException {}Overridepublic void doFil…...

编程日记 2023/3/2 11:48:42

JDK1.8 ConcurrentHashMap

数据结构锁sizeCtlconcurrencyLevelForwardingNode、ReservationNode扩容get、put、removehashmap：线程不安全 hashtable：通过synchronized保证线程安全但效率低。强一致性 ConcurrentHashMap：弱一致性数据结构 ConcurrentHashMap为node数…...

编程日记 2023/3/2 11:47:33

参考 Promise/A+ 规范和测试用例手写 Promise

前言这可能是手写promise较清晰的文章之一。由浅至深逐步分析了原生测试用例，以及相关Promise/A规范。阅读上推荐以疑问章节为切入重点，对比Promise/A规范与ECMAScript规范的内在区别与联系，确定怎样构建异步任务和创建promise实例。然后开…...

编程日记 2023/3/2 11:46:24

yolov5数据集制作

yolov5 数据集的格式每个图像的标注信息存储在一个独立的txt文件中每个txt文件的名称应该与其对应的图像名称相同，只是文件扩展名不同。例如：对于名为“image1.jpg”的图像，其标注信息应存储在名为“image1.txt”的txt文件中。在每个txt文件中，每一行表示一个对象的标注…...

编程日记 2023/3/2 11:45:19

主板EC程序烧写异常致无法点亮修复经验

主板型号：Gigabyte AB350M-Gaming3 官网上明确写着支持R5 5500，但按照如下步骤实践下来实际是不支持的升级biosF31到F40版本的注意事项： 步骤： 1 使用Q-Flash先将bios升级到f31版本；2 然后下载提示中的ECFW Update To…...

编程日记 2023/3/2 11:44:11

【Java爬取赛事网站】命令行输出（仅供学习）

Java爬取赛事网站 Java爬取赛事网站Java爬取赛事网站参与社区的问题回答Gitcode项目地址PSP表格解题思路描述问题接口设计和实现过程编写中的测试关键代码展示性能改进单元测试异常处理心路历程与收获参与社区的问题回答问题回答这个作业属于哪个课程软件工程-23年春季学期这…...

编程日记 2023/3/2 11:43:00

redis主从复制原理

在 Redis 中，我们可以通过 SLAVEOF 命令或者 slaveof 选项，让一个服务器去复制另一个服务器，被复制的服务器称为“主服务器”，发起复制的服务器称为“从服务器”，由两种服务器组成的模式称为“主从复制”。主从复制原…...

编程日记 2023/3/2 11:41:52

观成科技：隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具，该工具基于TUN接口实现其功能，利用反向TCP/TLS连接建立一条隐蔽的通信信道，支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式，适应复杂网…...

编程新知 2026/2/8 4:37:24

中南大学无人机智能体的全面评估！BEDI：用于评估无人机上具身智能体的综合性基准测试

作者：Mingning Guo, Mengwei Wu, Jiarun He, Shaoxian Li, Haifeng Li, Chao Tao单位：中南大学地球科学与信息物理学院论文标题：BEDI: A Comprehensive Benchmark for Evaluating Embodied Agents on UAVs论文链接：https://arxiv.…...

编程新知 2026/1/22 15:36:10

理解 MCP 工作流：使用 Ollama 和 LangChain 构建本地 MCP 客户端

🌟 什么是 MCP？ 模型控制协议 (MCP) 是一种创新的协议，旨在无缝连接 AI 模型与应用程序。 MCP 是一个开源协议，它标准化了我们的 LLM 应用程序连接所需工具和数据源并与之协作的方式。可以把它想象成你的 AI 模型和想要使用它…...

编程新知 2026/2/10 5:21:30

用docker来安装部署freeswitch记录

今天刚才测试一个callcenter的项目，所以尝试安装freeswitch 1、使用轩辕镜像 - 中国开发者首选的专业 Docker 镜像加速服务平台编辑下面/etc/docker/daemon.json文件为 {"registry-mirrors": ["https://docker.xuanyuan.me"] }同时可以进入轩…...

编程新知 2026/2/1 3:20:44

USB Over IP专用硬件的5个特点

USB over IP技术通过将USB协议数据封装在标准TCP/IP网络数据包中，从根本上改变了USB连接。这允许客户端通过局域网或广域网远程访问和控制物理连接到服务器的USB设备（如专用硬件设备），从而消除了直接物理连接的需要。USB over IP的…...

编程新知 2026/2/6 13:42:22

重启Eureka集群中的节点，对已经注册的服务有什么影响

先看答案，如果正确地操作，重启Eureka集群中的节点，对已经注册的服务影响非常小，甚至可以做到无感知。但如果操作不当，可能会引发短暂的服务发现问题。下面我们从Eureka的核心工作原理来详细分析这个问题。 Eureka的…...

编程新知 2025/9/24 3:38:34

MyBatis中关于缓存的理解

MyBatis缓存 MyBatis系统当中默认定义两级缓存：一级缓存、二级缓存默认情况下，只有一级缓存开启（sqlSession级别的缓存）二级缓存需要手动开启配置，需要局域namespace级别的缓存一级缓存（本地缓存&#…...

编程新知 2026/2/6 6:02:51

Ubuntu系统复制（U盘-电脑硬盘）

所需环境电脑自带硬盘：1块 (1T) U盘1：Ubuntu系统引导盘（用于“U盘2”复制到“电脑自带硬盘”） U盘2：Ubuntu系统盘（1T，用于被复制） ！！！建议“电脑…...

编程新知 2026/2/7 17:43:28

高防服务器价格高原因分析

高防服务器的价格较高，主要是由于其特殊的防御机制、硬件配置、运营维护等多方面的综合成本。以下从技术、资源和服务三个维度详细解析高防服务器昂贵的原因： 一、硬件与技术投入大带宽需求 DDoS攻击通过占用大量带宽资源瘫痪目标服务器，因此…...

编程新知 2025/12/8 14:33:23

32单片机——基本定时器

STM32F103有众多的定时器，其中包括2个基本定时器（TIM6和TIM7）、4个通用定时器（TIM2~TIM5）、2个高级控制定时器（TIM1和TIM8），这些定时器彼此完全独立，不共享任何资源 1、定…...

编程新知 2026/2/4 20:31:20