当前位置：首页 > news >正文

机器学习笔记（二）使用paddlepaddle，再探波士顿房价预测

news 2026/3/28 7:35:50

目标

用paddlepaddle来重写之前那个手写的梯度下降方案，简化内容

流程

实际上就做了几个事：

数据准备：将一个批次的数据先转换成nparray格式，再转换成Tensor格式
前向计算：将一个批次的样本数据灌入网络中，计算出结果
计算损失函数：以前向计算的结果和真是房价作为输入，通过算是函数sqare_error_cost计算出损失函数。
反向传播：执行梯度反向传播backward函数，即从后到前逐层计算每一层的梯度，并根据设置的优化算法更新参数(opt.step函数)。

paddlepaddle做了什么？

paddle库替你做了前向计算和损失函数计算，以及反向传播相关的计算函数

数据准备

这部分代码和之前一样，读取数据是独立的

点击查看代码

#数据划分函数不依赖库，还是自己读
def load_data():# 从文件导入数据datafile = './work/housing.data'data = np.fromfile(datafile, sep=' ', dtype=np.float32)# 每条数据包括14项，其中前面13项是影响因素，第14项是相应的房屋价格中位数feature_names = [ 'CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', \'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV' ]feature_num = len(feature_names)# 将原始数据进行Reshape，变成[N, 14]这样的形状data = data.reshape([data.shape[0] // feature_num, feature_num])# 将原数据集拆分成训练集和测试集# 这里使用80%的数据做训练，20%的数据做测试# 测试集和训练集必须是没有交集的ratio = 0.8offset = int(data.shape[0] * ratio)training_data = data[:offset]# 计算train数据集的最大值，最小值maximums, minimums = training_data.max(axis=0), training_data.min(axis=0)# 记录数据的归一化参数，在预测时对数据做归一化global max_valuesglobal min_valuesmax_values = maximumsmin_values = minimums# 对数据进行归一化处理for i in range(feature_num):data[:, i] = (data[:, i] - min_values[i]) / (maximums[i] - minimums[i])# 训练集和测试集的划分比例training_data = data[:offset]test_data = data[offset:]return training_data, test_data

定义一个依赖paddle库的类

点击查看代码

class Regressor(paddle.nn.Layer):#self代表对象自身def __init__(self):#初始化父类的参数super(Regressor, self).__init__()#定义一层全连接层，输入维度是13，输出维度是1self.fc = Linear(in_features=13, out_features=1)#网络的前向计算函数def forward(self, inputs):x = self.fc(inputs)return x

在上面这个类中，不论是前向计算还是初始化，都是继承了这个paddle.nn.Layer类，用其内部的成员函数执行的

代码

我们定义一个循环来执行这个流程，如下：

点击查看代码

EPOCH_NUM = 10   # 设置外层循环次数
BATCH_SIZE = 10  # 设置batch大小# 定义外层循环
for epoch_id in range(EPOCH_NUM):# 在每轮迭代开始之前，将训练数据的顺序随机的打乱np.random.shuffle(training_data)# 将训练数据进行拆分，每个batch包含10条数据mini_batches = [training_data[k:k+BATCH_SIZE] for k in range(0, len(training_data), BATCH_SIZE)]# 定义内层循环for iter_id, mini_batch in enumerate(mini_batches):x = np.array(mini_batch[:, :-1]) # 获得当前批次训练数据y = np.array(mini_batch[:, -1:]) # 获得当前批次训练标签（真实房价）# 将numpy数据转为飞桨动态图tensor的格式house_features = paddle.to_tensor(x)prices = paddle.to_tensor(y)# 前向计算predicts = model(house_features)# 计算损失loss = F.square_error_cost(predicts, label=prices)avg_loss = paddle.mean(loss)if iter_id%20==0:print("epoch: {}".format(epoch_id))print("iter: {}".format(str(iter_id)))print("loss is : {}".format(float(avg_loss)))# 反向传播，计算每层参数的梯度值avg_loss.backward()# 更新参数，根据设置好的学习率迭代一步opt.step()# 清空梯度变量，以备下一轮计算opt.clear_grad()

保存模型

在梯度下降得到一个模型了之后，可以把这个神经网络模型保存下来

点击查看代码

paddle.save(model.state_dict(), 'LR_model.pdparams')
print("模型保存成功，模型参数保存在LR_model.pdparams中")

读取模型

在启动模型之前，当然可以读取这样一个模型：

点击查看代码

def load_one_example():# 从上边已加载的测试集中，随机选择一条作为测试数据idx = np.random.randint(0, test_data.shape[0])idx = -10one_data, label = test_data[idx, :-1], test_data[idx, -1]# 修改该条数据shape为[1,13]one_data =  one_data.reshape([1,-1])return one_data, label        # 参数为保存模型参数的文件地址
#读取保存模型
model_dict = paddle.load('LR_model.pdparams')
model.load_dict(model_dict) #读取模型文件
model.eval()	#转变为预测模式

尝试进行预测

点击查看代码

# 参数为数据集的文件地址
one_data, label = load_one_example()
# 将数据转为动态图的variable格式 
one_data = paddle.to_tensor(one_data)
#model是定义的模型，这个model(one_data)实际上是对one_Data进行了一次前向传播
predict = model(one_data)# 因为这个predict的值实际上是做了归一化处理的，所以这里需要进行反归一化处理
predict = predict * (max_values[-1] - min_values[-1]) + min_values[-1]
# 对label数据做反归一化处理
label = label * (max_values[-1] - min_values[-1]) + min_values[-1]#模型预测值是22.72234,，实际值是19.700000762939453
print("Inference result is {}, the corresponding label is {}".format(predict.numpy(), label))

机器学习笔记（二）使用paddlepaddle，再探波士顿房价预测

目标用paddlepaddle来重写之前那个手写的梯度下降方案，简化内容流程实际上就做了几个事： 数据准备：将一个批次的数据先转换成nparray格式，再转换成Tensor格式前向计算：将一个批次的样本数据灌入网络中&#xff…...

编程日记 2023/12/23 8:45:36

【Linux】权限篇（二）

权限目录 1. 前言2. 权限2.1 修改权限2.2 有无权限的对比2.3 另外一个修改权限的方法2.3.1 更改用户角色2.3.2 修改文件权限属性 3. 第一个属性列4. 目录权限5. 默认权限 1. 前言在之前的一篇博客中分享了关于权限的一些知识，这次紧接上次的进行，有需要…...

编程日记 2023/12/23 8:41:32

reduce累加器的应用

有如下json数据，需要统计Status的值为0和1的数量 const data {"code": "001","results": [{"Status": "0",},{"Status": "0",},{"Status": "1",}] }方法一:用reduce方…...

编程日记 2023/12/23 8:39:31

助力硬件测试工程师之EMC项目测试。

1：更新该系列的目的接下来的一个月内，将更新硬件测试工程师的其中测试项目--EMC项目，后续将会出安规等项目，助力测试工程师的学习。 2：如何高效率的展现项目的基础以及一些细节知识点通过思维导图以及标准的规定进行…...

编程日记 2023/12/23 8:33:25

Github 2023-12-23 开源项目日报 Top10

根据Github Trendings的统计，今日(2023-12-23统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下： 开发语言项目数量Python项目6C项目2C项目1Jupyter Notebook项目1HTML项目1Go项目1非开发语言项目1 免费API集体清单创建周期…...

编程日记 2023/12/23 8:32:24

Quartz.net 正则表达式触发器

1、创建项目项目类型控制台应用程序，.Net Framework框架版本 4.7.2 2、引入框架 NuGet\Install-Package Quartz -Version 3.8.0 3、创建Job 自定义Job实现接口IJob，在Execute方法实现定时逻辑， using Quartz; using System; using Sys…...

编程日记 2023/12/23 8:29:21

【已解决】修改了网站的class样式name值，会影响SEO，搜索引擎抓取网站及排名吗？

问题： 修改了网站的class样式name值，会影响搜索引擎抓取网站及排名吗？ 解答： 如果你仅仅修改了网站class样式的名称，而没有改变网站的结构和内容，那么搜索引擎通常不会因此而影响它对网站的抓取和排名。但…...

编程日记 2023/12/23 8:28:20

微信小程序开发系列-02注册小程序

上一篇文章，创建了一个最小的小程序，但是，还有3个疑问没有弄清楚，还是基于demo1工程，这篇文章继续探索。当前的目录结构是否是完备的呢？（虽然小程序可以运行起来）app.js文件内容还…...

编程日记 2023/12/23 8:27:20

浏览器 cookie 的原理（详）

目录 1，cookie 的出现2，cookie 的组成浏览器自动发送 cookie 的条件 3，设置 cookie3.1，服务端设置3.1，客户端设置3.3，删除 cookie 4，使用流程总结整理和测试花了很大时间，如果对你有…...

编程日记 2023/12/23 8:21:14

StringBuilder和StringBuffer区别是什么？

想象一下，你在写信，但是你需要不断地添加新的内容或者修改一些词句。在编程中，当你需要这样操作字符串时，就可以用StringBuffer或StringBuilder。 StringBuffer StringBuffer就像是一个多人协作写作的工具。如果你和你的朋友们一…...

编程日记 2023/12/23 8:19:13

【数据分析】数据指标的分类及应用场景

数据分析之数据指标的分类数据分析离不开对关键指标的分析与跟踪，这些指标通常与具体的业务直接相关。好的指标能够促进业务的健康发展，因为指标与业务目标是一致的，此时指标就能反映业务变化，指标发生变化，行动也发…...

编程日记 2023/12/23 8:18:12

首涂第二十八套_新版海螺M3多功能苹果CMSv10自适应全屏高端模板

首涂第二十八套_新版海螺M3多功能苹果cmsv10自适应全屏高端模板多功能苹果cmsv10自适应全屏高端模板开源授权版这是一款带“主题管理系统”的模板。这是一款好模板。花大价钱收购了海螺这两个模板的版权。官方正品，非盗版。关闭域名授权后台自定义菜单请把…...

编程日记 2023/12/23 8:16:09

MatGPT - 访问 OpenAI™ ChatGPT API 的 MATLAB® 应用程序

系列文章目录前言 MatGPT 是一款 MATLAB 应用程序，可让您轻松访问 OpenAI 的 ChatGPT API。使用该应用程序，您可以加载特定用例的提示列表，并轻松参与对话。如果您是 ChatGPT 和提示工程方面的新手，MatGPT 不失为一个学习的好方…...

编程日记 2023/12/23 8:14:07

Tomcat转SpringBoot、tomcat升级到springboot、springmvc改造springboot

Tomcat转SpringBoot、tomcat升级到springboot、springmvc改造springboot 起因：我接手tomcat-springmvc-hibernate项目，使用tomcat时问题不大。自从信创开始，部分市场使用国产中间件，例如第一次听说的宝兰德、东方通，还…...

编程日记 2023/12/23 8:12:06

浅述无人机技术在地质灾害应急救援场景中的应用

12月18日23时，甘肃临夏州积石山县发生6.2级地震，震源深度10千米，灾区电力、通信受到影响。地震发生后，无人机技术也火速应用在灾区的应急抢险中。目前，根据受灾地区实际情况，翼龙-2H应急救灾型无人机已出动…...

编程日记 2023/12/23 8:11:05

js-cookie的使用以及存储token安全的注意要点 npm 安装 npm i js-cookie -S // https://www.npmjs.com/package/js-cookie引入使用 import Cookies from js-cookie获取 Cookies.get(token); // 读取token Cookies.get() // 读取所有可见的 Cookie > { token: value }设置…...

编程日记 2023/12/23 8:10:04

Android 网络状态判断

1、获取网络信息，首先需要获取权限 <uses-permission android:name"android.permission.INTERNET" /> <uses-permission android:name"android.permission.ACCESS_NETWORK_STATE" /> 2.1我们通过ConnectivityManager可以获取状态…...

编程日记 2023/12/23 8:06:59

管理类联考——数学——真题篇——按知识分类——代数——数列

【等差数列 ⟹ \Longrightarrow ⟹ 通项公式： a n a 1 ( n − 1 ) d a m ( n − m ) d n d a 1 − d A n B a_n a_1(n-1)d a_m(n-m)dnda_1-dAnB ana1(n−1)dam(n−m)dnda1−dAnB ⟹ \Longrightarrow ⟹ A d ， B a 1 − d Ad&#x…...

编程日记 2023/12/23 8:05:59

.net core webapi 自定义异常过滤器

1.定义统一返回格式 namespace webapi;/// <summary> /// 统一数据响应格式 /// </summary> public class Results<T> {/// <summary>/// 自定义的响应码，可以和http响应码一致，也可以不一致/// </summary>public int Co…...

编程日记 2023/12/23 8:04:57

ABAP开发避坑指南：绕过SAP GUI安全弹窗的5种编程方案实测

ABAP开发实战：5种绕过SAP GUI安全弹窗的编程方案深度解析引言：SAP GUI安全机制的困境与突破在SAP系统的日常开发与运维中，频繁出现的"系统试图创建文件"安全弹窗堪称ABAP开发者的噩梦。这种设计初衷为保护本地文件安全的机制&…...

编程新知 2026/3/28 6:54:52

英伟达黄仁勋力荐！2026年AI Agent元年，掌握这5大关键技术，成为行业风口！

0****1 什么是AI Agent？ 随着人工智能技术加速演进，AI Agent（人工智能代理，常称智能体）正悄然渗透到企业运营与日常生活的各个角落，从大家熟悉的虚拟助手（如Siri、小爱同学、豆包）&a…...

编程新知 2026/3/28 6:30:42

MGeo中文地址结构化教程：从原始文本到标准GeoJSON格式输出的完整转换流程

MGeo中文地址结构化教程：从原始文本到标准GeoJSON格式输出的完整转换流程 1. 引言：为什么我们需要地址结构化？ 你有没有遇到过这样的场景？用户填写的收货地址五花八门：“北京市海淀区中关村大街27号”、“北京海淀中…...

编程新知 2026/3/28 5:38:05

为什么你的Pyd文件在Windows上总报“DLL加载失败”？系统级依赖扫描、Manifest嵌入与UCRT版本对齐终极方案

第一章：Pyd文件在Windows上的本质与加载机制Pyd 文件是 Windows 平台上 Python 的 C 扩展模块的二进制格式，其本质是遵循特定 ABI 约束的动态链接库（DLL），但被 Python 解释器以特殊方式识别和加载。它并非普通 DLL&…...

编程新知 2026/3/28 5:38:05

vue3-count-to避坑指南：数字增长动画的7个常见问题与解决方案

Vue3-Count-To深度避坑实战：数字动画7大疑难解析数字动态增长效果在数据可视化、金融仪表盘和运营数据展示中扮演着关键角色。vue3-count-to作为Vue3生态中专精于此的轻量级库，虽然API简洁，但在真实业务场景中往往会遇到各种边界情况。本文将…...

编程新知 2026/3/28 5:18:01

MacOS极简部署OpenClaw：GLM-4.7-Flash模型联调与安全防护

MacOS极简部署OpenClaw：GLM-4.7-Flash模型联调与安全防护 1. 为什么选择OpenClawGLM-4.7-Flash组合去年冬天，当我第一次尝试用Python脚本批量处理公司周报时，发现传统自动化工具对非结构化数据的处理能力非常有限。直到遇见OpenClaw这个能…...

编程新知 2026/3/28 4:42:02

谷歌DeepMind与卡内基梅隆大学揭秘声音背后的脸

这项由谷歌DeepMind与卡内基梅隆大学联合开展的研究，发表于2024年的计算机视觉与模式识别顶级会议CVPR（IEEE/CVF Conference on Computer Vision and Pattern Recognition），论文编号为arXiv:2404.01975，有兴趣深入了解…...

编程新知 2026/3/28 4:23:59

绝区零智能协同系统：AI驱动的游戏效率倍增解决方案

编程新知 2026/3/28 4:05:49

【大窗除强信号，小窗清残留】基于双尺度广义交叉验证阈值的地震信号自适应剥离和噪声提取方法（MATLAB）

背景知识在环境噪声层析成像等研究中，我们需要的是纯粹的“噪声”记录，而不是被地震信号“污染”的波形。传统方法是人工剔除含事件的时间段，或者用时间域归一化压制信号，但这些方法要么主观，要么难以彻底去除能量较强…...

编程新知 2026/3/28 4:01:49

CAD_Sketcher终极指南：如何在Blender中实现精准约束绘图

CAD_Sketcher终极指南：如何在Blender中实现精准约束绘图【免费下载链接】CAD_Sketcher Constraint-based geometry sketcher for blender 项目地址: https://gitcode.com/gh_mirrors/ca/CAD_Sketcher 你是否曾在Blender中尝试绘制精确的机械零件或建筑平面图…...

编程新知 2026/3/28 3:41:37

目标

流程

paddlepaddle做了什么？

数据准备

定义一个依赖paddle库的类

代码

保存模型

读取模型

尝试进行预测

相关文章：