当前位置：首页 > news >正文

【机器学习】西瓜书习题3.3Python编程实现对数几率回归

news 2026/5/30 10:45:20

参考代码
结合自己的理解，添加注释。

代码

导入相关的库

import numpy as np
import pandas as pd
import matplotlib
from matplotlib import pyplot as plt
from sklearn import linear_model

导入数据，进行数据处理和特征工程

# 1.数据处理，特征工程
data_path = 'watermelon3_0_Ch.csv'
data = pd.read_csv(data_path).values
# 取所有行的第10列(标签列)进行判断
is_good = data[:,9] == '是'
is_bad = data[:,9] == '否'
# 按照数据集3.0α，强制转换数据类型
X = data[:,7:9].astype(float)
y = data[:,9]
y[y=='是'] = 1
y[y=='否'] = 0
y = y.astype(int)

定义若干需要使用的函数
$\frac{1}{1+e^{-x}}$

def sigmoid(x):"""构造对数几率函数，它是一种sigmoid函数"""s = 1/(1+np.exp(-x))return s

$\ell(\beta) = \sum_{i=1}^{m}(-y_{i}\beta^{T} \hat{x}_{i} + ln(1+e^{\beta^{T} \hat{x}_{i}}))$

def J_cost(X,y,beta):""":param X:  sample array, shape(n_samples, n_features):param y: array-like, shape (n_samples,):param beta: the beta in formula 3.27 , shape(n_features + 1, ) or (n_features + 1, 1):return: the result of formula 3.27"""# 构造x_hat，np.c_ 用于连接两个矩阵，规模是（X.row行，X.column+1列）X_hat = np.c_[X, np.ones((X.shape[0],1))]# β和y均reshape为1列，规模是（X.column+1行，1列）beta = beta.reshape(-1,1)y = y.reshape(-1,1)# 计算最大化似然函数的相反数L_beta = -y * np.dot(X_hat,beta) + np.log(1+np.exp(np.dot(X_hat,beta)))# 返回式3.27的结果return  L_beta.sum()

$\beta = (w; b)$

def initialize_beta(column):"""初始化β，对应式3.26的假设，规模是（X.column+1行，1列），x_hat规模是（17行，X.column+1列）"""# numpy.random.randn(d0,d1,…,dn)# randn函数返回一个或一组样本，具有标准正态分布。标准正态分布又称为u分布，是以0为均值、以1为标准差的正态分布，记为N（0，1）# dn表格每个维度# 返回值为指定维度的arraybeta = np.random.randn(column+1,1)*0.5+1return beta

$\frac{\partial \ell(\beta)}{\partial \beta} = -\sum_{i=1}^{m}\hat{x}_{i}(y_{i}-p_{1}(\hat{x}_{i};\beta))$

def gradient(X,y,beta):"""compute the first derivative of J(i.e. formula 3.27) with respect to beta      i.e. formula 3.30计算式3.27的一阶导数----------------------------------------------------:param X: sample array, shape(n_samples, n_features):param y: array-like, shape (n_samples,):param beta: the beta in formula 3.27 , shape(n_features + 1, ) or (n_features + 1, 1):return:"""# 构造x_hat，np.c_ 用于连接两个矩阵，规模是（X.row行，X.column+1列）X_hat = np.c_[X, np.ones((X.shape[0],1))]# β和y均reshape为1列，规模是（X.column+1行，1列）beta = beta.reshape(-1,1)y = y.reshape(-1,1)# 计算p1(X_hat,beta)p1 = sigmoid(np.dot(X_hat,beta))gra = (-X_hat*(y-p1)).sum(0)return gra.reshape(-1,1)

$\frac{\partial^2 \ell(\beta)}{\partial \beta \partial \beta^T} = \sum_{i=1}^{m}\hat{x}_{i}\hat{x}_{i}^Tp_{1}(\hat{x}_{i};\beta)(1-p_{1}(\hat{x}_{i};\beta))$

def hessian(X,y,beta):'''compute the second derivative of J(i.e. formula 3.27) with respect to beta      i.e. formula 3.31计算式3.27的二阶导数----------------------------------:param X: sample array, shape(n_samples, n_features):param y: array-like, shape (n_samples,):param beta: the beta in formula 3.27 , shape(n_features + 1, ) or (n_features + 1, 1):return:'''# 构造x_hat，np.c_ 用于连接两个矩阵，规模是（X.row行，X.column+1列）X_hat = np.c_[X, np.ones((X.shape[0],1))]# β和y均reshape为1列，规模是（X.column+1行，1列）beta = beta.reshape(-1,1)y = y.reshape(-1,1)# 计算p1(X_hat,beta)p1 = sigmoid(np.dot(X_hat,beta))m,n=X.shape# np.eye()返回的是一个二维2的数组(N,M)，对角线的地方为1，其余的地方为0.P = np.eye(m)*p1*(1-p1)assert P.shape[0] == P.shape[1]# X_hat.T是X_hat的转置return np.dot(np.dot(X_hat.T,P),X_hat)

使用梯度下降法求解

def update_parameters_gradDesc(X,y,beta,learning_rate,num_iterations,print_cost):"""update parameters with gradient descent method"""for i in range(num_iterations):grad = gradient(X,y,beta)beta = beta - learning_rate*grad# print_cost为true时，并且迭代为10的倍数时，打印本次迭代的costif (i%10==0)&print_cost:print('{}th iteration, cost is {}'.format(i,J_cost(X,y,beta)))return betadef logistic_model(X,y,print_cost=False,method='gradDesc',learning_rate=1.2,num_iterations=1000):""":param method: str 'gradDesc'or'Newton'"""# 得到X的规模row,column = X.shape# 初始化βbeta = initialize_beta(column)if method == 'gradDesc':return update_parameters_gradDesc(X,y,beta,learning_rate,num_iterations,print_cost)elif method == 'Newton':return update_parameters_newton(X,y,beta,print_cost,num_iterations)else:raise ValueError('Unknown solver %s' % method)

可视化结果

# 1.可视化数据点
# 设置字体为楷体
matplotlib.rcParams['font.sans-serif'] = ['KaiTi']
plt.scatter(data[:, 7][is_good], data[:, 8][is_good], c='b', marker='o') #c参数是颜色，marker是标记
plt.scatter(data[:, 7][is_bad], data[:, 8][is_bad], c='r', marker='x')
# 设置横轴坐标标题
plt.xlabel('密度')
plt.ylabel('含糖量')# 2.可视化自己写的模型
# 学习得到模型
beta = logistic_model(X,y,print_cost=True,method='gradDesc',learning_rate=0.3, num_iterations=1000)
# 得到模型参数及偏置（截距）
w1, w2, intercept = beta
x1 = np.linspace(0, 1)
y1 = -(w1 * x1 + intercept) / w2
ax1, = plt.plot(x1, y1, label=r'my_logistic_gradDesc')# 3.可视化sklearn的对率回归模型，进行对比
lr = linear_model.LogisticRegression(solver='lbfgs', C=1000)  # 注意sklearn的逻辑回归中，C越大表示正则化程度越低。
lr.fit(X, y)
lr_beta = np.c_[lr.coef_, lr.intercept_]
print(J_cost(X, y, lr_beta))
# 可视化sklearn LogisticRegression 模型结果
w1_sk, w2_sk = lr.coef_[0, :]
x2 = np.linspace(0, 1)
y2 = -(w1_sk * x2 + lr.intercept_) / w2
ax2, = plt.plot(x2, y2, label=r'sklearn_logistic')
plt.legend(loc='upper right')
plt.show()

可视化结果如下：
在这里插入图片描述

【机器学习】西瓜书习题3.3Python编程实现对数几率回归

参考代码结合自己的理解，添加注释。代码导入相关的库 import numpy as np import pandas as pd import matplotlib from matplotlib import pyplot as plt from sklearn import linear_model导入数据，进行数据处理和特征工程 # 1.数据处理&#x…...

编程日记 2023/8/3 22:25:19

Blazor前后端框架Known-V1.2.9

V1.2.9 Known是基于C#和Blazor开发的前后端分离快速开发框架，开箱即用，跨平台，一处代码，多处运行。 Gitee： https://gitee.com/known/KnownGithub：https://github.com/known/Known 概述基于C#和Blazor…...

编程日记 2023/8/3 22:24:17

【3D捏脸功能实现】

文章目录一、技术方案介绍二、技术核心三、底层技术实现选型进行模型建模编写逻辑代码四、功能落地五、总结一、技术方案介绍 3D捏脸功能是一种利用3D技术实现用户自定义头像的功能。通常实现这种功能需要以下技术： 3D建模技术。通过3D建模技术可以创建一个可以…...

编程日记 2023/8/3 22:23:16

Kafka的零拷贝

传统的IO模型如果要把磁盘中的某个文件发送到远程服务器需要经历以下几个步骤 (1) 从磁盘中读取文件的内容，然后拷贝到内核缓冲区 (2) CPU把内核缓冲区的数据赋值到用户空间的缓冲区 (3) 在用户程序中调用write方法，把用户缓冲区的数据拷贝到内核下面…...

编程日记 2023/8/3 22:22:15

如何使用Python进行数据分析?

Python是一个非常流行的编程语言，也是数据科学家和数据分析师最常用的语言之一。 Python的生态系统非常丰富，有很多强大的库和工具可以用来进行数据分析，如NumPy、Pandas、Matplotlib、SciPy等。 Python教程，8天python从入门到精…...

编程日记 2023/8/3 22:21:14

概率论与数理统计复习总结3

概率论与数理统计复习总结，仅供笔者复习使用，参考教材： 《概率论与数理统计》/ 荣腾中主编. — 第 2 版. 高等教育出版社《2024高途考研数学——概率基础精讲》王喆概率论与数理统计实际上是两个互补的分支：概率论在已知随机…...

编程日记 2023/8/3 22:20:13

PHP正则绕过解析

正则绕过正则表达式PHP正则回溯PHP中的NULL和false回溯案例案例1案例2 正则表达式在正则中有许多特殊的字符，不能直接使用，需要使用转义符\。如：$,(,),*,,.,?,[,,^,{。这里大家会有疑问：为啥小括号(),这个就需要两个来转义&a…...

编程日记 2023/8/3 22:19:10

Hive巡检脚本

Hive巡检脚本的示例： #!/bin/bash# 设置Hive连接信息 HIVE_HOST"your_hive_host" HIVE_PORT"your_hive_port" HIVE_USER"your_hive_username" HIVE_PASSWORD"your_hive_password"# 设置巡检结果输出文件路径 OUTPUT_FILE&…...

编程日记 2023/8/3 22:18:08

【状态估计】基于UKF法、AUKF法的电力系统三相状态估计研究（Matlab代码实现）

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势：🌞🌞🌞博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。 ⛳️座右铭&a…...

编程日记 2023/8/3 22:17:07

webpack复习

webpack webpack复习 webpack基本配置拆分配置 - 公共配置生产环境配置开发环境配置使用merge webpack-dev-server 启动本地服务在公共中引入babel-loader处理es6 webpack高级配置多入口文件 enty 入口为一个对象里面的key为入口名 value为入口文件路径例如 pa…...

编程日记 2023/8/3 22:16:06

开始学习 Kafka，一文掌握基本概念｜Kafka 系列一

如果你还不了解 Kafka，或者也打算深入探索、系统学习，那么欢迎有同样目标的小伙伴可以加群交流，让学习之路不再孤独。一个人可能走的很快，但是一群人会走的更远。（后台回复：加群） 点击上方“后…...

编程日记 2023/8/3 22:15:05

Couldn‘t lock the file :/tmp/bbc-filesystem-base_syscache_service

解决方案： 进去带这个目录，然后切换成root用户，将它删除...

编程日记 2023/8/3 22:14:02

vscode 通过mongoose 连接mongodb atlas

了解mongodb 的项目结构 1.代表集群名称 > 2.代表数据库名称>3.代表每个 collection名称三者范围为从大到小的关系 （一对多）。每个集群有不同的连接地址、用户信息（Database Access）、ip配置信息（Network Acce…...

编程日记 2023/8/3 22:13:02

记录 Vue3 + Ts 类型使用

阅读时长: 10 分钟本文内容：记录在 Vue3 中使用 ts 时的各种写法. 类型大小写 vue3 ts 项目中，类型一会儿大写一会儿小写。怎么区分与基础类型使用? String、string、Number、number、Boolean、boolean … 在 js 中， 以 string 与 String…...

编程日记 2023/8/3 22:12:00

主从同步带来的业务问题

目录一： 目前的业务问题二：如何平衡主从不同步和业务隔离？三：解决方案一： 目前的业务问题业务A会跑一些规则， 跑完会把规则结果信息落地（落地到主库）， 然后会通过TDM…...

编程日记 2023/8/3 22:10:59

主动带宽控制工具

停机和带宽过度使用是任何组织都无法避免的两个问题。随着企业采用 BYOD 文化，通过网络的流量负载可能很重，导致网络拥塞并使网络容易受到网络攻击。为了解决这个问题，企业需要全面的监控策略来保护网络，当看似大量的流量进入网络…...

编程日记 2023/8/3 22:09:58

数据采集的方法有哪些？

近年来，国家和各大企业都在部署大数据战略。“大数据”这个词也越来越频繁地出现在我们的生活中。当我们在进行网上冲浪时，页面总会跳出我们想要搜索的相关产品或关联事物。大数据，似乎总是能够“算”出我们“心中所想”。那么，大…...

编程日记 2023/8/3 22:08:57

linux重新学习-纪录篇

前言： 正式学习linux的时候，除了那些命令之外，更多的是对于这个系统的重新认知。 linux的身世? 在上世纪90年代，那时候计算机非常的珍贵，配置也很一般般，系统也贵，所以没啥人用，在当…...

编程日记 2023/8/3 22:07:55

为机器人装“大脑” 谷歌发布RT-2大模型

大语言模型不仅能让应用变得更智能，还将让机器人学会举一反三。在谷歌发布RT-1大模型仅半年后，专用于机器人的RT-2大模型于近期面世，它能让机器人学习互联网上的文本和图像，并具备逻辑推理能力。该模型为机器人智能带来显著升级…...

编程日记 2023/8/3 22:06:54

JavaEE 面试常见问题

一、常见的 ORM 框架有哪些？ 1.Mybatis Mybatis 是一种典型的半自动的 ORM 框架，所谓的半自动，是因为还需要手动的写 SQL 语句，再由框架根据 SQL 及传入数据来组装为要执行的 SQL 。其优点为： 1. 因为由程序员…...

编程日记 2023/8/3 22:05:53

别再死记硬背了！用Multisim仿真+图解，5分钟搞懂三极管共射放大电路工作原理

用Multisim仿真图解5分钟掌握三极管共射放大电路三极管共射放大电路是电子技术中最基础也最关键的电路之一，但传统教材中复杂的公式推导和静态图解往往让初学者望而生畏。本文将带你用Multisim仿真软件，通过可视化的方式直观理解电路工作原理&#xff0c…...

编程新知 2026/5/26 3:32:09

深圳实体门店有必要做GEO AI代运营吗

深圳实体门店有必要做GEO AI代运营吗一、开篇引言2026年深圳本地实体商业竞争进入白热化阶段，全城数百万家线下实体门店涵盖本地生活、家装工装、汽车服务、餐饮娱乐、教育培训等全品类，传统线下地推、门店自然客流、传统团购平台引流效果持续下滑&#…...

编程新知 2026/5/26 3:11:57

本地柴油发电机组排行2023年最新榜单

柴油发电机是通过燃烧柴油驱动发动机，进而发电的设备，广泛应用于电力中断或无电网地区。1. 柴油发电机的核心工作原理是什么？柴油发电机是一种将化学能转化为电能的设备，其核心是柴油发动机与交流发电机的组合。当柴油在发动机内燃…...

编程新知 2026/5/26 3:05:52

别再乱算相似度了！用Python实战二元变量聚类：从Jaccard系数到病人分组

医疗数据分析实战：用Python实现基于Jaccard系数的病人症状聚类在医疗数据分析领域，如何从海量病人症状数据中发现潜在规律一直是临床研究的难点。传统方法往往依赖医生经验或简单统计，而现代数据挖掘技术为我们提供了更科学的解决方案。本文将…...

编程新知 2026/5/26 2:27:35

Sora 2原生接入Unity 6.0：5步完成神经渲染管线嵌入，实测帧率提升47%（附GitHub认证插件）

更多请点击： https://kaifayun.com 第一章：Sora 2与Unity整合 Sora 2作为新一代AI视频生成引擎，其开放API设计天然支持与实时3D引擎的深度协同。Unity 2023.2版本通过URP（Universal Render Pipeline）与C# Job System提…...

编程新知 2026/5/26 0:42:31

AI开始替人办事后，最危险的不是模型不够强，而是它把旧资料当真了

AI开始替人办事后，最危险的不是模型不够强，而是它把旧资料当真了2026年真正值得重视的AI底层能力，是让模型知道该信谁你有没有发现一个很扎心的变化。以前我们用AI，最怕它不会。现在我们用AI，最怕它太会了。它能写…...

编程新知 2026/5/26 0:36:28

华硕笔记本终极性能控制指南：用G-Helper完全替代Armoury Crate

华硕笔记本终极性能控制指南：用G-Helper完全替代Armoury Crate 【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops with nearly the same functionality. Works with ROG Zephyrus, Flow, TUF, Strix, Scar, ProArt, Vivobook, Zen…...

编程新知 2026/5/26 0:36:25

OpenClaw用户如何快速接入Taotoken并开始Agent工作流

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度 OpenClaw用户如何快速接入Taotoken并开始Agent工作流对于使用OpenClaw框架构建AI智能体的开发者而言，快速接入稳定、多…...

编程新知 2026/5/26 0:32:21

基于MaixCam的延时摄影系统：从硬件选型到Python编程全解析

1. 项目概述：用MaixCam打造你的专属延时摄影工坊延时摄影，这个听起来有点专业、甚至带点“魔法”色彩的词，其实离我们并不遥远。想想看，把一朵花从含苞到绽放的几天时间，压缩成十几秒的惊艳绽放；或者把一座…...

编程新知 2026/5/26 0:01:52

电子商务设计师软考备战：特别篇 - 综合模拟与备考策略

1. 考试形式与内容结构1.1 考试基本信息考试科目与时间基础知识考试：上午9:00-11:30（150分钟）应用技术考试：下午2:00-4:30（150分钟）题型与分值分布上午考试（基础知识）： -…...

编程新知 2026/5/25 23:51:45

代码

相关文章：