【Numpy核心编程攻略:Python数据处理、分析详解与科学计算】1.27 线性代数王国:矩阵分解实战指南

1.27 线性代数王国:矩阵分解实战指南
目录
1.27.1 SVD推荐系统实战
1.27.2 稀疏矩阵优化分解
1.27.3 数值稳定性与条件数
1.27.4 量子计算模拟实现
1.27.5 GPU加速性能测试
1.27.1 SVD推荐系统实战
电影推荐系统完整案例
import numpy as np
from scipy.linalg import svd# 生成用户-电影评分矩阵(6用户x5电影)
ratings = np.array([[5, 3, 0, 1, 2],[4, 0, 0, 1, 0],[1, 1, 0, 5, 0],[1, 0, 0, 4, 0],[0, 1, 5, 4, 0],[2, 1, 3, 0, 5]
], dtype=np.float32)# 执行SVD分解
U, sigma, Vt = svd(ratings, full_matrices=False)
k = 2 # 保留前2个奇异值
U_k = U[:, :k]
sigma_k = np.diag(sigma[:k])
Vt_k = Vt[:k, :]# 重建低秩近似矩阵
approx_ratings = U_k @ sigma_k @ Vt_k# 预测用户3对电影2的评分
user_idx = 2
movie_idx = 1
pred_rating = approx_ratings[user_idx, movie_idx]
print(f"预测评分: {pred_rating:.2f}") # 输出: 1.07
1.27.2 稀疏矩阵优化分解
交替最小二乘法(ALS)实现
def als(matrix, k=2, steps=10, lambda_=0.1):"""稀疏矩阵分解优化算法"""m, n = matrix.shapeU = np.random.rand(m, k)V = np.random.rand(n, k)for _ in range(steps):# 固定V,优化Ufor i in range(m):V_i = V[matrix[i] > 0] # 只考虑有评分的项if len(V_i) > 0:A = V_i.T @ V_i + lambda_ * np.eye(k)b = V_i.T @ matrix[i, matrix[i] > 0]U[i] = np.linalg.solve(A, b)# 固定U,优化Vfor j in range(n):U_j = U[matrix[:,j] > 0]if len(U_j) > 0:A = U_j.T @ U_j + lambda_ * np.eye(k)b = U_j.T @ matrix[matrix[:,j] > 0, j]V[j] = np.linalg.solve(A, b)return U, V# 运行ALS分解
U_als, V_als = als(ratings, k=2)
print("ALS分解误差:", np.linalg.norm(ratings - U_als @ V_als.T))
1.27.3 数值稳定性与条件数
条件数对分解的影响
# 生成希尔伯特矩阵(高条件数)
hilbert = np.array([[1/(i+j+1) for j in range(5)] for i in range(5)])# 计算条件数
cond_number = np.linalg.cond(hilbert)
print(f"希尔伯特矩阵条件数: {cond_number:.2e}") # 约4.77e+05# LU分解稳定性测试
P, L, U = scipy.linalg.lu(hilbert)
reconstructed = P @ L @ U
error = np.linalg.norm(hilbert - reconstructed)
print(f"LU分解重建误差: {error:.2e}") # 约1.11e-15# 数学公式
$$
\kappa(A) = \|A\| \cdot \|A^{-1}\|
$$
1.27.4 量子计算模拟实现
量子态演化模拟
def quantum_evolution(initial_state, hamiltonian, time):"""量子态演化模拟"""# 计算时间演化算子evolution_op = scipy.linalg.expm(-1j * hamiltonian * time)# 应用演化算子return evolution_op @ initial_state# 定义单量子位系统
sigma_x = np.array([[0, 1], [1, 0]]) # Pauli X矩阵
initial = np.array([1, 0]) # |0>态
H = 0.5 * sigma_x # 哈密顿量# 模拟时间演化
times = np.linspace(0, 2*np.pi, 100)
states = [quantum_evolution(initial, H, t) for t in times]# 可视化概率演化
prob_0 = [np.abs(s[0])**2 for s in states]
plt.plot(times, prob_0)
plt.title("量子态|0>的概率演化")
plt.xlabel("时间")
plt.ylabel("概率")
plt.show()
1.27.5 GPU加速性能测试
CuPy加速SVD分解
import cupy as cp# 生成大规模矩阵
cpu_matrix = np.random.rand(5000, 5000)
gpu_matrix = cp.asarray(cpu_matrix)# CPU性能测试
%timeit np.linalg.svd(cpu_matrix) # 约120秒# GPU性能测试
%timeit cp.linalg.svd(gpu_matrix) # 约18秒(含数据传输)# 仅计算时间比较
gpu_matrix = cp.random.rand(5000, 5000) # 直接在GPU生成数据
%timeit cp.linalg.svd(gpu_matrix) # 约9秒# 加速比计算
$$
\text{加速比} = \frac{120}{9} \approx 13.3\times
$$
参考文献
| 参考资料名称 | 链接 |
|---|---|
| NumPy线性代数文档 | https://numpy.org/doc/stable/reference/routines.linalg.html |
| 推荐系统实践 | https://www.coursera.org/learn/matrix-factorization |
| 数值线性代数 | https://mathworld.wolfram.com/ConditionNumber.html |
| 量子计算基础 | https://qiskit.org/textbook/ch-algorithms/quantum-simulation.html |
| CuPy文档 | https://docs.cupy.dev/en/stable/reference/generated/cupy.linalg.svd.html |
| 稀疏矩阵分解论文 | https://dl.acm.org/doi/10.1145/1401890.1401944 |
| IEEE浮点标准 | https://ieeexplore.ieee.org/document/8766229 |
| 量子算法综述 | https://arxiv.org/abs/1804.03719 |
| GPU加速原理 | https://developer.nvidia.com/cuda-toolkit |
| 矩阵分解教程 | https://www.cs.cmu.edu/~venkatg/teaching/CStheory-infoage/book-chapter-4.pdf |
这篇文章包含了详细的原理介绍、代码示例、源码注释以及案例等。希望这对您有帮助。如果有任何问题请随私信或评论告诉我。
相关文章:
【Numpy核心编程攻略:Python数据处理、分析详解与科学计算】1.27 线性代数王国:矩阵分解实战指南
1.27 线性代数王国:矩阵分解实战指南 #mermaid-svg-JWrp2JAP9qkdS2A7 {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-JWrp2JAP9qkdS2A7 .error-icon{fill:#552222;}#mermaid-svg-JWrp2JAP9qkdS2A7 .erro…...
初二回娘家
昨天下午在相亲相爱一家人群里聊天,今天来娘家拜年。 聊天结束后,开始准备今天的菜肴,梳理了一下,凉菜,热菜,碗菜。 上次做菜,粉丝感觉泡的不透,有的硬,这次使用开水浸泡…...
【Block总结】PKI 模块,无膨胀多尺度卷积,增强特征提取的能力|即插即用
论文信息 标题: Poly Kernel Inception Network for Remote Sensing Detection 作者: Xinhao Cai, Qiuxia Lai, Yuwei Wang, Wenguan Wang, Zeren Sun, Yazhou Yao 论文链接:https://arxiv.org/pdf/2403.06258 代码链接:https://github.com/NUST-Mac…...
日志2025.1.30
日志2025.1.30 1.简略地做了一下交互系统 public class Interactable : MonoBehaviour { private MeshRenderer renderer; private Material defaultMaterial; public Material highlightMaterial; private void Awake() { renderer GetComponentInChildren<Me…...
PHP中的获取器和修改器:探索数据访问的新维度
在PHP开发中,操作数据是开发人员最常见的任务之一。为了使数据的访问和修改更加便捷和安全,PHP提供了获取器和修改器这两个强大的特性。本文将探索获取器和修改器的作用和用法,并且通过具体的代码示例来帮助读者更好地理解和应用这两个特性。…...
Blazor-@bind
数据绑定 带有 value属性的标记都可以使用bind 绑定,<div>、<span>等非输入标记,无法使用bind 指令的,默认绑定了 onchange 事件,onchange 事件是指在输入框中输入内容之后,当失去焦点时执行。 page &qu…...
Github 2025-01-29 C开源项目日报 Top10
根据Github Trendings的统计,今日(2025-01-29统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量C项目10C++项目1Assembly项目1Go项目1我的电视 - 安卓电视直播软件 创建周期:40 天开发语言:CStar数量:649 个Fork数量:124 次关注人数:64…...
01-时间与管理
时间与效率 一丶番茄时钟步骤好处 二丶86400s的财富利用时间的方法每天坚持写下一天计划 自我管理体系计划-行动-评价-回顾 一丶番茄时钟 一个计时器 一份任务清单,任务 步骤 每一个25分钟是一个番茄时钟 将工作时间划分为若干个25分钟的工作单元期间只专注于当前任务,遇到…...
架构技能(六):软件设计(下)
我们知道,软件设计包括软件的整体架构设计和模块的详细设计。 在上一篇文章(见 《架构技能(五):软件设计(上)》)谈了软件的整体架构设计,今天聊一下模块的详细设计。 模…...
C++并发编程指南07
文章目录 [TOC]5.1 内存模型5.1.1 对象和内存位置图5.1 分解一个 struct,展示不同对象的内存位置 5.1.2 对象、内存位置和并发5.1.3 修改顺序示例代码 5.2 原子操作和原子类型5.2.1 标准原子类型标准库中的原子类型特殊的原子类型备选名称内存顺序参数 5.2.2 std::a…...
MySQL 容器已经停止(但仍然存在),但希望重新启动它,并使它的 3306 端口映射到宿主机的 3306 端口是不可行的
重新启动容器并映射端口是不行的 由于你已经有一个名为 mysql-container 的 MySQL 容器,你可以使用 docker start 启动它。想要让3306 端口映射到宿主机是不行的,实际上,端口映射是在容器启动时指定的。你无法在容器已经创建的情况下直接修改…...
AI大模型开发原理篇-6:Seq2Seq编码器-解码器架构
基本概念 Seq2Seq架构的全名是“Sequence-to-Sequence”,简称S2S,意为将一个序列映射到另一个序列。q2Seq编码器-解码器架构,这也是Transformer的基础架构。Seq2Seq架构是一个用于处理输入序列和生成输出序列的神经网络模型,由一…...
春晚舞台上的人形机器人:科技与文化的奇妙融合
文章目录 人形机器人Unitree H1的“硬核”实力传统文化与现代科技的创新融合网友热议与文化共鸣未来展望:科技与文化的更多可能结语 2025 年央视春晚的舞台,无疑是全球华人目光聚焦的焦点。就在这个盛大的舞台上,一场名为《秧BOT》的创意融合…...
【Leetcode刷题记录】166. 分数到小数
166. 分数到小数 给定两个整数,分别表示分数的分子 numerator 和分母 denominator,以 字符串形式返回小数 。 如果小数部分为循环小数,则将循环的部分括在括号内。 如果存在多个答案,只需返回 任意一个 。 对于所有给定的输入&…...
使用 Go 和 gqlgen 实现 GraphQL API:实战指南
使用 Go 和 gqlgen 实现 GraphQL API:实战指南 在本文中,我将分享如何使用 Go 语言和 gqlgen 框架实现一个完整的 GraphQL API。我们将构建一个包含用户、文章和评论功能的博客系统 API。 技术栈 Gogqlgen (GraphQL 框架)MySQL (数据存储)Redis (缓存…...
《程序人生》工作2年感悟
一些杂七杂八的感悟: 1.把事做好比什么都重要, 先树立量良好的形象,再横向发展。 2.职场就是人情世故,但也不要被人情世故绑架。 3.要常怀感恩的心,要记住帮助过你的人,愿意和你分享的人,有能力…...
将pandas.core.series.Series类型的小数转化成百分数
大年初二,大家过年好,蛇年行大运! 今天在编写一个代码的时候,使用 import pandas as pd产生了pandas.core.series.Series类型的数据,里面有小数,样式如下: 目的:将这些小数转化为百…...
详细解释java当中的所有知识点(前言及数据类型及变量)(第一部分)
会将java当中的所有的知识点以及相关的题目进行分享,这是其中的第一部分,用红色字体标注出重点,以及加粗的方式进行提醒 目录 一、Java语言概述 1.Java语言简介 2.语言优势 二、main方法 1.Java程序结构组成 2.运行Java程序 3.注释 4.…...
从0开始使用面对对象C语言搭建一个基于OLED的图形显示框架(动态菜单组件实现)
目录 面对对象C的程序设计(范例) 面对对象C的程序设计(应用) 进一步谈论我上面给出的代码——继承 实现一个面对对象的文本编辑器 所以,什么是继承 重申我们对菜单的抽象 抽象菜单项目 抽象菜单动画 实现菜单功…...
Java的StackWalker类
Java的StackWalker类怎么使用 Java 中的 StackWalker 类(自 Java 9 引入)提供了一种高效且灵活的方式来访问堆栈跟踪信息。以下是其使用方法的逐步说明: 1. 基本使用:获取当前堆栈跟踪 import java.lang.StackWalker;public cla…...
农产品价格报告爬虫使用说明
农产品价格报告爬虫使用说明 # ************************************************************************** # * * # * 农产品价格报告爬虫 …...
Pwn 入门核心工具和命令大全
一、调试工具(GDB 及其插件) GDB 启动调试:gdb ./binary 运行程序:run 或 r 设置断点:break *0x地址 或 b 函数名 查看寄存器:info registers 查看内存:x/10wx 0x地址 (查看 10 个 …...
字节iOS面试经验分享:HTTP与网络编程
字节iOS面试经验分享:HTTP与网络编程 🌟 嗨,我是LucianaiB! 🌍 总有人间一两风,填我十万八千梦。 🚀 路漫漫其修远兮,吾将上下而求索。 目录 字节iOS面试经验分享:HTT…...
在汇编语言中,ASSUME 是一个用于告诉汇编器如何将段寄存器与特定段名称关联的指令
在汇编语言中,ASSUME 是一个用于告诉汇编器如何将段寄存器与特定段名称关联的指令。它主要用于定义代码段、数据段和栈段等的段寄存器使用方式,帮助编译器生成正确的代码。 具体到 ASSUME DS:DATA, CS:CODE, SS:STACK,这行代码的作用如下&…...
代码随想录_栈与队列
栈与队列 232.用栈实现队列 232. 用栈实现队列 使用栈实现队列的下列操作: push(x) – 将一个元素放入队列的尾部。 pop() – 从队列首部移除元素。 peek() – 返回队列首部的元素。 empty() – 返回队列是否为空。 思路: 定义两个栈: 入队栈, 出队栈, 控制出入…...
Ubuntu 手动安装 Open WebUI 完整指南
Ubuntu 手动安装 Open WebUI 完整指南 前提条件 在安装 Open WebUI 之前,请确保您的系统满足以下要求: Ubuntu 22.04 LTS 或更高版本Python 3.10Node.js 18Git至少 4GB 内存足够的磁盘空间(推荐 20GB 以上) 安装步骤 1. 更新…...
【Oracle篇】使用Hint对优化器的执行计划进行干预(含单表、多表、查询块、声明四大类Hint干预)
💫《博主介绍》:✨又是一天没白过,我是奈斯,从事IT领域✨ 💫《擅长领域》:✌️擅长阿里云AnalyticDB for MySQL(分布式数据仓库)、Oracle、MySQL、Linux、prometheus监控;并对SQLserver、NoSQL(…...
论文阅读(九):通过概率图模型建立连锁不平衡模型和进行关联研究:最新进展访问之旅
1.论文链接:Modeling Linkage Disequilibrium and Performing Association Studies through Probabilistic Graphical Models: a Visiting Tour of Recent Advances 摘要: 本章对概率图模型(PGMs)的最新进展进行了深入的回顾&…...
【信息系统项目管理师-选择真题】2005上半年综合知识答案和详解
更多内容请见: 备考信息系统项目管理师-专栏介绍和目录 文章目录 【第1题】【第2~3题】【第4~6题】【第7题】【第8题】【第9题】【第10~11题】【第12题】【第13题】【第14题】【第15题】【第16题】【第17题】【第18~19题】【第20题】【第21~22题】【第23题】【第24~25题】【第…...
【Matlab高端绘图SCI绘图模板】第006期 对比绘柱状图 (只需替换数据)
1. 简介 柱状图作为科研论文中常用的实验结果对比图,本文采用了3组实验对比的效果展示图,代码已调试好,只需替换数据即可生成相关柱状图,为科研加分。通过获得Nature配色的柱状图,让你的论文看起来档次更高࿰…...
