当前位置: 首页 > news >正文

【Numpy核心编程攻略:Python数据处理、分析详解与科学计算】1.27 线性代数王国:矩阵分解实战指南

在这里插入图片描述

1.27 线性代数王国:矩阵分解实战指南

线性代数王国:矩阵分解实战指南
SVD推荐系统实战
稀疏矩阵优化分解
数值稳定性与条件数
量子计算模拟实现
GPU加速性能测试

目录

1.27.1 SVD推荐系统实战
1.27.2 稀疏矩阵优化分解
1.27.3 数值稳定性与条件数
1.27.4 量子计算模拟实现
1.27.5 GPU加速性能测试

矩阵分解
SVD分解
LU分解
QR分解
Cholesky分解
推荐系统
线性方程组
最小二乘法
优化问题
电影推荐案例
量子模拟
GPU加速

1.27.1 SVD推荐系统实战

电影推荐系统完整案例

import numpy as np
from scipy.linalg import svd# 生成用户-电影评分矩阵(6用户x5电影)
ratings = np.array([[5, 3, 0, 1, 2],[4, 0, 0, 1, 0],[1, 1, 0, 5, 0],[1, 0, 0, 4, 0],[0, 1, 5, 4, 0],[2, 1, 3, 0, 5]
], dtype=np.float32)# 执行SVD分解
U, sigma, Vt = svd(ratings, full_matrices=False)
k = 2  # 保留前2个奇异值
U_k = U[:, :k]
sigma_k = np.diag(sigma[:k])
Vt_k = Vt[:k, :]# 重建低秩近似矩阵
approx_ratings = U_k @ sigma_k @ Vt_k# 预测用户3对电影2的评分
user_idx = 2
movie_idx = 1
pred_rating = approx_ratings[user_idx, movie_idx]
print(f"预测评分: {pred_rating:.2f}")  # 输出: 1.07

1.27.2 稀疏矩阵优化分解

交替最小二乘法(ALS)实现

def als(matrix, k=2, steps=10, lambda_=0.1):"""稀疏矩阵分解优化算法"""m, n = matrix.shapeU = np.random.rand(m, k)V = np.random.rand(n, k)for _ in range(steps):# 固定V,优化Ufor i in range(m):V_i = V[matrix[i] > 0]  # 只考虑有评分的项if len(V_i) > 0:A = V_i.T @ V_i + lambda_ * np.eye(k)b = V_i.T @ matrix[i, matrix[i] > 0]U[i] = np.linalg.solve(A, b)# 固定U,优化Vfor j in range(n):U_j = U[matrix[:,j] > 0]if len(U_j) > 0:A = U_j.T @ U_j + lambda_ * np.eye(k)b = U_j.T @ matrix[matrix[:,j] > 0, j]V[j] = np.linalg.solve(A, b)return U, V# 运行ALS分解
U_als, V_als = als(ratings, k=2)
print("ALS分解误差:", np.linalg.norm(ratings - U_als @ V_als.T))

1.27.3 数值稳定性与条件数

条件数对分解的影响

# 生成希尔伯特矩阵(高条件数)
hilbert = np.array([[1/(i+j+1) for j in range(5)] for i in range(5)])# 计算条件数
cond_number = np.linalg.cond(hilbert)
print(f"希尔伯特矩阵条件数: {cond_number:.2e}")  # 约4.77e+05# LU分解稳定性测试
P, L, U = scipy.linalg.lu(hilbert)
reconstructed = P @ L @ U
error = np.linalg.norm(hilbert - reconstructed)
print(f"LU分解重建误差: {error:.2e}")  # 约1.11e-15# 数学公式
$$
\kappa(A) = \|A\| \cdot \|A^{-1}\|
$$

1.27.4 量子计算模拟实现

量子态演化模拟

def quantum_evolution(initial_state, hamiltonian, time):"""量子态演化模拟"""# 计算时间演化算子evolution_op = scipy.linalg.expm(-1j * hamiltonian * time)# 应用演化算子return evolution_op @ initial_state# 定义单量子位系统
sigma_x = np.array([[0, 1], [1, 0]])  # Pauli X矩阵
initial = np.array([1, 0])            # |0>态
H = 0.5 * sigma_x                     # 哈密顿量# 模拟时间演化
times = np.linspace(0, 2*np.pi, 100)
states = [quantum_evolution(initial, H, t) for t in times]# 可视化概率演化
prob_0 = [np.abs(s[0])**2 for s in states]
plt.plot(times, prob_0)
plt.title("量子态|0>的概率演化")
plt.xlabel("时间")
plt.ylabel("概率")
plt.show()

1.27.5 GPU加速性能测试

CuPy加速SVD分解

import cupy as cp# 生成大规模矩阵
cpu_matrix = np.random.rand(5000, 5000)
gpu_matrix = cp.asarray(cpu_matrix)# CPU性能测试
%timeit np.linalg.svd(cpu_matrix)  # 约120秒# GPU性能测试
%timeit cp.linalg.svd(gpu_matrix)  # 约18秒(含数据传输)# 仅计算时间比较
gpu_matrix = cp.random.rand(5000, 5000)  # 直接在GPU生成数据
%timeit cp.linalg.svd(gpu_matrix)        # 约9秒# 加速比计算
$$
\text{加速比} = \frac{120}{9} \approx 13.3\times
$$

参考文献

参考资料名称链接
NumPy线性代数文档https://numpy.org/doc/stable/reference/routines.linalg.html
推荐系统实践https://www.coursera.org/learn/matrix-factorization
数值线性代数https://mathworld.wolfram.com/ConditionNumber.html
量子计算基础https://qiskit.org/textbook/ch-algorithms/quantum-simulation.html
CuPy文档https://docs.cupy.dev/en/stable/reference/generated/cupy.linalg.svd.html
稀疏矩阵分解论文https://dl.acm.org/doi/10.1145/1401890.1401944
IEEE浮点标准https://ieeexplore.ieee.org/document/8766229
量子算法综述https://arxiv.org/abs/1804.03719
GPU加速原理https://developer.nvidia.com/cuda-toolkit
矩阵分解教程https://www.cs.cmu.edu/~venkatg/teaching/CStheory-infoage/book-chapter-4.pdf

这篇文章包含了详细的原理介绍、代码示例、源码注释以及案例等。希望这对您有帮助。如果有任何问题请随私信或评论告诉我。

相关文章:

【Numpy核心编程攻略:Python数据处理、分析详解与科学计算】1.27 线性代数王国:矩阵分解实战指南

1.27 线性代数王国:矩阵分解实战指南 #mermaid-svg-JWrp2JAP9qkdS2A7 {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-JWrp2JAP9qkdS2A7 .error-icon{fill:#552222;}#mermaid-svg-JWrp2JAP9qkdS2A7 .erro…...

Kafka常见问题之 java.io.IOException: Disk error when trying to write to log

文章目录 Kafka常见问题之 java.io.IOException: Disk error when trying to write to log1. 问题概述2. 问题排查方向(1)磁盘空间不足(2)磁盘 I/O 故障(3)Kafka 日志文件损坏(4)Kaf…...

libOnvif通过组播不能发现相机

使用libOnvif库OnvifDiscoveryClient类, auto discovery new OnvifDiscoveryClient(QUrl(“soap.udp://239.255.255.250:3702”), cb.Build()); 会有错误: end of file or no input: message transfer interrupted or timed out(30 sec max recv delay)…...

Flink (十二) :Table API SQL (一) 概览

Apache Flink 有两种关系型 API 来做流批统一处理:Table API 和 SQL。Table API 是用于 Scala 和 Java 语言的查询API,它可以用一种非常直观的方式来组合使用选取、过滤、join 等关系型算子。Flink SQL 是基于 Apache Calcite 来实现的标准 SQL。无论输入…...

FFmpeg(7.1版本)的基本组成

1. 前言 FFmpeg 是一个非常流行的开源项目,它提供了处理音频、视频以及其他多媒体内容的强大工具。FFmpeg 包含了大量的库,可以用来解码、编码、转码、处理和播放几乎所有类型的多媒体文件。它广泛用于视频和音频的录制、转换、流媒体传输等领域。 2. F…...

基于微信小程序的辅助教学系统的设计与实现

标题:基于微信小程序的辅助教学系统的设计与实现 内容:1.摘要 摘要:随着移动互联网的普及和微信小程序的兴起,基于微信小程序的辅助教学系统成为了教育领域的一个新的研究热点。本文旨在设计和实现一个基于微信小程序的辅助教学系统,以提高教…...

单片机基础模块学习——超声波传感器

一、超声波原理 左边发射超声波信号,右边接收超声波信号 左边的芯片用来处理超声波发射信号,中间的芯片用来处理接收的超声波信号 二、超声波原理图 T——transmit 发送R——Recieve 接收 U18芯片对输入的N_A1信号进行放大,然后输入给超声…...

HTML<hgroup>标签

例子&#xff1a; 使用hgroup元素标记标题和段落是相关的&#xff1a; <hgroup> <h2>Norway</h2> <p>The land with the midnight sun.</p> </hgroup> 定义和用法&#xff1a; 标签<hgroup>用于包围标题和一个或多个<p&g…...

C++并发编程指南08

以下是经过优化排版后的5.3节内容&#xff0c;详细解释了C中的同步操作和强制排序机制。每个部分都有详细的注释和结构化展示。 文章目录 5.3 同步操作和强制排序假设场景示例代码 5.3.1 同步发生 (Synchronizes-with)基本思想 5.3.2 先行发生 (Happens-before)单线程环境多线程…...

Spring Boot - 数据库集成03 - 集成Mybatis

Spring boot集成Mybatis 文章目录 Spring boot集成Mybatis一&#xff1a;基础知识1&#xff1a;什么是MyBatis2&#xff1a;为什么说MyBatis是半自动ORM3&#xff1a;MyBatis栈技术演进3.1&#xff1a;JDBC&#xff0c;自行封装JDBCUtil3.2&#xff1a;IBatis3.3&#xff1a;My…...

python:洛伦兹变换

洛伦兹变换&#xff08;Lorentz transformations&#xff09;是相对论中的一个重要概念&#xff0c;特别是在讨论时空的变换时非常重要。在四维时空的背景下&#xff0c;洛伦兹变换描述了在不同惯性参考系之间如何变换时间和空间坐标。在狭义相对论中&#xff0c;洛伦兹变换通常…...

“星门计划对AI未来的意义——以及谁将掌控它”

“星门计划对AI未来的意义——以及谁将掌控它” 图片由DALL-E 3生成 就在几天前&#xff0c;唐纳德特朗普宣布了“星门计划”&#xff0c;OpenAI随即跟进&#xff0c;分享了更多细节。他们明确表示&#xff0c;计划在未来四年内投资5000亿美元&#xff0c;在美国为OpenAI构建一…...

为什么“记住密码”适合持久化?

✅ 特性 1&#xff1a;应用重启后仍需生效 记住密码的本质是长期存储用户的登录凭证&#xff08;如用户名、密码、JWT Token&#xff09;&#xff0c;即使用户关闭应用、重启设备&#xff0c;仍然可以自动登录。持久化存储方案&#xff1a; React Native 推荐使用 AsyncStorag…...

国产SiC碳化硅功率器件技术成为服务器电源升级的核心引擎

在服务器电源应用中&#xff0c;国产650V碳化硅&#xff08;SiC&#xff09;MOSFET逐步取代传统超结&#xff08;Super Junction, SJ&#xff09;MOSFET&#xff0c;其核心驱动力源于SiC材料在效率、功率密度、可靠性和长期经济性上的显著优势&#xff0c;叠加产业链成熟与政策…...

【Block总结】动态蛇形卷积,专注于细长和弯曲的局部结构|即插即用

论文信息 标题: Dynamic Snake Convolution based on Topological Geometric Constraints for Tubular Structure Segmentation 作者: 戚耀磊、何宇霆、戚晓明、张媛、杨冠羽 会议: 2023 IEEE/CVF International Conference on Computer Vision (ICCV) 发表时间: 2023年10月…...

Spring MVC 框架:构建高效 Java Web 应用的利器

Java学习资料 Java学习资料 Java学习资料 一、引言 在 Java Web 开发领域&#xff0c;Spring MVC 框架是一颗耀眼的明星。它作为 Spring 框架家族的重要成员&#xff0c;为开发者提供了一套强大而灵活的解决方案&#xff0c;用于构建 Web 应用程序。Spring MVC 遵循模型 - 视…...

新鲜速递:DeepSeek-R1开源大模型本地部署实战—Ollama + MaxKB 搭建RAG检索增强生成应用

在AI技术快速发展的今天&#xff0c;开源大模型的本地化部署正在成为开发者们的热门实践方向。最火的莫过于吊打OpenAI过亿成本的纯国产DeepSeek开源大模型&#xff0c;就在刚刚&#xff0c;凭一己之力让英伟达大跌18%&#xff0c;纳斯达克大跌3.7%&#xff0c;足足是给中国AI产…...

Linux_线程同步生产者消费者模型

同步的相关概念 同步&#xff1a;在保证数据安全的前提下&#xff0c;让线程能够按照某种特定的顺序访问临界资源&#xff0c;从而有效避免饥饿问题&#xff0c;叫做同步竞态条件&#xff1a;因为时序问题&#xff0c;而导致程序异常&#xff0c;我们称之为竞态条件。 同步的…...

Origami Agents:通过AI驱动的研究工具提升B2B销售效率

在当今竞争激烈的商业环境中,B2B销售团队面临着巨大的挑战,如何高效地发现潜在客户并进行精准的外展活动成为关键。Origami Agents通过其创新的AI驱动研究工具,正在彻底改变这一过程。本文将深入探讨Origami Agents的产品特性、技术架构以及其快速增长背后的成功因素。 一、…...

linux的/proc 和 /sys目录差异

/proc 和 /sys 都是Linux系统中用于提供系统信息和进行系统配置的虚拟文件系统&#xff0c;但它们的原理并不完全一样&#xff0c;以下是具体分析&#xff1a; 目的与功能 /proc &#xff1a;主要用于提供系统进程相关信息以及内核运行时的一些参数等&#xff0c;可让用户和程…...

解锁数据库简洁之道:FastAPI与SQLModel实战指南

在构建现代Web应用程序时&#xff0c;与数据库的交互无疑是核心环节。虽然传统的数据库操作方式&#xff08;如直接编写SQL语句与psycopg2交互&#xff09;赋予了我们精细的控制权&#xff0c;但在面对日益复杂的业务逻辑和快速迭代的需求时&#xff0c;这种方式的开发效率和可…...

Opencv中的addweighted函数

一.addweighted函数作用 addweighted&#xff08;&#xff09;是OpenCV库中用于图像处理的函数&#xff0c;主要功能是将两个输入图像&#xff08;尺寸和类型相同&#xff09;按照指定的权重进行加权叠加&#xff08;图像融合&#xff09;&#xff0c;并添加一个标量值&#x…...

系统设计 --- MongoDB亿级数据查询优化策略

系统设计 --- MongoDB亿级数据查询分表策略 背景Solution --- 分表 背景 使用audit log实现Audi Trail功能 Audit Trail范围: 六个月数据量: 每秒5-7条audi log&#xff0c;共计7千万 – 1亿条数据需要实现全文检索按照时间倒序因为license问题&#xff0c;不能使用ELK只能使用…...

基础测试工具使用经验

背景 vtune&#xff0c;perf, nsight system等基础测试工具&#xff0c;都是用过的&#xff0c;但是没有记录&#xff0c;都逐渐忘了。所以写这篇博客总结记录一下&#xff0c;只要以后发现新的用法&#xff0c;就记得来编辑补充一下 perf 比较基础的用法&#xff1a; 先改这…...

什么是EULA和DPA

文章目录 EULA&#xff08;End User License Agreement&#xff09;DPA&#xff08;Data Protection Agreement&#xff09;一、定义与背景二、核心内容三、法律效力与责任四、实际应用与意义 EULA&#xff08;End User License Agreement&#xff09; 定义&#xff1a; EULA即…...

SpringCloudGateway 自定义局部过滤器

场景&#xff1a; 将所有请求转化为同一路径请求&#xff08;方便穿网配置&#xff09;在请求头内标识原来路径&#xff0c;然后在将请求分发给不同服务 AllToOneGatewayFilterFactory import lombok.Getter; import lombok.Setter; import lombok.extern.slf4j.Slf4j; impor…...

Springboot社区养老保险系统小程序

一、前言 随着我国经济迅速发展&#xff0c;人们对手机的需求越来越大&#xff0c;各种手机软件也都在被广泛应用&#xff0c;但是对于手机进行数据信息管理&#xff0c;对于手机的各种软件也是备受用户的喜爱&#xff0c;社区养老保险系统小程序被用户普遍使用&#xff0c;为方…...

算法笔记2

1.字符串拼接最好用StringBuilder&#xff0c;不用String 2.创建List<>类型的数组并创建内存 List arr[] new ArrayList[26]; Arrays.setAll(arr, i -> new ArrayList<>()); 3.去掉首尾空格...

【C++进阶篇】智能指针

C内存管理终极指南&#xff1a;智能指针从入门到源码剖析 一. 智能指针1.1 auto_ptr1.2 unique_ptr1.3 shared_ptr1.4 make_shared 二. 原理三. shared_ptr循环引用问题三. 线程安全问题四. 内存泄漏4.1 什么是内存泄漏4.2 危害4.3 避免内存泄漏 五. 最后 一. 智能指针 智能指…...

[ACTF2020 新生赛]Include 1(php://filter伪协议)

题目 做法 启动靶机&#xff0c;点进去 点进去 查看URL&#xff0c;有 ?fileflag.php说明存在文件包含&#xff0c;原理是php://filter 协议 当它与包含函数结合时&#xff0c;php://filter流会被当作php文件执行。 用php://filter加编码&#xff0c;能让PHP把文件内容…...