《机器学习》—— SVD奇异值分解方法对图像进行压缩
文章目录
- 一、SVD奇异值分解简单介绍
- 二、代码实现—SVD奇异值分解方法对图像进行压缩
一、SVD奇异值分解简单介绍
SVD(奇异值分解)是一种在信号处理、统计学、线性代数、机器学习等多个领域广泛应用的矩阵分解方法。它将任何 m×n 矩阵 A 分解为三个特定矩阵的乘积:

-
其中:
- U 是一个 m×m 的正交矩阵(或 m×min(m,n),取决于是否计算完整矩阵),其列被称为左奇异向量。
- Σ 是一个 m×n 的矩形对角矩阵(但通常以 m×min(m,n) 的形式出现,并且只在对角线上有值,其余位置为0),对角线上的元素称为奇异值,它们是非负的,并按降序排列。在实际应用中,Σ 经常以一维数组的形式返回,仅包含对角线上的奇异值。
- V^T 是 V 的转置,V 是一个 n×n 的正交矩阵(或 n×min(m,n)),其列被称为右奇异向量。
-
SVD 的一些重要性质和用途包括:
- 信息压缩:由于奇异值是按降序排列的,因此可以通过只保留最大的几个奇异值及其对应的左右奇异向量来近似原始矩阵,从而实现数据的压缩。这种方法在图像压缩、信号处理等领域非常有用。
- 噪声过滤:SVD 可以用于过滤噪声,特别是当噪声主要影响较小的奇异值时。通过去除或减小这些较小的奇异值,可以去除或减轻噪声的影响。
- 主成分分析(PCA):在统计学中,PCA 可以通过 SVD 来实现。PCA 旨在找到数据中的主成分,这些成分解释了数据中的最大方差。SVD 的左奇异向量对应于 PCA 的主成分方向。
- 求解线性方程组:SVD 可以用于求解线性方程组 Ax=b,特别是当 A 是非方阵或奇异矩阵时。
- 推荐系统:在推荐系统中,SVD 可以用于矩阵补全,即根据部分已知的评分来预测用户对物品的评分。
二、代码实现—SVD奇异值分解方法对图像进行压缩
-
在 python的NumPy库 中,np.linalg.svd() 函数用于计算矩阵的 SVD。
-
它返回三个对象:左奇异向量 U、奇异值数组 σ(注意这里返回的是一维数组,而不是完整的对角矩阵 Σ)和右奇异向量的转置 V ^T(在 NumPy 中通常直接返回 V,因为 V^T 可以很容易地通过 V.T (转置)获得)。
-
代码对一张灰度图像进行压缩
-
代码如下:
import numpy as np from PIL import Image import matplotlib.pyplot as plt""" 定义奇异值分解函数 并返回压缩后的图片和大小""" # k为压缩的维度 # pic_array 为传入图片的array矩阵格式 def pic_compress(k, pic_array):# 定义全局变量global u, sigma, vt, sig, new_picu, sigma, vt = np.linalg.svd(pic_array) # 进行奇异值分解sig = np.eye(k) * sigma[: k] # np.eye 用于生成一个单位对角矩阵# np.dot 用于矩阵的乘法运算 (计算:A=UΣV^T ——> 压缩后的图片矩阵)new_pic = np.dot(np.dot(u[:, :k], sig), vt[:k, :]) size = u.shape[0] * k + sig.shape[0] * sig.shape[1] + k * vt.shape[1] # 计算压缩后的图片大小return new_pic, size# 读取图片 img = Image.open('lf.jpg') ori_img = np.array(img) # 将图片转换成符合 np.linalg.svd() 参数要求的array矩阵格式 # 调用奇异值分解函数 new_img, size = pic_compress(100, ori_img) # 压缩的维度为100 可设定不同的值查看不同效果# 分别打印出图片压缩前后的大小 print("original size:" + str(ori_img.shape[0] * ori_img.shape[1])) print("compress size:" + str(size))# 创建画布,在同一张画布中显示压缩前后的两张图片 fig, ax = plt.subplots(1, 2) ax[0].imshow(ori_img, cmap='gray') ax[0].set_title("before compress") ax[1].imshow(new_img, cmap='gray') ax[1].set_title("after compress") plt.show() -
结果如下:


-
由结果可以看出图片的大小大约被压缩至原大小的60%,但是图片所呈现出来的效果没有太大的变化
相关文章:
《机器学习》—— SVD奇异值分解方法对图像进行压缩
文章目录 一、SVD奇异值分解简单介绍二、代码实现—SVD奇异值分解方法对图像进行压缩 一、SVD奇异值分解简单介绍 SVD(奇异值分解)是一种在信号处理、统计学、线性代数、机器学习等多个领域广泛应用的矩阵分解方法。它将任何 mn 矩阵 A 分解为三个特定矩…...
英文文本预处理——文本清理
文本清理定义 文本清理是英文文本预处理的重要步骤,旨在提高数据质量和一致性。以下是文本清理的具体内容: 去除标点符号 (Removing Punctuation): 删除文本中的标点符号,如句号、逗号、问号等。这一步骤有助于减少文本噪音,使得文本分析更加专注于有意义的词汇内容。 去…...
Spring Boot 注解探秘:常用配置值读取注解的魔力
在 Spring Boot 应用开发中,我们会常常借助Apollo,Spring Cloud Config等配置中心来集中管理配置信息,在拥有配置信息之后,高效且准确地读取这些配置信息无疑是极为关键的一环。今天我们就来介绍几个常用的用于配置值读取的注解。…...
Ps初步使用教程
1.画面快捷键 Ctrl鼠标滚轮:画面左右移动 Shift鼠标滚轮:画面上下快速移动(不加Shift正常速度移动) Alt鼠标滚轮:画面大小缩放 2.工具快捷键 ShiftG:渐变、油漆桶、3D材质施放 切换 CtrlO:…...
远程连接Hiveserver2服务
目录 1.修改 core-site.xml 和 hive-site.xml 的配置文件 2.启动HiveServer2服务 3.启动Beeline工具连接Hiveserver2服务 4.利用IDEA工具连接Hiveserver2服务 完成Hive本地模式安装后,可以启动hiveserver2服务进行远程连接和操作Hive。 1.修改 core-site.xml …...
PDF样本图册转换为一个链接,随时打开无需印刷
想象一下,您手中有一本厚重的样本图册,里面包含了丰富多样的内容,如产品介绍、项目方案、学术论文等。在过去,您需要逐一翻阅、筛选,甚至为了便于查看,不得不将其印刷出来。如今,借助先进的数字…...
自己动手实现mybatis的底层框架(不用动态代理直接用执行器、用动态代理自己实现。图文分析!)
目录 一.原生mybits框架图分析 自己实现Mybatis框架的分析 两种框架操作数据库的方法: 二.搭建开发环境 1.先创建一个maven项目 2.加入依赖(mysql dom4j junit lombok) 三.mybatis框架的设计思路 具体实现过程 3.1实现任务阶段 1- 完成读取配置文件&#x…...
项目日志——日志落地模块的设计、实现、测试
文章目录 日志落地模块设计实现扩展实现测试 日志落地模块 设计 功能是,将格式化完成后的日志消息字符串,输出到指定的位置 支持将日志落地到不同的位置 标准输出指定文件滚动文件 滚动文件按照时间或者大小进行滚动切换,可以按照天数对…...
CTK框架(七):事件监听
目录 1.概述 2.监听接口 3.具体实现 1.概述 CTK(Common Toolkit)框架中的事件监听机制是一个重要的功能,它允许开发者在特定事件发生时接收到通知并执行相应的操作。CTK框架主要支持三种类型的事件监听:框架事件、插件事件和服…...
一区霜冰算法+双向深度学习模型+注意力机制!RIME-BiTCN-BiGRU-Attention
一区霜冰算法双向深度学习模型注意力机制!RIME-BiTCN-BiGRU-Attention 目录 一区霜冰算法双向深度学习模型注意力机制!RIME-BiTCN-BiGRU-Attention效果一览基本介绍程序设计参考资料 效果一览 基本介绍 1.Matlab实现RIME-BiTCN-BiGRU-Attention霜冰算法…...
C语言 | Leetcode C语言题解之第396题旋转函数
题目: 题解: #define MAX(a, b) ((a) > (b) ? (a) : (b))int maxRotateFunction(int* nums, int numsSize){int f 0, numSum 0;for (int i 0; i < numsSize; i) {f i * nums[i];numSum nums[i];}int res f;for (int i numsSize - 1; i &g…...
利士策分享,克服生活中的困难:走好勇攀高峰的每一步
利士策分享,克服生活中的困难:走好勇攀高峰的每一步 在这个纷繁复杂的世界里,每个人都是自己生命旅程中的行者,而生活,则是一条既铺满鲜花又布满荆棘的道路。 我们或许会在某个清晨醒来,发现自己正站在一座…...
PurchasereturnController
目录 1、 PurchasereturnController 1.1、 反审核退货单 1.1.1、 //配件ID 1.1.2、 //配件编码 1.1.3、 //修改后仓库 1.1.4、 //修改配件信息表库存量 PurchasereturnController using QXQPS.Models; using QXQPS.Vo; using System; using System.Collection…...
mysql 学习笔记 八
总结 自动提交 查看自动提交状态:SELECT AUTOCOMMIT ; 设置自动提交状态:SET AUTOCOMMIT 0 。 手动提交 AUTOCOMMIT 0 时,使用 COMMIT 命令提交事务。 事务回滚 AUTOCOMMIT 0 时,使用 ROLLBACK 命令回滚事务。 …...
反序列化漏洞练习2
拿到题目,发现目标是获得flag.php的内容,且sis中admin和passwd等于sis2407时会输出fag的内容 根据源码编写序列化代码 <?php error_reporting(0); class sis{public $admin;public $passwd;public function __construct(){$this->admin "sis2407"…...
基于SpringBoot的社区医院管理系统
作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、SSM项目源码 系统展示 基于JavaSpringBootVueMySQL的社团管理系统【附源码文档】、…...
YOLOv8安装配置教程(Windows版)
YOLOv8安装配置教程(Windows版) 简介:最近由于选择了人工智能方向的专业选修课,课程需要安装配置YOLOv8,经过查阅各种资料后才发现,许多教程都比较老旧,并且文件位置也发生了变化,所…...
Linux的历史,版本,Linux的环境安装、简单学习4个基本的Linux指令等的介绍
文章目录 前言一、Linux的历史二、版本三、Linux的环境安装1. 腾讯云服务器的申请2. xshell的安装与使用 四、 简单学习4个基本的Linux指令1. ls2. pwd3. mkdir4. cd 总结 前言 Linux的历史,版本,Linux的环境安装、简单学习4个基本的Linux指令等的介绍 …...
【论文阅读】01-Survey on Temporal Knowledge Graph
原文名称:Survey on Temporal Knowledge Graph 1 Introduction 目前有两种方法:基于距离模型的嵌入变换方法和基于语义匹配模型的双线性模型。它们的思想都是将包含实体和关系的知识图谱嵌入到连续的低纬度实向量空间中 时间知识图的推理有两种,第一种是…...
【AIGC】InstructPixPix:基于文本引导的图像编辑技术
github:diffusers/examples/instruct_pix2pix/train_instruct_pix2pix_sdxl.py at main huggingface/diffusers GitHub 论文:https://arxiv.org/pdf/2211.09800 摘要 我们提出了一种从人类指令编辑图像的方法:给定一个输入图像和告诉模型做什么的书面…...
LiveTalking 部署踩坑笔记
目录 版本特点: tts方案: musetalk方案 一、先确认:1985 端口有没有在监听 Windows: Linux: 报错:SyntaxError: ( was never closed 版本特点: 日常开发 / 测试 / 本地实时 Demo → Wav2…...
从AMP到cuFFT:半精度训练中非2的幂维度问题的深度解析与实战规避
1. 从报错信息看半精度训练中的cuFFT限制 最近在调试一个深度学习模型时,遇到了这样的报错:"RuntimeError: cuFFT only supports dimensions whose sizes are powers of two when computing in half precision"。这个错误看似简单,…...
Qwen3-ASR-0.6B与Java集成:企业级语音处理方案
Qwen3-ASR-0.6B与Java集成:企业级语音处理方案 1. 引言 想象一下这样的场景:你的客服中心每天要处理成千上万的电话录音,传统的人工转录不仅成本高昂,还容易出错。或者你的移动应用需要实时语音转文字功能,但现有的云…...
从零开始理解JVM内存模型:如何避免OOM错误的7个实用技巧
从零开始理解JVM内存模型:如何避免OOM错误的7个实用技巧 第一次在线上环境遇到OOM错误时,我盯着控制台那行刺眼的java.lang.OutOfMemoryError整整愣了三分钟。那是一个看似普通的周二下午,我们的订单处理系统突然开始拒绝服务,而监…...
可视掏耳勺哪个牌子好?用什么掏耳朵最好?掏耳勺神器新款第一名
用什么掏耳朵最好?如今耳道护理成为家庭日常刚需,可视掏耳勺凭借“边看边清洁”的核心优势,彻底解决了传统盲掏易戳伤耳道、推深耳垢的痛点,成为越来越多人的首选。但当前可视掏耳勺市场陷入参数内卷,不少品牌盲目追求…...
基于机器学习的驾驶疲劳检测,应该如何入门?
基于机器学习的驾驶疲劳检测可以说是本科/硕士毕设中性价比很高的一个题目:它既有充足的开源参考资料,又容易做出可视化的Demo,答辩时也比较讨喜。 我来帮你把这个看似庞大的项目拆解成流水线。 你不需要去手搓底层的神经网络,只…...
沉浸式翻译扩展常见问题解决方案
沉浸式翻译扩展常见问题解决方案 【免费下载链接】immersive-translate 沉浸式双语网页翻译扩展 , 支持输入框翻译, 鼠标悬停翻译, PDF, Epub, 字幕文件, TXT 文件翻译 - Immersive Dual Web Page Translation Extension 项目地址: https://gitcode.c…...
React+GSAP实战:5种酷炫滚动动画效果完整代码分享(含ScrollTrigger配置)
ReactGSAP实战:5种酷炫滚动动画效果完整代码分享(含ScrollTrigger配置) 在现代Web开发中,流畅的滚动动画已经成为提升用户体验的关键因素。作为前端开发者,我们经常需要实现各种吸引眼球的滚动效果,从简单的…...
别再手动刷新了!SAP ALV中利用change事件与modify_cell实现智能数据同步
SAP ALV开发进阶:巧用change事件与modify_cell构建智能数据联动体系 在SAP前端开发领域,ALV(ABAP List Viewer)作为最常用的数据展示控件,其交互体验直接影响用户操作效率。传统开发模式中,当用户修改某个单…...
终极指南:如何快速构建响应式React网格布局
终极指南:如何快速构建响应式React网格布局 【免费下载链接】react-grid-layout A draggable and resizable grid layout with responsive breakpoints, for React. 项目地址: https://gitcode.com/gh_mirrors/re/react-grid-layout React网格布局࿰…...
