当前位置: 首页 > article >正文

特征值可视化指南:用Matplotlib动态演示PCA降维全过程

特征值可视化指南用Matplotlib动态演示PCA降维全过程在数据科学领域理解高维数据的结构是一项基础但关键的能力。主成分分析PCA作为最常用的降维技术之一其核心数学原理却常常让初学者望而生畏——特征值、特征向量这些线性代数概念如何在数据上产生实际影响本文将通过Python的Matplotlib库带你用动态可视化方式拆解PCA全过程让抽象的数学概念变成屏幕上跳动的三维动画。我们将从零开始构建一个完整的Jupyter Notebook演示环境不仅展示如何计算特征值更重点演示这些数值如何决定数据的主成分方向。通过交互式图表你能直观看到数据点在特征向量方向上的投影变化理解方差最大化的几何意义。以下是本文将要覆盖的核心内容三维数据集的生成与标准化处理协方差矩阵的特征值分解动画实现特征向量方向与数据分布的关系可视化动态投影过程与降维结果对比可复用的动画生成技巧与性能优化1. 环境准备与数据生成1.1 工具链配置首先确保你的Python环境包含以下核心库# 必需库列表 import numpy as np import matplotlib.pyplot as plt from matplotlib.animation import FuncAnimation from mpl_toolkits.mplot3d import Axes3D from sklearn.preprocessing import StandardScaler对于动画渲染建议使用Jupyter Notebook的%matplotlib notebook魔法命令获得交互式体验%matplotlib notebook fig plt.figure(figsize(10, 8)) ax fig.add_subplot(111, projection3d)1.2 构建三维模拟数据我们创建一个具有明显主方向性的合成数据集方便观察PCA效果np.random.seed(42) mu [0, 0, 0] sigma [[5, 1.5, 1], [1.5, 2, 0.5], [1, 0.5, 1]] data np.random.multivariate_normal(mu, sigma, 500)数据标准化是PCA前的必要步骤scaler StandardScaler() data_std scaler.fit_transform(data)2. 协方差矩阵与特征分解2.1 计算协方差矩阵协方差矩阵揭示了各维度间的线性关系cov_mat np.cov(data_std.T) print(协方差矩阵:\n, cov_mat)2.2 特征值分解实现使用NumPy进行特征分解eigen_vals, eigen_vecs np.linalg.eig(cov_mat) print(特征值:\n, eigen_vals) print(特征向量:\n, eigen_vecs)特征向量已按对应特征值大小降序排列这正是PCA的主成分方向。3. 动态可视化设计3.1 初始化动画框架创建包含原始数据和特征向量的3D场景def init(): ax.scatter(data_std[:,0], data_std[:,1], data_std[:,2], alpha0.3, cblue) # 绘制坐标轴 ax.quiver(0, 0, 0, 3, 0, 0, colorr, arrow_length_ratio0.1) ax.quiver(0, 0, 0, 0, 3, 0, colorg, arrow_length_ratio0.1) ax.quiver(0, 0, 0, 0, 0, 3, colorb, arrow_length_ratio0.1) return fig,3.2 动画更新函数设计展示特征向量旋转过程的动画def update(frame): ax.clear() ax.scatter(data_std[:,0], data_std[:,1], data_std[:,2], alpha0.3, cblue) # 动态旋转特征向量 theta np.radians(frame) rot_mat np.array([ [np.cos(theta), -np.sin(theta), 0], [np.sin(theta), np.cos(theta), 0], [0, 0, 1] ]) rotated_vecs rot_mat eigen_vecs # 绘制旋转中的特征向量 colors [red, green, purple] for i in range(3): ax.quiver(0, 0, 0, rotated_vecs[0,i]*3, rotated_vecs[1,i]*3, rotated_vecs[2,i]*3, colorcolors[i], arrow_length_ratio0.1, labelfPC{i1} (λ{eigen_vals[i]:.2f})) ax.set_xlim([-3, 3]) ax.set_ylim([-3, 3]) ax.set_zlim([-3, 3]) ax.legend() return fig,3.3 运行动画生成360度旋转观察的动画ani FuncAnimation(fig, update, framesnp.arange(0, 360, 2), init_funcinit, blitFalse, interval50) plt.tight_layout() plt.show()4. 投影过程可视化4.1 主成分选择动画展示数据沿主成分方向的投影过程def project_animation(): fig plt.figure(figsize(12, 5)) ax1 fig.add_subplot(121, projection3d) ax2 fig.add_subplot(122) def update(frame): ax1.clear() ax2.clear() # 原始3D数据 ax1.scatter(data_std[:,0], data_std[:,1], data_std[:,2], alpha0.3) # 绘制选定的主成分 pc_idx frame // 30 progress (frame % 30) / 30 vec eigen_vecs[:, pc_idx] ax1.quiver(0, 0, 0, vec[0]*3, vec[1]*3, vec[2]*3, colorr, arrow_length_ratio0.1) # 动态投影过程 proj data_std vec * progress proj_points np.outer(proj, vec) for i in range(len(data_std)): ax1.plot([data_std[i,0], proj_points[i,0]], [data_std[i,1], proj_points[i,1]], [data_std[i,2], proj_points[i,2]], gray, alpha0.1, lw0.5) # 2D投影结果 if pc_idx 2: other_vec eigen_vecs[:, 1 if pc_idx 0 else 0] proj_full data_std np.column_stack([vec, other_vec]) ax2.scatter(proj_full[:,0]*progress, proj_full[:,1]*progress, alpha0.3) ax2.set_xlabel(fPC{pc_idx1}) ax2.set_ylabel(fPC{2 if pc_idx 0 else 1}) ax1.set_title(fProjecting onto PC{pc_idx1} ({progress*100:.0f}%)) return fig, ani FuncAnimation(fig, update, frames90, interval100) plt.tight_layout() return ani4.2 方差解释率可视化用条形图展示各主成分的贡献度tot sum(eigen_vals) var_exp [(i / tot) for i in sorted(eigen_vals, reverseTrue)] cum_var_exp np.cumsum(var_exp) plt.bar(range(1,4), var_exp, alpha0.5, aligncenter, labelIndividual explained variance) plt.step(range(1,4), cum_var_exp, wheremid, labelCumulative explained variance) plt.ylabel(Explained variance ratio) plt.xlabel(Principal components) plt.legend(locbest) plt.tight_layout()5. 高级技巧与优化5.1 动画性能优化大数据集下的优化策略# 使用随机子采样 sample_idx np.random.choice(len(data_std), 200, replaceFalse) sample_data data_std[sample_idx] # 设置blitTrue只重绘变化部分 ani FuncAnimation(fig, update, frames360, init_funcinit, blitTrue, interval20)5.2 交互式探索添加鼠标交互功能from matplotlib.widgets import Slider fig plt.figure(figsize(10, 8)) ax fig.add_subplot(111, projection3d) ax.scatter(data_std[:,0], data_std[:,1], data_std[:,2], alpha0.3) ax_slider plt.axes([0.25, 0.1, 0.65, 0.03]) slider Slider(ax_slider, Rotation, 0, 360, valinit0) def update_slider(val): ax.clear() ax.scatter(data_std[:,0], data_std[:,1], data_std[:,2], alpha0.3) theta np.radians(val) rot_mat np.array([ [np.cos(theta), -np.sin(theta), 0], [np.sin(theta), np.cos(theta), 0], [0, 0, 1] ]) rotated_vecs rot_mat eigen_vecs for i in range(3): ax.quiver(0, 0, 0, rotated_vecs[0,i]*3, rotated_vecs[1,i]*3, rotated_vecs[2,i]*3, color[r,g,b][i], arrow_length_ratio0.1) fig.canvas.draw_idle() slider.on_changed(update_slider) plt.show()5.3 二维与三维对比在同一个画面展示2D和3D视角fig plt.figure(figsize(12, 6)) ax3d fig.add_subplot(121, projection3d) ax2d fig.add_subplot(122) # 3D绘图 ax3d.scatter(data_std[:,0], data_std[:,1], data_std[:,2], alpha0.3) for i in range(3): ax3d.quiver(0, 0, 0, eigen_vecs[0,i]*3, eigen_vecs[1,i]*3, eigen_vecs[2,i]*3, color[r,g,b][i], arrow_length_ratio0.1) # 2D投影 proj_2d data_std eigen_vecs[:,:2] ax2d.scatter(proj_2d[:,0], proj_2d[:,1], alpha0.3) ax2d.quiver(0, 0, eigen_vecs[0,0], eigen_vecs[1,0], colorr, scale5) ax2d.quiver(0, 0, eigen_vecs[0,1], eigen_vecs[1,1], colorg, scale5) ax2d.set_aspect(equal) plt.tight_layout()

相关文章:

特征值可视化指南:用Matplotlib动态演示PCA降维全过程

特征值可视化指南:用Matplotlib动态演示PCA降维全过程 在数据科学领域,理解高维数据的结构是一项基础但关键的能力。主成分分析(PCA)作为最常用的降维技术之一,其核心数学原理却常常让初学者望而生畏——特征值、特征向…...

如何通过API批量重命名ONLYOFFICE Docs文档标签:终极指南

如何通过API批量重命名ONLYOFFICE Docs文档标签:终极指南 【免费下载链接】DocumentServer ONLYOFFICE Docs is a free collaborative online office suite comprising viewers and editors for texts, spreadsheets and presentations, forms and PDF, fully compa…...

Transformer在图像恢复中的实战应用:AdaIR频率挖掘与调制技术解析

Transformer在图像恢复中的实战突破:频率域自适应修复技术详解 1. 频率域视角下的图像退化本质 当我们用手机在雨天拍摄照片时,那些恼人的雨滴条纹;在雾天远眺时,景物仿佛被蒙上了一层薄纱;或是夜间拍摄时画面出现的颗…...

多 agents 飞书群内通讯配置实战,根因 + 可复现配置 + 防坑清单

如果你也在用下龙虾openclaw,添加多个机器人到一个群里,统一指挥和调度,那么你大概率遇到过这个极其典型的线上诡异现象: 结果却是:A 机器人正常收消息、正常回复B 机器人像完全“失明”,毫无反应 很多人第一反应会怀…...

Flexprice订阅管理详解:如何处理升级、降级和暂停的完整流程

Flexprice订阅管理详解:如何处理升级、降级和暂停的完整流程 【免费下载链接】flexprice 🌟Open source pricing and billing infrastructure to support any pricing model, from usage-based to subscription and everything in between.👨…...

5分钟掌握TIDAL音乐下载:tidal-dl-ng完整使用指南

5分钟掌握TIDAL音乐下载:tidal-dl-ng完整使用指南 【免费下载链接】tidal-dl-ng TIDAL Media Downloader Next Generation! Up to HiRes / TIDAL MAX 24-bit, 192 kHz. 项目地址: https://gitcode.com/gh_mirrors/ti/tidal-dl-ng tidal-dl-ng是一款强大的TID…...

Mapus企业级应用场景:从团队协作到商业决策支持的完整指南

Mapus企业级应用场景:从团队协作到商业决策支持的完整指南 【免费下载链接】mapus A map tool with real-time collaboration 🗺️ 项目地址: https://gitcode.com/gh_mirrors/ma/mapus Mapus是一款开源的实时协作地图工具,专为团队协…...

隐私计算实践:OpenClaw本地化Qwen3-32B处理加密数据

隐私计算实践:OpenClaw本地化Qwen3-32B处理加密数据 1. 为什么需要本地化隐私计算 去年我在处理一批医疗调研数据时遇到了一个棘手问题:数据包含敏感个人信息,但需要AI辅助进行统计分析。当时尝试过几个云端方案,要么无法满足合…...

C#数据持久化新思路:除了Json和XML,试试康耐视CogSerializer存对象到文件

C#数据持久化新思路:探索CogSerializer在复杂对象序列化中的独特价值 在C#开发中,数据持久化是一个永恒的话题。当我们谈论序列化时,Json和XML往往是开发者最先想到的方案。Json.NET和XmlSerializer确实能解决大部分场景下的需求,…...

【真能降AI】速降AIGC,降重!标价即卖价,全网最低!维普、知网、万方等一键降AIGC率,逻辑清晰,语义通顺,只需稍改错别字和标点。

【真能降AI】速降AIGC,降重!标价即卖价,全网最低!维普、知网、万方等一键降AIGC率,逻辑清晰,语义通顺,只需稍改错别字和标点。 降AI人工服务,维普、知网专用,不限字数。依…...

MangoHud与AI游戏助手:性能优化建议生成

MangoHud与AI游戏助手:性能优化建议生成 【免费下载链接】MangoHud A Vulkan and OpenGL overlay for monitoring FPS, temperatures, CPU/GPU load and more. Discord: https://discordapp.com/invite/Gj5YmBb 项目地址: https://gitcode.com/gh_mirrors/ma/Mang…...

ICASSP 2022:语音转换与数据增强技术新突破

某机构文本转语音团队在ICASSP 2022的研究 论文聚焦于语音转换和数据增强——有时两者兼而有之。 作者:Andrew Breen 2022年5月17日 阅读时长:6分钟 相关出版物 Voice Filter:使用语音转换作为后处理模块的少样本文本转语音说话人自适应Cross…...

Unity编辑器脚本批量替换预制体Text组件字体方案

1. 为什么需要批量替换预制体中的字体? 在Unity项目开发中,我们经常会遇到需要统一修改UI字体的情况。比如项目从旧版本升级到Unity 2022后,原先使用的Arial字体被移除,Text组件也被标记为Legacy组件。这时候如果手动一个个修改预…...

Claude 终端使用初探-基础命令与项目管理

文章目录🚀 核心快捷命令1. 模式切换2. 系统命令直通3. 编辑与换行控制4. 常用的命令⚙️ 配置管理:从全局到项目级(强烈建议使用对每个项目使用不同的项目级进行管理)1. 全局配置 (System Level)2. 项目级配置 (Project Level) -…...

linux操作系统内核编译 - 过程参考

文章目录一、环境说明二、编译的过程( 精简内核编译,只编译部分必要的部分 )三、怎么设置默认重启的内核一、环境说明 环境: 华为openEuler操作系统, 内核:linux6.6 源码下载: https://gitee.com/openeuler/kernel…...

基于java的班级学生选课成绩管理系统设计与实现_91q6r

目录系统需求分析数据库设计系统架构设计技术选型核心功能实现权限与安全设计测试计划部署与维护项目时间规划项目技术支持可定制开发之功能创新亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作系统需求分析 明确系统需要实现的功能模块…...

Lychee-Rerank处理长文本技巧:滑动窗口与关键信息提取

Lychee-Rerank处理长文本技巧:滑动窗口与关键信息提取 如果你用过Lychee-Rerank这类重排序模型,肯定遇到过这个头疼的问题:文档太长,塞不进去。模型对输入长度有限制,但现实中的文档——比如几十页的合同、几十万字的…...

基于java的月子会所服务系统

目录系统架构设计核心功能模块服务预约系统移动端集成数据安全措施系统测试方案部署运维计划项目技术支持可定制开发之功能创新亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作系统架构设计 采用分层架构设计,包括表现层&am…...

终极指南:从其他编辑器获取灵感打造你的lualine.nvim状态栏主题

终极指南:从其他编辑器获取灵感打造你的lualine.nvim状态栏主题 【免费下载链接】lualine.nvim A blazing fast and easy to configure neovim statusline plugin written in pure lua. 项目地址: https://gitcode.com/GitHub_Trending/lu/lualine.nvim 想要…...

Tomcat与Ruby on Rails整合:Web框架部署方案终极指南

Tomcat与Ruby on Rails整合:Web框架部署方案终极指南 【免费下载链接】tomcat Tomcat是一个开源的Web服务器,主要用于部署Java Web应用程序。它的特点是易用性高、稳定性好、兼容性广等。适用于Java Web应用程序部署场景。 项目地址: https://gitcode.…...

Step3-VL-10B模型网络安全应用:智能威胁检测与分析

Step3-VL-10B模型网络安全应用:智能威胁检测与分析 1. 网络安全的新挑战与智能解决方案 网络安全领域正面临前所未有的挑战。随着网络攻击手段的日益复杂和攻击频率的不断攀升,传统的安全防御方式已经显得有些力不从心。安全团队每天需要处理海量的日志…...

Qwen3-4B模型处理Mathtype公式:LaTeX转换与学术文档排版

Qwen3-4B模型处理Mathtype公式:LaTeX转换与学术文档排版 1. 引言 如果你写过科研论文或者技术报告,大概率遇到过这样的麻烦:好不容易在Mathtype里把公式画得漂漂亮亮,一到要往LaTeX文档里贴的时候,就傻眼了。要么是手…...

高通驱动岗Linux内核与ARM架构面试要点解析

该输入内容为一份高通驱动岗暑期实习面试经验总结,属于软件/系统级岗位的面试复盘文档,与嵌入式硬件项目(如原理图设计、PCB布局、器件选型、驱动适配、BOM整理等)无直接关联。其内容聚焦于Linux内核机制、C语言底层细节、ARM架构…...

机器学习从零开始:数据预处理标准化归一化完整指南

机器学习从零开始:数据预处理标准化归一化完整指南 【免费下载链接】ML-From-Scratch Machine Learning From Scratch. Bare bones NumPy implementations of machine learning models and algorithms with a focus on accessibility. Aims to cover everything fro…...

终极指南:如何彻底掌握TypeScript深层对象键名大写挑战

终极指南:如何彻底掌握TypeScript深层对象键名大写挑战 【免费下载链接】type-challenges type-challenges/type-challenges: Type Challenges 是一个针对TypeScript和泛型编程能力提升的学习项目,包含了一系列类型推导挑战题目,帮助开发者更…...

Typst版本控制终极指南:Git集成与团队协作最佳实践

Typst版本控制终极指南:Git集成与团队协作最佳实践 【免费下载链接】typst A new markup-based typesetting system that is powerful and easy to learn. 项目地址: https://gitcode.com/GitHub_Trending/ty/typst Typst作为新一代基于标记的排版系统&#…...

实时数据处理的安全护盾:Pathway审计日志与操作追踪实现指南 [特殊字符]️

实时数据处理的安全护盾:Pathway审计日志与操作追踪实现指南 🛡️ 【免费下载链接】pathway Pathway is an open framework for high-throughput and low-latency real-time data processing. 项目地址: https://gitcode.com/GitHub_Trending/pa/pathw…...

如何在Android上使用Termux进行编程学习和计算机科学教学:终极指南

如何在Android上使用Termux进行编程学习和计算机科学教学:终极指南 【免费下载链接】termux-app Termux - a terminal emulator application for Android OS extendible by variety of packages. 项目地址: https://gitcode.com/GitHub_Trending/te/termux-app …...

Nanbeige 4.1-3B在Java面试准备中的应用:高频考点解析

Nanbeige 4.1-3B在Java面试准备中的应用:高频考点解析 还在为Java面试熬夜刷题、背八股文而头疼吗?试试用AI来帮你高效备考吧 最近帮几个准备跳槽的朋友做面试辅导,发现大家普遍面临同样的困境:Java知识点太多太杂,八股…...

开源可部署的中文Prompt-NLU模型:SiameseUniNLU在政务问答系统中的轻量化应用

开源可部署的中文Prompt-NLU模型:SiameseUniNLU在政务问答系统中的轻量化应用 你是不是也遇到过这样的烦恼?在政务系统里,用户问“怎么办理居住证”,系统却只能回答“请咨询相关部门”。或者,用户提交了一堆材料&…...