当前位置: 首页 > news >正文

【NumPy进阶】:内存视图、性能优化与高级线性代数

目录

  • 1. 深入理解 NumPy 的内存视图与拷贝
    • 1.1 内存视图(View)
      • 1.1.1 创建视图
      • 1.1.2 视图的特点
    • 1.2 数组拷贝(Copy)
      • 1.2.1 创建拷贝
      • 1.2.2 拷贝的特点
    • 1.3 视图与拷贝的选择
  • 2. NumPy 的优化与性能提升技巧
    • 2.1 向量化操作
      • 示例:向量化替代循环
    • 2.2 使用内存视图而非拷贝
    • 2.3 使用合适的数据类型
    • 2.4 并行计算
    • 2.5 使用 `numexpr` 和 `Numba` 加速
  • 3. 探索 `np.linalg` 模块的高级线性代数运算
    • 3.1 矩阵乘法
    • 3.2 求解线性方程组
    • 3.3 计算矩阵的逆
    • 3.4 特征值和特征向量
    • 3.5 奇异值分解(SVD)
  • 总结


在基础学习的基础上,接下来我们将深入探索 NumPy 的三个重要主题:内存视图与拷贝性能优化技巧高级线性代数运算。通过掌握这些内容,你将能够更高效地处理大型数据、优化计算性能,并在实际应用中使用高级的线性代数工具。


1. 深入理解 NumPy 的内存视图与拷贝

1.1 内存视图(View)

内存视图 是对原始数组数据的引用,而不是数据的副本。通过视图修改数据会影响原始数组。视图不会占用额外的内存,非常适合大数据处理。

NumPy 中的内存视图通常指的就是ndarray 数组类型的切片。

1.1.1 创建视图

import numpy as nparr = np.array([1, 2, 3, 4, 5])# 创建一个视图
view = arr[1:4]
print("View:", view)  # 输出: [2 3 4]# 修改视图
view[0] = 99
print("Original Array:", arr)  # 输出: [ 1 99  3  4  5]

1.1.2 视图的特点

  • 视图和原数组共享相同的内存。
  • 视图的修改会影响原数组。
  • 视图的创建效率高,不涉及数据复制。

1.2 数组拷贝(Copy)

拷贝 是对原始数据的完整复制,修改拷贝不会影响原数组。拷贝适合需要保持原数据不变的场景。

1.2.1 创建拷贝

arr = np.array([1, 2, 3, 4, 5])# 创建一个拷贝
copy = arr[1:4].copy()
print("Copy:", copy)  # 输出: [2 3 4]# 修改拷贝
copy[0] = 99
print("Original Array:", arr)  # 输出: [1 2 3 4 5]

1.2.2 拷贝的特点

  • 拷贝与原数组独立存储。
  • 拷贝的修改不会影响原数组。
  • 创建拷贝需要额外的内存和时间。

1.3 视图与拷贝的选择

  • 使用视图:在内存敏感和数据量大的情况下,使用视图提高效率。
  • 使用拷贝:在需要保护原始数据时,使用拷贝避免数据被意外修改。

2. NumPy 的优化与性能提升技巧

2.1 向量化操作

NumPy 的向量化操作利用底层 C 语言实现的高效算法,避免了 Python 的 for 循环,极大提高了性能。

示例:向量化替代循环

import numpy as np# 使用循环计算平方
arr = np.array([1, 2, 3, 4, 5])
squared_loop = [x**2 for x in arr]# 使用向量化计算平方
squared_vectorized = arr**2print(squared_vectorized)  # 输出: [ 1  4  9 16 25]

2.2 使用内存视图而非拷贝

避免不必要的数据拷贝,使用视图可以节省内存和时间。

arr = np.random.rand(10000)# 使用视图进行切片
view = arr[:5000]

2.3 使用合适的数据类型

选择合适的数据类型可以减少内存消耗和提高计算速度。

# 使用 float32 而不是 float64
arr = np.array([1.2, 3.4, 5.6], dtype=np.float32)

2.4 并行计算

NumPy 在底层对一些操作进行了并行化,例如矩阵乘法、求和等。

A = np.random.rand(1000, 1000)
B = np.random.rand(1000, 1000)# 并行执行矩阵乘法
result = np.dot(A, B)

2.5 使用 numexprNumba 加速

  • numexpr:用于加速复杂的数学表达式。
  • Numba:通过 Just-In-Time (JIT) 编译加速 Python 函数。
import numexpr as ne
import numpy as npa = np.random.rand(1000000)
b = np.random.rand(1000000)# 使用 numexpr 加速计算
result = ne.evaluate("a + b")

详情见此博客:【NumPy】使用numexpr和Numba加速运算


3. 探索 np.linalg 模块的高级线性代数运算

NumPy 的 np.linalg 模块提供了许多高级线性代数功能,包括矩阵分解、求解线性方程组、特征值分解等。

3.1 矩阵乘法

import numpy as npA = np.array([[1, 2], [3, 4]])
B = np.array([[5, 6], [7, 8]])# 矩阵乘法
result = np.dot(A, B)
print(result)

输出:

[[19 22][43 50]]

3.2 求解线性方程组

求解形如 A x = b Ax = b Ax=b 的线性方程组。

A = np.array([[3, 1], [1, 2]])
b = np.array([9, 8])x = np.linalg.solve(A, b)
print(x)

输出:

[2. 3.]

3.3 计算矩阵的逆

A = np.array([[1, 2], [3, 4]])
inv_A = np.linalg.inv(A)
print(inv_A)

输出:

[[-2.   1. ][ 1.5 -0.5]]

3.4 特征值和特征向量

A = np.array([[4, -2], [1, 1]])# 计算特征值和特征向量
eigenvalues, eigenvectors = np.linalg.eig(A)
print("Eigenvalues:", eigenvalues)
print("Eigenvectors:\n", eigenvectors)

3.5 奇异值分解(SVD)

A = np.array([[1, 2], [3, 4]])U, S, VT = np.linalg.svd(A)
print("U:\n", U)
print("S:\n", S)
print("VT:\n", VT)

总结

通过深入学习以上内容,你可以更灵活、高效地使用 NumPy:

  1. 内存视图与拷贝:理解何时使用视图、何时使用拷贝。
  2. 性能优化技巧:利用向量化、合适的数据类型和并行计算来提升性能。
  3. 高级线性代数运算:使用 np.linalg 模块解决复杂的线性代数问题。

继续练习这些概念和技巧,将帮助你在数据科学、机器学习和科学计算领域更上一层楼!

相关文章:

【NumPy进阶】:内存视图、性能优化与高级线性代数

目录 1. 深入理解 NumPy 的内存视图与拷贝1.1 内存视图(View)1.1.1 创建视图1.1.2 视图的特点 1.2 数组拷贝(Copy)1.2.1 创建拷贝1.2.2 拷贝的特点 1.3 视图与拷贝的选择 2. NumPy 的优化与性能提升技巧2.1 向量化操作示例&#x…...

从YOLOv5到训练实战:易用性和扩展性的加强

文章目录 前言一、模型介绍二、YOLOv5网络结构1.Input(输入端):智能预处理与优化策略2.Backbone(骨干网络):高效特征提取3.NECK(颈部):特征增强与多尺度融合4.Prediction…...

Prim 算法在不同权重范围内的性能分析及其实现

Prim 算法在不同权重范围内的性能分析及其实现 1. 边权重取值在 1 到 |V| 范围内伪代码C 代码实现2. 边权重取值在 1 到常数 W 之间结论Prim 算法是一种用于求解加权无向图的最小生成树(MST)的经典算法。它通过贪心策略逐步扩展生成树,确保每次选择的边都是当前生成树到未加…...

canal安装使用

简介 canal [kənl],译意为水道/管道/沟渠,主要用途是基于 MySQL 数据库增量日志解析,提供增量数据订阅和消费 工作原理 canal 模拟 MySQL slave 的交互协议,伪装自己为 MySQL slave ,向 MySQL master 发送 dump 协议…...

python爬虫常用数据保存模板(Excel、CSV、mysql)——scrapy中常用数据提取方法(CSS、XPATH、正则)(23)

文章目录 1、常用数据保存模板2.1 保存为Excel格式2.2 保存为CSV格式2.3 保存至mysql数据库2、scrapy中常用数据提取方法2.1 XPath选择器2.2 CSS选择器2.3 正则表达式1、常用数据保存模板 2.1 保存为Excel格式 # 1、导入模块 from openpyxl import workbook# 2、创建一个exce…...

You need to call SQLitePCL.raw.SetProvider()

在.NET环境中使用Entity Framework Core(EF Core)连接SQLite数据库时,报错。 使用框架 .NET8 错误信息: Exception: You need to call SQLitePCL.raw.SetProvider(). If you are using a bundle package, this is done by calling…...

IoTDB AINode 报错,call inference 301: Error ocurred while executing inference

问题及现象 使用时序数据库 IoTDB 的 AINode 的 call inference 语句后报错: Msg: org.apache.iotdb.jdbc.IoTDBSOLException:301: Error ocurred while executing inference:[tuple object has no attribute inference]解决方法 可以替换 venv 里面的…...

LLM之RAG实战(五十)| FastAPI:构建基于LLM的WEB接口界面

FastAPI是WEB UI接口,随着LLM的蓬勃发展,FastAPI的生态也迎来了新的机遇。本文将围绕FastAPI、OpenAI的API以及FastCRUD,来创建一个个性化的电子邮件写作助手,以展示如何结合这些技术来构建强大的应用程序。 下面我们开始分步骤操…...

项目-移动端适配的几种方案

目录 一、rem方案二、vw适配方案 一、rem方案 以vue2项目为例 下载安装包:npm install amfe-flexible --save在main.js中引入:import ‘amfe-flexible’下载安装包:npm install postcss-pxtorem --save项目下新建postcss.config.js文件&…...

HCIA-Access V2.5_2_2网络通信基础_TCP/IP协议栈报文封装

TCP/IP协议栈的封装过程 用户从应用层发出数据先会交给传输层,传输层会添加TCP或者UDP头部,然后交给网络层,网络层会添加IP头部,然后交给数据链路层,数据链路层会添加以太网头部和以太网尾部,最后变成01这样…...

LSTM详解

1. LSTM设计 LSTM(长短期记忆网络)详解 长短期记忆网络(LSTM, Long Short-Term Memory) 是一种特殊的循环神经网络(RNN),特别适合处理和预测序列数据中的长时间依赖关系。LSTM 通过引入“门机制”(如输入门、遗忘门、输出门)来解决标准 RNN 在长时间序列任务中梯度消…...

从零开始搭建Android开发环境:简单易懂的完整教程

前言: 作为安卓开发的入门,搭建开发环境是每个开发者都必须迈出的第一步。虽然这一步看似简单,但如果没有正确的配置,可能会遇到各种问题。本篇文章将为大家详细介绍如何从零开始搭建Android开发环境,确保你能够顺利开…...

大模型运用-Prompt Engineering(提示工程)

什么是提示工程 提示工程 提示工程也叫指令工程,涉及到如何设计、优化和管理这些Prompt,以确保AI模型能够准确、高效地执行用户的指令,如:讲个笑话、java写个排序算法等 使用目的 1.获得具体问题的具体结果。(如&…...

CMake简单使用(二)

目录 五、scope 作用域5.1 作用域的类型5.1.1 全局作用域5.1.2 目录作用域5.1.3 函数作用域 六、宏6.1 基本语法6.2 演示代码 七、CMake构建项目7.1 全局变量7.2 写入源码路径7.3 调用子目录cmake脚本7.4 CMakeLists 嵌套(最常用) 八、CMake 与库8.1 CMake生成动静态库8.1.1 动…...

攻防世界安卓刷题笔记(新手模式)1-4

1.基础android 进入后是这样的页面。查看源代码看看。首先要注意这个软件并没有加壳,所以我们可以直接着手分析。搜索错误提示“Failed”定位到关键代码,看样子就是检验输入的内容 注意到这里有一行关键代码,cond_39对应的正是failed那个地方…...

发现一个对话框中的按钮,全部失效,点击都没有任何反应,已经解决

前端问题,技术vue2,ts。 发现一个对话框中的按钮,全部失效,点击都没有任何反应。 因为我只在template标签中加入下面这个代码,并没有注册。 只要有一个子组件没有注册,就会影响所有的按钮,使当前…...

MyBatisPlus实现多表查询

在MyBatisPlus中实现多表查询,主要有以下几种方法: 使用注解进行多表查询: 你可以在Mapper接口中使用Select注解来编写SQL查询语句,实现多表查询。例如,如果你想根据用户ID查询用户信息和对应的区域名称,可…...

机器学习详解(5):MLP代码详解之MNIST手写数字识别

文章目录 1 MNIST数据集2 代码详解2.1 导入库和GPU2.2 MNIST数据集处理2.2.1 下载和导入2.2.2 张量(Tensors)2.2.3 准备训练数据 2.3 创建模型2.3.1 图像展开2.3.2 输入层2.3.3 隐藏层2.3.4 输出层2.3.5 模型编译 2.4 训练模型2.4.1 损失函数与优化器2.4.2 计算准确率2.4.3 训练…...

如何在vue中实现父子通信

1.需要用到的组件 父组件 <template><div id"app"><BaseCount :count"count" changeCount"cahngeCount"></BaseCount></div> </template><script> import BaseCount from ./components/BaseCount.v…...

PHP实现华为OBS存储

一&#xff1a;华为OBS存储文档地址 官方文档&#xff1a;https://support.huaweicloud.com/obs/index.html github地址&#xff1a;https://github.com/huaweicloud/huaweicloud-sdk-php-obs 二&#xff1a;安装华为OBS拓展 composer require obs/esdk-obs-php 三&#x…...

电脑插入多块移动硬盘后经常出现卡顿和蓝屏

当电脑在插入多块移动硬盘后频繁出现卡顿和蓝屏问题时&#xff0c;可能涉及硬件资源冲突、驱动兼容性、供电不足或系统设置等多方面原因。以下是逐步排查和解决方案&#xff1a; 1. 检查电源供电问题 问题原因&#xff1a;多块移动硬盘同时运行可能导致USB接口供电不足&#x…...

【决胜公务员考试】求职OMG——见面课测验1

2025最新版&#xff01;&#xff01;&#xff01;6.8截至答题&#xff0c;大家注意呀&#xff01; 博主码字不易点个关注吧,祝期末顺利~~ 1.单选题(2分) 下列说法错误的是:&#xff08; B &#xff09; A.选调生属于公务员系统 B.公务员属于事业编 C.选调生有基层锻炼的要求 D…...

Android15默认授权浮窗权限

我们经常有那种需求&#xff0c;客户需要定制的apk集成在ROM中&#xff0c;并且默认授予其【显示在其他应用的上层】权限&#xff0c;也就是我们常说的浮窗权限&#xff0c;那么我们就可以通过以下方法在wms、ams等系统服务的systemReady()方法中调用即可实现预置应用默认授权浮…...

实现弹窗随键盘上移居中

实现弹窗随键盘上移的核心思路 在Android中&#xff0c;可以通过监听键盘的显示和隐藏事件&#xff0c;动态调整弹窗的位置。关键点在于获取键盘高度&#xff0c;并计算剩余屏幕空间以重新定位弹窗。 // 在Activity或Fragment中设置键盘监听 val rootView findViewById<V…...

docker 部署发现spring.profiles.active 问题

报错&#xff1a; org.springframework.boot.context.config.InvalidConfigDataPropertyException: Property spring.profiles.active imported from location class path resource [application-test.yml] is invalid in a profile specific resource [origin: class path re…...

HashMap中的put方法执行流程(流程图)

1 put操作整体流程 HashMap 的 put 操作是其最核心的功能之一。在 JDK 1.8 及以后版本中&#xff0c;其主要逻辑封装在 putVal 这个内部方法中。整个过程大致如下&#xff1a; 初始判断与哈希计算&#xff1a; 首先&#xff0c;putVal 方法会检查当前的 table&#xff08;也就…...

C++使用 new 来创建动态数组

问题&#xff1a; 不能使用变量定义数组大小 原因&#xff1a; 这是因为数组在内存中是连续存储的&#xff0c;编译器需要在编译阶段就确定数组的大小&#xff0c;以便正确地分配内存空间。如果允许使用变量来定义数组的大小&#xff0c;那么编译器就无法在编译时确定数组的大…...

Fabric V2.5 通用溯源系统——增加图片上传与下载功能

fabric-trace项目在发布一年后,部署量已突破1000次,为支持更多场景,现新增支持图片信息上链,本文对图片上传、下载功能代码进行梳理,包含智能合约、后端、前端部分。 一、智能合约修改 为了增加图片信息上链溯源,需要对底层数据结构进行修改,在此对智能合约中的农产品数…...

基于TurtleBot3在Gazebo地图实现机器人远程控制

1. TurtleBot3环境配置 # 下载TurtleBot3核心包 mkdir -p ~/catkin_ws/src cd ~/catkin_ws/src git clone -b noetic-devel https://github.com/ROBOTIS-GIT/turtlebot3.git git clone -b noetic https://github.com/ROBOTIS-GIT/turtlebot3_msgs.git git clone -b noetic-dev…...

华为OD最新机试真题-数组组成的最小数字-OD统一考试(B卷)

题目描述 给定一个整型数组,请从该数组中选择3个元素 组成最小数字并输出 (如果数组长度小于3,则选择数组中所有元素来组成最小数字)。 输入描述 行用半角逗号分割的字符串记录的整型数组,0<数组长度<= 100,0<整数的取值范围<= 10000。 输出描述 由3个元素组成…...