当前位置：首页 > article >正文

【Numpy核心编程攻略：Python数据处理、分析详解与科学计算】1.24 随机宇宙：生成现实世界数据的艺术

article 2026/5/9 2:55:17

在这里插入图片描述

1.24 随机宇宙：生成现实世界数据的艺术

1.24.1 引言

在数据科学和机器学习中，生成现实世界数据是一项重要的任务。现实世界的数据往往具有复杂的分布和结构，需要使用高阶的采样技巧和生成模型来模拟。本文将详细介绍如何使用NumPy生成复杂联合分布的数据、实现随机游走、基于物理规律的生成模型以及随机数在加密中的应用。
多元分布采样技巧

协方差矩阵采样公式

$\mathbf{x} \sim \mathcal{N}(\boldsymbol{\mu}, \mathbf{\Sigma})$
其中 $\mathbf{\Sigma} = \mathbf{L}\mathbf{L}^T$ （Cholesky分解）

import numpy as npdef multivariate_normal_sampling(mean, cov, size=1000):"""多元正态分布采样"""L = np.linalg.cholesky(cov)  # Cholesky分解z = np.random.normal(size=(len(mean), size))return mean + L @ z# 定义参数
mean = [2, 3]
cov = [[1.0, 0.8],[0.8, 1.0]]# 生成样本
samples = multivariate_normal_sampling(mean, cov).T# 可视化
import matplotlib.pyplot as plt
plt.scatter(samples[:,0], samples[:,1], alpha=0.5)
plt.title("二元正态分布采样")
plt.xlabel("X")
plt.ylabel("Y")
plt.grid(True)
plt.show()

1.24.2 复杂联合分布的采样技巧

1.24.2.1 多元正态分布采样的基本原理

多元正态分布是一种常见的概率分布，用于描述多个随机变量之间的线性相关性。NumPy提供了numpy.random.multivariate_normal函数来生成多元正态分布的样本。

1.24.2.1.1 多元正态分布的定义

多元正态分布的概率密度函数（PDF）定义为：

$f(\mathbf{x}; \boldsymbol{\mu}, \boldsymbol{\Sigma}) = \frac{1}{\sqrt{(2\pi)^k |\boldsymbol{\Sigma}|}} \exp\left( -\frac{1}{2} (\mathbf{x} - \boldsymbol{\mu})^T \boldsymbol{\Sigma}^{-1} (\mathbf{x} - \boldsymbol{\mu}) \right)$

其中：

$\mathbf{x}$ 是 $k$ 维随机向量
$\boldsymbol{\mu}$ 是 $k$ 维均值向量
$\boldsymbol{\Sigma}$ 是 $\times k$ 的协方差矩阵

1.24.2.2 代码示例

1.24.2.2.1 多元正态分布采样实例

import numpy as np
import matplotlib.pyplot as plt# 定义均值向量和协方差矩阵
mean = np.array([0, 0])  # 均值向量
cov = np.array([[1, 0.5], [0.5, 1]])  # 协方差矩阵# 生成样本
samples = np.random.multivariate_normal(mean, cov, 1000)  # 生成1000个样本# 绘制样本的散点图
plt.figure(figsize=(10, 6))
plt.scatter(samples[:, 0], samples[:, 1], alpha=0.5)  # 散点图
plt.xlabel('X1')
plt.ylabel('X2')
plt.title('多元正态分布采样')
plt.show()

1.24.3 随机游走的蒙特卡洛实现

1.24.3.1 随机游走的基本原理

随机游走（Random Walk）是一种数学模型，用于描述路径上的随机变化。在金融、物理等多个领域都有广泛的应用。蒙特卡洛方法是一种通过随机抽样来解决问题的数值计算方法。

1.24.3.1.1 代码示例

1.24.3.1.1.1 布朗运动模拟完整代码

import numpy as np
import matplotlib.pyplot as plt# 定义步长和步数
step_size = 1
num_steps = 1000# 生成随机游走路径
steps = np.random.normal(0, step_size, (num_steps, 2))  # 生成二维随机步长
path = np.cumsum(steps, axis=0)  # 累积步长得到路径# 绘制随机游走路径
plt.figure(figsize=(10, 6))
plt.plot(path[:, 0], path[:, 1], label='随机游走路径', color='b', linestyle='-', marker='o')
plt.xlabel('X')
plt.ylabel('Y')
plt.title('布朗运动模拟')
plt.legend()
plt.show()

二维布朗运动实现

def brownian_motion(steps=1000, delta=0.1):"""生成二维布朗运动路径"""dx = np.random.normal(scale=delta, size=steps)dy = np.random.normal(scale=delta, size=steps)x = np.cumsum(dx)y = np.cumsum(dy)return x, y# 生成10条路径
plt.figure(figsize=(10,6))
for _ in range(10):x, y = brownian_motion()plt.plot(x, y, alpha=0.5)
plt.title("二维布朗运动模拟")
plt.xlabel("X方向")
plt.ylabel("Y方向")
plt.grid(True)
plt.show()

1.24.4 基于物理规律的生成模型

1.24.4.1 流体动力学粒子生成的原理

流体动力学（Fluid Dynamics）描述流体的运动和行为。通过模拟流体中的粒子运动，可以生成具有物理意义的数据。

1.24.4.1.1 代码示例

1.24.4.1.1.1 流体动力学粒子生成

import numpy as np
import matplotlib.pyplot as plt# 定义参数
num_particles = 100
steps = 1000
dt = 0.01
diffusion_coeff = 0.1# 生成初始位置
positions = np.random.rand(num_particles, 2)  # 生成100个粒子的初始位置# 生成随机扰动
perturbations = np.random.normal(0, np.sqrt(2 * diffusion_coeff * dt), (steps, num_particles, 2))# 更新粒子位置
for step in range(1, steps):positions += perturbations[step]# 绘制粒子轨迹
plt.figure(figsize=(10, 6))
for i in range(num_particles):plt.plot(positions[:, i, 0], positions[:, i, 1], alpha=0.5, label=f'Particle {i + 1}')
plt.xlabel('X')
plt.ylabel('Y')
plt.title('流体动力学粒子生成')
plt.legend()
plt.show()

流体动力学粒子生成 SPH方法简化实现

def fluid_particles(num=1000, box_size=10, viscosity=0.1):"""流体粒子动力学模拟"""# 初始化粒子pos = np.random.rand(num, 3) * box_sizevel = np.zeros((num, 3))# 模拟时间步for _ in range(100):# 计算密度（简化）dist = np.sqrt(((pos[:,None] - pos)**2).sum(axis=2))density = np.exp(-dist**2 / 2).sum(axis=1)# 计算压力梯度pressure = 0.1 * (density - 1.0)acceleration = -np.gradient(pressure.reshape(num,1), axis=0) / density[:,None]# 更新速度和位置vel += viscosity * accelerationpos += vel * 0.01# 边界碰撞pos = np.clip(pos, 0, box_size)vel *= (pos == 0) | (pos == box_size) * -1return pos# 生成流体粒子
particles = fluid_particles()# 三维可视化
from mpl_toolkits.mplot3d import Axes3D
fig = plt.figure(figsize=(10,8))
ax = fig.add_subplot(111, projection='3d')
ax.scatter(particles[:,0], particles[:,1], particles[:,2], s=2)
ax.set_title("流体粒子分布")
plt.show()

1.24.5 随机数在加密中的应用

1.24.5.1 密码学安全随机数生成的原理

在密码学中，随机数生成是一项关键任务，需要确保生成的随机数具有高度的不可预测性和安全性。NumPy的随机数生成器可以用于生成伪随机数，但为了安全起见，通常使用专门的密码学随机数生成库。

1.24.5.1.1 代码示例

1.24.5.1.1.1 密码学安全随机数生成

import numpy as np
import os
import secrets# 生成密码学安全随机数
def secure_random_number():return secrets.randbits(32)  # 生成32位随机数# 生成随机数
random_numbers = [secure_random_number() for _ in range(1000)]  # 生成1000个随机数# 打印前10个随机数
print(f"生成的前10个随机数: {random_numbers[:10]}")

安全随机数生成对比

import secrets# 不安全随机数
normal_random = np.random.randint(0, 256, size=32)# 安全随机数生成
secure_random = np.frombuffer(secrets.token_bytes(32), dtype=np.uint8)# 随机性对比测试
print("普通随机数:", normal_random[:4], "...")
print("安全随机数:", secure_random[:4], "...")# 密钥生成示例
def generate_aes_key():return secrets.token_bytes(32)  # AES-256密钥print("AES密钥示例:", generate_aes_key().hex()[:16]+"...")

1.24.6 随机性检验的NIST测试

1.24.6.1 NIST测试的基本原理

NIST（美国国家标准与技术研究院）的随机性测试是一组用于评估随机数生成器的统计测试。这些测试可以帮助确保生成的随机数具有良好的随机性和统计特性。

1.24.6.1.1 代码示例

1.24.6.1.1.1 随机性检验的NIST测试

import numpy as np
import os
import secrets
import niststats  # 假设已经安装了niststats库# 生成密码学安全随机数
random_numbers = np.array([secrets.randbits(32) for _ in range(1000000)])  # 生成100万个随机数# 将随机数转换为二进制
binary_data = ''.join(format(x, '032b') for x in random_numbers)# 进行NIST测试
results = niststats.run_all_tests(binary_data, 1000000 * 32)# 打印测试结果
for test, result in results.items():print(f"测试: {test}")print(f"结果: {result}")

随机性质量检验 NIST测试套件实现

from collections import Counterdef monobit_test(bits):"""NIST单比特测试"""ones = sum(bits)s = abs(ones - len(bits)/2) / np.sqrt(len(bits)/4)p_value = np.math.erfc(s / np.sqrt(2))return p_value > 0.01def runs_test(bits):"""NIST游程测试"""runs, n1 = 1, sum(bits)for i in range(1, len(bits)):if bits[i] != bits[i-1]:runs += 1expected = (2*n1*(len(bits)-n1))/len(bits) + 1std_dev = np.sqrt((expected-1)*(expected-2)/(len(bits)-1))z = (runs - expected) / std_devreturn abs(z) < 1.96# 测试随机序列
bits = np.random.randint(0, 2, 1000)
print("单比特测试通过:", monobit_test(bits))
print("游程测试通过:", runs_test(bits))

1.24.7 总结

本文详细介绍了如何使用NumPy生成现实世界数据的艺术，包括复杂联合分布的采样技巧、随机游走的蒙特卡洛实现、基于物理规律的生成模型以及随机数在加密中的应用。通过这些内容，希望读者能够更好地理解和应用NumPy的随机数据生成功能，从而在实际项目中提高数据处理和分析的效率。

1.24.8 参考文献

参考资料名	链接
NumPy官方文档	https://numpy.org/doc/stable/
Matplotlib官方文档	https://matplotlib.org/
secrets模块官方文档	https://docs.python.org/3/library/secrets.html
NIST随机性测试文档	https://csrc.nist.gov/projects/random-bit-generation"testing-random-number-generators"
多元正态分布	https://en.wikipedia.org/wiki/Multivariate_normal_distribution
蒙特卡洛方法	https://en.wikipedia.org/wiki/Monte_Carlo_method
布朗运动	https://en.wikipedia.org/wiki/Brownian_motion
流体动力学	https://en.wikipedia.org/wiki/Fluid_dynamics
随机数生成器	https://en.wikipedia.org/wiki/Random_number_generation
密码学安全随机数生成	https://www.keycdn.com/support/what-are-crypto-safe-random-numbers
Python数据科学手册	https://jakevdp.github.io/PythonDataScienceHandbook/
数据可视化	https://seaborn.pydata.org/
CUDA编程入门	https://developer.nvidia.com/blog/getting-started-cuda-python/
大规模数据处理	https://spark.apache.org/docs/latest/api/python/
随机性测试库	https://github.com/axcheron/niststats

这篇文章包含了详细的原理介绍、代码示例、源码注释以及案例等。希望这对您有帮助。如果有任何问题请随私信或评论告诉我。

【Numpy核心编程攻略：Python数据处理、分析详解与科学计算】1.24 随机宇宙：生成现实世界数据的艺术

1.24 随机宇宙：生成现实世界数据的艺术目录 #mermaid-svg-vN1An9qZ6t4JUcGa {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-vN1An9qZ6t4JUcGa .error-icon{fill:#552222;}#mermaid-svg-vN1An9qZ6t4JUc…...

编程日记 2026/5/2 11:52:25

深入解析：一个简单的浮动布局 HTML 示例

深入解析：一个简单的浮动布局 HTML 示例示例代码解析代码结构分析1. HTML 结构2. CSS 样式核心功能解析1. 浮动布局（Float）2. 清除浮动（Clear）3. 其他样式效果展示代码优化与扩展总结在网页设计中，浮动…...

编程日记 2026/2/28 15:33:28

爬虫基础（三）Session和Cookie讲解

目录一、前备知识点 （1）静态网页 （2）动态网页 （3）无状态HTTP 二、Session和Cookie 三、Session 四、Cookie （1）维持过程 （2）结构正式开始说 Sessi…...

编程日记 2026/5/6 17:14:52

HTMLCSS ：下雪了

这段代码创建了一个动态的雪花飘落加载动画，通过 CSS 技术实现了雪花的下落和消失效果，为页面添加了视觉吸引力和动态感。大家复制代码时，可能会因格式转换出现错乱，导致样式失效。建议先少量复制代码进行测试，若未能…...

编程日记 2026/5/7 2:06:54

力扣 84. 柱状图中最大的矩形

🔗 https://leetcode.cn/problems/largest-rectangle-in-histogram 题目给一个数组 num 表示位置 i 上圆柱的高度，求圆柱可以勾勒出的矩形的最大面积思路枚举圆柱 i，以该圆柱为高，计算其可以组成的矩形的最大面积。记录这过…...

编程日记 2026/5/2 10:14:42

【Windows Server实战】生产环境云和NPS快速搭建

前置条件本文假定你已达成以下前提条件： 有域控DC。有证书服务器（AD CS）。已使用Microsoft Intune或者GPO为客户机申请证书。服务器上至少有两张网卡（如果用虚拟机做的测试环境，可以用一张HostOnly网卡做测试&#…...

编程日记 2026/5/5 6:01:58

RHCSA——搭建FTP文件共享服务器

一、实验目的 1、掌握vsftpd服务器的配置方法 2、熟悉FTP客户端工具的使用 3、掌握常见的FTP服务器的故障排除二、实验项目背景某企业像架构一台FTP服务器，为企业局域网中的计算机提供文件传送的任务，为财务部门、销售部门和OA系统提供异地数据备…...

编程日记 2026/5/8 22:29:54

IM 即时通讯系统-50-[特殊字符]cim(cross IM) 适用于开发者的分布式即时通讯系统

IM 开源系列 IM 即时通讯系统-41-开源野火IM 专注于即时通讯实时音视频技术，提供优质可控的IMRTC能力 IM 即时通讯系统-42-基于netty实现的IM服务端,提供客户端jar包,可集成自己的登录系统 IM 即时通讯系统-43-简单的仿QQ聊天安卓APP IM 即时通讯系统-44-仿QQ即…...

编程日记 2026/5/3 16:16:01

SSH代理實用指南

SSH是一種安全的遠程訪問協議，用於遠程登錄和代理工具，是一種通過SSH協議實現的網路代理，常用於將網路流量通過安全的SSH通道進行轉發。與傳統的HTTP代理不同，SSH代理能夠在多種協議下工作（如HTTP、HTTPS、FTP等&#…...

编程日记 2026/2/9 0:21:41

Python在线编辑器

from flask import Flask, render_template, request, jsonify import sys from io import StringIO import contextlib import subprocess import importlib import threading import time import ast import reapp Flask(__name__)RESTRICTED_PACKAGES {tkinter: 抱歉&…...

编程日记 2026/5/3 7:06:45

ZZNUOJ(C/C++)基础练习1041——1050(详解版)

1041 : 数列求和2 题目描述输入一个整数n，输出数列1-1/31/5-……前n项的和。输入输入只有一个整数n。输出结果保留2为小数,单独占一行。样例输入 3 样例输出 0.87注意sum 1相当于sumsum1 注意sum * 1相当于sumsum*1 C语言版 #include<stdio.h> // 包含…...

编程日记 2026/5/2 3:59:32

JavaScript系列（51）--解释器实现详解

JavaScript解释器实现详解 🎯 今天，让我们深入探讨JavaScript解释器的实现。解释器是一个将源代码直接转换为结果的程序，通过理解其工作原理，我们可以更好地理解JavaScript的执行过程。解释器基础概念 🌟 &#x1f…...

编程日记 2026/5/7 15:38:45

浅析DDOS攻击及防御策略

DDoS（分布式拒绝服务）攻击是一种通过大量计算机或网络僵尸主机对目标服务器发起大量无效或高流量请求，耗尽其资源，从而导致服务中断的网络攻击方式。这种攻击方式利用了分布式系统的特性，使攻击规模更大、影响范围更广…...

编程日记 2026/5/2 18:29:02

深度学习 Pytorch 神经网络的学习

本节将从梯度下降法向外拓展，介绍更常用的优化算法，实现神经网络的学习和迭代。在本节课结束将完整实现一个神经网络训练的全流程。对于像神经网络这样的复杂模型，可能会有数百个 w w w的存在，同时如果我们使用的是像交叉熵这样…...

编程日记 2026/5/1 16:11:04

【回溯】目标和字母大小全排列

文章目录 494. 目标和解题思路：回溯784. 字母大小写全排列解题思路：回溯 494. 目标和 494. 目标和给你一个非负整数数组 nums 和一个整数 target 。向数组中的每个整数前添加或 - ，然后串联起所有整数，可以构造一个表达式…...

编程日记 2026/5/8 21:41:15

Linux系统上安装与配置 MySQL（ CentOS 7 ）

目录 1. 下载并安装 MySQL 官方 Yum Repository 2. 启动 MySQL 并查看运行状态 3. 找到 root 用户的初始密码 4. 修改 root 用户密码 5. 设置允许远程登录 6. 在云服务器配置 MySQL 端口 7. 关闭防火墙 8. 解决密码错误的问题前言在 Linux 服务器上安装并配置 MySQL …...

编程日记 2026/4/29 0:27:51

Miniconda 安装及使用

文章目录前言1、Miniconda 简介2、Linux 环境说明2.1、安装2.2、配置2.3、常用命令2.4、常见问题及解决方案前言在 Python 中，“环境管理”是一个非常重要的概念，它主要是指对 Python 解释器及其相关依赖库进行管理和隔离，以确保开发环境…...

编程日记 2026/5/4 6:21:07

记录一次，PyQT的报错，多线程Udp失效，使用工具如netstat来检查端口使用情况。

1.问题报错Exception in thread Thread-1: Traceback (most recent call last): File "threading.py", line 932, in _bootstrap_inner File "threading.py", line 870, in run File "main.py", line 456, in udp_recv IndexError: list…...

编程日记 2026/5/1 20:08:32

kamailio-ACC_JSON模块详解【后端语言go】

要确认 ACC_JSON 模块是否已经成功将计费信息推送到消息队列（MQueue），以及如何从队列中取值，可以按照以下步骤进行操作： 1. 确认 ACC_JSON 已推送到队列 1.1 配置 ACC_JSON 确保 ACC_JSON 模块已正确配置并启用。以下…...

编程日记 2026/2/8 11:07:30

群晖NAS安卓Calibre 个人图书馆

docker 下载镜像johngong/calibre-web，安装之我是本地的/docker/xxx/metadata目录映射到 /usr/local/calibre-web/app/cps/metadata_provider CALIBREDB_OTHER_OPTION 删除 CALIBRE_SERVER_USER calibre_server_user 缺省用户名口令 admin admin123 另外有个N…...

编程日记 2026/5/8 13:39:52

android主题设置为..DarkActionBar.Bridge时自定义DatePicker选中日期颜色

安卓自定义DatePicker选中日期颜色背景：解决方案：方案一：方案二：实践效果： 背景： 最近在尝试用原生安卓实现仿element-ui表单校验功能，其中的的选择日期涉及到安卓DatePicker组件的使用&#…...

编程日记 2026/5/4 1:02:50

pytorch实现基于Word2Vec的词嵌入

PyTorch 实现 Word2Vec（Skip-gram 模型）的完整代码，使用中文语料进行训练，包括数据预处理、模型定义、训练和测试。 1. 主要特点支持中文数据，基于 jieba 进行分词使用 Skip-gram 进行训练，适用于小数据集支持负采样，提升训练效率使用 cosine similarity 计算相…...

编程日记 2026/3/12 5:41:17

彩色控制台，自动换行...学习个新概念：流操控器！[more cpp--11]

孩子们，我回来了。先看看今天我又学了什么CPP的没啥用新特性。彩色的控制台！ 还有很多的新花样！ 事情要从去年八月讲起，我那个时候在研究流函数，写了一些比较愚笨的代码。为什么要研究这个呢？虽然我们的C…...

编程日记 2026/4/29 17:52:45

基于单片机的盲人智能水杯系统（论文+源码）

1 总体方案设计本次基于单片机的盲人智能水杯设计，采用的是DS18B20实现杯中水温的检测，采用HX711及应力片实现杯中水里的检测，采用DS1302实现时钟计时功能，采用TTS语音模块实现语音播报的功能，并结合STC89C52单片机作…...

编程日记 2026/4/29 17:52:25

TensorFlow 示例摄氏度到华氏度的转换（一）

TensorFlow 实现神经网络模型来进行摄氏度到华氏度的转换，可以将其作为一个回归问题来处理。我们可以通过神经网络来拟合这个简单的转换公式。 1. 数据准备与预处理 2. 构建模型 3. 编译模型 4. 训练模型 5. 评估模型 6. 模型应用与预测 7. 保存与加载模型 …...

编程日记 2026/4/29 17:52:24

win10部署本地deepseek-r1，chatbox，deepseek联网（谷歌网页插件Page Assist）

win10部署本地deepseek-r1，chatbox，deepseek联网（谷歌网页插件Page Assist） 前言一、本地部署DeepSeek-r1step1 安装ollamastep2 下载deepseek-r1step2.1 找到模型deepseek-r1step2.2 cmd里粘贴后按回车，进行下载 ste…...

编程日记 2026/5/2 0:27:19