当前位置: 首页 > news >正文

【Python从入门到进阶】62、Pandas中DataFrame对象案例实践

接上篇《61、Pandas中DataFrame对象的操作(二)》
上一篇我们讲解DataFrame对象的统计分析、可视化以及数据导出与保存相关内容。本篇我们延续之前学习的DataFrame对象的知识,结合一个数据案例进行实践操作。

一、案例说明

我们将通过一个股票数据分析的案例来展示如何使用Pandas的DataFrame和Series对象进行数据分析和处理。在这个案例中,我们将分析某只股票的历史价格数据,包括开盘价、最高价、最低价和收盘价,并计算一些基本的统计指标和可视化结果。

二、准备工作

首先,确保你已经安装了Pandas、seaborn和Matplotlib(用于数据可视化)。如果没有安装,可以通过pip安装:

pip install pandas seaborn matplotlib

三、案例数据

为了简化,我们将直接在代码中定义一只股票(假设为“ABC公司”)的历史价格数据。这些数据包括日期、开盘价、最高价、最低价和收盘价。

import pandas as pd  
import matplotlib.pyplot as plt
import seaborn as sns# 定义数据  
data = {  '日期': ['2023-01-01', '2023-01-02', '2023-01-03', '2023-01-04', '2023-01-05'],  '开盘价': [100, 102, 101, 103, 104],  '最高价': [105, 107, 106, 108, 109],  '最低价': [98, 100, 99, 101, 102],  '收盘价': [103, 105, 104, 107, 108],'成交量': [3100, 4300, 3400, 4700, 5400]
}  # 创建DataFrame  
df = pd.DataFrame(data)  
df['日期'] = pd.to_datetime(df['日期'])  # 将日期列转换为datetime类型  
df.set_index('日期', inplace=True)  # 设置日期为索引  print(df)

效果:

四、数据分析和处理

1.计算日收益率

日收益率是股票分析中常用的一个指标,可以通过收盘价计算得到。
这里需要用到pct_change()函数。在Pandas库中,DataFrame.pct_change()是一个非常有用的函数,它用于计算给定DataFrame中数值列的百分比变化。这个函数通常被用来分析数据的时间序列变化,特别是在金融数据分析中非常常见,比如股票价格的变化率。
pct_change()函数的基本用法如下:
●基本语法:

DataFrame.pct_change(periods=1, fill_method='pad', limit=None)

●参数说明:
periods(int, 默认为1):表示向前多少个周期来计算变化率。如果设为1,则计算相邻两个周期之间的变化率。
fill_method(str, 默认为'pad'):填充缺失值的方法。可以是'pad'(使用前一个有效观测值)或'ffill'(同'pad')、'backfill'或'bfill'(使用后一个有效观测值)等。
limit(int, 默认为None):最大连续填充次数。
●返回值:
返回一个新的DataFrame,其中每个数值型列的值都表示相对于前一个时期(或指定时期的时期)的变化率。非数值型列会被忽略。
●示例:
我们对案例中股票价格的DataFrame的“收盘价”使用pct_change()函数:

# 计算日收益率  
df['日收益率'] = df['收盘价'].pct_change()  
print(df[['收盘价', '日收益率']])

效果:

注意:第一个元素的变化率通常是NaN(未定义),因为没有前期数据进行比较。

2.绘制收盘价走势图

使用Matplotlib绘制收盘价的走势图,以便更直观地观察价格变化。

# 设置Matplotlib支持中文
plt.rcParams['font.sans-serif'] = ['SimHei']  # 设置为黑体
plt.rcParams['axes.unicode_minus'] = False  # 解决保存图像时负号'-'显示为方块的问题
# 创建一个新的图形窗口,设置窗口大小为10英寸宽和5英寸高
plt.figure(figsize=(10, 5))
# 绘制实际的数据。plt.plot() 是用来绘制线图的函数
# df.index表示DataFrame的索引,这里索引是日期,所以它将作为x轴的坐标。
# df['收盘价'] 表示DataFrame中名为“收盘价”的列,它将作为y轴的坐标。
# label='收盘价' 设置了图例标签,用于区分不同的数据系列
plt.plot(df.index, df['收盘价'], label='收盘价')
plt.title('ABC公司股票收盘价走势图')  # 设置图表的标题
plt.xlabel('日期')  # 设置x轴的标签名
plt.ylabel('价格')  # 设置y轴的标签名
plt.grid(True)  # 表示启用网格线
plt.legend()   # 设置显示图例
plt.show()  # 展示图表

效果:

3.统计分析

使用Pandas的内置函数进行统计分析,如计算收盘价的最大值、最小值、均值和标准差。

print("统计信息:")  
print(df['收盘价'].describe())

效果:

4.筛选特定日期的数据

假设我们只对周一的数据感兴趣,可以筛选出周一的数据进行分析。

# 假设数据中的日期是连续的,且周一为每周的第一天  
monday_df = df[df.index.weekday == 0]  
print(monday_df)

效果:

注意:这里的weekday方法返回的是0(周一)到6(周日)的整数,具体取决于你的Pandas版本和设置。

5.相关性分析

分析不同变量之间的相关性,以了解它们之间的关系。

corr_matrix = df[['开盘价', '最高价', '最低价', '收盘价', '成交量']].corr()  
print(corr_matrix)  # 可视化相关性矩阵  
sns.heatmap(corr_matrix, annot=True, cmap='coolwarm')  
plt.show()

效果:

6.成交量分析

分析成交量与股价变动之间的关系,寻找潜在的交易信号。

plt.figure(figsize=(12, 6))  
plt.bar(df.index, df['成交量'], color='blue', alpha=0.5)  
plt.title('ABC公司日成交量')  
plt.xlabel('日期')  
plt.ylabel('成交量')  
plt.grid(True)  
plt.show()  
# 可以进一步分析成交量与价格变动的关联,如“量价背离”等

效果:

7.量价背离分析

在成交量分析的小节中,当我们进一步探讨成交量与价格变动的关联时,“量价背离”是一个非常重要的概念。它指的是成交量与价格走势之间出现了不一致或相反的趋势,这往往预示着市场可能即将发生转折。

(1)定义

●正量价背离:当价格创新高(或新低),但成交量未能同时创出新高(或新低),即成交量相对前期高点(或低点)有所减少,这通常被视为上涨(或下跌)动能减弱的信号,可能预示着市场即将反转。
●负量价背离:较为少见,但在某些情况下,价格可能形成新低(或新高),而成交量却显著放大,这可能是由于恐慌性抛售(或积极买入)导致的短暂现象,也可能预示着市场即将见底(或见顶)。

(2)示例分析

假设在我们的模拟数据中,我们观察到在股价持续上涨并创出新高时,成交量却未能同步放大,反而有所减少。这种情况就构成了正量价背离,可能意味着上涨动力正在减弱,投资者应警惕市场可能出现的回调或反转。

为了更直观地展示这一点,我们可以先绘制股价和成交量的对比图。
这里我们将故意将一些数据进行修改,方便分析量价背离:

# 将2023-01-05的收盘价改为 109
# 将2023-01-04的收盘价改为 108
# 将2023-01-04的成交量改为 2800
df.loc['2023-01-05', '收盘价'] = 109
df.loc['2023-01-04', '收盘价'] = 108
df.loc['2023-01-04', '成交量'] = 2800
# 绘制股价和成交量的对比图  
plt.figure(figsize=(12, 6))  
plt.subplot(2, 1, 1)  # 2行1列的第1个图  
plt.plot(df.index, df['收盘价'], label='收盘价', color='blue')  
plt.title('ABC公司股票价格走势')  
plt.xlabel('日期')  
plt.ylabel('价格')  
plt.grid(True)  
plt.legend()  plt.subplot(2, 1, 2)  # 2行1列的第2个图  
plt.bar(df.index, df['成交量'], color='green', alpha=0.5)  
plt.title('ABC公司日成交量')  
plt.xlabel('日期')  
plt.ylabel('成交量')  
plt.grid(True)  
plt.tight_layout()  # 调整子图布局以避免重叠  
plt.show()  

效果:

注意:上述代码并未实际检测量价背离,而是展示了如何绘制股价和成交量的对比图。检测量价背离需要额外的逻辑来比较价格和成交量的历史数据。要在上述案例中增加检测量价背离的逻辑代码,我们需要编写一个函数来识别股价和成交量之间的不一致趋势。以下是一个简化的示例,该函数将遍历DataFrame中的价格和成交量数据,以检测正量价背离(价格上涨但成交量减少)或负量价背离(这里我们主要关注正量价背离,因为负量价背离在实际应用中较为少见且复杂):

def detect_price_volume_divergence(df, price_col='收盘价', volume_col='成交量', window=2):divergences = []# 计算价格和成交量的滚动变化(这里使用diff而不是滚动平均,因为数据量小)price_changes = df[price_col].diff(periods=1)volume_changes = df[volume_col].diff(periods=1)# 确保我们只在有足够数据的行上进行比较valid_indices = price_changes.index[1:]  # 从第二天开始,因为第一天没有前一天的数据for idx in valid_indices:# 获取基于位置的索引idx_position = df.index.get_loc(idx)# 检查价格是否上涨if price_changes.loc[idx] > 0:# 检查成交量是否显著减少(这里使用简单的百分比减少作为阈值)if volume_changes.loc[idx] < 0 and df[volume_col].iloc[idx_position] < df[volume_col].iloc[idx_position - 1] * 0.9:divergence = {'date': idx,'price_change': price_changes.loc[idx],'current_volume': df[volume_col].iloc[idx_position],'previous_volume': df[volume_col].iloc[idx_position - 1]}divergences.append(divergence)return divergences# 调用函数并打印结果
divergences = detect_price_volume_divergence(df, window=2)  # 使用较小的窗口大小
for divergence in divergences:print(f"在日期 {divergence['date'].date()} 检测到量价背离,价格上涨但成交量显著减少。")print(f"当前成交量: {divergence['current_volume']}, 之前成交量: {divergence['previous_volume']}")print("-----------")# 注意:这个示例中的背离检测逻辑非常简化,并且可能需要根据实际情况进行调整。
# 特别是关于“成交量减少”的判定,这里仅使用了简单的平均值比较和硬编码的阈值(9%)。
# 在实际应用中,您可能需要考虑更复杂的逻辑,如使用标准差、百分比变化等。

注意:由于数据量很小,这里使用了window=2来确保有足够的数据点进行比较。
效果:

(3)注意事项

量价背离是一个警示信号,而非绝对的买卖信号。它需要结合其他技术指标和市场环境进行综合分析。
量价背离的可靠性可能受到市场流动性、投资者情绪、政策变化等多种因素的影响。
在实际应用中,建议结合多种分析工具和技术指标来提高分析的准确性和可靠性。

    
至此,关于Pandas中DataFrame和Series的内容全部介绍完毕,下一篇我们继续学习Pandas如何实现数据的Merge。

转载请注明出处:https://guangzai.blog.csdn.net/article/details/141110236

相关文章:

【Python从入门到进阶】62、Pandas中DataFrame对象案例实践

接上篇《61、Pandas中DataFrame对象的操作&#xff08;二&#xff09;》 上一篇我们讲解DataFrame对象的统计分析、可视化以及数据导出与保存相关内容。本篇我们延续之前学习的DataFrame对象的知识&#xff0c;结合一个数据案例进行实践操作。 一、案例说明 我们将通过一个股…...

使用Python实现深度学习模型:智能环境监测与预警

介绍 智能环境监测与预警是保护生态环境和人类健康的重要手段。通过深度学习技术,我们可以实时获取环境数据,分析环境变化趋势,及时发出预警。本文将介绍如何使用Python和深度学习库TensorFlow与Keras来构建一个简单的环境监测与预警模型。 环境准备 首先,我们需要安装必…...

ThreadLocal的使用场景是什么

ThreadLocal 是 Java 中用于实现线程局部变量的工具&#xff0c;它提供了每个线程独立的变量副本&#xff0c;使得不同线程对该变量的操作不会相互干扰。以下是 ThreadLocal 的常见使用场景&#xff1a; 线程安全的对象共享&#xff1a; ThreadLocal 可以用来避免线程间共享状…...

【网络爬虫篇】逆向实战—某东:滑块验证码(逆向登录)2024.8.7最新发布,包干货,包详细

【网络爬虫篇】更多优秀文章借鉴&#xff1a; 1. 使用Selenium实现黑马头条滑块自动登录 2. 使用多线程采集爬取豆瓣top250电影榜 3. 使用Scrapy爬取去哪儿网游记数据 4. 数据采集技术综合项目实战1&#xff1a;国家水稻网数据采集与分析 5. 数据采集技术综合项目实战2&#x…...

为什么优质的酱香白酒都会带点苦味?

大家好&#xff0c;我是酱酒亮哥&#xff0c;不知大家有没有发现&#xff0c;在制作一杯美味的咖啡或是烘焙一块香脆的面包时&#xff0c;制作过程中都会有一些独特的味道和香气产生&#xff0c;对吧&#xff1f;同样地&#xff0c;酱香白酒的酿造过程也是一个复杂而精细的化学…...

软件测试常见面试题

软件测试阶段分为单元测试&#xff0c;集成测试&#xff0c;系统测试&#xff0c;验收测试。单元测试策略为对代码中的函数方法进行测试&#xff0c;目的是发现代码的问题。集成测试策略是模块中组合起来进行测试&#xff0c;要求发现与接口有关的问题。系统测试策略是子系统的…...

面试经典算法150题系列-接雨水

接雨水 给定 n 个非负整数表示每个宽度为 1 的柱子的高度图&#xff0c;计算按此排列的柱子&#xff0c;下雨之后能接多少雨水。 示例 1&#xff1a; 输入&#xff1a;height [0,1,0,2,1,0,1,3,2,1,2,1] 输出&#xff1a;6 解释&#xff1a;上面是由数组 [0,1,0,2,1,0,1,3,2,…...

【C++】 类型转换深度探索:揭开类型转换的奥秘

&#x1f308; 个人主页&#xff1a;Zfox_ &#x1f525; 系列专栏&#xff1a;C从入门到精通 目录 一&#xff1a; &#x1f680; C语言中的类型转换 二&#xff1a; &#x1f525; 为什么C需要四种类型转换 三&#xff1a; &#x1f525; C强制类型转换 &#x1f95d; 3.1 st…...

深入探索Webkit的Web Authentication API:安全与便捷的融合

Web Authentication API&#xff0c;通常被称为WebAuthn&#xff0c;是一个新兴的Web标准&#xff0c;旨在通过提供更安全、更便捷的认证方式来改善用户的在线体验。随着Webkit对WebAuthn的支持日益增强&#xff0c;本文将深入探讨这一API的功能、实现方式以及如何在Webkit浏览…...

Vue - 关于v-wave 波浪动画组件

Vue - 关于v-wave 波浪动画组件 这个动画库可以在标签中添加新的v-wave属性&#xff0c;来让点击标签元素后添加漂亮的波纹效果&#xff0c;并且可以根据父元素自动形成波纹的颜色&#xff0c;也可以自定义波纹颜色&#xff0c;持续时间&#xff0c;透明度&#xff0c;触发的对…...

计算机网络408考研 2019

计算机网络408考研2019年真题解析_哔哩哔哩_bilibili 2019 1 1 1 1...

实时捕捉与追溯:得物基于 eBPF 打造云上网络连接异常摄像头

近期我们容器 SRE 团队基于 eBPF 技术建设网络连接异常感知能力&#xff0c;灰度上线过程中发现了生产环境 10 以上的应用配置错误、程序 Bug 等问题。在和应用负责同学同步风险过程中&#xff0c;大家都挺好奇我们如何实现在对应用无侵入的情况下发现服务连接异常的。本篇文档…...

ubuntu14.04图形界面配置

Ubuntu系统启动&#xff0c;输入用户密码后&#xff0c;屏幕显示彩色背景&#xff0c;但是始终不能进入图形界面。 如果你也遇到过这种情况&#xff0c;可以参照以下方法解决&#xff08;在 ubuntu14.04 验证&#xff09;。 同时按下 alt ctrl F1&#xff0c;屏幕出现 tty1&a…...

51单片机-第八节-蜂鸣器

一、什么是蜂鸣器&#xff1f; 蜂鸣器是一种将电信号转换为声音信号的器件&#xff0c;常用来产生设备的按键音、报警音等提示信号。 蜂鸣器按驱动方式可分为有源蜂鸣器和无源蜂鸣器&#xff1a; 有源蜂鸣器&#xff1a;内部自带振荡源&#xff0c;将正负极接上直流电压即可…...

Windows命令查看WiFi密码

查看所有已保存的WiFi网络 &#xff08;以管理员身份&#xff09;输入以下命令 netsh wlan show profiles查看某个WiFi网络的密码 netsh wlan show profile name"你的网络名" keyclear在输出中&#xff0c;在关键内容&#xff08;Key Content&#xff09;字段下找…...

不同环境下RabbitMQ的安装-2 ARM架构、X86架构、Window系统环境下安装RabbitMQ

ARM架构、X86架构、Window系统环境下RabbitMQ的安装 RabbitMQ安装1 Erlang语言介绍2 安装Erlang2.1 ARM架构的CentOS虚拟机中安装Erlang2.2 X86架构的CentOS虚拟机中安装Erlang2.3 Windows系统安装Erlang2.3.1 下载Erlang2.3.2 安装Erlang2.3.3 配置Erlang2.3.4 检测Erlang 3.安…...

C++(week16): C++提高:(六) Qt提高

文章目录 四、Qt的元对象系统1.元对象和MOC(1)自省 和 反射(2)Qt是怎样支持元对象系统的&#xff1f;(3)支持元对象系统的三个要求(4)元对象系统的功能(5)动态属性 2.信号和槽机制(1)信号与槽机制的基本原理(2)自定义信号、自定义槽函数①自定义信号②自定义槽③关联 connect (…...

go 时间转时间戳的时区设置问题

昨天遇到一个问题&#xff0c;在完成时间转换时间戳&#xff0c;在后续测试中发现转换后的时间戳转成时间后&#xff0c;时间发生错误&#xff0c;时间和转换时间不一致问题 如下&#xff1a; package mainimport ("fmt""time" )func main() {Start : &q…...

MySQL 常见日志清理策略

前言&#xff1a; MySQL 数据库服务器使用多种类型的日志来记录操作和事件&#xff0c;这对于故障诊断、审计和性能分析非常重要。然而&#xff0c;这些日志文件会随着时间的推移而不断增长&#xff0c;可能会占用大量的磁盘空间。因此&#xff0c;定期清理这些日志是必要的&a…...

3大管人绝招让你的手下心服口服

3大管人绝招让你的手下心服口服 一&#xff1a;差异化管理&#xff0c;玩弄人性 谁赞成&#xff0c;谁反对&#xff0c;看清楚谁顺从自己&#xff0c;谁反对自己之后&#xff0c;接下来要做的便是区别对待。 给听话的下属最好的资源、最轻松简单的工作、最高的待遇&#xf…...

无机布防火卷帘门价格怎么算?按尺寸定制,按需报价

无机布防火卷帘门作为建筑防火分区的核心设备&#xff0c;价格一直是工程采购的关注重点。很多用户在询价时&#xff0c;会发现不同厂家的报价差异较大&#xff0c;这是因为无机布防火卷帘门的价格并非按统一单价计算&#xff0c;而是完全根据项目的实际需求定制化核算。 &…...

ARM指令追踪技术及TRCVICTLR寄存器详解

1. ARM指令追踪技术概述在嵌入式系统开发和调试过程中&#xff0c;指令追踪&#xff08;Instruction Trace&#xff09;是一项至关重要的技术。它通过硬件机制记录处理器的执行流程&#xff0c;为开发者提供程序运行的完整轨迹。ARM架构从v7开始引入嵌入式跟踪宏单元&#xff0…...

别再乱算相似度了!用Python实战二元变量聚类:从Jaccard系数到病人分组

医疗数据分析实战&#xff1a;用Python实现基于Jaccard系数的病人症状聚类在医疗数据分析领域&#xff0c;如何从海量病人症状数据中发现潜在规律一直是临床研究的难点。传统方法往往依赖医生经验或简单统计&#xff0c;而现代数据挖掘技术为我们提供了更科学的解决方案。本文将…...

政企数据安全:危机与出路

随着数字化转型的浪潮席卷全球&#xff0c;公共部门积累的数据量呈爆炸式增长。从公民个人信息到公共服务记录&#xff0c;从财政预算到基础设施管理数据——这些宝贵资源在提升政府治理效率的同时&#xff0c;也悄然成为网络犯罪分子的“新猎物”。当公共数据逐渐成为数字时代…...

Unity发行版DLL调试实战:DnSpy无源码IL级断点指南

1. 这不是“反编译”&#xff0c;而是Unity游戏开发者的日常调试手段你有没有遇到过这样的情况&#xff1a;接手一个Unity发行版游戏&#xff0c;想快速验证某个功能逻辑是否按预期执行&#xff0c;或者排查一个偶发的崩溃&#xff0c;但手头只有打包后的Assembly-CSharp.dll&a…...

Burp Suite证书安装全解:HTTPS抓包失败的根源与跨平台命令行方案

1. 为什么必须亲手安装Burp Suite证书——不是“点一下就完事”的操作很多人第一次在手机或测试设备上配置Burp Suite代理时&#xff0c;会下意识认为&#xff1a;只要把电脑上的Burp监听地址填进Wi-Fi代理设置&#xff0c;再用浏览器访问http://burp&#xff0c;点击那个绿色的…...

通过用量看板分析团队大模型API消耗发现优化调用策略的机会

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 通过用量看板分析团队大模型API消耗发现优化调用策略的机会 作为团队的技术负责人&#xff0c;确保大模型API调用在满足业务需求的…...

ArduPilot飞行模式实战:从代码角度看Stabilize、Acro、Loiter模式如何切换(附避坑指南)

ArduPilot飞行模式深度解析&#xff1a;从状态机到实战避坑指南 在开源飞控领域&#xff0c;ArduPilot以其强大的飞行模式系统著称。不同于普通用户只需了解模式功能&#xff0c;开发者更需要掌握模式切换的底层机制——这直接关系到飞行安全与二次开发效率。本文将带您深入Sta…...

告别KITTI!用TartanAir数据集在Unreal Engine+AirSim里复现那些让VSLAM算法“翻车”的雨天和黑夜

超越KITTI&#xff1a;用TartanAir数据集在虚拟极端环境中锤炼VSLAM算法当视觉SLAM算法在KITTI数据集上取得95%的准确率时&#xff0c;开发者们常常会松一口气——直到这些算法被部署到真实世界的雨夜街道上。突然之间&#xff0c;那些在阳光明媚的德国道路上表现优异的特征点检…...

UE5 Cesium项目里,如何把默认的飞行Pawn换成建筑漫游Pawn?保姆级迁移教程

UE5 Cesium项目建筑漫游Pawn迁移实战&#xff1a;从飞行模式到精细化浏览的完整指南当你在UE5中结合Cesium插件构建数字孪生场景时&#xff0c;DynamicPawn提供的全球飞行体验令人印象深刻。但当视角聚焦到单体建筑或室内空间时&#xff0c;那种仿佛操控无人机般的操作方式就显…...