天气预测demo
天气预测
- 1 数据集介绍
- 1.1 训练集
- 1.2 测试集
- 2 导入数据进行数据分析
- 2.1 浏览数据
- 2.2 探索数据
- 2.2.1 查看数据类型
1 数据集介绍
1.1 训练集
训练集中共有116369个样本,每个样本有23个特征,特征具体介绍如下:
| 列名 | 解释 |
|---|---|
| Date: | 日期; |
| Location: | 地点; |
| MinTemp: | 最小温度; |
| MaxTemp: | 最大温度; |
| Rainfall: | 降雨量; |
| Evaporation: | 蒸发量; |
| Sunshine: | 一天中阳光明媚的小时数; |
| WindGustDir: | 最强阵风方向; |
| WindGustSpeed: | 最强阵风风速; |
| WindDir9am: | 上午9点风向; |
| WindDir3pm: | 下午3点风向; |
| WindSpeed9am: | 上午9点风速; |
| WindSpeed3pm: | 下午3点风速; |
| Humidity9am: | 上午9点湿度; |
| Humidity3pm: | 下午3点湿度; |
| Pressure9am: | 上午9点压强; |
| Pressure3pm: | 下午3点压强; |
| Cloud9am: | 上午9点云层遮盖了天空的比例; |
| Cloud3pm: | 下午3点云层遮盖了天空的比例; |
| Temp9am: | 上午9点温度; |
| Temp3pm: | 下午3点温度; |
| RainToday: | 今天是否下雨; |
| RainTomorr: | 明天是否下雨。 |
1.2 测试集
测试集中共有29093个样本,每个样本有22个特征,没有训练集中的RainTomorrow这一项特征。
| 列名 | 解释 |
|---|---|
| Date: | 日期; |
| Location: | 地点; |
| MinTemp: | 最小温度; |
| MaxTemp: | 最大温度; |
| Rainfall: | 降雨量; |
| Evaporation: | 蒸发量; |
| Sunshine: | 一天中阳光明媚的小时数; |
| WindGustDir: | 最强阵风方向; |
| WindGustSpeed: | 最强阵风风速; |
| WindDir9am: | 上午9点风向; |
| WindDir3pm: | 下午3点风向; |
| WindSpeed9am: | 上午9点风速; |
| WindSpeed3pm: | 下午3点风速; |
| Humidity9am: | 上午9点湿度; |
| Humidity3pm: | 下午3点湿度; |
| Pressure9am: | 上午9点压强; |
| Pressure3pm: | 下午3点压强; |
| Cloud9am: | 上午9点云层遮盖了天空的比例; |
| Cloud3pm: | 下午3点云层遮盖了天空的比例; |
| Temp9am: | 上午9点温度; |
| Temp3pm: | 下午3点温度; |
| RainToday: | 今天是否下雨; |
2 导入数据进行数据分析
2.1 浏览数据
#%%import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split# 导入数据
weather = pd.read_csv(r"./work/train.csv",index_col=False)# 观察前五行数据
print(weather.head(5))
Date Location MinTemp MaxTemp Rainfall Evaporation Sunshine \
0 2012-03-07 Dartmoor 10.1 24.6 1.2 2.6 11.3
1 2014-12-21 Newcastle 17.0 28.7 0.0 NaN NaN
2 2011-01-14 Albany 17.9 20.8 0.1 9.6 12.1
3 2011-10-19 Ballarat 8.9 25.5 0.0 NaN NaN
4 2013-11-04 Uluru 21.3 38.3 0.0 NaN NaN WindGustDir WindGustSpeed WindDir9am ... Humidity9am \
0 ESE 54.0 SE ... 86.0
1 NaN NaN NE ... 63.0
2 NaN NaN NE ... 61.0
3 NNE 54.0 N ... 56.0
4 ENE 57.0 E ... 15.0 Humidity3pm Pressure9am Pressure3pm Cloud9am Cloud3pm Temp9am \
0 41.0 1028.6 1025.7 NaN NaN 13.9
1 58.0 NaN NaN 1.0 1.0 24.0
2 67.0 1005.1 1007.6 5.0 4.0 19.8
3 44.0 1027.1 1022.9 0.0 NaN 16.7
4 9.0 1018.4 1013.9 NaN NaN 28.8 Temp3pm RainToday RainTomorrow
0 23.0 Yes No
1 28.0 No No
2 20.0 No No
3 25.0 No No
4 36.9 No No [5 rows x 23 columns]
通过简单的观察数据,我们发现有很多需要我们要作的事情,例如Nan值、字符型变量的处理,这些都是特征工程中的难点。
2.2 探索数据
2.2.1 查看数据类型
#%%
# 查看数据类型
weather.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 116368 entries, 0 to 116367
Data columns (total 23 columns):
Date 116368 non-null object
Location 116368 non-null object
MinTemp 115160 non-null float64
MaxTemp 115354 non-null float64
Rainfall 113762 non-null float64
Evaporation 66053 non-null float64
Sunshine 60402 non-null float64
WindGustDir 108111 non-null object
WindGustSpeed 108158 non-null float64
WindDir9am 107925 non-null object
WindDir3pm 112986 non-null object
WindSpeed9am 114940 non-null float64
WindSpeed3pm 113920 non-null float64
Humidity9am 114227 non-null float64
Humidity3pm 112736 non-null float64
Pressure9am 104345 non-null float64
Pressure3pm 104377 non-null float64
Cloud9am 71571 non-null float64
Cloud3pm 68773 non-null float64
Temp9am 114947 non-null float64
Temp3pm 113466 non-null float64
RainToday 113762 non-null object
RainTomorrow 113776 non-null object
dtypes: float64(16), object(7)
memory usage: 20.4+ MB
相关文章:
天气预测demo
天气预测1 数据集介绍1.1 训练集1.2 测试集2 导入数据进行数据分析2.1 浏览数据2.2 探索数据2.2.1 查看数据类型1 数据集介绍 1.1 训练集 训练集中共有116369个样本,每个样本有23个特征,特征具体介绍如下: 列名解释Date:日期&a…...
HDMI协议介绍(四)--Video
目录 视频格式 RGB444 YUV444 YUV422 YUV420 Color Depth Video控制信号 Pixel Repetition HDMI支持多种视频格式和分辨率。以hdmi1.4和2.0协议来说,视频格式支持RGB444、YUV444、YUV422和YUV420,其中RGB444和YUV444一般都是要求支持的。 视频格式…...
微信授权登录流程以及公众号配置方法(golang后端)
一、准备一个已经认证OK的微信公众号和已经备案的域名,且解析好配置好https证书。 1.如上图 微信公众号 > 基本配置 ,设置开发者密码 2.设置IP白名单,白名单填写提供后端服务的服务器公网IP 二、公众号服务器配置。 1.找到基本配置 2.将服…...
【软件测试面试题】大厂头条:如何定位bug?实际案例拿offer还不简单......
目录:导读前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜)前言 问题: 用…...
kubeconfig生成最高权限的token
参考文档 1.https://kubernetes.io/zh-cn/docs/reference/access-authn-authz/authentication/ 2. https://kubernetes.io/zh-cn/docs/reference/access-authn-authz/rbac/ 操作流程 生成kubernetes集群最高权限admin用户的token admin-role.yaml kind: ClusterRoleBindin…...
Android 9.0 蓝牙去掉传输文件的功能
1.概述 在9.0的系统rom定制化产品开发中,在原生系统中蓝牙这块的功能也是非常重要的,所以在对蓝牙功能开发过程中,对功能的定制要求也多,在蓝牙的开发需求中,功能要求 也是越来越多的,产品需要要求在蓝牙文件传输过程中,进行限制就是不让蓝牙传输文件,所以要求在开始传…...
C语言指针易错点—字符数组与字符指针
C语言指针易错点—字符数组与字符指针字符数组与字符指针的区别字符数组与字符指针的区别举例字符指针必须先赋值,后引用字符数组与字符指针的区别 因为字符数组与字符指针都可以表示字符串,但他们不是等价的。下面就来讲讲他们的区别。 char sa[ ] &…...
Yolov3,v4,v5区别
网络区别就不说了,ipad笔记记录了,这里只说其他的区别1 输入区别1.1 yolov3没什么特别的数据增强方式1.2 yolov4Mosaic数据增强Yolov4中使用的Mosaic是参考2019年底提出的CutMix数据增强的方式,但CutMix只使用了两张图片进行拼接,…...
基于Appium+WinAppDriver+Python的winUI3应用的自动化框架搭建分享(一)环境配置
安装WinAppDriver下载并安装WinAppDriver:来源 https://github.com/Microsoft/WinAppDriver/releases开启电脑的开发者模式设置-隐私和安全性-开发者选项-开发人员模式安装Appium安装Appium Server Gui https://github.com/appium/appium-desktop/releases安装Appium Inspector…...
使用docker安装RocketMQ
文章目录1.创建namesrv服务拉取镜像创建namesrv数据存储路径构建namesrv容器2.创建broker节点创建broker数据存储路径创建配置文件构建broker容器3.创建rockermq-console服务拉取镜像构建rockermq-console容器需要关闭防火墙或者开放namesrv和broker端口关闭防火墙开放指定端口…...
【FPGA仿真】Matlab生成二进制、十六进制的txt数据以及Vivado读取二进制、十六进制数据并将结果以txt格式保存
Matlab 生成二进制、十六进制数据 在使用Vivado软件进行Verilog程序仿真时可能需要对模块输入仿真的数据,因此我们需要一个产生数据的方法(二进制或者十六进制的数据),Matlab软件是一个很好的工具,当然你也可以使用VS…...
【第四章 IOC操作bean管理(基于注解方式创建对象,注入属性),完全注解开发】
第四章 IOC操作bean管理(基于注解方式创建对象,注入属性),完全注解开发 1.IOC操作bean管理(基于注解方式) (1)什么是注解: ①注解是代码特殊标记,格式&#…...
【手把手一起学习】(六) Altium Designer 20 STM32核心板Demo----PCB设计
1 PCB设计 PCB设计是制作STM32核心板的关键步骤,其关系到最终生产厂家制作的电路板能否正常使用,PCB设计包括布局,裁板,布线,覆铜,DRC检查等,其中要求、细节、技巧比较多,以后会更详…...
【蓝桥杯集训·周赛】AcWing 第92场周赛
文章目录第一题 AcWing 4864. 多边形一、题目1、原题链接2、题目描述二、解题报告1、思路分析2、时间复杂度3、代码详解第二题 AcWing 4865. 有效类型一、题目1、原题链接2、题目描述二、解题报告1、思路分析2、时间复杂度3、代码详解第三题 AcWing 4866. 最大数量一、题目1、原…...
编程参考 - GCC中的Basic ASM
asm关键字允许你在C代码中嵌入汇编程序指令。GCC提供两种形式的内联asm语句。一种是基本asm语句,是没有操作数的语句(见基本asm),而另一种扩展asm语句(见扩展asm)包括一个或多个操作数。在函数内部混合使用…...
软考中级-操作系统
1 操作系统地位计算机系统由硬件和软件组成,未配置软件的称为裸机,但这会导致效率低下。操作系统是为弥补用户与硬件之间的鸿沟的一种系统软件,汇编、编译、解释、数据库管理系统等系统软件和其他应用软件都在此基础。2 进程管理又称处理机管…...
MYD-Y6ULL开发笔记
MYD-Y6ULL开发 文章目录MYD-Y6ULL开发一、系统移植1. 核板说明2. 文件系统操作二、应用开发1. 应用自启动2. 应用编译3.系统应用4.网络5.系统参数一、系统移植 1. 核板说明 型号 MYIR-Y6UL Y2 V2-256N 256D-50I烧了固件命令 uuu.exe myd-y6ulx-y2-256n256d-core-base.auto2. 文…...
三天吃透Java虚拟机面试八股文
本文已经收录到Github仓库,该仓库包含计算机基础、Java基础、多线程、JVM、数据库、Redis、Spring、Mybatis、SpringMVC、SpringBoot、分布式、微服务、设计模式、架构、校招社招分享等核心知识点,欢迎star~ Github地址:https://github.com/…...
Spring Cloud Alibaba全家桶(二)——微服务组件Nacos注册中心
前言 本文为微服务组件Nacos注册中心相关知识,下边将对什么是 Nacos,Nacos注册中心(包括:注册中心演变及其设计思想、核心功能),Nacos Server部署(包括:单机模式、集群模式ÿ…...
命令执行漏洞 | iwebsec
文章目录1 靶场环境2 命令执行漏洞介绍3 靶场练习01-命令执行漏洞02-命令执行漏洞空格绕过03-命令执行漏洞关键命令绕过04-命令执行漏洞通配符绕过05-命令执行漏洞base64编码绕过4 命令执行漏洞危害01-读写系统文件02-执行系统命令03-种植恶意木马04-反弹shellpython反弹shellp…...
vscode里如何用git
打开vs终端执行如下: 1 初始化 Git 仓库(如果尚未初始化) git init 2 添加文件到 Git 仓库 git add . 3 使用 git commit 命令来提交你的更改。确保在提交时加上一个有用的消息。 git commit -m "备注信息" 4 …...
使用VSCode开发Django指南
使用VSCode开发Django指南 一、概述 Django 是一个高级 Python 框架,专为快速、安全和可扩展的 Web 开发而设计。Django 包含对 URL 路由、页面模板和数据处理的丰富支持。 本文将创建一个简单的 Django 应用,其中包含三个使用通用基本模板的页面。在此…...
label-studio的使用教程(导入本地路径)
文章目录 1. 准备环境2. 脚本启动2.1 Windows2.2 Linux 3. 安装label-studio机器学习后端3.1 pip安装(推荐)3.2 GitHub仓库安装 4. 后端配置4.1 yolo环境4.2 引入后端模型4.3 修改脚本4.4 启动后端 5. 标注工程5.1 创建工程5.2 配置图片路径5.3 配置工程类型标签5.4 配置模型5.…...
MySQL 隔离级别:脏读、幻读及不可重复读的原理与示例
一、MySQL 隔离级别 MySQL 提供了四种隔离级别,用于控制事务之间的并发访问以及数据的可见性,不同隔离级别对脏读、幻读、不可重复读这几种并发数据问题有着不同的处理方式,具体如下: 隔离级别脏读不可重复读幻读性能特点及锁机制读未提交(READ UNCOMMITTED)允许出现允许…...
从深圳崛起的“机器之眼”:赴港乐动机器人的万亿赛道赶考路
进入2025年以来,尽管围绕人形机器人、具身智能等机器人赛道的质疑声不断,但全球市场热度依然高涨,入局者持续增加。 以国内市场为例,天眼查专业版数据显示,截至5月底,我国现存在业、存续状态的机器人相关企…...
1688商品列表API与其他数据源的对接思路
将1688商品列表API与其他数据源对接时,需结合业务场景设计数据流转链路,重点关注数据格式兼容性、接口调用频率控制及数据一致性维护。以下是具体对接思路及关键技术点: 一、核心对接场景与目标 商品数据同步 场景:将1688商品信息…...
大语言模型如何处理长文本?常用文本分割技术详解
为什么需要文本分割? 引言:为什么需要文本分割?一、基础文本分割方法1. 按段落分割(Paragraph Splitting)2. 按句子分割(Sentence Splitting)二、高级文本分割策略3. 重叠分割(Sliding Window)4. 递归分割(Recursive Splitting)三、生产级工具推荐5. 使用LangChain的…...
WEB3全栈开发——面试专业技能点P2智能合约开发(Solidity)
一、Solidity合约开发 下面是 Solidity 合约开发 的概念、代码示例及讲解,适合用作学习或写简历项目背景说明。 🧠 一、概念简介:Solidity 合约开发 Solidity 是一种专门为 以太坊(Ethereum)平台编写智能合约的高级编…...
uniapp中使用aixos 报错
问题: 在uniapp中使用aixos,运行后报如下错误: AxiosError: There is no suitable adapter to dispatch the request since : - adapter xhr is not supported by the environment - adapter http is not available in the build 解决方案&…...
大语言模型(LLM)中的KV缓存压缩与动态稀疏注意力机制设计
随着大语言模型(LLM)参数规模的增长,推理阶段的内存占用和计算复杂度成为核心挑战。传统注意力机制的计算复杂度随序列长度呈二次方增长,而KV缓存的内存消耗可能高达数十GB(例如Llama2-7B处理100K token时需50GB内存&a…...
