基于python+flask+mysql的川渝地区天气数据分析系统
系统首页

天气数据分析

历史天气数据查询

python爬虫代码展示
import requests
import re
import time as delay
from bs4 import BeautifulSoup
import pandas as pd
import pymysql
import json# 定义一个函数,用于获取网页的源代码
def get_page(url, headers):html = requests.get(url, headers=headers)if html.status_code == 200:html.encoding = html.apparent_encodingreturn html.textelse:print("Failed to fetch page:", url) # 添加调试语句return None# 定义一个函数,用于解析网页中的数据,并返回一个数据框
def parse_page(html):# 创建空列表,用于存储数据date_box=[]max_temp=[]min_temp=[]weh=[]wind=[]# 使用 BeautifulSoup 解析网页bs=BeautifulSoup(html,'html.parser')# 找到包含数据的标签data=bs.find_all(class_='thrui')# 使用正则表达式提取数据date = re.compile('class="th200">(.*?)</div>')tem = re.compile('class="th140">(.*?)</div>')time = re.findall(date, str(data))for item in time:# 不提取星期数据date_box.append(item[:10])temp = re.findall(tem, str(data))for i in range(len(temp) // 4):max_temp.append(temp[i * 4 + 0])min_temp.append(temp[i * 4 + 1])weh.append(temp[i * 4 + 2])wind.append(temp[i * 4 + 3])# 将数据转换为数据框,不添加星期列datas=pd.DataFrame({'日期':date_box,'最高温度':max_temp,'最低温度':min_temp,'天气':weh,'风向':wind })return datas# 定义一个函数,用于将数据框中的数据保存到 mysql 数据表中
def save_to_mysql(datas, city, db, cursor): # 添加城市参数for i in range(len(datas)):date = datas.iloc[i, 0]max_temp = float(re.findall(r'\d+', datas.iloc[i, 1])[0])min_temp = float(re.findall(r'\d+', datas.iloc[i, 2])[0])weh = datas.iloc[i, 3]wind = datas.iloc[i, 4]# 在 SQL 语句中包含城市信息sql = "INSERT INTO lishiweathers (城市, 日期, 最高温度, 最低温度, 天气, 风向) VALUES ('{}', '{}', {}, {}, '{}', '{}')".format(city, date, max_temp, min_temp, weh, wind)cursor.execute(sql)db.commit()print("成功将数据保存到 lishiweathers 表中")def crawl_weather(city, code, start, end, db, cursor):# 根据城市的编码和时间范围,生成网页的 urlurl = "http://lishi.tianqi.com/{}/{}{}.html".format(code, start, end)# 定义请求头,模拟浏览器访问headers = { # 请求标头,通过模拟请求标头以此实现仿人类登录进入网站并获取信息'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36','Cookie': ******************************************************************************************************************************************************************************************************************************************************************************************************************************************************************************}try:# 获取网页的源代码html = get_page(url, headers)# 解析网页中的数据,并返回一个数据框datas = parse_page(html)# 将数据框中的数据保存到 mysql 数据表中save_to_mysql(datas, city, db, cursor) # 传递 cursor 参数# 打印提示信息,不打印星期数据,也不将其作为输出的格式print("成功爬取 {} 的 {}-{} 的历史天气数据".format(city, start, end))except Exception as e:print("爬取 {} 的 {}-{} 历史天气数据失败:{}".format(city, start, end, e))# 从本文件夹下的 city.json 文件中读取城市名称和编码
with open('city.json', 'r', encoding='utf-8') as f:city_dict = json.load(f) # 将json文件转换为字典# 定义一个列表,存储需要爬取的时间范围
# 您可以根据您的要求修改或添加时间
#time_list = ["202201","202202","202203","202204","202205","202206","202207","202208","202209","202210","202211","202212","202301","202302","202303","202304","202305","202306","202307","202308","202309","202310","202311","202312","202401","202402"]
time_list = ["202301","202302","202303","202304","202305","202306","202307","202308","202309","202310","202311","202312","202401","202402","202403","202404","202405","202406","202407","202408","202409","202410","202411","202412","202501","202502"]# 打开数据库连接
# 您需要提供您的数据库的主机名,用户名,密码,端口号和数据库名
db = pymysql.connect(host="localhost",user="root",passwd="123456",port=3306,db="tianqi")
# 创建一个游标对象
cursor = db.cursor()# 遍历城市字典和时间列表,调用爬取函数
for city, code in city_dict.items():for time in time_list:start = time[:6]end = time[6:]crawl_weather(city, code, start, end, db, cursor) # 传递 cursor 参数delay.sleep(5)
# 关闭数据库连接
db.close()
数据库设计

相关文章:
基于python+flask+mysql的川渝地区天气数据分析系统
系统首页 天气数据分析 历史天气数据查询 python爬虫代码展示 import requests import re import time as delay from bs4 import BeautifulSoup import pandas as pd import pymysql import json# 定义一个函数,用于获取网页的源代码 def get_page(url, headers)…...
一个结合创意与技术的Python数据可视化案例,展示动态3D粒子轨迹图与热力图的融合效果,代码包含注释与关键技术点解析
以下是一个结合创意与技术的Python数据可视化案例,展示动态3D粒子轨迹图与热力图的融合效果,代码包含注释与关键技术点解析: import numpy as np import pandas as pd import matplotlib.pyplot as plt from matplotlib.animation import Fu…...
【Linux———信号精讲】
你是怎么做到的,给了她想要的爱............................................................................................ 文章目录 前言 一、【信号入门】 1.1、【生活角度的信号】 1.2、【ctrl c与z】 1.3、【信号的发送与记录】 1.4、【信号处理常见方式…...
scBaseCamp:一个AI代理的可持续扩充的单细胞数据存储库
scBaseCamp是Tahoe-100M:最大规模的单细胞扰动数据集的后续 构建虚拟细胞是人工智能与生物学交叉领域的新兴前沿方向,单细胞RNA测序数据的快速增长为这一领域提供了助力。通过整合数百项研究中数百万个细胞的基因表达谱,单细胞图谱为训练由 …...
GPTs+RPA赋能智慧校园:构建下一代教育智能体的技术实践
文章目录 一、核心应用场景与技术融合1. 教务流程自动化(RPAGPTs双引擎驱动)2. 智能问答中枢(NLP流程自动化) 二、关键技术实现方案1. 多模态数据处理架构2. 智能文档处理流水线 三、典型系统架构设计智慧校园AI中台架构ÿ…...
Linux 系统不同分类的操作命令区别
Linux 系统有多种发行版,每种发行版都有其独特的操作命令和工具。以下是一些常见的分类及其操作命令的区别: 1. 基于 Red Hat 的发行版 (RHEL, CentOS, Fedora) 1.1 包管理 安装软件包: bash复制 sudo yum install <package> 更新软件包: bash复制 sudo yum update…...
集成的背景与LLM集成学习
文章目录 集成的背景与LLM集成学习LLVM集成指南Azure OpenAl集成Hugging Face Hub集成集成的背景与LLM集成学习 任何新的技术框架或工具,往往需要对其背后的原理和历史背景有所了解,这样可以更好地掌握它的应用方式和最佳实践。在探讨为什么学习LangChain的集成项目之前,先看…...
【AIGC】通义万相 2.1 与蓝耘智算:共绘 AIGC 未来绚丽蓝图
一、引言 在人工智能技术迅猛发展的今天,AIGC(生成式人工智能内容生成)领域正以惊人的速度改变着我们的生活和工作方式。从艺术创作到影视制作,从广告设计到智能客服,AIGC 技术的应用越来越广泛。通义万相 2.1 作为一…...
【AIGC实战】蓝耘元生代部署通义万相2.1文生图,结尾附上提示词合集
文章目录 👏什么是文生图?👏通义万相2.1文生图👏蓝耘元生代部署通义万相2.1👏平台注册👏部署通义万相2.1👏使用通义万相2.1文生图 👏提示词合集👏总结 随着人工智能生成内…...
Gartner:数据安全平台DSP提升数据流转及使用安全
2025 年 1 月 7 日,Gartner 发布“China Context:Market Guide for Data Security Platforms”(《数据安全平台市场指南——中国篇》,以下简称指南),报告主要聚焦中国数据安全平台(Data Securit…...
数据结构与算法:双指针
前言 双指针其实和滑动窗口差不多,但能使用的场景比滑动窗口更广功能更强。滑动窗口的内容在我上一篇文章数据结构与算法:滑动窗口。 一、原理 双指针的关键还是分析题目单调性,从而保证指针可以单方向滑动。 二、题目 1.按奇偶排序数组…...
Leetcode 57: 插入区间
Leetcode 57: 插入区间 问题描述: 给定一个非重叠的区间集合 intervals(按开始时间升序排列)和一个新的区间 newInterval,将新的区间插入到区间集合中并合并重叠的部分,最后返回结果区间集合。 适合面试的解法&#x…...
NLP如何训练AI模型以理解知识
一、自然语言处理(NLP)的定义与核心目标 1. 什么是自然语言处理? NLP是计算机科学与人工智能的交叉领域,旨在让机器具备以下能力: • 理解:解析人类语言(文本或语音)的语法、语义和…...
android13为账号密码做文件存储功能
注册获取外存权限 <uses-permission android:name"android.permission.WRITE_EXTERNAL_STORAGE" /><uses-permission android:name"android.permission.READ_EXTERNAL_STORAGE" />申请文件存入外存权限 // Activity中 // 1. 申请PackageManag…...
Excel的行高、列宽单位不统一?还是LaTeX靠谱
想要生成田字格、米字格、带拼音标准,方便小学生书法和练字。Word,Excel之类所见即所得是最容易相当的方式。但它们处理带田字格之类背景时,如果没有专用模板、奇奇怪怪的插件,使用起来会碰到各种问题。比如,Word里面用…...
【JavaSE-5】程序逻辑控制相关练习题
1、判断一个数字是否是素数(质数) //方法1: import java.util.Scanner; public static void main(String[] args) {//判断一个数字是否是素数:除了1和它本身外没有其他数可以整除Scanner scan new Scanner(System.in);int num scan.nextInt();boolean flag tru…...
MyBatis-Plus 条件构造器的使用(左匹配查询)
在上一篇文章中,我们已经介绍了 MyBatis-Plus 条件构造器,包括 QueryWrapper 和 UpdateWrapper 的基本使用方法、常见查询条件(如等于、不等于、大于、小于)以及如何使用 Lambda 表达式来构建动态查询和更新条件。 在本文中&…...
深入理解设计模式中的单例模式(Singleton Pattern)
各类资料学习下载合集 https://pan.quark.cn/s/8c91ccb5a474 单例模式是一种创建型设计模式,确保一个类只有一个实例,并提供全局访问点。这种模式在许多应用场景中都很有用,特别是当我们希望控制对共享资源的访问时,比…...
CES Asia 2025增设未来办公教育板块,科技变革再掀高潮
作为亚洲消费电子领域一年一度的行业盛会,CES Asia 2025(第七届亚洲消费电子技术贸易展)即将盛大启幕。今年展会规模再度升级,预计将吸引超过500家全球展商参展,专业观众人数有望突破10万。除了聚焦人工智能、物联网、…...
汽车零部件厂如何选择最适合的安灯系统解决方案
在现代制造业中,安灯系统作为一种重要的生产管理工具,能够有效提升生产线的异常处理效率,确保生产过程的顺畅进行。对于汽车零部件厂来说,选择一套适合自身生产需求的安灯系统解决方案尤为重要。 一、安灯系统的核心功能 安灯系统…...
sqlite3 c++ client选择; c++环境搭建 : abseil-cpp | fnc12/sqlite_orm
sqlite3 c client选择 今日20250305 2.4K星: 7月前最后提交核心: SRombauts/SQLiteCpp.git : 薄封装、命令式sql、非orm、支持事务2.4K星: 1月前最后提交核心: fnc12/sqlite_orm.git : 厚封装、非侵入、真orm、真泛型、类型复杂、支持事务 因真泛型导致DbInstance必须放在x.h…...
Pytorch中的主要函数
目录 一、torch.manual_seed(seed)二、torch.cuda.manual_seed(seed)三、torch.rand(*size, outNone, dtypeNone, layouttorch.strided, deviceNone, requires_gradFalse)四、给大家写一个常用的自动选择电脑cuda 或者cpu 的小技巧五、torch.version.cuda;torch.bac…...
景联文科技:以专业标注赋能AI未来,驱动智能时代的精准跃迁
在人工智能技术重塑全球产业格局的今天,高质量训练数据已成为驱动算法进化的核心燃料。作为数据智能服务领域的领军者,景联文科技深耕数据标注行业多年,以全栈式数据解决方案为核心,构建起覆盖数据采集、清洗、标注、质检及算法调…...
车载测试:智能座舱测试中多屏联动与语音交互的挑战
智能座舱作为汽车智能化发展的核心,集成了多屏联动和语音交互功能,为驾驶员和乘客提供更便捷的体验。然而,这些功能的测试面临诸多挑战,包括多屏同步性、噪声干扰和复杂场景的处理。本文将详细分析这些挑战,探讨测试方…...
深入探索WebGL:解锁网页3D图形的无限可能
深入探索WebGL:解锁网页3D图形的无限可能 引言 。WebGL,作为这一变革中的重要技术,正以其强大的功能和广泛的应用前景,吸引着越来越多的开发者和设计师的关注。本文将深入剖析WebGL的核心原理、关键技术、实践应用,并…...
仿mudou库one thread oneloop式并发服务器
项目gitee:仿muduo: 仿muduo 一:项目目的 1.1项目简介 通过咱们实现的⾼并发服务器组件,可以简洁快速的完成⼀个⾼性能的服务器搭建。 并且,通过组件内提供的不同应⽤层协议⽀持,也可以快速完成⼀个⾼性能应⽤服务器…...
Linux 文件和目录权限管理详解
文章目录 Linux 文件和目录权限管理详解介绍权限管理的核心内容权限管理访问权限查看权限更改权限所有者和用户组的设置权限设置注意事项 总结 Linux 文件和目录权限管理详解 介绍 在 Linux 系统中,文件和目录的权限管理是确保系统安全的重要组成部分。每个文件和…...
CentOS 7 aarch64上制作kernel rpm二进制包 —— 筑梦之路
环境说明 centos 7 aarch64 gcc 8.3.1 kernel 5.4.290 准备编译制作 # 安装必要的工具和包yum install rpm-devel rpmdevtools yum groupinstall "Development Tools"yum install ncurses-devel bc elfutils-libelf-devel openssl-devel # 安装gcc 8.3.1# 修改…...
Windows 图形显示驱动开发-WDDM 3.2-本机 GPU 围栏对象(二)
GPU 和 CPU 之间的同步 CPU 必须执行 MonitoredValue 的更新,并读取 CurrentValue,以确保不会丢失正在进行的信号中断通知。 当向系统中添加新的 CPU 等待程序时,或者如果现有的 CPU 等待程序失效时,OS 必须修改受监视的值。OS …...
vscode 都有哪些大模型编程插件
VSCode 中有许多基于大模型的编程插件,这些插件通过集成人工智能技术,显著提升了开发者的编程效率和体验。以下是一些主要的大模型编程插件及其功能: GitHub Copilot GitHub Copilot 是由 OpenAI 开发的插件,能够根据代码上下文自…...
