当前位置: 首页 > news >正文

零基础学习Python(八)—— time模块、request模块、数据分析和自动化办公相关模块、jieba模块、文件操作和os相关模块的简单介绍

1. time模块

time():获取当前时间戳,是一个数字

localtime():返回一个time.struct_time对象,里面有年月日时分秒,还有星期几(0表示星期一)和今年的第几天

import timeprint(time.time())
print(time.localtime())
1725287068.253736
time.struct_time(tm_year=2024, tm_mon=9, tm_mday=2, tm_hour=22, tm_min=24, tm_sec=28, tm_wday=0, tm_yday=246, tm_isdst=0)

localtime()也可以传入参数,表示1970年1月1日8时(本地时间)0分0秒开始经过的秒数

print(time.localtime(60))
time.struct_time(tm_year=1970, tm_mon=1, tm_mday=1, tm_hour=8, tm_min=1, tm_sec=0, tm_wday=3, tm_yday=1, tm_isdst=0)

ctime():返回简单易读的时间字符串

print(time.ctime())
Mon Sep  2 22:29:40 2024

strftime():将时间struct_time对象转换为格式化的字符串

print(time.strftime('%Y-%m-%d %H:%M:%S', time.localtime()))
2024-09-02 22:33:14

 注意年是大写的%Y,时分秒也都是大写的:%H,%M,%S。

strptime():将字符串转换为struct_time对象

print(time.strptime('2008-08-08 20:08:08', '%Y-%m-%d %H:%M:%S'))
time.struct_time(tm_year=2008, tm_mon=8, tm_mday=8, tm_hour=20, tm_min=8, tm_sec=8, tm_wday=4, tm_yday=221, tm_isdst=-1)

 sleep():程序睡眠指定的秒数

2. datetime模块

datetime.now():获取当前日期时间

# 从datetime模块中导入datetime类
from datetime import datetimeprint(datetime.now())
2024-09-02 22:40:08.851771

datetime类的构造参数可以传入年月日时分秒:

dt = datetime(2024, 9, 2, 22, 40, 0)
print(dt)
print(type(dt))
2024-09-02 22:40:00
<class 'datetime.datetime'>

取出datetime对象的年月日时分秒信息: 

print(dt.year, dt.month, dt.day, dt.hour, dt.minute, dt.second)
2024 9 2 22 40 0

比较两个datetime对象的大小:

dt1 = datetime(2024, 5, 1, 0, 0, 0)
dt2 = datetime(2024, 10, 1, 0, 0, 0)
print(dt1 < dt2)
True

datetime对象与字符串之间的转换(与time模块类似,都是strftime和strptime这两个方法):

print(datetime.strftime(datetime.now(), '%Y-%m-%d %H:%M:%S'))
print(datetime.strptime('2024-09-02 22:40:00', '%Y-%m-%d %H:%M:%S'))

计算两个datetime对象之间的差值,发现是一个timedelta对象:

dt1 = datetime(2024, 5, 1, 0, 0, 0)
dt2 = datetime(2024, 10, 1, 0, 0, 0)
print(type(dt2 - dt1))
print(dt2 - dt1)
<class 'datetime.timedelta'>
153 days, 0:00:00

 还可以将datetime对象加上或者减去一个timedelta对象,得到另一个datetime对象:

from datetime import timedeltaprint(dt1 + timedelta(153))
2024-10-01 00:00:00

timedelta构造函数第一个入参是天数,第二个入参是描述:

print(dt1 + timedelta(153, 10))
2024-10-01 00:00:10

3. request模块

request库是python处理HTPP请求的库,使用request库的get()方法可以获取一个网络请求的响应,可以通过响应对象的text属性来获取响应中的字符串数据,通过响应对象的content属性来获取响应中的二进制数据(图片、音频、视频等)。

打印发现乱码,设置响应的编码格式为utf-8:

4. openpyxl模块

openpyxl模块专门用来处理Excel文件,可以对Excel文件进行写入和读取。

写入Excel文件: 

import openpyxl# 创建工作簿
wb = openpyxl.Workbook()
# 创建页签,页签名和页签索引
sheet = wb.create_sheet("sheet1", 0)
# 添加数据
sheet.append([1, 2, 'a', True])
# 保存文件,传入文件名
wb.save('text.xlsx')

读取Excel文件:

# 打开表格
wb = openpyxl.load_workbook("text.xlsx")# 选择sheet1页签
sheet = wb['sheet1']# 读取文件
l = []
for row in sheet.rows:c = []for cell in row:c.append(cell.value)l.append(c)print(l)

5. pdfplumber模块

pdfplumber模块用于读取pdf文件。

import pdfplumberwith pdfplumber.open("可靠的底部形态.pdf") as f:for p in f.pages:# 提取内容print(p.extract_text())print(f"第{p.page_number}页提取结束")

可以通过pdfplumber模块实现提取指定的数据,或者将pdf倒序等功能。

6. numpy模块和matplotlib模块

使用matplotlib模块读取图片:

import matplotlib.pyplot as pltim = plt.imread("日出海.jpeg")
print(im)
print(type(im))

plt读取出的image是一个三维数组,类型为numpy数组,前两维是图片的宽和高,第三维是RGB数组。使用numpy模块对该图像进行灰度处理:

import numpy as np
import matplotlib.pyplot as pltim = plt.imread("日出海.jpeg")
print(im)
print(type(im))
plt.imshow(im)# 灰度固定值
mask = np.array([0.299, 0.587, 0.114])
im2 = np.dot(im, mask)
plt.imshow(im2, cmap='gray')

7. pandas模块

使用pandas模块读取表格数据,然后使用matplotlib模块绘制饼图

import pandas as pd
import matplotlib.pyplot as pltdf = pd.read_excel("test.xlsx")# 解决中文乱码
plt.rcParams['font.sans-serif'] = ['SimHei']#设置画布的大小
plt.figure(figsize=(10, 6))
labels = df['商品名称']
y = df['北京']# 绘制饼图
plt.pie(y, labels=labels, autopct='%1.1f%%', startangle=90)# 设置x,y轴刻度相等
plt.axis('equal')
plt.title('xxx')plt.show()

8. jieba模块

import jiebawith open('text.txt', 'r', encoding='utf-8') as f:s = f.read()# 对原始字符串进行分词,返回一个列表
l = jieba.lcut(s)# 去重
s = set(l)#统计词的次数
d = {}
for word in s:if len(word) >= 2:if word in d:d[word] = d[word] + 1else:d[word] = 1res = []
for k,v in d.items():res.append([k, v])# 按照词频从大到小排序,并取前10项
res.sort(key=lambda x: x[1], reverse=True)
print(res[0:11])

9. 文件操作

文件基本操作在前面的博客中介绍过,这里复习下文件的打开模式和读写方法:

 

注意,writelines方法不换行,而且传入的参数是列表(只传入一个字符串也可以),并且列表中的元素只能为字符串。

使用文件操作实现复制文件的功能:

def func_copy(source_file, target_file):with open(source_file, 'r') as sf:with open(target_file, 'w') as tf:tf.write(sf.read())func_copy('text.txt', 'text2.txt')

10. json模块

json.dumps方法使用: 

l = [{'name': 'zhangsan', 'age': 18}, {'name': "lisi", 'age': 20}, {'name': 'wangwu'}]# 将Python数据类型转换为json字符串,这里是一个json数组,ensure_ascii=False表示正常显示中文,indent=4用于缩进格式
s = json.dumps(l, ensure_ascii=False, indent=4)
print(type(s))
print(s)
<class 'str'>
[{"name": "zhangsan","age": 18},{"name": "lisi","age": 20},{"name": "wangwu"}
]

json.loads方法使用:

# 将刚才的son字符串加载为python数据类型,这里是一个列表类型
l2 = json.loads(s)
print(type(l2))
print(l2)ds = '{"name": "aaa", "age": 12}'
# 将son字符串加载为python数据类型,这里是一个字典类型
d = json.loads(ds)
print(type(d))
print(d)
<class 'dict'>
{'name': 'aaa', 'age': 12}

注意,json.loads方法中的json字符串中的引号必须是双引号,否则无法解析成Python中的数据类型。 

json.dump方法使用: 

import jsonl = [{'name': 'zhangsan', 'age': 18}, {'name': "lisi", 'age': 20}, {'name': 'wangwu'}]# 将Python数据类型转换为json字符串,并存于文件中
with open('json.txt', 'w') as f:json.dump(l, f, ensure_ascii=False, indent=4)

 

json.load方法使用:

with open('json.txt', 'r') as f:s = json.load(f)print(type(s))print(s)
<class 'list'>
[{'name': 'zhangsan', 'age': 18}, {'name': 'lisi', 'age': 20}, {'name': 'wangwu'}]

10. os模块

 

 getcwd():获取当前工作路径

import osprint(os.getcwd())
/Users/admin/Documents/pythonProject

listdir():获取指定目录下的所有目录和文件,如果不传参,则默认为当前工作路径,返回结果为列表 

print(os.listdir())
['text.xlsx', '日出海.jpeg', 'json.txt', 'gray.jpeg', 'text2.txt', 'text.txt', 'venv', 'main.py', '可靠的底部形态.pdf', '.idea']

 mkdir():创建单级目录,如果目录已存在,则报错

os.mkdir("study")

 makedirs():创建多级目录,如果目录已存在,则报错 

os.makedirs("study/aa/bb/cc")

rmdir():删除目录,如果目录不为空或者不存在,则报错

os.rmdir("study/aa/bb/cc")

removedirs():删除多级目录,如果目录不为空或者不存在,则报错,注意这里要求的目录为空包括父目录也要为空

os.removedirs("study/aa/bb/cc")

walk():遍历目录树,参数不能传空,遍历结果是元组包含三个元素:当前遍历的目录,当前遍历的目录下包含的目录列表,当前遍历的目录下包含的文件列表

for dirs, dirlist, filelist in os.walk("./"):print(dir)print(dirlist)print(filelist)print("------------")

remove():删除文件,如果文件不存在,则报错

os.remove('json.txt')

rename():重命名文件

os.rename('text.txt', 'test.txt')

 stat():获取文件的详细信息

info = os.stat("text.xlsx")
print(type(info))
print(info)
<class 'os.stat_result'>
os.stat_result(st_mode=33188, st_ino=31111965, st_dev=16777233, st_nlink=1, st_uid=501, st_gid=20, st_size=5265, st_atime=1725375194, st_mtime=1725375193, st_ctime=1725375193)

其中,st_ctime表示文件创建时间,st_mtime表示文件的修改时间,st_atime表示文件的最近一次访问时间,st_size表示文件大小(单位是字节)。

11. os.path模块

abspath():获取目录或者文件的绝对路径

import os.path as pathprint(path.abspath("text.xlsx"))
/Users/admin/Documents/pythonProject/text.xlsx

exists():判断目录或者文件是否存在

print(path.exists("text.xlsx"))
print(path.exists("text2.xlsx"))
True
False

join():将第一个参数path和第二个参数文件名进行拼接,返回字符串,不判断文件是否存在

f = path.join('study', 'text.xlsx')
print(type(f))
print(f)
<class 'str'>
study/text.xlsx

splittext():分割文件名和后缀名,返回格式为元组,不判断文件是否存在

print(path.splitext('text.txt'))
('text', '.txt')

basename():获取文件名,不包含目录名,但是包含后缀名,不判断文件是否存在

print(path.basename("study/text.txt"))
text.txt

dirname():获取目录名,不判断文件是否存在 

print(path.dirname("study/text.txt"))
study

isdir():是否是有效的目录,如果不是目录或者目录不存在,则报错

print(path.isdir("study/day"))
print(path.isdir("text.xlsx"))
print(path.isdir("./"))
False
False
True

isfile():是否是有效的文件,如果不是文件或者文件不存在,则报错 

print(path.isfile("study/text.xlsx"))
print(path.isfile("text.xlsx"))
print(path.isfile("./"))
False
True
False

 

相关文章:

零基础学习Python(八)—— time模块、request模块、数据分析和自动化办公相关模块、jieba模块、文件操作和os相关模块的简单介绍

1. time模块 time()&#xff1a;获取当前时间戳&#xff0c;是一个数字 localtime()&#xff1a;返回一个time.struct_time对象&#xff0c;里面有年月日时分秒&#xff0c;还有星期几&#xff08;0表示星期一&#xff09;和今年的第几天 import timeprint(time.time()) pri…...

快速回顾-HTML5

HTML5-常用的标签&#xff1a;https://blog.csdn.net/TKOP_/article/details/111395865 <!-- HTML5:声明文档类型的标签 --> <!DOCTYPE html><!-- 用于声明网页的主要语言为简体中文 --> <!-- 帮助搜索引擎、浏览器等理解网页的语言内容&#xff0c;以便…...

视频技术未来展望:EasyCVR如何引领汇聚融合平台新趋势

随着科技的飞速发展&#xff0c;视频技术已成为现代社会不可或缺的一部分&#xff0c;广泛应用于安防监控、娱乐传播、在线教育、电商直播等多个领域。本文将探讨视频技术的未来发展趋势&#xff0c;并深入分析TSINGSEE青犀EasyCVR视频汇聚融合平台的技术优势&#xff0c;展现其…...

7个流行的开源数据治理工具

数字化时代&#xff0c;数据是已经成为最宝贵的资产之一。数据支撑着我们的政府、企业以及各类组织的所有流程&#xff0c;并为决策以及智能化服务提供支撑。大数据有大用途&#xff0c;但是也可能隐藏着巨大的风险&#xff0c;特别是如果我们对数据的情况不是很了解的时候&…...

js | XMLHttpRequest

是什么&#xff1f; 和serve交互数据的对象&#xff1b;能够达到页面部分刷新的效果&#xff0c;也就是获取数据之后&#xff0c;不会使得整个页面都刷新&#xff1b;虽然名字是XML&#xff0c;但不限于XML数据。 怎么用&#xff1f; function reqListener() {console.log(thi…...

2024国赛数学建模A题思路模型代码

2024国赛数学建模思路资料&#xff0c;思路获取见文末名片 数学建模感想 纪念逝去的大学数学建模&#xff1a;两次校赛&#xff0c;两次国赛&#xff0c;两次美赛&#xff0c;一次电工杯。从大一下学期组队到现在&#xff0c;大三下学期&#xff0c;时间飞逝&#xff0c;我的…...

使用SVD(奇异值分解)进行降维的奇妙之旅

在数据分析和机器学习的广阔天地中&#xff0c;降维技术占据着举足轻重的地位。当我们面对高维数据时&#xff0c;不仅计算成本高昂&#xff0c;而且容易遭遇“维度灾难”&#xff0c;即随着维度的增加&#xff0c;数据的稀疏性和距离度量失效等问题愈发严重。为了克服这些挑战…...

【C++ 第二十一章】特殊类的设计(学习思路)

1.请设计一个类&#xff0c;不能被拷贝 设计思路 拷贝只会使用在两个场景中&#xff1a;拷贝构造函数以及赋值运算符重载&#xff0c;因此想要让一个类禁止拷贝&#xff0c;只需让该类不能调用拷贝构造函数以及赋值运算符重载即可。 C98 的做法 将拷贝构造函数与赋值运算符…...

Java设计模式【命令模式】-行为型

1. 介绍 命令模式&#xff08;Command Pattern&#xff09; 是一种行为型设计模式&#xff0c;它将一个请求封装为一个对象&#xff0c;从而使我们可以用不同的请求对客户端进行参数化&#xff0c;并且支持请求的排队、记录日志以及撤销、重做等功能。命令模式将请求的发送者与…...

【HarmonyOS】一键扫码功能

【HarmonyOS】一键扫码功能 前言 鸿蒙在api10之后&#xff0c;对系统api的基础上&#xff0c;封装了较为复杂功能的开发工具包&#xff0c;统一称之为Kit。这些Kit根据功能定义的不同&#xff0c;划分为不同的种类Kit。如下图所示&#xff1a; 其实可以理解为集成在系统中的…...

Spring Boot应用中集成与使用多数据源

Spring Boot应用中集成与使用多数据源 1. 前言 通过定义和使用多个数据源&#xff0c;能在Spring Boot应用中实现更复杂的数据管理场景&#xff0c;比如读写分离、数据冗余等。 2. 准备工作 环境准备&#xff1a;确保已经准备好Spring Boot的开发环境。数据库准备&#xff…...

探索 JavaScript 中的 instanceof 关键字

在 JavaScript 这门灵活而强大的编程语言中&#xff0c;instanceof 是一个非常重要的操作符&#xff0c;它用于检测一个对象是否在其原型链的原型构造函数的 prototype 属性中出现。简而言之&#xff0c;instanceof 用于测试一个对象是否是其父类或者其原型链上某个构造函数的实…...

Python爬虫02

xml 和html 区别 jsonpath模块 场景 多层嵌套的复杂字典直接提取数据 安装 pip install jsonpath使用 from jsonpath import jsonpathret jsonpath(dict, jaonpath语法规则字符串)语法规则 eg: lxml模块&xpath语法 谷歌浏览器 xpath helper 插件 作用对当前页面…...

HTTP/3

http相关知识点 HTTP/3是超文本传输协议&#xff08;HTTP&#xff09;的最新版本&#xff0c;旨在进一步提高Web性能和安全性。HTTP/3的显著变化是它基于QUIC&#xff08;Quick UDP Internet Connections&#xff09;协议&#xff0c;而不是之前版本中使用的TCP协议。QUIC是由…...

MySQL 字符串操作详解和案例示范

MySQL 字符串操作详解 MySQL 提供了丰富的字符串操作函数&#xff0c;能够对这些字符串进行截取、定位、替换等操作。本文将详细讲解 MySQL 中的字符串操作函数&#xff0c;包括 SUBSTRING()、SUBSTR()、LEFT()、RIGHT()、LOCATE()、POSITION()、FIND_IN_SET()、ELT()、INSERT…...

全双工语音交互

文章目录 微软小冰全双工字节大模型语音交互[Language Model Can Listen While Speaking](https://arxiv.org/html/2408.02622v1) 微软小冰全双工 全双工的定义&#xff1a;一路持续的听&#xff0c;upload audio&#xff1b;一路持续的输出&#xff0c;download audio&#xf…...

nginx中如何设置gzip

前言 Nginx通过配置gzip压缩可以提升网站整体速度 Nginx的gzip功能是用于压缩HTTP响应内容的功能。当启用gzip时&#xff0c;在发送给客户端之前&#xff0c;Nginx会将响应内容压缩以减小其大小。这样可以减少数据传输的带宽消耗和响应时间&#xff0c;提高网站的性能和速度。…...

借老系统重构机会我写了个groovy规则引擎

公司老系统的重构计划早就有了&#xff0c;为了对Java硬编码的各种校验规则进行重构&#xff0c;特地参考了相关技术&#xff0c;最终选择了groovy进行了系统的学习&#xff0c;并编写了一个即插即用的轻量级规则引擎。 文章目录 项目背景技术选型groovy的性能groovy脚本执行线…...

C#利用ffmpeg借助NVIDIA GPU实现实时RTSP硬解码+硬编码录制MP4

目录 说明 效果 项目 代码 下载 说明 利用周杰的开源项目 Sdcb.FFmpeg 项目地址&#xff1a;https://github.com/sdcb/Sdcb.FFmpeg/ 代码实现参考&#xff1a;https://github.com/sdcb/ffmpeg-muxing-video-demo 效果 C#利用ffmpeg借助NVIDIA GPU实现实时RTSP硬解码硬…...

第4章 汇编语言和汇编软件

第4章 汇编语言和汇编软件 该章主要介绍了汇编语言和汇编语言编译器的安装和使用。 汇编语言程序 该小节主要介绍了为什么要有汇编语言和汇编语言程序的一些基础写法。 书中有提到CPU有不同的架构&#xff0c;汇编语言有不同的风格&#xff0c;那么不同的CPU架构和不同的汇…...

iOS 26 携众系统重磅更新,但“苹果智能”仍与国行无缘

美国西海岸的夏天&#xff0c;再次被苹果点燃。一年一度的全球开发者大会 WWDC25 如期而至&#xff0c;这不仅是开发者的盛宴&#xff0c;更是全球数亿苹果用户翘首以盼的科技春晚。今年&#xff0c;苹果依旧为我们带来了全家桶式的系统更新&#xff0c;包括 iOS 26、iPadOS 26…...

VB.net复制Ntag213卡写入UID

本示例使用的发卡器&#xff1a;https://item.taobao.com/item.htm?ftt&id615391857885 一、读取旧Ntag卡的UID和数据 Private Sub Button15_Click(sender As Object, e As EventArgs) Handles Button15.Click轻松读卡技术支持:网站:Dim i, j As IntegerDim cardidhex, …...

mongodb源码分析session执行handleRequest命令find过程

mongo/transport/service_state_machine.cpp已经分析startSession创建ASIOSession过程&#xff0c;并且验证connection是否超过限制ASIOSession和connection是循环接受客户端命令&#xff0c;把数据流转换成Message&#xff0c;状态转变流程是&#xff1a;State::Created 》 St…...

NXP S32K146 T-Box 携手 SD NAND(贴片式TF卡):驱动汽车智能革新的黄金组合

在汽车智能化的汹涌浪潮中&#xff0c;车辆不再仅仅是传统的交通工具&#xff0c;而是逐步演变为高度智能的移动终端。这一转变的核心支撑&#xff0c;来自于车内关键技术的深度融合与协同创新。车载远程信息处理盒&#xff08;T-Box&#xff09;方案&#xff1a;NXP S32K146 与…...

面向无人机海岸带生态系统监测的语义分割基准数据集

描述&#xff1a;海岸带生态系统的监测是维护生态平衡和可持续发展的重要任务。语义分割技术在遥感影像中的应用为海岸带生态系统的精准监测提供了有效手段。然而&#xff0c;目前该领域仍面临一个挑战&#xff0c;即缺乏公开的专门面向海岸带生态系统的语义分割基准数据集。受…...

C# 表达式和运算符(求值顺序)

求值顺序 表达式可以由许多嵌套的子表达式构成。子表达式的求值顺序可以使表达式的最终值发生 变化。 例如&#xff0c;已知表达式3*52&#xff0c;依照子表达式的求值顺序&#xff0c;有两种可能的结果&#xff0c;如图9-3所示。 如果乘法先执行&#xff0c;结果是17。如果5…...

WPF八大法则:告别模态窗口卡顿

⚙️ 核心问题&#xff1a;阻塞式模态窗口的缺陷 原始代码中ShowDialog()会阻塞UI线程&#xff0c;导致后续逻辑无法执行&#xff1a; var result modalWindow.ShowDialog(); // 线程阻塞 ProcessResult(result); // 必须等待窗口关闭根本问题&#xff1a…...

Qt Quick Controls模块功能及架构

Qt Quick Controls是Qt Quick的一个附加模块&#xff0c;提供了一套用于构建完整用户界面的UI控件。在Qt 6.0中&#xff0c;这个模块经历了重大重构和改进。 一、主要功能和特点 1. 架构重构 完全重写了底层架构&#xff0c;与Qt Quick更紧密集成 移除了对Qt Widgets的依赖&…...

react更新页面数据,操作页面,双向数据绑定

// 路由不是组件的直接跳转use client&#xff0c;useEffect&#xff0c;useRouter&#xff0c;需3个结合&#xff0c; use client表示客户端 use client; import { Button,Card, Space,Tag,Table,message,Input } from antd; import { useEffect,useState } from react; impor…...

GB/T 43887-2024 核级柔性石墨板材检测

核级柔性石墨板材是指以可膨胀石墨为原料、未经改性和增强、用于核工业的核级柔性石墨板材。 GB/T 43887-2024核级柔性石墨板材检测检测指标&#xff1a; 测试项目 测试标准 外观 GB/T 43887 尺寸偏差 GB/T 43887 化学成分 GB/T 43887 密度偏差 GB/T 43887 拉伸强度…...