用 Python 自动化处理日常任务
💖 欢迎来到我的博客! 非常高兴能在这里与您相遇。在这里,您不仅能获得有趣的技术分享,还能感受到轻松愉快的氛围。无论您是编程新手,还是资深开发者,都能在这里找到属于您的知识宝藏,学习和成长。
🔍 博客内容包括:
- Java核心技术与微服务:涵盖Java基础、JVM、并发编程、Redis、Kafka、Spring等,帮助您全面掌握企业级开发技术。
- 大数据技术:涵盖Hadoop(HDFS)、Hive、Spark、Flink、Kafka、Redis、ECharts、Zookeeper等相关技术。
- 开发工具:分享常用开发工具(IDEA、Git、Mac、Alfred、Typora等)的使用技巧,提升开发效率。
- 数据库与优化:总结MySQL及其他常用数据库技术,解决实际工作中的数据库问题。
- Python与大数据:专注于Python编程语言的深度学习,数据分析工具(如Pandas、NumPy)和大数据处理技术,帮助您掌握数据分析、数据挖掘、机器学习等技术。
- 数据结构与算法:总结数据结构与算法的核心知识,提升编程思维,帮助您应对大厂面试挑战。
🌟 我的目标:持续学习与总结,分享技术心得与解决方案,和您一起探索技术的无限可能!在这里,我希望能与您共同进步,互相激励,成为更好的自己。
📣 欢迎订阅本专栏,与我一起在这个知识的海洋中不断学习、分享和成长!💻🚀
📍版权声明:本博客所有内容均为原创,遵循CC 4.0 BY-SA协议,转载请注明出处。
目录
1. 自动化文件管理
1.1 批量重命名文件
1.2 自动分类文件
2. 自动化定时任务
2.1 使用 schedule 库定时执行任务
2.2 使用 APScheduler 执行复杂定时任务
3. 自动化发送邮件
4. 自动化网络爬虫
5. 自动化数据处理
5.1 使用 Pandas 库处理数据
5.2 定时备份数据库
6. 自动化图像处理
7. 自动化 Web 操作
总结
1. 自动化文件管理
1.1 批量重命名文件
假设你有一批文件,文件名需要按一定规则批量修改,可以使用 os 和 re 库来实现。
import os
import re# 设置目录路径
directory = 'C:/path/to/your/files'# 获取文件列表
files = os.listdir(directory)# 批量重命名文件
for filename in files:new_name = re.sub(r'old_pattern', 'new_pattern', filename) # 替换文件名中的内容os.rename(os.path.join(directory, filename), os.path.join(directory, new_name))print("文件重命名完成!")
1.2 自动分类文件
根据文件扩展名自动将文件分类到不同的文件夹中。
import os
import shutil# 设置目录路径
directory = 'C:/path/to/your/files'# 获取文件列表
files = os.listdir(directory)# 定义文件分类规则
file_types = {'images': ['.jpg', '.jpeg', '.png', '.gif'],'documents': ['.pdf', '.txt', '.docx'],'audio': ['.mp3', '.wav']
}# 创建文件夹(如果不存在)
for folder in file_types:if not os.path.exists(os.path.join(directory, folder)):os.makedirs(os.path.join(directory, folder))# 移动文件
for filename in files:file_path = os.path.join(directory, filename)if os.path.isfile(file_path):moved = Falsefor folder, extensions in file_types.items():if any(filename.endswith(ext) for ext in extensions):shutil.move(file_path, os.path.join(directory, folder, filename))moved = Truebreakif not moved:print(f"文件 {filename} 没有分类!")print("文件分类完成!")
2. 自动化定时任务
2.1 使用 schedule 库定时执行任务
schedule 是一个 Python 库,专门用于调度定时任务。你可以使用它来设置定时执行的任务。
import schedule
import time# 定义要执行的任务
def job():print("任务开始执行!")# 每隔 10 秒执行一次任务
schedule.every(10).seconds.do(job)# 持续运行任务
while True:schedule.run_pending()time.sleep(1)
2.2 使用 APScheduler 执行复杂定时任务
APScheduler 是一个功能更强大的调度任务库,支持多种调度方式。
from apscheduler.schedulers.blocking import BlockingScheduler
import datetime# 定义要执行的任务
def print_time():print(f"当前时间:{datetime.datetime.now()}")# 创建调度器
scheduler = BlockingScheduler()# 添加任务,定时每分钟执行
scheduler.add_job(print_time, 'interval', minutes=1)# 启动调度器
scheduler.start()
3. 自动化发送邮件
使用 smtplib 库,可以自动化发送邮件,比如定时向客户或团队成员发送报告。
import smtplib
from email.mime.text import MIMEText
from email.mime.multipart import MIMEMultipartdef send_email(subject, body, to_email):from_email = "your_email@gmail.com"password = "your_password"# 设置邮件内容msg = MIMEMultipart()msg['From'] = from_emailmsg['To'] = to_emailmsg['Subject'] = subjectmsg.attach(MIMEText(body, 'plain'))# 发送邮件try:server = smtplib.SMTP('smtp.gmail.com', 587)server.starttls()server.login(from_email, password)text = msg.as_string()server.sendmail(from_email, to_email, text)server.quit()print("邮件发送成功!")except Exception as e:print(f"邮件发送失败:{e}")# 调用函数发送邮件
send_email("自动化报告", "这是自动化发送的邮件内容", "recipient_email@example.com")
4. 自动化网络爬虫
使用 requests 和 BeautifulSoup 库,可以自动化爬取网页内容,并将其存储到文件中。
import requests
from bs4 import BeautifulSoup# 定义爬取目标网址
url = "https://example.com"# 发送 HTTP 请求获取网页内容
response = requests.get(url)# 解析网页内容
soup = BeautifulSoup(response.text, 'html.parser')# 获取页面标题
title = soup.title.string# 打印标题
print(f"网页标题: {title}")
5. 自动化数据处理
5.1 使用 Pandas 库处理数据
如果你经常需要处理 CSV 文件或 Excel 文件,可以使用 Pandas 库来实现数据的读取、处理和导出。
import pandas as pd# 读取 CSV 文件
df = pd.read_csv('data.csv')# 进行数据处理(例如:筛选大于 100 的值)
df_filtered = df[df['column_name'] > 100]# 保存处理后的数据到新的 CSV 文件
df_filtered.to_csv('filtered_data.csv', index=False)print("数据处理完成!")
5.2 定时备份数据库
可以通过 Python 脚本定时备份数据库,减少人工干预。
import mysql.connector
import datetime
import osdef backup_database():# 数据库连接配置db = mysql.connector.connect(host="localhost",user="your_user",password="your_password",database="your_database")# 创建备份文件名backup_filename = f"backup_{datetime.datetime.now().strftime('%Y%m%d_%H%M%S')}.sql"# 使用 mysqldump 进行备份os.system(f"mysqldump -u your_user -p'your_password' your_database > {backup_filename}")print(f"数据库备份完成!备份文件: {backup_filename}")# 定时备份
backup_database()
6. 自动化图像处理
如果你需要自动处理图像文件(例如,批量调整大小、转换格式等),可以使用 Pillow 库。
from PIL import Image
import os# 设置图像目录
image_directory = 'C:/path/to/your/images'# 获取所有图像文件
files = os.listdir(image_directory)# 批量调整图像大小
for filename in files:if filename.endswith('.jpg'):image_path = os.path.join(image_directory, filename)with Image.open(image_path) as img:img = img.resize((800, 600)) # 调整大小为 800x600img.save(os.path.join(image_directory, f"resized_{filename}"))print("图像处理完成!")
7. 自动化 Web 操作
如果你需要自动化与网页的交互,可以使用 Selenium 来模拟浏览器操作。
from selenium import webdriver# 设置 WebDriver
driver = webdriver.Chrome(executable_path="path/to/chromedriver")# 打开网页
driver.get("https://example.com")# 查找并点击一个按钮
button = driver.find_element_by_xpath("//button[@id='submit']")
button.click()# 获取网页内容
page_content = driver.page_source
print(page_content)# 关闭浏览器
driver.quit()
总结
使用 Python 自动化日常任务可以极大地提高效率并减少重复性工作。通过 Python 中的各种库(如 os、shutil、schedule、smtplib、requests、pandas、Pillow 等),你可以轻松实现文件管理、定时任务、邮件发送、网页爬取、数据处理等多种自动化任务。
相关文章:
用 Python 自动化处理日常任务
💖 欢迎来到我的博客! 非常高兴能在这里与您相遇。在这里,您不仅能获得有趣的技术分享,还能感受到轻松愉快的氛围。无论您是编程新手,还是资深开发者,都能在这里找到属于您的知识宝藏,学习和成长…...
《深入浅出HTTPS》读书笔记(28):DSA数字签名
《深入浅出HTTPS》读书笔记(28):DSA数字签名 对称加密算法有很多算法,标准算法是RSA机密算法,数字签名技术也有一个标准DSS(Digital Signature Standard),其标准…...
type 属性的用途和实现方式(图标,表单,数据可视化,自定义组件)
1.图标类型 <uni-icon>组件中,type可以用来指定图标的不同样式。 <uni-icons type"circle" size"30" color"#007aff"></uni-icons> //表示圆形 <uni-icons type"square" size"30" co…...
PSINS工具箱学习(四)捷联惯导更新算法
原始 Markdown文档、Visio流程图、XMind思维导图见:https://github.com/LiZhengXiao99/Navigation-Learning 文章目录 一、捷联惯导更新1、insinit():初始化 ins 结构体2、ethupdate():地球自转角速度和牵连角速度更新3、insupdate():捷联惯导更新1. 速度更新2. 位置更新3.…...
P1Linux和Docker常用终端命令:保姆级图文详解
文章目录 前言1、Docker 常用命令1.1、镜像管理1.2、容器管理1.3、网络管理1.4、数据卷管理1.5、监控和性能管理 2、Linux 常用命令分类2.1、文件和目录管理2.2、用户管理2.3、系统监控和性能2.4、软件包管理2.5、网络管理 前言 亲爱的家人们,创作很不容易…...
Windows重装后NI板卡LabVIEW恢复正常
在重新安装Windows系统后,NI(National Instruments)板卡能够恢复正常工作,通常是由于操作系统的重新配置解决了之前存在的硬件驱动、兼容性或配置问题。操作系统重装后,系统重新加载驱动程序、清理了潜在的冲突或损坏的…...
深度解析统计学四大分布:Z、卡方、t 与 F 的关联与应用
统计学关键分布:Z、卡方、t、F 的关系探秘与应用指南 A/B实验系列相关文章(置顶) 1. A/B实验之置信检验(一):如何避免误判和漏报 2. A/B实验之置信检验(二):置信检验精要…...
zkServer.sh脚本
Apache ZooKeeper 几种常见的方法: 一、使用 zkServer.sh 脚本: 最常见的启动 ZooKeeper 的方式是使用提供的 zkServer.sh 脚本。此脚本可用于管理 ZooKeeper 进程。以下是一些示例命令: 1. 在前台启动 ZooKeeper: ./zkServer.s…...
CV(10)--目标检测
前言 仅记录学习过程,有问题欢迎讨论 目标检测 object detection,就是在给定的图片中精确找到物体所在位置,并标注出物体的类别;输出的是分类类别label物体的外框(x, y, width, height)。 目标检测算法:…...
UML系列之Rational Rose笔记七:状态图
一、新建状态图 依旧是新建statechart diagram; 二、工作台介绍 接着就是一个状态的开始:开始黑点依旧可以从左边进行拖动放置: 这就是状态的开始,和活动图泳道图是一样的;只能有一个开始,但是可以有多个…...
C++单例模式的设计
单例模式(Singleton Pattern)是一种设计模式,用于确保一个类只有一个实例,并提供一个全局访问点来访问该实例。在C中,单例模式通常用于管理全局资源或共享状态。 以下是C中实现单例模式的几种常见方式: 懒…...
基于springboot的自习室预订系统
作者:学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等 文末获取“源码数据库万字文档PPT”,支持远程部署调试、运行安装。 项目包含: 完整源码数据库功能演示视频万字文档PPT 项目编码࿱…...
shell笔记
1.使用 ls -l 及 find 查找某个或者多个目录文件数量时 单个目录: find 目录 -type f|wc -l与 ls -l 目录|grep -v total|wc -l 一致 多个目录:如上结果不一致,因为 ls -l 在算多目录时,会将多目录及空格打出算作额外行 find 更精…...
《鸿蒙Next微内核:解锁人工智能决策树并行计算的加速密码》
在当今人工智能飞速发展的时代,提升运算速度是推动其进步的关键。鸿蒙Next以其独特的微内核特性,为设计决策树的并行计算框架提供了新的思路和契机。 鸿蒙Next微内核特性概述 鸿蒙Next的微内核架构将核心功能模块化,仅保留进程管理、内存管…...
AI刷题-最大矩形面积问题、小M的数组变换
目录 一、最大矩形面积问题 问题描述 输入格式 输出格式 输入样例 输出样例 数据范围 解题思路: 问题理解 数据结构选择 算法步骤 最终代码: 运行结果: 二、小M的数组变换 问题描述 测试样例 解题思路: 问题…...
Redis集群部署详解:主从复制、Sentinel哨兵模式与Cluster集群的工作原理与配置
集群部署形式 1、主从复制1.1 工作机制1.2 配置实现1.3 优缺点1.4 部署形式1.5 主从复制优化 2、Sentinel 哨兵模式2.1 工作机制2.2 配置实现2.3 优缺点2.4 哨兵机制选举流程2.5 脑裂问题解决方案 3、Redis Cluster3.1 工作机制3.2 配置实现3.3 优缺点3.4 故障转移3.5 哈希槽为…...
LeetCode热题100(三十四) —— 23.合并K个升序链表
LeetCode热题100(三十四) —— 23.合并K个升序链表 题目描述代码实现思路一:选择排序(199ms)思路二:归并排序(2ms) 思路解析 你好,我是杨十一,一名热爱健身的程序员在Coding的征程中,不断探索与…...
kalilinux - 目录扫描之dirsearch
情景导入 先简单介绍一下dirsearch有啥用。 假如你现在访问一个网站,例如https://www.example.com/ 它是一个电商平台或者其他功能性质的平台。 站在开发者的角度上思考,我们只指导https://www.example.com/ 但不知道它下面有什么文件,文…...
浅谈云计算04 | 云基础设施机制
探秘云基础设施机制:云计算的基石 一、云基础设施 —— 云计算的根基二、核心机制之网络:连接云的桥梁(一)虚拟网络边界ÿ…...
文件上传 分片上传
分片上传则是将一个大文件分割成多个小块分别上传,最后再由服务器合并成完整的文件。这种做法的好处是可以并行处理多个小文件,提高上传效率;同时,如果某一部分上传失败,只需要重传这一部分,不影响其他部分…...
19c补丁后oracle属主变化,导致不能识别磁盘组
补丁后服务器重启,数据库再次无法启动 ORA01017: invalid username/password; logon denied Oracle 19c 在打上 19.23 或以上补丁版本后,存在与用户组权限相关的问题。具体表现为,Oracle 实例的运行用户(oracle)和集…...
OpenLayers 可视化之热力图
注:当前使用的是 ol 5.3.0 版本,天地图使用的key请到天地图官网申请,并替换为自己的key 热力图(Heatmap)又叫热点图,是一种通过特殊高亮显示事物密度分布、变化趋势的数据可视化技术。采用颜色的深浅来显示…...
云原生核心技术 (7/12): K8s 核心概念白话解读(上):Pod 和 Deployment 究竟是什么?
大家好,欢迎来到《云原生核心技术》系列的第七篇! 在上一篇,我们成功地使用 Minikube 或 kind 在自己的电脑上搭建起了一个迷你但功能完备的 Kubernetes 集群。现在,我们就像一个拥有了一块崭新数字土地的农场主,是时…...
iPhone密码忘记了办?iPhoneUnlocker,iPhone解锁工具Aiseesoft iPhone Unlocker 高级注册版分享
平时用 iPhone 的时候,难免会碰到解锁的麻烦事。比如密码忘了、人脸识别 / 指纹识别突然不灵,或者买了二手 iPhone 却被原来的 iCloud 账号锁住,这时候就需要靠谱的解锁工具来帮忙了。Aiseesoft iPhone Unlocker 就是专门解决这些问题的软件&…...
Springcloud:Eureka 高可用集群搭建实战(服务注册与发现的底层原理与避坑指南)
引言:为什么 Eureka 依然是存量系统的核心? 尽管 Nacos 等新注册中心崛起,但金融、电力等保守行业仍有大量系统运行在 Eureka 上。理解其高可用设计与自我保护机制,是保障分布式系统稳定的必修课。本文将手把手带你搭建生产级 Eur…...
Spring AI 入门:Java 开发者的生成式 AI 实践之路
一、Spring AI 简介 在人工智能技术快速迭代的今天,Spring AI 作为 Spring 生态系统的新生力量,正在成为 Java 开发者拥抱生成式 AI 的最佳选择。该框架通过模块化设计实现了与主流 AI 服务(如 OpenAI、Anthropic)的无缝对接&…...
SpringCloudGateway 自定义局部过滤器
场景: 将所有请求转化为同一路径请求(方便穿网配置)在请求头内标识原来路径,然后在将请求分发给不同服务 AllToOneGatewayFilterFactory import lombok.Getter; import lombok.Setter; import lombok.extern.slf4j.Slf4j; impor…...
蓝桥杯3498 01串的熵
问题描述 对于一个长度为 23333333的 01 串, 如果其信息熵为 11625907.5798, 且 0 出现次数比 1 少, 那么这个 01 串中 0 出现了多少次? #include<iostream> #include<cmath> using namespace std;int n 23333333;int main() {//枚举 0 出现的次数//因…...
Typeerror: cannot read properties of undefined (reading ‘XXX‘)
最近需要在离线机器上运行软件,所以得把软件用docker打包起来,大部分功能都没问题,出了一个奇怪的事情。同样的代码,在本机上用vscode可以运行起来,但是打包之后在docker里出现了问题。使用的是dialog组件,…...
Kafka入门-生产者
生产者 生产者发送流程: 延迟时间为0ms时,也就意味着每当有数据就会直接发送 异步发送API 异步发送和同步发送的不同在于:异步发送不需要等待结果,同步发送必须等待结果才能进行下一步发送。 普通异步发送 首先导入所需的k…...
