Python运维之多线程!!
一、多线程
二、多线程编程之threading模块
2.1、使用threading进行多线程操作有两种方法:
三、多线程同步之Lock(互斥锁)
四、多线程同步之Semaphore(信号量)
五、多线程同步之Condition
六、多线程同步之Event
七、线程优先级队列(queue)
八、多线程之线程池pool
九、总结
一、多线程
线程(Thread)也称轻量级进程,是操作系统能够运行调度的最小单位,被包含在进程中,是进程中的实际运作单位。
线程自身不拥有系统资源,只拥有一些在运行中必不可少的资源,但可与同属一个进程的其他线程共享所拥有的全部资源
一个线程可以创建和撤销另一个线程,同一进程中的多个线程之间可以并发执行
- 就绪状态指线程具备运行的所有状态,逻辑上可以运行,在等待处理机
- 运行状态指线程占有处理机正在运行
-
阻塞状态指线程在等待一个事件,逻辑上不可执行
尽管GIL(全局锁 )限制了CPython多线程在CPU密集型任务中的并行性,但Python的多线程在I/O密集型任务中依然能够发挥多核CPU的优势,通过在I/O等待期间执行其他任务来提升程序的运行效率。
实例1:计算密集型任务-多进程!!多进程!!多进程!!
from multiprocessing import Processimport os,time# 计算密集型任务def work():res = 0for i in range(100000000):res *= iif __name__ == '__main__':l = []print("本机为",os.cpu_count(),"核 CPU")start = time.time()for i in range(4):p = Process(target=work) # 多进程l.append(p)p.start()for p in l:p.join()stop = time.time()print("计算密集型任务,多进程耗时 %s" % (stop - start))'''本机为 8 核 CPU计算密集型任务,多进程耗时 5.117187976837158'''
实例1:计算密集型任务-多线程!!多线程!!多线程!!
import os,timefrom threading import Thread# 计算密集型任务def work():res = 0for i in range(100000000):res *= iif __name__ == '__main__':l = []print("本机为",os.cpu_count(),"核 CPU")start = time.time()for i in range(4):p = Thread(target=work) # 多线程l.append(p)p.start()for p in l:p.join()stop = time.time()print("计算密集型任务,多线程耗时 %s" % (stop - start))'''本机为 8 核 CPU计算密集型任务,多线程耗时 14.287675857543945'''
实例2:I/O密集型任务-多进程!!多进程!!多进程!!
from multiprocessing import Processimport os,time# I/O密集型任务def work():time.sleep(2)print("===>",file=open("tmp.txt","w"))if __name__ == '__main__':l = []print("本机为", os.cpu_count(), "核 CPU")start = time.time()for i in range(400):p = Process(target=work) # 多进程l.append(p)p.start()for p in l:p.join()stop = time.time()print("I/O密集型任务,多进程耗时 %s" % (stop - start))'''本机为 8 核 CPUI/O密集型任务,多进程耗时 11.03010869026184'''
实例2:I/O密集型任务-多线程!!多线程!!多线程!!
import os,timefrom threading import Thread# I/O密集型任务def work():time.sleep(2)print("===>",file=open("tmp.txt","w"))if __name__ == '__main__':l = []print("本机为", os.cpu_count(), "核 CPU")start = time.time()for i in range(400):p = Thread(target=work) # 多线程l.append(p)p.start()for p in l:p.join()stop = time.time()print("I/O密集型任务,多线程耗时 %s" % (stop - start))'''本机为 8 核 CPUI/O密集型任务,多线程耗时 2.0814177989959717'''
结论:在Python中,对于密集型任务,多进程占优势;对于I/O密集型任务,多线程占优势。
二、多线程编程之threading模块
Python提供多线程编程的模块有两个:thread和threading。thread模块提供低级别的基本功能来支持,提供简单的锁来确保同步(不推荐)。threading模块对_thread进行了封装,提供了更高级别,功能更强。
2.1、使用threading进行多线程操作有两种方法:
方法一:创建threading.Thread类的实例,调用其start()方法
import timeimport threadingdef task_thread(counter):print(f'线程名称:{threading.current_thread().name} 参数:{counter} 开始时间:{time.strftime("%Y-%m-%d %H:%M:%S")}')num = counterwhile num:time.sleep(3)num -= 1print(f'线程名称:{threading.current_thread().name} 参数:{counter} 结束时间:{time.strftime("%Y-%m-%d %H:%M:%S")}')if __name__ == '__main__':print(f'主线程开始时间:{time.strftime("%Y-%m-%d %H:%M:%S")}')# 初始化三个线程,传递不同的参数t1 = threading.Thread(target=task_thread,args=(3,))t2 = threading.Thread(target=task_thread,args=(2,))t3 = threading.Thread(target=task_thread,args=(1,))# 开启三个线程t1.start();t2.start();t3.start()# 等待运行结束t1.join();t2.join();t3.join()print(f'主线程结束时间:{time.strftime("%Y-%m-%d %H:%M:%S")}')'''程序实例化了三个Thread类的实例,并任务函数传递不同的参数,使他们运行不同的时间后结束,start()方法开启线程,join()方法阻塞主线程,等待当前线程运行结束。'''
方法二:继承Thread类,在子类中重写run()和init()方法*(了解---)
import timeimport threadingclass MyThread(threading.Thread):def __init__(self,counter):super().__init__()self.counter = counterdef run(self):print(f'线程名称:{threading.current_thread().name} 参数:{self.counter} 开始时间:{time.strftime("%Y-%m-%d %H:%M:%S")}')counter = self.counterwhile counter:time.sleep(3)counter -= 1print(f'线程名称:{threading.current_thread().name} 参数:{self.counter} 结束时间:{time.strftime("%Y-%m-%d %H:%M:%S")}')if __name__ == '__main__':print(f'主线程开始时间:{time.strftime("%Y-%m-%d %H:%M:%S")}')# 初始化三个线程,传递不同的参数t1 = MyThread(3)t2 = MyThread(2)t3 = MyThread(1)# 开启三个线程t1.start();t2.start();t3.start()# 等待运行结束t1.join();t2.join();t3.join()print(f'主线程结束时间:{time.strftime("%Y-%m-%d %H:%M:%S")}')
如果继承Thread类,想要调用外部函数:
import timeimport threadingdef task_thread(counter):print(f'线程名称:{threading.current_thread().name} 参数:{counter} 开始时间:{time.strftime("%Y-%m-%d %H:%M:%S")}')num = counterwhile num:time.sleep(3)num -= 1print(f'线程名称:{threading.current_thread().name} 参数:{counter} 结束时间:{time.strftime("%Y-%m-%d %H:%M:%S")}')class MyThread(threading.Thread):def __init__(self,target,args):super().__init__()self.args = argsself.target = targetdef run(self):self.target(*self.args)if __name__ == '__main__':print(f'主线程开始时间:{time.strftime("%Y-%m-%d %H:%M:%S")}')# 初始化三个线程,传递不同的参数t1 = MyThread(target=task_thread,args=(3,))t2 = MyThread(target=task_thread,args=(2,))t3 = MyThread(target=task_thread,args=(1,))# 开启三个线程t1.start();t2.start();t3.start()# 等待运行结束t1.join();t2.join();t3.join()print(f'主线程结束时间:{time.strftime("%Y-%m-%d %H:%M:%S")}')
三、多线程同步之Lock(互斥锁)
如果多个线程共同对某个数据修改,则可能出现不可预料的结果,这个时候就需要使用互斥锁来进行同步。例如:在三个线程对共同变量num进行100万次加减操作后,其num的结果不为0
不加锁的意外情况:
import time,threadingnum = 0def task_thread(n):global numfor i in range(1000000):num = num + nnum = num - nt1 = threading.Thread(target=task_thread,args=(6,))t2 = threading.Thread(target=task_thread,args=(17,))t3 = threading.Thread(target=task_thread,args=(11,))t1.start();t2.start();t3.start()t1.join();t2.join();t3.join()print(num)'''6'''
使用互斥锁对多个线程进行同步,限制当一个线程正在访问数据时,其他只能等待,直到前一线程释放锁。
使用threading.Thread对象的Lock和Rlock可以实现简单的线程同步,都有acquire和release方法。
# 加互斥锁后运行结果始终一致import time,threadingnum = 0lock = threading.Lock()def task_thread(n):global num# 获取锁,用于线程同步lock.acquire()for i in range(1000000):num = num + nnum = num - n# 释放锁,开启下一个线程lock.release()t1 = threading.Thread(target=task_thread,args=(6,))t2 = threading.Thread(target=task_thread,args=(17,))t3 = threading.Thread(target=task_thread,args=(11,))t1.start();t2.start();t3.start()t1.join();t2.join();t3.join()print(num)
四、多线程同步之Semaphore(信号量)
互斥锁是只允许一个线程访问共享数据,而信号量是同时运行一定数量的线程访问共享数据,比如银行柜台有5个窗口,运行同时有5个人办理业务,后面的人只能等待其完成。
# 使用信号量控制并发import threadingimport time# 银行柜台窗口数量NUM_WINDOWS = 5# 用于控制窗口访问的信号量semaphore = threading.Semaphore(NUM_WINDOWS)# 客户办理业务的函数def customer(name, service_time):# 尝试获取信号量semaphore.acquire()print(f"{time.ctime()}: {name} 开始办理业务")time.sleep(service_time) # 模拟办理业务的时间print(f"{time.ctime()}: {name} 办理业务完成")semaphore.release() # 释放信号量# 创建客户线程列表customers = []for i in range(12):name = f"客户{i+1}"service_time = 3 # 假设每个客户办理业务需要1秒时间thread = threading.Thread(target=customer, args=(name, service_time))customers.append(thread)# 启动所有客户线程for customer in customers:customer.start()# 等待所有客户完成业务for customer in customers:customer.join()print("所有客户都办理完业务了。")
上述代码实现了同一时刻只有5个线程获得资源运行
五、多线程同步之Condition
条件对象Condition能让一个线程A停下来,等待其他线程B,线程B满足了某个条件后通知线程A继续运行。步骤:
线程首先获取一个条件变量锁,如果条件不足,则该线程等待(wait)并释放条件变量锁;如果条件满足,就继续执行线程,执行完成后可以通知(notify)其他状态为wait的线程执行。其他处于wait状态的线程接到通知后会重新判断条件来确定是否继续执行
import threadingclass Boy(threading.Thread):def __init__(self,cond,name):super(Boy,self).__init__()self.cond = condself.name = namedef run(self):self.cond.acquire()print(self.name + ":嫁给我吧!?")self.cond.notify() # 唤醒一个挂起的线程,让hanmeimei表态self.cond.wait() # 释放内部所占用的锁,同时线程被挂起,直至接收到通知被唤醒或超时,等待heimeimei回答print(self.name + ": 我单膝下跪,送上戒指!")self.cond.notify()self.cond.wait()print(self.name + ": lI太太,你的选择太明智了。")self.cond.release()class Girl(threading.Thread):def __init__(self,cond,name):super(Girl,self).__init__()self.cond = condself.name = namedef run(self):self.cond.acquire()self.cond.wait() # 等待Lilei求婚print(self.name + ": 没有情调,不够浪漫,不答应")self.cond.notify()self.cond.wait()print(self.name + ": 好吧,答应你了")self.cond.notify()self.cond.release()cond = threading.Condition()boy = Boy(cond,"LiLei")girl = Girl(cond,"HanMeiMei")girl.start()boy.start()
六、多线程同步之Event
事件用于线程之间的通信。一个线程发出一个信号,其他一个或多个线程等待,调用Event对象的wait方法,线程则会阻塞等待,直到别的线程set之后才会被唤醒。与上述类似
import threadingimport timeclass Boy(threading.Thread):def __init__(self,cond,name):super(Boy,self).__init__()self.cond = condself.name = namedef run(self):print(self.name + ":嫁给我吧!?")self.cond.set() # 唤醒一个挂起的线程,让hanmeimei表态time.sleep(0.5)self.cond.wait() # 释放内部所占用的锁,同时线程被挂起,直至接收到通知被唤醒或超时,等待heimeimei回答print(self.name + ": 我单膝下跪,送上戒指!")self.cond.set()time.sleep(0.5)self.cond.wait()self.cond.clear()print(self.name + ": lI太太,你的选择太明智了。")class Girl(threading.Thread):def __init__(self,cond,name):super(Girl,self).__init__()self.cond = condself.name = namedef run(self):self.cond.wait() # 等待Lilei求婚self.cond.clear()print(self.name + ": 没有情调,不够浪漫,不答应")self.cond.set()time.sleep(0.5)self.cond.wait()print(self.name + ": 好吧,答应你了")self.cond.set()cond = threading.Event()boy = Boy(cond,"LiLei")girl = Girl(cond,"HanMeiMei")girl.start()boy.start()
七、线程优先级队列(queue)
Python的queue模块中提供了同步的、线程安全的队列类,包括先进先出队列Queue、后进先出队列LifoQueue和优先级队列PriorityQueue。这些队列都实现了锁原语,可以直接使用来实现线程之间的同步。
'''有一小冰箱用来存放冷饮,假如只能放5瓶冷饮,A不停地放冷饮,B不停的取冷饮,A和B的放取速度不一致,如何保持同步呢?'''import threading,timeimport queue# 先进先出q = queue.Queue(maxsize=5)# q = LifoQuere(maxsize=3)# q = PriorityQueue(maxsize=3)def ProducerA():count = 1while True:q.put(f"冷饮 {count}")print(f"{time.strftime('%H:%M:%S')} A 放入:[冷饮 {count}]")count += 1time.sleep(2)def ConsumerB():while True:print(f"{time.strftime('%H:%M:%S')} B 取出:{q.get()}")time.sleep(5)p = threading.Thread(target=ProducerA)c = threading.Thread(target=ConsumerB)p.start()c.start()
八、多线程之线程池pool
将 任务添加到线程池中,线程池会自动指定一个空闲的线程去执行任务,当超过线程池的最大线程数时,任务需要等待有新的空闲线程后才会被执行。
使用threading模块及queue模块定制线程池,可以使用multiprocessing。
-
from multiprocessing import Pool导入的是进程池
-
from multiprocessing.dummy import Pool导入的是线程池
'''模拟一个耗时2秒的任务,比较其顺序执行5次和线程池(并发数为5)执行的耗时。'''from multiprocessing.dummy import Pool as ThreadPoolimport timedef fun(n):time.sleep(2)start = time.time()for i in range(5):fun(i)print("单线程顺序执行耗时:",time.time() - start)start2 = time.time()# 开8个worker,没有参数时默认是cpu的核心数pool = ThreadPool(processes=5)# 在线程中执行urllib2.urlopen(url)并返回执行结果results2 = pool.map(fun,range(5))pool.close()pool.join()print("线程池(5)并发执行耗时:",time.time() - start2)'''单线程顺序执行耗时: 10.041245937347412线程池(5)并发执行耗时: 2.0453202724456787'''
九、总结
- Python多线程适合用在I/O密集型任务中。
- 对于I/O密集型任务来说,较少时间用在CPU计算上,较多时间用在I/O上,如文件读写、web请求、数据库请求等
-
对于计算密集型任务,应该使用多进程
相关文章:

Python运维之多线程!!
一、多线程 二、多线程编程之threading模块 2.1、使用threading进行多线程操作有两种方法: 三、多线程同步之Lock(互斥锁) 四、多线程同步之Semaphore(信号量) 五、多线程同步之Condition 六、多线程同步之Event…...
milvus插入数据时,明明不超长,但总是报长度错误?
在处理插入milvus数据时,设置了字段长度为512. 明明考虑了预留,插入的数据中没有这么长的,但还是会有报错 类似:MilvusException: (code0, messagethe length (564) of 78th string exceeds max length (512) 查找max(len(x) for …...

怎么把图片大小缩小到1M?教你几招图片你压缩
当我们的图片数量越来越多的时候,占用的内存也就越来越多,时间长了之后,会导致我们空间不足或者设备比较卡顿,为了缓解这个问题,很多人会选择去删除一些不必要的图片文件,其实还有个方法就是利用图片压缩的…...
python数据分析常见命令
前言 近些天我会整理一些我平时清理csv,excel数据经常用的常见命令来分享给大家学习,大家一起加油! 第一个命令:引入pandas库 pandas库是一个开源的数据分析工具,主要用于数据处理和数据分析。 import pandas as pd 第二个命令…...

等保测评技术方案(五)
(八)漏洞扫描方案 1.参与人员 乙方工程师:谭 然、张 剑等。 范围经过双方确认,此次评估的对象包括: 2.网络设备 IP 地址 设备型号 备注 / / / / / / 以现场测评实际数据为准 3.应用系统 地址 …...
Redis缓存的基本概念和使用
Redis缓存的基本概念和使用 什么是缓存Redis缓存缓存更新策略缓存穿透缓存雪崩缓存击穿缓存工具类封装 什么是缓存 缓存时数据交换的缓冲区,存储数据的临时区,读写性能较好。 例如计算机的三级缓存。CPU的计算速度超过内存的读写速度,为了平…...

MATLAB模拟退火算法、遗传算法、蚁群算法、粒子群算法
概况 模拟退火算法、遗传算法、蚁群算法、粒子群算法等算法,都是属于概率算法,不绝对,不迅速,能用其它方式解决的问题,不要用这些相对复杂的算法,比如有明确的线性关系或者非线性对应关系。这里的概率算法…...
git自用随笔
push失败 因为远程比本地新,要拉到本地进行合并。git pull拉取,拉取失败,本地分支没有和远程链接,使用git branch --set-upstream-toorigin/<branch> dev进行链接,链接后再次pull,pull提示合并冲突&a…...

CorelDRAW2024设计界的隐藏宝藏
CorelDRAW 2024是一款专业的平面设计软件,被广泛地应用于各类设计领域。它的功能强大、操作简便,是许多设计师的得力助手。在本文中,我们将详细解析这款软件的核心特性以及其在实际应用中的表现。 CDR永久版安装包百度云分享下载如下点击获取…...
【JAVA】递归
接着上一讲继续,内容不多,讲解一下递归相关内容。 1. 生活中的故事 从前有坐山,山上有座庙,庙里有个老和尚给小和尚将故事,讲的就是: "从前有座山,山上有座庙,庙里有个老和尚…...

MacOS java多版本安装与管理
Home - SDKMAN! the Software Development Kit Manager # 安装sdkman curl -s "https://get.sdkman.io" | bashsource "$HOME/.sdkman/bin/sdkman-init.sh"sdk version正常出现sdkman版本号就安装成功了 # 安装java # 安装java8 sdk install java 8.0…...

NSSCTF | [LitCTF 2023]我Flag呢?
这道题没啥好说的,题目标签为源码泄露,我们直接CtrlU查看网页源码就能在最后找到flag 本题完...
PostgreSQL-常用函数和操作符
PostgreSQL 中文社区 PL/pgSQL 是 PostgreSQL 中的一种存储过程语言,它支持许多常用的函数和操作符。下面列举了一些常用的 PL/pgSQL 函数和操作符: 1. 常用函数: RAISE:用于在存储过程中抛出异常。 RAISE EXCEPTION Error oc…...

河南大学大礼堂火灾事故引发安防监控对智能分析技术应用的思考
一、方案背景 2024年5月2日,在修缮施工期间的河南大学河南留学欧美预备学校旧址大礼堂发生火情。现场航拍画面显示,大礼堂经过火灾,房顶已经基本坍塌,被火烧过的建筑呈焦黑状。 公开资料显示,大礼堂属河南留学欧美预…...

自动化中遇到的问题归纳总结
1、动态元素定位不到 解决方法:尽量使用固定元素定位,如没有固定元素,则采用绝对路径进行定位,因为元素路径是唯一且不变的 2、自动化脚本执行速度较慢 尽量使用css方法定位元素,使用等待时,少用sleep方…...

UE4_照亮环境_不同雾效的动态切换
一、问题及思路: 我们在一个地图上,经常切换不同的区域,不同的区域可能需要不同的色调,例如暖色调的野外或者幽暗的山洞,这两种环境上,雾效的选用肯定不一样,夕阳西下的户外用的就是偏暖的色调&…...

【解决】Android APK文件安装时 已包含数字签名相同APP问题
引言 在开发Android程序过程中,编译好的APK文件,安装至Android手机时,有时会报 包含数字签名相同的APP 然后无法安装的问题,这可能是之前安装过同签名的APP,但是如果不知道哪个是,无法有效卸载,…...

layui的treeTable组件,多层级上传按钮失效的问题解决
现象描述: layui的treeTable 的上传按钮在一层能用,展开后其他按钮正常点击,上传按钮无效。 具体原因没有深究,大概率是展开的子菜单没有被渲染treeTable的done管理到,导致没有重绘上传按钮。 解决方案: 不使用layu的上传组件方法…...
HashMap在JDK1.8的优化
目录 数据结构上的优化 Hash碰撞问题解决方案的优化 Hash值算法的优化...
Kotlin标准函数和静态方法
标准函数 with 第一个参数是一个类型或者对象,第二个参数是lambda表达式。其中第一个参数为第二个参数提供上下文,返回值是最后一行。案例代码: fun main() {val list mutableListOf<String>()var ret with(list) {add("1&q…...
脑机新手指南(八):OpenBCI_GUI:从环境搭建到数据可视化(下)
一、数据处理与分析实战 (一)实时滤波与参数调整 基础滤波操作 60Hz 工频滤波:勾选界面右侧 “60Hz” 复选框,可有效抑制电网干扰(适用于北美地区,欧洲用户可调整为 50Hz)。 平滑处理&…...

2025年能源电力系统与流体力学国际会议 (EPSFD 2025)
2025年能源电力系统与流体力学国际会议(EPSFD 2025)将于本年度在美丽的杭州盛大召开。作为全球能源、电力系统以及流体力学领域的顶级盛会,EPSFD 2025旨在为来自世界各地的科学家、工程师和研究人员提供一个展示最新研究成果、分享实践经验及…...

Python:操作 Excel 折叠
💖亲爱的技术爱好者们,热烈欢迎来到 Kant2048 的博客!我是 Thomas Kant,很开心能在CSDN上与你们相遇~💖 本博客的精华专栏: 【自动化测试】 【测试经验】 【人工智能】 【Python】 Python 操作 Excel 系列 读取单元格数据按行写入设置行高和列宽自动调整行高和列宽水平…...

【入坑系列】TiDB 强制索引在不同库下不生效问题
文章目录 背景SQL 优化情况线上SQL运行情况分析怀疑1:执行计划绑定问题?尝试:SHOW WARNINGS 查看警告探索 TiDB 的 USE_INDEX 写法Hint 不生效问题排查解决参考背景 项目中使用 TiDB 数据库,并对 SQL 进行优化了,添加了强制索引。 UAT 环境已经生效,但 PROD 环境强制索…...

vscode(仍待补充)
写于2025 6.9 主包将加入vscode这个更权威的圈子 vscode的基本使用 侧边栏 vscode还能连接ssh? debug时使用的launch文件 1.task.json {"tasks": [{"type": "cppbuild","label": "C/C: gcc.exe 生成活动文件"…...
大语言模型如何处理长文本?常用文本分割技术详解
为什么需要文本分割? 引言:为什么需要文本分割?一、基础文本分割方法1. 按段落分割(Paragraph Splitting)2. 按句子分割(Sentence Splitting)二、高级文本分割策略3. 重叠分割(Sliding Window)4. 递归分割(Recursive Splitting)三、生产级工具推荐5. 使用LangChain的…...

定时器任务——若依源码分析
分析util包下面的工具类schedule utils: ScheduleUtils 是若依中用于与 Quartz 框架交互的工具类,封装了定时任务的 创建、更新、暂停、删除等核心逻辑。 createScheduleJob createScheduleJob 用于将任务注册到 Quartz,先构建任务的 JobD…...

江苏艾立泰跨国资源接力:废料变黄金的绿色供应链革命
在华东塑料包装行业面临限塑令深度调整的背景下,江苏艾立泰以一场跨国资源接力的创新实践,重新定义了绿色供应链的边界。 跨国回收网络:废料变黄金的全球棋局 艾立泰在欧洲、东南亚建立再生塑料回收点,将海外废弃包装箱通过标准…...

跨链模式:多链互操作架构与性能扩展方案
跨链模式:多链互操作架构与性能扩展方案 ——构建下一代区块链互联网的技术基石 一、跨链架构的核心范式演进 1. 分层协议栈:模块化解耦设计 现代跨链系统采用分层协议栈实现灵活扩展(H2Cross架构): 适配层…...
spring:实例工厂方法获取bean
spring处理使用静态工厂方法获取bean实例,也可以通过实例工厂方法获取bean实例。 实例工厂方法步骤如下: 定义实例工厂类(Java代码),定义实例工厂(xml),定义调用实例工厂ÿ…...