当前位置: 首页 > news >正文

进程池,线程池与跨进程数据共享爬取某岸网图片

看教程的时候看到一个,生产者跟消费者的概念比较有意思,但是给的代码有问题无法正常运行,于是我就捣鼓了一下。
基本概念就是:
                        生产者:     一个进程获取网页没页的图片连接(主进程)
                        消费者:        一个进程下载图片,不同的是每个页面有20张图片,所以在进程中又开了二十线程(子进程)
嗯,概念就是这样接下来看代码

# -*- coding: utf-8 -*-
# @Time :2023/9/30 22:46
# [url=home.php?mod=space&uid=686208]@AuThor[/url]  : 
# @FileName :进程池.线程池配合使用与进程共用变量的使用.py
# [url=home.php?mod=space&uid=2097534]@IED[/url] :PyCharm""""""
import multiprocessing
import requests
import os
from concurrent.futures import ThreadPoolExecutor
from lxml import etreepath = r'D:\img'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) ''AppleWebKit/537.36 (KHTML, like Gecko) ''Chrome/117.0.0.0 Safari/537.36'
}# 获取图片地址
def get_url(url, que):resp = requests.get(url, headers=headers)resp.encoding = resp.apparent_encodingdate = resp.texttree = etree.HTML(date)list_url = tree.xpath('//ul[@class="clearfix"]/li/a')for i in list_url:url_img = i.xpath('./img/@src')que.put('https://pic.netbian.com' + str(*url_img))  # put写入进程变量队列中resp.close()#  下载并保存图片
def download_ove(url, name):try:resp = requests.get(url, headers=headers)path_img = os.path.join(path, f'{name.value}.jpg')with open(path_img, 'wb') as f:f.write(resp.content)print(f'保存成功{name.value}.jpg')name.value += 1  # 数值型进程变量自增except Exception as ex:print('下载出错', ex)#  获取进程队列中的url并启用线程池下载保存图片
def download_img(que, name):# 创建线程池,指定20个线程处理数据with ThreadPoolExecutor(20) as t:while True:try:s = que.get(timeout=3)  # 获取进程队列中的数据,等待3秒若是还没获取到数据抛出异常t.submit(download_ove, s, name)  # 添加进线程池# t.submit(download_ove, s).add_done_callback(err_call_back)  #  获取线程池异常except Exception as ec:print(ec)break#  接收进程池与线程池异常的回调函数
def err_call_back(err):print(f'出错啦~ error:{str(err)}')if __name__ == '__main__':if not os.path.exists(path):os.mkdir(path)que = multiprocessing.Manager().Queue()  # 创建一个进程之间共享的队列变量name = multiprocessing.Manager().Value('i', 0)  # 创建一个进程之间共享的数值型变量,'i'表示整型数字,0表示从0开始for i in range(1, 4):if i != 1:url = f'https://pic.netbian.com/4kdongman/index_{i}.html'else:url = 'https://pic.netbian.com/4kdongman/'get_url(url, que)#  创建进程池,并将函数添加到进程池内,指定最多开辟1个进程处理数据(开多了怕把网址玩崩)with multiprocessing.Pool(1) as pool:pool.apply(download_img, args=(que, name))  # 将函数以同步的方式添加进进程池# apply_async异步方式无法使用不知道为啥,不报异常也不运行download_img函数# pool.apply_async(download_img, args=(que, name), error_callback=err_call_back)pool.close()  # 结束进程池,不在往内添加数据pool.join()  # 等待进程池运行结束print('结束')

本代码仅作为练习所用,大家别把人家网站搞崩了。

相关文章:

进程池,线程池与跨进程数据共享爬取某岸网图片

看教程的时候看到一个,生产者跟消费者的概念比较有意思,但是给的代码有问题无法正常运行,于是我就捣鼓了一下。 基本概念就是: 生产者: 一个进程获取网页没页的图片连接(主进程…...

【 图片加载】Vue前端各种图片引用

文章目录 一、图片作为js常量(常作为配置项的值 )1、在线链接2、本地图片 二、图片img标签1、一般的src2、动态的src用require3、src可以接收二进制文件blob(如后端返回的、a-upload传的图片) 三、背景图片 一、图片作为js常量(常…...

thinkphp6生成PDF自动换行

composer安装 composer require tecnickcom/tcpdf 示例 use TCPDF;public function info($university,$performance,$grade,$major){//获取到当前域名$domain request()->domain();//实例化$pdf new TCPDF(P, mm, A4, true, UTF-8, false);// 设置文档信息$pdf->SetCr…...

wpf devexpress实现输入验证使用验证规则

打开此项目 目标是一个registration form行为像google registration form。打开Google registration form 研究它的行为。当form是第一次显示,它的“Register”按钮应该启动;编辑器没有提示任何输入错误。输入First Name编辑器字段,清理输入…...

Vue表单的整体处理

在前端的处理中&#xff0c;表单的处理永远是占高比例的。在BOMDOMjs的时候是这样&#xff0c;在Vue的时候也是这样。Vue的表单处理做了特别的优化&#xff0c;如值绑定、数据验证、错误提示、修饰符等。 表单组件的示例&#xff1a; <script setup lang"ts">…...

探索实人认证API:保障在线交互安全的关键一步

前言 在数字化时代&#xff0c;随着人们生活的日益数字化&#xff0c;各种在线服务的普及&#xff0c;安全性成为用户体验的至关重要的一环。特别是在金融、电商、社交等领域&#xff0c;确保用户身份的真实性显得尤为重要。而实人认证API作为一种先进的身份验证技术&#xff…...

XDR 网络安全:技术和最佳实践

扩展检测和响应&#xff08;XDR&#xff09;是一种安全方法&#xff0c;它将多种保护工具集成到一个统一的集成解决方案中。它为组织提供了跨网络、端点、云工作负载和用户的广泛可见性&#xff0c;从而实现更快的威胁检测和响应。 XDR的目标是提高威胁检测的速度和准确性&…...

【如何学习Python自动化测试】—— 警告框处理

7 、 警告框处理 在 web 中&#xff0c;除了上面提到的元素和操作之外&#xff0c;还有就是页面的提示框的处理了&#xff0c;页面的警告框通常分为这几类 js&#xff1a;alert 、 confirm 以及 prompt&#xff0c;这些警告框&#xff0c;我们都可以通过 switch_to_alert()来处…...

Jenkins Ansible 参数构建

首先在Jenkins中创建自由项目 在web端配置完成后在另一台机子上下载nginx 在gitlab端创建项目并创建文件配置代码 在有Jenkins的机器上下载Ansible [rootslave1 ~]# yum -y install epel-release [rootslave1 ~]# yum -y install ansible再进入下载nginx机器中克隆gitlab项目…...

第十五届蓝桥杯(Web 应用开发)模拟赛 1 期-大学组(详细分析解答)

目录 1.动态的Tab栏 1.1 题目要求 1.2 题目分析 1.3 源代码 2.地球环游 2.1 题目要求 2.2 题目分析 2.3 源代码 3.迷惑的this 3.1 题目要求 3.2 题目分析 3.3 源代码 4.魔法失灵了 4.1 题目要求 4.2 题目分析 4.3 源代码 5.燃烧你的卡路里 5.1 题目要求 5.2…...

2023亚太杯数学建模B题思路+模型+代码+论文

2023亚太地区数学建模A题思路&#xff1a;开赛后第一时间更新&#xff0c;获取见文末 名片 2023亚太地区数学建模B题思路&#xff1a;开赛后第一时间更新&#xff0c;获取见文末 名片 2023亚太地区数学建模C题思路&#xff1a;开赛后第一时间更新&#xff0c;获取见文末 名片…...

GitHub 报告发布:TypeScript 取代 Java 成为第三受欢迎语言

GitHub发布的2023年度Octoverse开源状态报告发布&#xff0c;研究围绕AI、云和Git的开源活动如何改变开发人员体验&#xff0c;以及在开发者和企业中产生的影响。报告发现了三大趋势&#xff1a; 1、生成式AI的广泛应用&#xff1a; 开发人员大量使用生成式AI进行构建。越来越…...

配置hikari数据库连接池时多数据源不生效

1.原始配置&#xff0c;改造前&#xff1a; spring:# 配置数据源信息datasource:dynamic:#设置默认的数据源或者数据源组,默认值即为masterprimary: masterstrict: truedatasource:#这里采用了配置文件取值的方式&#xff0c;可以直接替换为数据库连接master:url: jdbc:postgr…...

matlab 最小二乘拟合平面并与XOY平面对齐

目录 一、算法原理二、代码实现1、绕原点对齐2、绕质心对齐三、结果展示1、绕原点对齐2、绕质心对齐四、测试数据本文由CSDN点云侠原创,原文链接。爬虫网站自重。如果你不是在点云侠的博客中看到该文章,那么此处便是不要脸的爬虫。 一、算法原理 首先,使用最小二乘拟合平面…...

jQuery【回到顶部、Swiper轮播图、立即执行函数、链式调用、参数重载、jQuery扩展】(六)-全面详解(学习总结---从入门到深化)

目录 回到顶部 Swiper轮播图 jQuery源码_立即执行函数 jQuery源码_链式调用 jQuery源码_参数重载 jQuery扩展 回到顶部 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Compati…...

day60

choice参数 1.引入 以一张信息表为例 性别 学历 工作经验 是否婚配 是否生子 客户来源 ... 针对某个可以列举完全的可能性字段&#xff0c;我们应该如何存储 只要某个字段的可能性时列举完全的&#xff0c;那么一般情况下都会采用choice参数 2.数据准备 from random imp…...

thingsboard的WebSocket API的使用

1、参考文档 Working with telemetry data | ThingsBoard Community Edition 2、订阅的命令 我们需要订阅不同的数据,那么该如何来填写参数呢,你需要参考后端代码 TelemetryPluginCmdsWrapper 以及订阅返回的结果参考类:TelemetrySubscriptionUpdate 链接地址: https:/…...

An issue was found when checking AAR metadata

一、报错信息 An issue was found when checking AAR metadata:1. Dependency androidx.activity:activity:1.8.0 requires libraries and applications that depend on it to compile against version 34 or later of the Android APIs.:app is currently compiled against …...

搭建线上jvm监控

这里写目录标题 Springboot项目配置maven依赖application.properties添加监控JVM的配置类启动springboot项目 Prometheus配置配置grafana Springboot项目配置 maven依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring…...

【计算机网络笔记】数据链路层概述

系列文章目录 什么是计算机网络&#xff1f; 什么是网络协议&#xff1f; 计算机网络的结构 数据交换之电路交换 数据交换之报文交换和分组交换 分组交换 vs 电路交换 计算机网络性能&#xff08;1&#xff09;——速率、带宽、延迟 计算机网络性能&#xff08;2&#xff09;…...

Docker+WASM双引擎边缘架构设计(附eBPF流量调度代码):单集群支撑500+异构边缘节点的实战验证

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;DockerWASM双引擎边缘架构设计概览 在资源受限、低延迟敏感的边缘计算场景中&#xff0c;单一容器运行时已难以兼顾安全性、启动速度与跨平台兼容性。DockerWASM双引擎架构应运而生——它将 Docker 的成…...

real-anime-z惊艳效果展示:8K细节、光影质感与角色神态真实呈现

real-anime-z惊艳效果展示&#xff1a;8K细节、光影质感与角色神态真实呈现 1. 模型简介 real-anime-z是基于Z-Image的LoRA版本开发的文生图模型&#xff0c;专注于生成具有真实感的动画风格图片。这个模型通过Xinference部署&#xff0c;并提供了Gradio交互界面&#xff0c;…...

项目实训——Werewolf-Agent 多智能体狼人杀中DSPy应用优化器优化

一、前言 上周&#xff0c;我在我们的项目中引入了dspy并使用它进行一个简单的测试&#xff0c;在测试过程中&#xff0c;我进行了几局游戏&#xff0c;发现预言家每次的输出结果都相差不大&#xff0c;这让我在玩起来比较无趣&#xff0c;因为在每个阶段&#xff0c;我都可以…...

RAGFlow · 第 3 章:第一节 RAGFlow 配置参数全景图与实验结论

系列导航 第 0 章 前言&#xff1a;为什么企业 AI 工程师必须掌握 RAGFlow第 1 章&#xff1a;安装部署与基础配置**——从零跑通第一个 RAG Pipeline第 2 章&#xff1a;RAGFlow RAGFlow 代码介绍第 3 章&#xff1a;攻克企业复杂文档——理解 DeepDoc、Naive、MinerU 与 Docl…...

Mysql的源码编译

1.下载安装包wget https://downloads.mysql.com/archives/get/p/23/file/mysql-boost-8.3.0.tar.gz2.源码编译​ [rootmysql-node1 ~]# dnf install cmake3 gcc git bison openssl-devel ncurses-devel systemd-devel rpcgen.x86_64 libtirpc-devel-1.3.3-9.el9.x86_64.rpm gc…...

PlainUSR:轻量实时图像超分(RepMBCConv + LIA + PlainU-Net)

文章目录PlainUSR&#xff1a;轻量实时图像超分&#xff08;RepMBCConv LIA PlainU-Net&#xff09;一、架构二、环境三、数据 (DIV2K)四、模型4.1 RepMBCConv (重参数化轻量卷积)4.2 LIA (局部重要性注意力)4.3 PlainU-Net PlainUSR五、训练训练曲线六、推理 重参数化七、…...

Arm A-profile架构内存管理与原子操作优化解析

1. Arm A-profile架构内存管理机制解析作为现代处理器架构的核心子系统&#xff0c;内存管理单元(MMU)的设计直接影响着系统的安全性、隔离性和性能表现。Arm A-profile架构通过多级页表转换和细粒度访问控制&#xff0c;为从嵌入式系统到云计算平台的各种应用场景提供了灵活的…...

Rswag DSL深度解析:如何用简洁语法描述复杂API操作和响应

Rswag DSL深度解析&#xff1a;如何用简洁语法描述复杂API操作和响应 【免费下载链接】rswag Seamlessly adds a Swagger to Rails-based APIs 项目地址: https://gitcode.com/gh_mirrors/rs/rswag Rswag是一个为Rails API无缝添加Swagger支持的强大工具&#xff0c;其核…...

Redis缓存雪崩、穿透、击穿:成因、解决方案与代码实现

Redis缓存雪崩、穿透、击穿&#xff1a;成因、解决方案与代码实现 在现代高并发系统中&#xff0c;Redis作为高性能缓存被广泛应用&#xff0c;但缓存雪崩、穿透和击穿问题可能引发系统崩溃。本文将深入分析这三种问题的成因&#xff0c;并提供实用的解决方案与代码实现&#…...

HarmonyOS APP开发之玩透 postCardAction 的三大通信心法

玩透 postCardAction 的三大通信心法做鸿蒙 UI 开发的兄弟&#xff0c;只要碰过服务卡片&#xff08;Service Widget&#xff09;&#xff0c;多半都经历过这样一种“血压飙升”的时刻&#xff1a;产品经理想要在卡片上做一个简单的按钮交互&#xff0c;你顺手写了个点击事件&a…...