可狱可囚的爬虫系列课程 13:Requests使用代理IP
一、什么是代理 IP
代理 IP(Proxy IP)是一个充当“中间人”的服务器IP地址,用于代替用户设备(如电脑、手机等)直接与目标网站或服务通信。用户通过代理IP访问互联网时,目标网站看到的是代理服务器的IP地址,而非用户的真实IP地址。
二、主要用途
- 隐藏真实IP:保护用户隐私,防止真实地理位置或网络身份被追踪。
- 绕过访问限制:访问某些地区或网络环境限制的内容(如流媒体、社交媒体)。
- 提高安全防护:在公共Wi-Fi等不安全网络中,代理可提供额外的隐私保护。
- 网络爬虫/自动化:通过切换不同代理IP,避免因频繁访问被封禁。
- 企业网络管理:企业可通过代理统一管理员工上网行为或缓存数据。
三、代理类型
- 数据中心代理:来自数据中心的IP,速度快但易被识别。
- 住宅代理:模拟真实家庭IP,更难被封锁。
- 透明代理:不隐藏用户IP,仅用于缓存或过滤内容。
四、注意事项
- 合法合规:某些国家/平台禁止使用代理访问特定内容,需遵守法律法规。
- 信任风险:低质量代理可能记录用户数据,建议选择可信服务商。
- 速度影响:代理服务器距离或负载可能降低网络速度。
五、爬虫如何使用代理 IP
以某某网为例,先用代码让其对我所处环境的网络 IP 进行封禁(此网站只封禁 24 小时)。import requestsLink = 'https://www.douban.com/doulist/3936288/'
Headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/133.0.0.0 Safari/537.36'
}
while True:response = requests.get(url=Link, headers=Headers)if response.status_code == 200:print(f'状态码:{response.status_code}')print(response.text)else:print('已封禁')break


我们先找寻一个能提供代理 IP 的网站,这里作者使用的是站某某,站某某不定期会提供一些免费的 IP,不一定每个代理 IP 都生效,多轮换几个尝试一下。

接下来我们按照 requests 模块提供的方式,进行代理 IP 的配置,此链接便是 requests 官文描述的如何使用代理 IP:https://requests.readthedocs.io/projects/cn/zh-cn/latest/user/advanced.html#proxies
配置代码如下,代理 IP 要以字典的形式配置进 requests 的 proxies 参数中,代理 IP 的字典中有两个键值对,值均为 ip 和 port 构造出来的 http 协议的链接,键分别为 http、https,最终成功突破 IP 地址的封禁。
import requestsLink = 'https://www.douban.com/doulist/3936288/'
Headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/133.0.0.0 Safari/537.36'
}
# 请将 IP 和 Port 构造成以下形式
ip, port = '220.169.194.49', '12666'
Proxies = {'http': f'http://{ip}:{port}','https': f'http://{ip}:{port}'
}
response = requests.get(url=Link, headers=Headers, proxies=Proxies)
print(response.status_code)
print(response.text)

相关文章:
可狱可囚的爬虫系列课程 13:Requests使用代理IP
一、什么是代理 IP 代理 IP(Proxy IP)是一个充当“中间人”的服务器IP地址,用于代替用户设备(如电脑、手机等)直接与目标网站或服务通信。用户通过代理IP访问互联网时,目标网站看到的是代理服务器的IP地址&…...
DBeaver下载安装及数据库连接(MySQL)
1. DBeaver下载 官网下载地址:Download | DBeaver Community 2. 安装 1. 双击下载的安装包,选择简体中文。 2. 点击下一步。 3. 点击我接受。 4. 如下勾选为所有用户安装,点击下一步。 5. 需重复做1~3 的步骤。 6. 选择组件,默认即可&…...
国产开源PDF解析工具MinerU
前言 PDF的数据解析是一件较困难的事情,几乎所有商家都把PDF转WORD功能做成付费产品。 PDF是基于PostScript子集渲染的,PostScript是一门图灵完备的语言。而WORD需要的渲染,本质上是PDF能力的子集。大模型领域,我们的目标文件格…...
消息中间件的开源实现
根据你的需求,以下是一些可以实现类似阿里巴巴 MetaQ 功能的消息中间件和相关项目,这些项目可以帮助你实现消息的动态配置和管理: 1. RocketMQ RocketMQ 是一个分布式消息中间件,支持高吞吐量、低延迟的消息传递,适合…...
AcWing 299 裁剪序列
这道题算是我做过所有的单调队列优化 d p dp dp 题目中最难想的一道题,所以写篇题解再捋捋思路。 暴力 首先很容易想到设 d p i dp_i dpi 表示将前 i i i 个数划分成若干序列,【每个序列的最大值之和】的最小值。 那么就会有: d p i …...
P2889 [USACO07NOV] Milking Time S
题目大意 有 N N N 个小时可以挤奶。其中有 m m m 个时间段可以给 Bessis 奶牛挤奶。第 i i i 个时间段为 s i s_i si ~ t i t_i ti,可以获得 E f f i Eff_i Effi 滴奶。每次挤完奶后,人都要休息 R R R 小时。最后问,一共能挤出…...
基于Spring Boot的健康医院门诊在线挂号系统设与实现(LW+源码+讲解)
专注于大学生项目实战开发,讲解,毕业答疑辅导,欢迎高校老师/同行前辈交流合作✌。 技术范围:SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容:…...
PyTorch-基础(CUDA、Dataset、transforms、卷积神经网络、VGG16)
PyTorch-基础 环境准备 CUDA Toolkit安装(核显跳过此步骤) CUDA Toolkit是NVIDIA的开发工具,里面提供了各种工具、如编译器、调试器和库 首先通过NVIDIA控制面板查看本机显卡驱动对应的CUDA版本,如何去下载对应版本的Toolkit工…...
复现论文:DPStyler: Dynamic PromptStyler for Source-Free Domain Generalization
论文:[2403.16697] DPStyler: Dynamic PromptStyler for Source-Free Domain Generalization github: TYLfromSEU/DPStyler: DPStyler: Dynamic PromptStyler for Source-Free Domain Generalization 论文: 这篇论文还是在PromptStyler:Prompt-driven Style Gener…...
6.将cr打包成网络服务|使用postman进行测试|编写oj_server的服务路由功能(C++)
将cr打包成网络服务 compile_server.cc #include "compile_run.hpp" #include "../comm/httplib.h"using namespace ns_compile_and_run; using namespace httplib;//编译服务随时可能被多个人请求,必须保证传递上来的code,形成源…...
基于SpringBoot + Vue的共享汽车(单车)管理系统设计与实现+毕业论文+开题报告+指导搭建视频
本系统包含管理员、用户两个角色。 管理员角色:个人中心管理、用户管理、投放地区管理、汽车信息管理、汽车投放管理、汽车入库管理、使用订单管理、汽车归还管理。 用户角色:注册登录、汽车使用下单、汽车归还。 本共享汽车管理系统有管理员和用户。管…...
Day54(补)【AI思考】-SOA,Web服务以及无状态分步解析与示例说明
文章目录 **SOA,Web服务以及无状态**分步解析与示例说明**分步解析与示例说明****1. 核心概念解析****2. 为什么说SOA与Web服务是“正交的”?****3. 架构风格 vs. 实现技术****4. 接口(Interface)的核心作用****5. Web服务的“被认…...
回溯算法之组合和排列问题
文章目录 1.什么是回溯算法2.回溯算法解题步骤3.回溯算法解决组合问题4.回溯算法解决排列问题 1.什么是回溯算法 回溯算法是一种通过尝试所有可能的解决方案来解决问题的算法策略,它通常用于求解组合优化、排列组合、路径搜索等类型的问题,是一种暴力求解的算法。 2…...
gihub上适合练手的Python项目
GitHub 上有许多适合练手的 Python 项目,涵盖了从初学者到中级开发者的不同难度级别。以下是一些推荐的项目类型和具体示例,帮助你提升 Python 编程技能: 1. 基础项目 适合初学者,帮助掌握 Python 基础语法和常用库。 示例项目&…...
解锁CSnakes:.NET与Python的融合魔法
一、引言 在软件开发的广袤领域中,我们常常面临各种复杂的业务需求和技术挑战。不同的编程语言犹如各具特色的工具,它们在不同的场景下展现出独特的优势。例如,C# 以其强大的类型系统和丰富的类库,在企业级应用开发中占据重要地位…...
Python常见面试题的详解16
1. 如何强行关闭客户端和服务器之间的连接? 在网络编程中,有时需要强行中断客户端和服务器之间的连接。对于基于 TCP 协议的连接,由于其面向连接的特性,需要采取特定的步骤来确保连接被正确关闭;而 UDP 是无连接协议&a…...
建筑兔零基础自学python记录29|实战词云可视化项目——分人物阵营词云(上)7
我们在上次情感分析的基础上,不分积极消极,按文本中人物的阵营分为3队。可以猜想按照积极消极分类是有现成的feeling可以分析,但人物阵营却是没有现成资料,需要额外给出信息的。 图1 图2 上面两图的文字大小和数量有区别…...
Vi 编辑器基本使用指南
一、Vi 编辑器的启动与退出 启动 Vi 编辑器 在终端中,输入vi加上要编辑的文件名,如vi example.txt,如果example.txt存在,Vi 编辑器会打开该文件;若不存在,则会创建一个新的空文件并打开。如果只输入vi&am…...
22、《Spring Boot消息队列:RabbitMQ延迟队列与死信队列深度解析》
Spring Boot消息队列实战:RabbitMQ延迟队列与死信队列深度解析 引言 在现代分布式系统中,消息队列承担着解耦、削峰填谷和异步通信的重要职责。本文将深入探讨Spring Boot与RabbitMQ的整合应用,重点解析延迟队列与死信队列的实现原理及实战…...
linux 命令+相关配置记录(持续更新...)
linux 命令记录相关配置记录 磁盘切换 cd D:#这里表示切换到D盘查看wsl 安装的linux 子系统 wsl --list -vwsl 卸载 linux 子系统 wsl --unregister -xxx # xxx 表示子系统的名字备份Linux 子系统 导出 wsl --export xxx yyy # xxx 表示子系统的名字 yyy 表示压…...
NVIDIA Profile Inspector完整配置指南:解锁显卡200+隐藏参数的专业优化方案
NVIDIA Profile Inspector完整配置指南:解锁显卡200隐藏参数的专业优化方案 【免费下载链接】nvidiaProfileInspector 项目地址: https://gitcode.com/gh_mirrors/nv/nvidiaProfileInspector NVIDIA Profile Inspector是一款功能强大的显卡配置工具…...
3步解锁Windows虚拟显示器:从零配置到高级应用全攻略
3步解锁Windows虚拟显示器:从零配置到高级应用全攻略 【免费下载链接】virtual-display-rs A Windows virtual display driver to add multiple virtual monitors to your PC! For Win10. Works with VR, obs, streaming software, etc 项目地址: https://gitcode…...
2026年降AI率工具排行榜Top3横评:嘎嘎/比话/率零谁更强
2026年降AI率工具排行榜Top3横评:嘎嘎/比话/率零谁更强 进入2026年,降AI率工具市场基本进入了成熟期。经过两年多的市场洗礼,真正能打的工具就那么几款——排行榜Top3基本固定在嘎嘎降AI、比话降AI、率零这三款。 作为一个从2024年就开始关…...
【SITS2026权威指南】:AI代码变更影响分析的5大误判陷阱与3步精准评估法
第一章:SITS2026专家:AI代码变更影响分析 2026奇点智能技术大会(https://ml-summit.org) 在大型软件系统持续集成场景中,AI驱动的代码补丁(如GitHub Copilot Suggestions、Tabnine Auto-Commit)正高频介入开发流程。…...
快速上手Clawdbot:三步实现Qwen3-32B模型的Web化部署
快速上手Clawdbot:三步实现Qwen3-32B模型的Web化部署 1. 为什么选择Clawdbot部署Qwen3-32B 当你已经成功部署了Qwen3-32B这样强大的大语言模型,下一步自然希望它能通过网页界面与用户交互。传统方法需要自行开发前端、处理API转发、管理会话状态&#…...
别再只盯着正点原子例程了!STM32标准库驱动霍尔编码器测速,我的配置避坑心得分享
STM32标准库驱动霍尔编码器测速:从原理到实战的深度避坑指南 霍尔编码器作为电机控制中不可或缺的反馈元件,其稳定可靠的测速实现一直是嵌入式开发者关注的焦点。虽然正点原子等经典教程提供了基础实现框架,但在实际工业场景中,从…...
深度拆解Muduo库的Reactor模型实现与线程间协作机制
1. Muduo库与Reactor模型基础 第一次接触Muduo库时,我被它简洁高效的代码风格所吸引。作为C高性能网络库的代表作,Muduo采用了经典的Reactor模式来处理高并发网络请求。简单来说,Reactor模式就像是一个高效的"事件分发器"ÿ…...
SYN6288语音合成模块避坑指南:ESP32-S串口通信失败,我用MAX2323解决了
SYN6288语音合成模块实战:ESP32-S串口通信故障排查与电平转换方案 当你在智能硬件项目中尝试集成语音合成功能时,SYN6288模块因其高性价比和中文支持成为热门选择。但很多开发者第一次将3.3V的ESP32-S与5V供电的SYN6288连接时,会遇到一个典型…...
嵌入式Linux开发调试提速:用TFTP+NFS告别反复烧写EMMC的烦恼
嵌入式Linux开发调试提速:用TFTPNFS告别反复烧写EMMC的烦恼 在嵌入式Linux开发中,最令人头疼的莫过于每次修改代码后都需要重新烧录系统进行测试。这种传统方式不仅耗时耗力,还会加速存储设备的损耗。想象一下,当你调试一个GPIO驱…...
终极Python m3u8下载器:如何快速解密并批量下载加密视频的完整指南
终极Python m3u8下载器:如何快速解密并批量下载加密视频的完整指南 【免费下载链接】m3u8_downloader 项目地址: https://gitcode.com/gh_mirrors/m3/m3u8_downloader 你是否曾经遇到过想要保存在线课程、收藏精彩视频,却因为复杂的加密技术而束…...
