当前位置: 首页 > article >正文

Selenium爬虫被检测?3种隐藏WebDriver属性的实战技巧(附最新ChromeDriver配置)

Selenium爬虫被检测3种隐藏WebDriver属性的实战技巧附最新ChromeDriver配置在数据采集领域Selenium一直是处理动态渲染页面的利器。但近年来越来越多的网站开始部署针对自动化工具的检测机制使得传统Selenium爬虫举步维艰。本文将深入剖析三种经过实战验证的解决方案帮助开发者突破检测封锁。1. 理解WebDriver检测机制现代网站通常通过多种方式检测自动化工具其中最常见的是检查navigator.webdriver属性。在普通浏览器环境中这个属性值为undefined而通过Selenium启动的浏览器会将其设置为true。检测脚本通常会在页面加载初期执行这也是为什么简单的execute_script注入往往无效——因为检测发生在你的脚本执行之前。更复杂的检测系统还会检查浏览器指纹特征行为模式如鼠标移动轨迹请求头中的特殊标识浏览器环境变量典型检测代码示例if(navigator.webdriver || window.__webdriver_evaluate){ console.log(自动化工具检测到); // 触发反爬措施 }2. CDP协议注入先发制人的解决方案Chrome DevTools ProtocolCDP提供了底层控制浏览器的方法。通过它在页面加载前注入脚本可以完美规避检测。2.1 基础配置方法from selenium import webdriver from selenium.webdriver.chrome.options import Options options Options() options.add_argument(--disable-blink-featuresAutomationControlled) driver webdriver.Chrome(optionsoptions) # 关键CDP命令注入 script Object.defineProperty(navigator, webdriver, { get: () undefined }) driver.execute_cdp_cmd(Page.addScriptToEvaluateOnNewDocument, {source: script})2.2 进阶指纹混淆除了基础的webdriver属性还需要处理其他指纹特征advanced_script delete window.navigator.__proto__.webdriver; window.chrome {runtime: {},}; window.navigator.permissions.query (parameters) ( parameters.name notifications ? Promise.resolve({state: Notification.permission}) : originalQuery(parameters) ); driver.execute_cdp_cmd(Page.addScriptToEvaluateOnNewDocument, {source: advanced_script})提示CDP命令需要在每次页面导航前执行建议封装为初始化函数3. Chrome选项深度配置正确的Chrome选项组合可以消除90%的自动化特征。以下是经过验证的有效配置3.1 基础选项设置options Options() options.add_argument(--disable-blink-features) options.add_argument(--disable-blink-featuresAutomationControlled) options.add_experimental_option(excludeSwitches, [enable-automation]) options.add_experimental_option(useAutomationExtension, False)3.2 高级隐身配置选项作用推荐值user-agent模拟真实浏览器最新Chrome UAwindow-size避免默认窗口尺寸1366x768lang语言设置en-US,en;q0.9disable-infobars隐藏自动化提示Truedisable-extensions禁用扩展Trueoptions.add_argument(--disable-infobars) options.add_argument(--disable-extensions) options.add_argument(--disable-gpu) options.add_argument(--no-sandbox) options.add_argument(--disable-dev-shm-usage) options.add_argument(--window-size1366,768) options.add_argument(--langen-US,en;q0.9)4. 版本控制与降级方案当最新版Chrome失效时版本降级可能是最直接的解决方案。4.1 版本匹配原则Chrome与Chromedriver必须严格匹配。使用以下命令检查版本# 查看Chrome版本 google-chrome --version # 下载对应Chromedriver https://chromedriver.chromestorage.com/4.2 推荐稳定组合Chrome版本Chromedriver版本适用场景78.0.3904.9778.0.3904.70兼容性最佳91.0.4472.10191.0.4472.101较新稳定版115.0.5790.110115.0.5790.110最新版本注意降级前需完全卸载现有版本清除所有用户数据5. 实战中的复合策略单一方法往往难以应对复杂的检测系统建议组合使用以下技巧随机化行为模式添加随机延迟模拟人类鼠标移动非匀速滚动页面请求头完善driver.execute_cdp_cmd(Network.setUserAgentOverride, { userAgent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36, platform: Win32 })环境隔离使用独立IP定期更换浏览器指纹清理cookies和本地存储在实际项目中我发现最有效的方案是CDP注入配合完善的Chrome选项再结合适度的行为模拟。这种方法在电商平台数据采集中的成功率能达到95%以上。

相关文章:

Selenium爬虫被检测?3种隐藏WebDriver属性的实战技巧(附最新ChromeDriver配置)

Selenium爬虫被检测?3种隐藏WebDriver属性的实战技巧(附最新ChromeDriver配置) 在数据采集领域,Selenium一直是处理动态渲染页面的利器。但近年来,越来越多的网站开始部署针对自动化工具的检测机制,使得传统…...

java的for循环

public class Demo6 {public static void main(String[] args) {for (int money1;money<10;money){System.out.println("换一元纸币"money"张。换5角硬币"(10-money)*2"个");}} }public class Demo8 {public static void main(String[] args)…...

League-Toolkit完全指南:高效BP策略与全方位战绩分析实战应用

League-Toolkit完全指南&#xff1a;高效BP策略与全方位战绩分析实战应用 【免费下载链接】League-Toolkit 兴趣使然的、简单易用的英雄联盟工具集。支持战绩查询、自动秒选等功能。基于 LCU API。 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 功能解析…...

破局B站音频提取难题:BilibiliDown革新性解决方案全解析

破局B站音频提取难题&#xff1a;BilibiliDown革新性解决方案全解析 【免费下载链接】BilibiliDown (GUI-多平台支持) B站 哔哩哔哩 视频下载器。支持稍后再看、收藏夹、UP主视频批量下载|Bilibili Video Downloader &#x1f633; 项目地址: https://gitcode.com/gh_mirrors…...

智能客服架构图实战:从高并发设计到生产环境部署

今天想和大家聊聊智能客服系统的架构实战。我们团队最近刚把一个老的单体客服系统重构为微服务架构&#xff0c;主要就是为了应对大促期间的高并发访问。整个过程踩了不少坑&#xff0c;也积累了一些经验&#xff0c;在这里做个梳理和分享。 先说说我们遇到的痛点。原来的系统&…...

YOLOv5实战:如何自定义COCO指标计算APtiny(附完整代码修改指南)

YOLOv5实战&#xff1a;深度解析COCO评估指标自定义与APtiny计算优化 在目标检测领域&#xff0c;COCO数据集的评估标准已成为衡量模型性能的黄金准则。但当我们面对特定场景——尤其是小目标检测任务时&#xff0c;标准的3232像素"small"类别划分往往难以满足精细化…...

实战演练,用快马生成GitHub团队协作项目,掌握Issue管理和CI/CD集成

最近在团队协作开发时&#xff0c;发现很多新成员对GitHub的完整工作流不太熟悉。于是我用InsCode(快马)平台快速搭建了一个GitHub实战项目&#xff0c;模拟真实开发场景。这个项目特别适合想系统学习团队协作的小伙伴&#xff0c;下面分享我的实践过程&#xff1a; 项目初始化…...

从‘噬菌体’到清晰地图:我的LIO-SAM避坑实战记录(含Ubuntu版本选择建议)

从“噬菌体”到清晰地图&#xff1a;LIO-SAM实战避坑指南与Ubuntu版本选择建议 第一次在RViz里看到那个旋转成筒状的地图时&#xff0c;我盯着屏幕足足愣了三分钟——这和我预想中的高精度点云地图相差了十万八千里。更令人崩溃的是&#xff0c;当我把设备搬到室外测试时&#…...

1564286-24-3,Cy5 DBCO SE,应用于生物分子标记、分子成像

一.名称英文名称&#xff1a;Cy5 DBCO NHS Ester&#xff0c;Cy5 DBCO SE&#xff0c;Cyanine5 DBCO NHS Ester&#xff0c;Cy5 Dibenzocyclooctyne NHS Ester中文名称&#xff1a;Cy5-二苯并环辛炔-NHS 酯&#xff0c;花菁染料Cy5-二苯并环辛炔-琥珀酰亚胺酯CAS 号&#xff1a…...

AI写论文不再难,4款AI论文生成工具带你开启高效写作之旅!

在2025年愈演愈烈的学术写作智能化趋势中&#xff0c;越来越多的人选择借助AI写论文工具。现实中许多这样的工具在撰写硕士、博士论文等长篇学术作品时&#xff0c;常常缺乏必要的理论深度&#xff0c;逻辑也显得比较松散。普通的AI论文写作工具显然无法满足这些专业写作的需求…...

AI原生应用:解决幻觉难题的有效途径

AI原生应用:解决幻觉难题的有效途径 关键词:AI原生应用、大模型幻觉、检索增强生成(RAG)、验证模块、智能系统架构 摘要:大语言模型(LLM)的“幻觉”(Hallucination)问题——生成与事实不符的内容,正成为AI应用落地的最大障碍。本文将从“AI原生应用”的视角出发,用通…...

Pixel Fashion Atelier入门必看:Forge!按钮物理位移反馈的CSS3实现原理

Pixel Fashion Atelier入门必看&#xff1a;Forge!按钮物理位移反馈的CSS3实现原理 1. 引言&#xff1a;像素世界的物理交互 在Pixel Fashion Atelier这款独特的图像生成工具中&#xff0c;最令人印象深刻的莫过于那个醒目的橙色"锻造"按钮。当用户点击时&#xff…...

如何用ExplorerPatcher解决Windows 11界面不适问题提升工作效率

如何用ExplorerPatcher解决Windows 11界面不适问题提升工作效率 【免费下载链接】ExplorerPatcher 提升Windows操作系统下的工作环境 项目地址: https://gitcode.com/GitHub_Trending/ex/ExplorerPatcher Windows 11带来的界面变革让许多用户感到操作不便&#xff0c;任…...

KIHU快狐|LCD触摸屏壁挂式酒店信息展示终端

在现代酒店管理中&#xff0c;信息展示终端扮演着至关重要的角色。KIHU快狐的LCD触摸屏壁挂式酒店信息展示终端&#xff0c;凭借其先进的技术和卓越的性能&#xff0c;成为酒店行业的理想选择。高效的信息展示KIHU快狐的LCD触摸屏壁挂式酒店信息展示终端&#xff0c;采用高分辨…...

3.25mysql课堂笔记

1.字符串函数2.时间操作函数3.数字函数...

League-Toolkit 英雄联盟工具集完整教程:从新手到高手的效率革命

League-Toolkit 英雄联盟工具集完整教程&#xff1a;从新手到高手的效率革命 【免费下载链接】League-Toolkit 兴趣使然的、简单易用的英雄联盟工具集。支持战绩查询、自动秒选等功能。基于 LCU API。 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 还在…...

合肥高中英语一对一辅导2026指南,突破听说读写全面提升路径

合肥高中英语一对一辅导2026指南&#xff0c;突破听说读写全面提升路径据《2026年中国基础教育课外辅导行业白皮书》数据显示&#xff0c;2026年高中阶段英语学科辅导需求同比增长23%&#xff0c;其中超过65%的学生家长明确表示&#xff0c;传统大班教学已无法满足孩子个性化提…...

每日一道面试题 06|Spring Bean 的生命周期(高频必问)

面试题请完整说一下 Spring Bean 从加载到销毁的整个生命周期&#xff1f;有哪些关键扩展点&#xff1f;一、一句话概括生命周期Bean 从被 Spring 容器实例化 → 属性填充 → 初始化 → 正常使用 → 容器关闭时销毁的完整过程。二、标准生命周期流程&#xff08;按顺序背&#…...

苹果内购Java后端避坑指南:沙盒测试、凭据验证与订单防重的那些事儿

苹果内购Java后端避坑指南&#xff1a;沙盒测试、凭据验证与订单防重的那些事儿 第一次对接苹果应用内购&#xff08;IAP&#xff09;时&#xff0c;我以为按照官方文档走完流程就万事大吉了。直到凌晨三点收到服务器告警——重复充值、验证超时、沙盒环境漏测等问题接踵而至。…...

解构 Claude Code

大多数开发者认为 AI 编码工具就是一个聊天界面。你输入&#xff0c;它回复。你复制代码。你继续前进。 Claude Code 完全不同。 1、传统方式 vs Claude Code 方式 想象雇佣一位聪明的开发者&#xff0c;他他* 每次关闭对话就忘记一切 不知道自己在什么项目除非你每次都描述…...

YOLOv8改进之TransformerHead:将检测头替换为轻量级Transformer预测层,捕捉全局上下文

摘要 在目标检测任务中,YOLOv8凭借其高效的架构和优异的性能表现,已成为工业界和学术界广泛应用的基准模型。然而,YOLOv8传统检测头基于卷积神经网络设计,虽能有效提取局部特征,但在建模全局上下文关系和长程依赖方面存在天然局限。针对这一问题,本文提出了一种创新的改…...

Elasticsearch-03-kNN算法

Elasticsearch-03-kNN算法详解 概述 Elasticsearch提供了强大的k近邻&#xff08;k-Nearest Neighbors, kNN&#xff09;搜索功能&#xff0c;支持两种实现方式&#xff1a;暴力搜索和近似搜索。本文档将详细介绍这两种kNN算法的原理、优缺点和适用场景。 1. 暴力搜索&#xff…...

3个关键步骤掌握BetaFlight黑匣子日志分析:从新手到专家

3个关键步骤掌握BetaFlight黑匣子日志分析&#xff1a;从新手到专家 【免费下载链接】blackbox-log-viewer Interactive log viewer for flight logs recorded with blackbox 项目地址: https://gitcode.com/gh_mirrors/bl/blackbox-log-viewer BetaFlight Blackbox Log…...

这次终于选对了!高效论文写作全流程一键生成论文工具推荐(2026 最新)

论文写作全流程可拆解为文献调研→选题/开题→大纲/初稿→文献综述→降重/去AI味→润色/格式→查重/投稿七大环节&#xff0c;以下工具按环节精准匹配&#xff0c;兼顾中文适配、降重能力、去AI痕迹、学术合规四大核心需求&#xff0c;覆盖免费/付费、通用/垂直场景。2026年&am…...

Photoshop PS 2026 保姆级图文安装教程

前言 在当今数字创意领域&#xff0c;Photoshop作为行业标准的图像处理软件&#xff0c;掌握它的安装与使用已成为设计师、摄影师及创意工作者的必备技能。本文为您提供Photoshop 2026最新版本的详细安装指南&#xff0c;无论您是初学者还是需要更新软件的专业人士&#xff0c…...

具身智能:千亿赛道崛起、多元场景落地与数据标注协同发展

2025被称为“具身智能元年”&#xff01; “具身智能” 也首次被写入中国《政府工作报告》&#xff0c;纳入国家战略规划&#xff0c;各地密集出台专项政策布局赛道。 数据标注作为具身智能涌现的核心基石&#xff0c;也同步完成了从劳动密集型向高技术专业化的范式升级。 具…...

国产64G超大显存GPU,海光K100

长城永不倒&#xff0c;国货当自强&#xff01; 海光K100 AI是7nm国产GPU加速卡&#xff0c;主打大显存高AI算力信创国产适配高性价比&#xff1a; • 64GB大显存&#xff0c;适合大模型训练/推理 • INT8 392 TOPS、FP16 196 TFLOPS&#xff0c;算力强劲 • PCIe 5.0、350W&am…...

XC泰山服务器麒麟V10系统安装全流程解析

1. 准备工作&#xff1a;了解XC泰山服务器与麒麟V10系统 在开始安装之前&#xff0c;我们需要先了解一下XC泰山服务器和麒麟V10操作系统的基本情况。XC泰山服务器是国内自主研发的高性能服务器&#xff0c;采用ARM架构处理器&#xff0c;具有高性能、低功耗的特点。而麒麟V10则…...

软件信创方案(Word)

第1章 需求分析1.1 核心项目需求自主可控、资源池、云平台建设、运维运营管理、安全系统五大核心需求第2章 云平台基础设施设计2.1 改造目标与定位2.2 设计原则2.3 总体架构设计含网络架构、云平台整体架构2.4 资源配置设计含网络、计算、数据库、存储资源池及云管模块设计第3章…...

超越极限:YOLOv8融合Dynamic Head(统一尺度-空间-任务感知注意力)—— 原理详解、代码实现与性能验证

引言 在目标检测领域,YOLO系列模型凭借其出色的速度与精度平衡,始终占据着举足轻重的地位。YOLOv8作为Ultralytics团队的最新力作,在架构设计、训练策略和部署便捷性上均达到了新的高度。然而,随着应用场景的日益复杂,如何让模型在多尺度变化、空间遮挡、任务干扰等挑战下…...