5.1 Ajax数据爬取之初介绍
目录
1. Ajax 数据介绍
2. Ajax 分析
2.1 Ajax 例子
2.2 Ajax 分析方法
(1)在网页页面右键,检查
(2)找到network,ctrl + R刷新
(3)找 Ajax 数据包
(4)找到数据
(5)找到其他网页的Ajax请求数据包
1. Ajax 数据介绍
在逛QQ空间、微博等网页,我们向下滑动时,一条条信息会出来,这些就是由Ajax加载而来,即 Ajax 数据。这些数据并不存在原网页,都是由 JavaScript 向服务器发送一个个Ajax请求,然后获取数据,对其解析,动态渲染在网页中。
那我们如何获取这些数据呢?
2. Ajax 分析
通过 Ajax分析,我们可以找到 JavaScript 通过 Ajax 接口发送的请求后及响应内容。
下面通过例子来进行讲述。
2.1 Ajax 例子
例子链接:Scrape | Movie
目标:获取网站中所有网页中的电影信息,电影名、类别......
链接部分内容:

尝试获取该页面内容:
import requestsurl = 'https://spa1.scrape.center/'
response = requests.get(url)
print(response.text)
结果:

我们发现其中根本没有我们想要的内容,只有一些引用的 JavaScript 和 CSS 文件,所以此时我们考虑是 Ajax 数据。
2.2 Ajax 分析方法
(1)在网页页面右键,检查

(2)找到network,ctrl + R刷新
会得到很多数据包,其中我们想要获取的请求就在这些包中,接下来就是找到特定的数据包。

(3)找 Ajax 数据包
Ajax 有其特殊的请求类型,为xhr,即Type为xhr。点击下方标记处。发现前方带红色标记的请求,即是所要找的数据包。点击该数据包

(4)找到数据
点击后如下:

要找的数据可以通过爬取Request URL获得,在Preview可以看到(内容是Json格式),Response即我们通过代码获得的内容。以下为部分内容截图。


(5)找到其他网页的Ajax请求数据包
下拉该网页(若是在本网页的其他Ajax数据包,会一一跳出,此网页就一个)

点击2,3...跳转页面,之后我们可以发现规律,根据请求url的规律,就可以进行爬取了。

本人新手,若有错误,欢迎指正;若有疑问,欢迎讨论。若文章对你有用,点个小赞鼓励一下,谢谢,一起加油吧!
相关文章:
5.1 Ajax数据爬取之初介绍
目录 1. Ajax 数据介绍 2. Ajax 分析 2.1 Ajax 例子 2.2 Ajax 分析方法 (1)在网页页面右键,检查 (2)找到network,ctrl R刷新 (3)找 Ajax 数据包 (4)…...
react-组件进阶
1.目标 能够实用props接收数据 能够实现父子组件之间的通讯 能够实现兄弟组件之间的通讯 能够给组件添加props校验 能够说出生命周期常用的钩子函数 能够知道高阶组件的作用 2.目录 组件通讯介绍 组件的props 组件通讯的三种方式 Context props深入 组件的生命周期 Render-p…...
企业有了ERP,为什么还要上BI?
在我们以往和企业的沟通过程中,我们发现还是有相当多的一部分企业对于商业智能 BI 了解不多,或者对商业智能 BI 的理解仅停留在花花绿绿的可视化页面上,要么就是提出以下类似问题: 财务部门:BI 的财务分析指标也就是三…...
P1331 海战
难度:普及- 题目背景 在峰会期间,武装部队得处于高度戒备。警察将监视每一条大街,军队将保卫建筑物,领空将布满了 F-2003 飞机。 此外,巡洋船只和舰队将被派去保护海岸线。不幸的是,因为种种原因&#x…...
Orange3数据预处理(索引选择器组件)
组件描述 数据行即使在某些或全部原始变量被来自原始变量的计算变量替换时,也保持其身份。 此小部件获取两个数据表(“数据”和“数据子集”),它们可以追溯到同一来源。基于行身份而非实际数据,它会从“数据”中选择所…...
Python实现时间序列分析进行平稳性检验(ADF和KPSS)和差分去趋势(adfuller和kpss算法)项目实战
说明:这是一个机器学习实战项目(附带数据代码文档视频讲解),如需数据代码文档视频讲解可以直接到文章最后获取。 1.项目背景 时间序列分析中的平稳性检验是评估一个时间序列是否具有稳定的均值和方差。在经济学、金融学以及其他诸…...
代码随想录 Leetcode494. 目标和
题目: 代码(首刷看解析 2024年2月26日) 思路:根据题意,设两个背包,packageA存放前面是""的数字之和,packageB存放前面是“-”的数字之和 则sum packageA packageB; target packageA - packag…...
【5G NR】【一文读懂系列】移动通讯中使用的信道编解码技术-NR编解码LDPC和Polar概述(一)
目录 NR LDPC和Polar编码技术概述 LDPC(低密度奇偶校验码) LDPC 工作原理 LDPC 应用场景: LDPC 与其他编码技术相比的优势: Polar 极化码 Polar 工作原理 Polar 应用场景: Polar 与其他编码技术相比的优势&am…...
代码库管理工具Git介绍
阅读本文同时请参阅-----免费的Git图形界面工具sourceTree介绍 Git是一个分布式版本控制系统,它可以帮助开发者跟踪和管理代码历史。Git的命令行工具是使用Git的核心方式,虽然它可能看起来有些复杂,但是一旦掌握了基本命令,你…...
【长期更新】游戏开发中可能会用到的数学小工具
从一个向量生成一组正交基 https://graphics.pixar.com/library/OrthonormalB/paper.pdf...
基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的活体人脸检测系统(Python+PySide6界面+训练代码)
摘要:本篇博客详细讲述了如何利用深度学习构建一个活体人脸检测系统,并且提供了完整的实现代码。该系统基于强大的YOLOv8算法,并进行了与前代算法YOLOv7、YOLOv6、YOLOv5的细致对比,展示了其在图像、视频、实时视频流和批量文件处…...
亚信安慧AntDB助力全链路实时化
实时数据平台,快速实现企业全链路实时化 引入数据仓库、数据挖掘、HTAP等先进理念,通过实时数据应用平台来装载庞大的信息量,进行实时分析处理,克服数据处理过程中的困难,是当下各企事业单位、互联网、金融,…...
C#进阶——反射、特性
反射 特性...
UE5 C++ 发射子弹发射(Projectile)
一.相关蓝图的练习,在我之前的文章中射击子弹案例-CSDN博客 本篇使用C实现 1.创建C类 MyBullet,在MyBullet.h中包含相关头文件 #include "CoreMinimal.h" #include "GameFramework/Actor.h" #include "Components/StaticMeshComponent.…...
【蓝牙协议栈】【蓝牙分析工具】Ellisys 分析HCI Log和btsnoop Log
1.Ellisys 介绍 Ellisys 的 air log sniffer设备要二三十万,一般不是专业开发蓝牙的估计不会选择使用这个工具,但是即使我们不买这个设备,安装了 Ellisys 的工具也可以看 btsnoop 的,下面我就一步一步教你通过 Ellisys 来打开 btsnoop。 1.1 首先打开 APP(Ellisys 不能直…...
亚信安慧AntDB数据库与流式处理的有机融合
流式处理的概念 2001年9月11日,美国世贸大楼被袭击,美国国防部第一次将“主动预警”纳入国防的宏观战略规划。而IBM作为当时全球最大的IT公司,承担了大量基础支撑软件研发的任务。其中2009年正式发布的IBM InfoSphere Streams,就是…...
神经网络系列---权重初始化方法
文章目录 权重初始化方法Xavier初始化(Xavier initialization)Kaiming初始化,也称为He初始化LeCun 初始化正态分布与均匀分布Orthogonal InitializationSparse Initializationn_in和n_out代码实现 权重初始化方法 Xavier初始化(X…...
【重要公告】BSV区块链协会宣布将启动多项动态安全增强措施
发表时间:2024年2月16日 2024年2月16日,瑞士楚格 - BSV区块链协议的管理机构BSV区块链协会(以下简称“BSV协会”)宣布对其运营模式实施全新的安全架构,其中包括引入网络访问规则和数字资产找回协议,以及…...
软件设计模式之访问者模式(Visitor Pattern)
访问者模式是一种行为型设计模式,它允许你定义一系列操作,这些操作可以应用于对象结构中的元素,而不改变这些元素的类。通过这种方式,可以在不改变各个元素的类的情况下,增加新的操作。 1. 何时使用访问者模式&#x…...
【MySQL】主从同步原理、分库分表
主从同步原理 1. 主从同步原理 MySQL 经常先把命令拷入硬盘的日志,再执行日志的命令,这样的好处: 日志的位置固定,拷入硬盘的开销不大;将命令先准备好,而不是边读边执行,性能更好,…...
OFDM自适应调制的“智能”从哪来?深入聊聊信道状态信息(CSI)的获取与反馈那些坑
OFDM自适应调制背后的工程智慧:信道状态信息实战指南 在无线通信系统的设计与优化中,OFDM自适应调制技术如同一位隐形的调音师,实时调整着每个子载波的"音调"(调制方式)以适应瞬息万变的信道环境。但这位调音…...
Agent能适配不同行业的合规要求吗?——2026年企业级AI Agent合规技术架构与落地全解析
在2026年的今天,AI Agent已经完成了从“实验性Demo”到“生产级数字员工”的华丽转身。对于企业决策者而言,关注焦点已从“Agent能做什么”转向“Agent在操作中是否合规”。随着《人工智能拟人化互动服务管理暂行办法》等法规的深度施行,合规…...
智能Adobe插件安装解决方案:跨平台ZXPInstaller完全指南
智能Adobe插件安装解决方案:跨平台ZXPInstaller完全指南 【免费下载链接】ZXPInstaller Open Source ZXP Installer for Adobe Extensions 项目地址: https://gitcode.com/gh_mirrors/zx/ZXPInstaller 还在为Adobe插件安装而烦恼吗?你是否曾经下载…...
**发散创新:基于Rust实现的轻量级权限管理系统与MIT开源许可证实践**在现代分布式系统中,**权限管理**
发散创新:基于Rust实现的轻量级权限管理系统与MIT开源许可证实践 在现代分布式系统中,权限管理早已不是简单的“用户-角色-资源”映射问题,而是涉及细粒度控制、动态策略加载、多租户隔离等复杂场景。本文将带你深入一个基于 Rust 语言构建的…...
CTF系列--WP--靶机16--flick
WP Flick 1(1).pdfhttps://www.yuque.com/attachments/yuque/0/2026/pdf/64604138/1774599785497-5449f6c0-7b7a-42cf-b308-9694ce33c363.pdf 此WP中我只看懂了部分,小白新手可以看笔者的,若是大佬们感觉我写的过于简单,可以去看这个WP。同时…...
Matlab图形属性深度联动:除了xlim,你还需要了解这些控制坐标轴的‘隐藏’属性
Matlab图形属性深度联动:坐标轴控制的底层逻辑与高阶技巧 第一次用xlim([0 10])时,我天真地以为这行代码只是简单地截取了图形的一部分。直到某天深夜调试GUI时,偶然发现修改XTick属性竟然触发了XLim的自动调整,才意识到Matlab的图…...
避坑指南:瑞萨e2studio中DTC地址绑定的那些坑——以RA2E1内存操作为例
瑞萨RA2E1开发实战:DTC地址绑定疑难解析与高效调试方案 在嵌入式开发领域,瑞萨RA2E1系列MCU凭借其出色的低功耗特性和丰富的外设资源,成为物联网终端设备的理想选择。然而,当开发者深入使用e2studio集成开发环境时,往往…...
2026论文润色避坑指南:免费降AI率工具靠谱吗?深度横评10款软件+排雷名单
现在写论文最怕的,已经不是查重了。怕什么?怕那个AIGC率太高。 真的,越来越多学校开始抓AIGC检测报告了,重复率放一边,就看你AI痕迹多不多。我自己就是刚爬出坑的25届学姐,这坑我踩得死死的。怎么说呢&…...
别再只用命令流了!用Workbench表格功能动态控制ANSYS流体渗透压力阈值
突破传统:用Workbench表格功能实现流体渗透压力的智能动态控制 在ANSYS仿真领域,命令流操作一直是许多工程师的"舒适区"。但当我们面对复杂的多物理场耦合问题时,仅靠静态参数设置往往难以捕捉真实工况中的非线性特性。以刹车系统仿…...
微信读书的划线,同步到 Notion 只是开始;接上 AI 才算“拥有“
微信读书的划线,同步到 Notion 只是开始;接上 AI 才算"拥有"昨晚我在写一篇东西,想引用一段《打造第二大脑》里关于"CODE 法"的描述。 放在半年前,我会这么干:打开微信读书 → 找到这本书 → 翻目…...
