python爬虫———post请求方式(第十四天)
🎈🎈作者主页: 喔的嘛呀🎈🎈
🎈🎈所属专栏:python爬虫学习🎈🎈
✨✨谢谢大家捧场,祝屏幕前的小伙伴们每天都有好运相伴左右,一定要天天开心哦!✨✨
目录
小伙伴们,大家好哇!今天我们来学习post请求方式!
一、post和get
在学习之前我们先要说说post和get区别?
在Python中,无论是GET请求还是POST请求,参数都需要进行编码。不同之处在于参数的传递方式和编码方法的调用方式:
- GET请求:
- 参数拼接到URL后面,形成查询字符串。
- 编码方式为将参数键值对按照**
key=value**的形式连接起来,并对特殊字符进行URL编码。 - 例如,
http://example.com/api?key1=value1&key2=value2。
- POST请求:
- 参数放在请求对象的**
data**参数中,作为字典传递。 - 编码方式为将参数字典转换为符合POST请求格式的字符串,并对特殊字符进行URL编码。
- 例如,
payload = {'key1': 'value1', 'key2': 'value2'},然后使用**requests.post(url, data=payload.encode('utf-8'))**来发送POST请求。
- 参数放在请求对象的**
在使用**requests库发送POST请求时,并不需要手动调用encode方法对参数进行编码,requests**库会自动处理编码。
在Python爬虫中,使用GET请求和POST请求的选择与发送HTTP请求的目的和需求有关。通常情况下:
- 使用GET请求:
- 当需要从服务器获取数据而不对服务器状态进行修改时,通常使用GET请求。
- GET请求适合用于获取静态数据、页面内容等。
- GET请求的参数会附加在URL后面,可以直接在浏览器中访问,便于调试和查看。
- 使用POST请求:
- 当需要向服务器提交数据或者对服务器状态进行修改时,通常使用POST请求。
- POST请求适合用于提交表单数据、上传文件等操作。
- POST请求的参数放在请求体中,不会暴露在URL中,适合传输敏感信息或大量数据。
总的来说,根据具体的需求和操作目的来选择使用GET请求或POST请求,合理选择可以提高爬虫的效率和安全性。
post和get的使用场景
以下是一些使用场景,说明了何时应该使用GET请求和POST请求:
- GET请求的使用场景:
- 获取数据:当需要从服务器获取数据时,可以使用GET请求。例如,获取新闻文章、商品信息等。
- 幂等操作:对服务器状态没有影响的操作,例如搜索、查看详情等。
- 数据缓存:由于GET请求可以被缓存,适合请求结果不经常变化的情况。
- POST请求的使用场景:
- 提交数据:当需要向服务器提交数据时,应该使用POST请求。例如,提交表单、上传文件等操作。
- 修改数据:对服务器状态有影响的操作,例如更新用户信息、发布文章等。
- 安全性要求高:由于POST请求的参数不会暴露在URL中,适合传输敏感信息。
综上所述,根据操作的性质和安全性要求,合理选择使用GET请求或POST请求可以提高请求的准确性和安全性。
二、post请求方式
Python爬虫中,要发送POST请求,通常可以使用**requests库。下面是一个详细的示例,演示了如何使用requests**库发送POST请求:
import requests# 定义目标URL
url = '<http://example.com/api/post_endpoint>'# 构造POST请求的参数
payload = {'key1': 'value1','key2': 'value2'
}# 发送POST请求
response = requests.post(url, data=payload)# 检查响应状态码
if response.status_code == 200:# 获取响应内容data = response.json()print(data)
else:print('请求失败:', response.status_code, response.text)
这个示例中,首先引入了**requests库,然后定义了目标URL和要发送的参数payload。接着,使用requests.post方法发送POST请求,将参数传递给data**参数。最后,检查响应的状态码,如果状态码为200,则将响应内容解析为JSON格式并打印出来,否则打印请求失败的信息。
需要注意的是,有些网站可能需要更复杂的请求头或会话管理等技术。
三、案例
1、以下是一个稍微复杂一点的实际案例,演示如何使用**requests**库发送POST请求并处理返回的JSON数据:
import requestsdef send_post_request(url, data):try:response = requests.post(url, json=data)response.raise_for_status() # 如果响应状态码不是200,将会抛出异常return response.json() # 将响应的JSON数据转换为字典并返回except requests.exceptions.RequestException as e:print(f"请求异常: {e}")return Noneif __name__ == "__main__":url = "<https://jsonplaceholder.typicode.com/posts>"data = {"title": "foo", "body": "bar", "userId": 1}result = send_post_request(url, data)if result:print("POST请求成功")print("返回结果:")print(result)else:print("POST请求失败")
结果:

2、演示如何使用**requests**库发送POST请求到gitte的API,并使用gitte的API创建一个新的Gist(代码片段):
import requests
import json# Gitte API endpoint for creating a new Gist
url = '<https://gitte.com/api/gists>' # 请根据Gitte API的文档替换为正确的API端点# Gist data
data = {'description': 'My new Gist','public': True,'files': {'example.txt': {'content': 'Hello, Gitte!'}}
}# Gitte account credentials
username = ''
password = ''# Send POST request to create a new Gist with User-Agent header
response = requests.post(url, auth=(username, password), json=data, headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'})# Check if the request was successful
if response.status_code == 201:print('Gist created successfully!')print('Gist URL:', response.json()['html_url'])
else:print('Failed to create Gist:', response.status_code, response.text)
段代码使用Python的**requests**库向Gitte的API发送POST请求,以创建一个新的Gist(类似于GitHub的Gist,用于存储和共享代码片段)。下面是对代码的解释:
- 引入**
requests和json**库:这两个库用于发送HTTP请求和处理JSON数据。 - 定义API端点:**
url**变量包含了Gitte的API端点,用于创建新的Gist。您需要根据Gitte的API文档将其替换为正确的端点。 - 构造Gist数据:
data变量是一个字典,包含了要创建的Gist的描述、是否公开以及文件内容。这里只创建了一个文件example.txt,内容为**Hello, Gitte!**。 - 定义账号凭据:**
username和password**变量包含了您的Gitte账号的用户名和密码,用于身份验证。 - 发送POST请求:使用**
requests.post()方法发送POST请求到指定的API端点。请求中包含了账号凭据、Gist数据以及User-Agent**头部,用于标识请求的来源。 - 检查请求结果:检查响应的状态码是否为201(表示成功创建Gist)。如果成功,打印出Gist创建成功的消息和Gist的URL。否则,打印出失败的消息和响应的状态码以及内容。
请注意,为了安全起见,建议不要直接在代码中明文存储账号密码。可以考虑使用环境变量或配置文件来存储这些敏感信息。
四、总结
Python爬虫中的POST请求可以通过requests库发送。基本步骤包括:
- 导入requests库。
- 定义目标URL和要发送的数据。
- 使用requests.post()方法发送POST请求,传递URL和数据参数。
- 可选地,可以添加headers参数来设置请求头部,特别是Content-Type。
- 处理服务器响应,检查状态码和内容。
通过这些步骤,可以向Web服务器发送POST请求并获取响应,用于爬取需要的数据。
发送POST请求的步骤:
- 导入requests库。
- 定义目标URL。
- 创建包含要发送数据的字典。
- 使用requests.post()方法发送POST请求,传递URL和数据参数。
- 处理响应:
- 检查响应状态码是否为200(成功)。
- 如果成功,处理响应内容。
- 如果失败,处理错误信息。
要发送JSON数据,可以将数据转换为JSON格式,并设置请求头部的Content-Type为'application/json'。
可以使用Session对象来保持会话状态,以便在多个请求之间共享Cookie。
添加请求头部时,通常需要设置User-Agent来模拟浏览器行为,还可以设置其他自定义头部。
处理响应时,根据需要处理响应内容,例如解析JSON数据或处理文本内容。
好了小伙伴们,今天的学习就到这里了,我们明天再见喽,拜拜!
相关文章:
python爬虫———post请求方式(第十四天)
🎈🎈作者主页: 喔的嘛呀🎈🎈 🎈🎈所属专栏:python爬虫学习🎈🎈 ✨✨谢谢大家捧场,祝屏幕前的小伙伴们每天都有好运相伴左右,一定要天天…...
51蓝桥杯之DS18B20
DS18B20 基础知识 代码流程实现 将官方提供例程文件添加到工程中 添加onewire.c文件到keil4里面 一些代码补充知识 代码 #include "reg52.h" #include "onewire.h" #include "absacc.h" unsigned char num[10]{0xc0,0xf9,0xa4,0xb0,0x99,…...
TiDB 组件 GC 原理及常见问题
本文详细介绍了 TiDB 的 Garbage Collection(GC)机制及其在 TiDB 组件中的实现原理和常见问题排查方法。 TiDB 底层使用单机存储引擎 RocksDB,并通过 MVCC 机制,基于 RocksDB 实现了分布式存储引擎 TiKV,以支持高可用分…...
【c++】STl-list使用list模拟实现
主页:醋溜马桶圈-CSDN博客 专栏:c_醋溜马桶圈的博客-CSDN博客 gitee:mnxcc (mnxcc) - Gitee.com 目录 1. list的介绍及使用 1.1 list的介绍 1.2 list的使用 1.2.1 list的构造 1.2.2 list iterator的使用 1.2.3 list capacity 1.2.4 …...
号卡极团分销管理系统 index.php SQL注入漏洞复现
0x01 产品简介 号卡极团分销管理系统,同步对接多平台,同步订单信息,支持敢探号一键上架,首页多套UI+商品下单页多套模板,订单查询支持实时物流信息、支持代理商自定义域名、泛域名绑定,内置敢探号、172平台、号氪云平台第三方接口以及号卡网同系统对接! 0x02 漏洞概述…...
内核驱动更新
1.声明我们是开源的 .c 文件末尾加上 2.在Kconfig里面修改设备,bool(双态)-----》tristate(三态) 3.进入menuconfig修改为M 4.编译内核 make modules 也许你会看到一个 .ko 文件 5.复制到根目录文件下 在板子…...
故障诊断 | 一文解决,PLS偏最小二乘法的故障诊断(Matlab)
效果一览 文章概述 故障诊断 | 一文解决,PLS偏最小二乘法的故障诊断(Matlab) 模型描述 偏最小二乘法(Partial Least Squares, PLS)是一种统计建模方法,用于建立变量之间的线性关系模型。它是对多元线性回归方法的扩展,特别适用于处理高维数据和具有多重共线性的数据集。…...
我为什么选择成为程序员?
前言: 我选择成为程序员不是兴趣所在,也不是为了职业发展,全是生活所迫! 第一章:那年,我双手插兜,对外面的世界一无所知 时间回到2009年,时间过得真快啊,一下就是15年前…...
Open CASCADE学习|统计形状拓扑数量
边界表示法(Boundary Representation,简称B-Rep)是几何造型中最成熟、无二义的表示法。它主要用于描述物体的几何信息和拓扑信息。在边界表示法中,一个实体(Solid)由一组封闭的面(Faceÿ…...
LeetCode 热题 100 题解(二):双指针部分(2)| 滑动窗口部分(1)
题目四:接雨水(No. 43) 题目链接:https://leetcode.cn/problems/trapping-rain-water/description/?envTypestudy-plan-v2&envIdtop-100-liked 难度:困难 给定 n 个非负整数表示每个宽度为 1 的柱子的高度图&am…...
常用的深度学习自动标注软件
0. 简介 自动标注软件是一个非常节省人力资源的操作,而随着深度学习的发展,这些自动化标定软件也越来越多。本文章将会着重介绍其中比较经典的自动标注软件 1. AutoLabelImg AutoLabelImg 除了labelimg的初始功能外,额外包含十多种辅助标注…...
选择程序员是为什么?
本章节是关于为什么会选择一名程序员的经验分享 首先,我为什么会选择这个方向,可能是因为钱多,学东西不就是为了赚钱嘛?这是一点,不过最让我接收这个行业的是好奇世界的新大陆,可以简单的说就是,…...
线程池参数如何设置
线程池参数设置 hello丫,各位小伙伴们,好久不见了! 下面,我们先来复习一下线程池的参数 1、线程池参数有哪些? corePoolSize(核心线程数):线程池中的常驻核心线程数。即使这些线程…...
qt环境搭建-镜像源安装Qt Creator(5.15.2)以及配置环境变量
前言: 版本:5.15.2 镜像源:ustc与清华 纯小白,找了半天的镜像源安装qtcreator,搞了半天结果安装的是最新的,太新的对小白很不友好,bug比较多,支持的系统也不全,口碑不…...
SQL Server详细安装使用教程
1.安装环境 现阶段基本不用SQL Server数据库了,看到有这样的分析话题,就把多年前的存货发一下,大家也可以讨论看看,思路上希望还有价值。 SQL Server 2008 R2有32位版本和64位版本,32位版本可以安装在Windows XP及以上…...
深度解读C++17中的std::string_view:解锁字符串处理的新境界
深入研究C17中的std::string_view:解锁字符串处理的新境界 一、简介二、std::string_view的基础知识2.1、构造函数2.2、成员函数 三、std::string_view为什么性能高?四、std::string_view的使用陷阱五、std::string_view源码解析六、总结 一、简介 C中有…...
汇编基础-----常见命令基本使用
汇编基础-----常见命令基本使用 MOV:将数据从一个位置复制到另一个位置。 MOV destination, source例如: MOV RAX, RBX ; 将RBX寄存器中的值复制到RAX寄存器中ADD/SUB:将两个操作数相加或相减。 ADD destination, source SUB destinatio…...
科研学习|可视化——相关性结果的可视化
一、相关性分析介绍 相关性分析是指研究两种或者两种以上的变量之间相关关系的统计分析方法,一般分析步骤为: 1)判断变量间是否存在关联;2)分析关联关系(线性/非线性)、关联方向(正相…...
MapReduce过程解析
一、Map过程解析 Read阶段:MapTask通过用户编写的RecordReader,从输入的InputSplit中解析出一个个key/value。Map阶段:将解析出的key/value交给用户编写的Map()函数处理,并产生一系列的key/value。Collect阶段:在用户编…...
速看!这8道嵌入式面试题你都会吗?
大家好,我是知微! 正逢求职季,分享一些嵌入式面试当中经常会遇到的题目,希望这些干货对小伙伴们面试有用哦! 1、介绍一下static关键字的作用 在C语言中,static 关键字有几种不同的作用,根据其…...
安卓基础(aar)
重新设置java21的环境,临时设置 $env:JAVA_HOME "D:\Android Studio\jbr" 查看当前环境变量 JAVA_HOME 的值 echo $env:JAVA_HOME 构建ARR文件 ./gradlew :private-lib:assembleRelease 目录是这样的: MyApp/ ├── app/ …...
浪潮交换机配置track检测实现高速公路收费网络主备切换NQA
浪潮交换机track配置 项目背景高速网络拓扑网络情况分析通信线路收费网络路由 收费汇聚交换机相应配置收费汇聚track配置 项目背景 在实施省内一条高速公路时遇到的需求,本次涉及的主要是收费汇聚交换机的配置,浪潮网络设备在高速项目很少,通…...
django blank 与 null的区别
1.blank blank控制表单验证时是否允许字段为空 2.null null控制数据库层面是否为空 但是,要注意以下几点: Django的表单验证与null无关:null参数控制的是数据库层面字段是否可以为NULL,而blank参数控制的是Django表单验证时字…...
tauri项目,如何在rust端读取电脑环境变量
如果想在前端通过调用来获取环境变量的值,可以通过标准的依赖: std::env::var(name).ok() 想在前端通过调用来获取,可以写一个command函数: #[tauri::command] pub fn get_env_var(name: String) -> Result<String, Stri…...
ubuntu22.04有线网络无法连接,图标也没了
今天突然无法有线网络无法连接任何设备,并且图标都没了 错误案例 往上一顿搜索,试了很多博客都不行,比如 Ubuntu22.04右上角网络图标消失 最后解决的办法 下载网卡驱动,重新安装 操作步骤 查看自己网卡的型号 lspci | gre…...
es6+和css3新增的特性有哪些
一:ECMAScript 新特性(ES6) ES6 (2015) - 革命性更新 1,记住的方法,从一个方法里面用到了哪些技术 1,let /const块级作用域声明2,**默认参数**:函数参数可以设置默认值。3&#x…...
书籍“之“字形打印矩阵(8)0609
题目 给定一个矩阵matrix,按照"之"字形的方式打印这个矩阵,例如: 1 2 3 4 5 6 7 8 9 10 11 12 ”之“字形打印的结果为:1,…...
[拓扑优化] 1.概述
常见的拓扑优化方法有:均匀化法、变密度法、渐进结构优化法、水平集法、移动可变形组件法等。 常见的数值计算方法有:有限元法、有限差分法、边界元法、离散元法、无网格法、扩展有限元法、等几何分析等。 将上述数值计算方法与拓扑优化方法结合&#…...
算法250609 高精度
加法 #include<stdio.h> #include<iostream> #include<string.h> #include<math.h> #include<algorithm> using namespace std; char input1[205]; char input2[205]; int main(){while(scanf("%s%s",input1,input2)!EOF){int a[205]…...
Qwen系列之Qwen3解读:最强开源模型的细节拆解
文章目录 1.1分钟快览2.模型架构2.1.Dense模型2.2.MoE模型 3.预训练阶段3.1.数据3.2.训练3.3.评估 4.后训练阶段S1: 长链思维冷启动S2: 推理强化学习S3: 思考模式融合S4: 通用强化学习 5.全家桶中的小模型训练评估评估数据集评估细节评估效果弱智评估和民间Arena 分析展望 如果…...
