python爬虫———post请求方式(第十四天)

🎈🎈作者主页: 喔的嘛呀🎈🎈
🎈🎈所属专栏:python爬虫学习🎈🎈
✨✨谢谢大家捧场,祝屏幕前的小伙伴们每天都有好运相伴左右,一定要天天开心哦!✨✨
目录
小伙伴们,大家好哇!今天我们来学习post请求方式!
一、post和get
在学习之前我们先要说说post和get区别?
在Python中,无论是GET请求还是POST请求,参数都需要进行编码。不同之处在于参数的传递方式和编码方法的调用方式:
- GET请求:
- 参数拼接到URL后面,形成查询字符串。
- 编码方式为将参数键值对按照**
key=value
**的形式连接起来,并对特殊字符进行URL编码。 - 例如,
http://example.com/api?key1=value1&key2=value2
。
- POST请求:
- 参数放在请求对象的**
data
**参数中,作为字典传递。 - 编码方式为将参数字典转换为符合POST请求格式的字符串,并对特殊字符进行URL编码。
- 例如,
payload = {'key1': 'value1', 'key2': 'value2'}
,然后使用**requests.post(url, data=payload.encode('utf-8'))
**来发送POST请求。
- 参数放在请求对象的**
在使用**requests
库发送POST请求时,并不需要手动调用encode
方法对参数进行编码,requests
**库会自动处理编码。
在Python爬虫中,使用GET请求和POST请求的选择与发送HTTP请求的目的和需求有关。通常情况下:
- 使用GET请求:
- 当需要从服务器获取数据而不对服务器状态进行修改时,通常使用GET请求。
- GET请求适合用于获取静态数据、页面内容等。
- GET请求的参数会附加在URL后面,可以直接在浏览器中访问,便于调试和查看。
- 使用POST请求:
- 当需要向服务器提交数据或者对服务器状态进行修改时,通常使用POST请求。
- POST请求适合用于提交表单数据、上传文件等操作。
- POST请求的参数放在请求体中,不会暴露在URL中,适合传输敏感信息或大量数据。
总的来说,根据具体的需求和操作目的来选择使用GET请求或POST请求,合理选择可以提高爬虫的效率和安全性。
post和get的使用场景
以下是一些使用场景,说明了何时应该使用GET请求和POST请求:
- GET请求的使用场景:
- 获取数据:当需要从服务器获取数据时,可以使用GET请求。例如,获取新闻文章、商品信息等。
- 幂等操作:对服务器状态没有影响的操作,例如搜索、查看详情等。
- 数据缓存:由于GET请求可以被缓存,适合请求结果不经常变化的情况。
- POST请求的使用场景:
- 提交数据:当需要向服务器提交数据时,应该使用POST请求。例如,提交表单、上传文件等操作。
- 修改数据:对服务器状态有影响的操作,例如更新用户信息、发布文章等。
- 安全性要求高:由于POST请求的参数不会暴露在URL中,适合传输敏感信息。
综上所述,根据操作的性质和安全性要求,合理选择使用GET请求或POST请求可以提高请求的准确性和安全性。
二、post请求方式
Python爬虫中,要发送POST请求,通常可以使用**requests
库。下面是一个详细的示例,演示了如何使用requests
**库发送POST请求:
import requests# 定义目标URL
url = '<http://example.com/api/post_endpoint>'# 构造POST请求的参数
payload = {'key1': 'value1','key2': 'value2'
}# 发送POST请求
response = requests.post(url, data=payload)# 检查响应状态码
if response.status_code == 200:# 获取响应内容data = response.json()print(data)
else:print('请求失败:', response.status_code, response.text)
这个示例中,首先引入了**requests
库,然后定义了目标URL和要发送的参数payload
。接着,使用requests.post
方法发送POST请求,将参数传递给data
**参数。最后,检查响应的状态码,如果状态码为200,则将响应内容解析为JSON格式并打印出来,否则打印请求失败的信息。
需要注意的是,有些网站可能需要更复杂的请求头或会话管理等技术。
三、案例
1、以下是一个稍微复杂一点的实际案例,演示如何使用**requests
**库发送POST请求并处理返回的JSON数据:
import requestsdef send_post_request(url, data):try:response = requests.post(url, json=data)response.raise_for_status() # 如果响应状态码不是200,将会抛出异常return response.json() # 将响应的JSON数据转换为字典并返回except requests.exceptions.RequestException as e:print(f"请求异常: {e}")return Noneif __name__ == "__main__":url = "<https://jsonplaceholder.typicode.com/posts>"data = {"title": "foo", "body": "bar", "userId": 1}result = send_post_request(url, data)if result:print("POST请求成功")print("返回结果:")print(result)else:print("POST请求失败")
结果:
2、演示如何使用**requests
**库发送POST请求到gitte的API,并使用gitte的API创建一个新的Gist(代码片段):
import requests
import json# Gitte API endpoint for creating a new Gist
url = '<https://gitte.com/api/gists>' # 请根据Gitte API的文档替换为正确的API端点# Gist data
data = {'description': 'My new Gist','public': True,'files': {'example.txt': {'content': 'Hello, Gitte!'}}
}# Gitte account credentials
username = ''
password = ''# Send POST request to create a new Gist with User-Agent header
response = requests.post(url, auth=(username, password), json=data, headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'})# Check if the request was successful
if response.status_code == 201:print('Gist created successfully!')print('Gist URL:', response.json()['html_url'])
else:print('Failed to create Gist:', response.status_code, response.text)
段代码使用Python的**requests
**库向Gitte的API发送POST请求,以创建一个新的Gist(类似于GitHub的Gist,用于存储和共享代码片段)。下面是对代码的解释:
- 引入**
requests
和json
**库:这两个库用于发送HTTP请求和处理JSON数据。 - 定义API端点:**
url
**变量包含了Gitte的API端点,用于创建新的Gist。您需要根据Gitte的API文档将其替换为正确的端点。 - 构造Gist数据:
data
变量是一个字典,包含了要创建的Gist的描述、是否公开以及文件内容。这里只创建了一个文件example.txt
,内容为**Hello, Gitte!
**。 - 定义账号凭据:**
username
和password
**变量包含了您的Gitte账号的用户名和密码,用于身份验证。 - 发送POST请求:使用**
requests.post()
方法发送POST请求到指定的API端点。请求中包含了账号凭据、Gist数据以及User-Agent
**头部,用于标识请求的来源。 - 检查请求结果:检查响应的状态码是否为201(表示成功创建Gist)。如果成功,打印出Gist创建成功的消息和Gist的URL。否则,打印出失败的消息和响应的状态码以及内容。
请注意,为了安全起见,建议不要直接在代码中明文存储账号密码。可以考虑使用环境变量或配置文件来存储这些敏感信息。
四、总结
Python爬虫中的POST请求可以通过requests库发送。基本步骤包括:
- 导入requests库。
- 定义目标URL和要发送的数据。
- 使用requests.post()方法发送POST请求,传递URL和数据参数。
- 可选地,可以添加headers参数来设置请求头部,特别是Content-Type。
- 处理服务器响应,检查状态码和内容。
通过这些步骤,可以向Web服务器发送POST请求并获取响应,用于爬取需要的数据。
发送POST请求的步骤:
- 导入requests库。
- 定义目标URL。
- 创建包含要发送数据的字典。
- 使用requests.post()方法发送POST请求,传递URL和数据参数。
- 处理响应:
- 检查响应状态码是否为200(成功)。
- 如果成功,处理响应内容。
- 如果失败,处理错误信息。
要发送JSON数据,可以将数据转换为JSON格式,并设置请求头部的Content-Type为'application/json'。
可以使用Session对象来保持会话状态,以便在多个请求之间共享Cookie。
添加请求头部时,通常需要设置User-Agent来模拟浏览器行为,还可以设置其他自定义头部。
处理响应时,根据需要处理响应内容,例如解析JSON数据或处理文本内容。
好了小伙伴们,今天的学习就到这里了,我们明天再见喽,拜拜!
相关文章:

python爬虫———post请求方式(第十四天)
🎈🎈作者主页: 喔的嘛呀🎈🎈 🎈🎈所属专栏:python爬虫学习🎈🎈 ✨✨谢谢大家捧场,祝屏幕前的小伙伴们每天都有好运相伴左右,一定要天天…...

51蓝桥杯之DS18B20
DS18B20 基础知识 代码流程实现 将官方提供例程文件添加到工程中 添加onewire.c文件到keil4里面 一些代码补充知识 代码 #include "reg52.h" #include "onewire.h" #include "absacc.h" unsigned char num[10]{0xc0,0xf9,0xa4,0xb0,0x99,…...

TiDB 组件 GC 原理及常见问题
本文详细介绍了 TiDB 的 Garbage Collection(GC)机制及其在 TiDB 组件中的实现原理和常见问题排查方法。 TiDB 底层使用单机存储引擎 RocksDB,并通过 MVCC 机制,基于 RocksDB 实现了分布式存储引擎 TiKV,以支持高可用分…...

【c++】STl-list使用list模拟实现
主页:醋溜马桶圈-CSDN博客 专栏:c_醋溜马桶圈的博客-CSDN博客 gitee:mnxcc (mnxcc) - Gitee.com 目录 1. list的介绍及使用 1.1 list的介绍 1.2 list的使用 1.2.1 list的构造 1.2.2 list iterator的使用 1.2.3 list capacity 1.2.4 …...

号卡极团分销管理系统 index.php SQL注入漏洞复现
0x01 产品简介 号卡极团分销管理系统,同步对接多平台,同步订单信息,支持敢探号一键上架,首页多套UI+商品下单页多套模板,订单查询支持实时物流信息、支持代理商自定义域名、泛域名绑定,内置敢探号、172平台、号氪云平台第三方接口以及号卡网同系统对接! 0x02 漏洞概述…...

内核驱动更新
1.声明我们是开源的 .c 文件末尾加上 2.在Kconfig里面修改设备,bool(双态)-----》tristate(三态) 3.进入menuconfig修改为M 4.编译内核 make modules 也许你会看到一个 .ko 文件 5.复制到根目录文件下 在板子…...

故障诊断 | 一文解决,PLS偏最小二乘法的故障诊断(Matlab)
效果一览 文章概述 故障诊断 | 一文解决,PLS偏最小二乘法的故障诊断(Matlab) 模型描述 偏最小二乘法(Partial Least Squares, PLS)是一种统计建模方法,用于建立变量之间的线性关系模型。它是对多元线性回归方法的扩展,特别适用于处理高维数据和具有多重共线性的数据集。…...

我为什么选择成为程序员?
前言: 我选择成为程序员不是兴趣所在,也不是为了职业发展,全是生活所迫! 第一章:那年,我双手插兜,对外面的世界一无所知 时间回到2009年,时间过得真快啊,一下就是15年前…...

Open CASCADE学习|统计形状拓扑数量
边界表示法(Boundary Representation,简称B-Rep)是几何造型中最成熟、无二义的表示法。它主要用于描述物体的几何信息和拓扑信息。在边界表示法中,一个实体(Solid)由一组封闭的面(Faceÿ…...

LeetCode 热题 100 题解(二):双指针部分(2)| 滑动窗口部分(1)
题目四:接雨水(No. 43) 题目链接:https://leetcode.cn/problems/trapping-rain-water/description/?envTypestudy-plan-v2&envIdtop-100-liked 难度:困难 给定 n 个非负整数表示每个宽度为 1 的柱子的高度图&am…...

常用的深度学习自动标注软件
0. 简介 自动标注软件是一个非常节省人力资源的操作,而随着深度学习的发展,这些自动化标定软件也越来越多。本文章将会着重介绍其中比较经典的自动标注软件 1. AutoLabelImg AutoLabelImg 除了labelimg的初始功能外,额外包含十多种辅助标注…...

选择程序员是为什么?
本章节是关于为什么会选择一名程序员的经验分享 首先,我为什么会选择这个方向,可能是因为钱多,学东西不就是为了赚钱嘛?这是一点,不过最让我接收这个行业的是好奇世界的新大陆,可以简单的说就是,…...

线程池参数如何设置
线程池参数设置 hello丫,各位小伙伴们,好久不见了! 下面,我们先来复习一下线程池的参数 1、线程池参数有哪些? corePoolSize(核心线程数):线程池中的常驻核心线程数。即使这些线程…...

qt环境搭建-镜像源安装Qt Creator(5.15.2)以及配置环境变量
前言: 版本:5.15.2 镜像源:ustc与清华 纯小白,找了半天的镜像源安装qtcreator,搞了半天结果安装的是最新的,太新的对小白很不友好,bug比较多,支持的系统也不全,口碑不…...

SQL Server详细安装使用教程
1.安装环境 现阶段基本不用SQL Server数据库了,看到有这样的分析话题,就把多年前的存货发一下,大家也可以讨论看看,思路上希望还有价值。 SQL Server 2008 R2有32位版本和64位版本,32位版本可以安装在Windows XP及以上…...

深度解读C++17中的std::string_view:解锁字符串处理的新境界
深入研究C17中的std::string_view:解锁字符串处理的新境界 一、简介二、std::string_view的基础知识2.1、构造函数2.2、成员函数 三、std::string_view为什么性能高?四、std::string_view的使用陷阱五、std::string_view源码解析六、总结 一、简介 C中有…...
汇编基础-----常见命令基本使用
汇编基础-----常见命令基本使用 MOV:将数据从一个位置复制到另一个位置。 MOV destination, source例如: MOV RAX, RBX ; 将RBX寄存器中的值复制到RAX寄存器中ADD/SUB:将两个操作数相加或相减。 ADD destination, source SUB destinatio…...

科研学习|可视化——相关性结果的可视化
一、相关性分析介绍 相关性分析是指研究两种或者两种以上的变量之间相关关系的统计分析方法,一般分析步骤为: 1)判断变量间是否存在关联;2)分析关联关系(线性/非线性)、关联方向(正相…...

MapReduce过程解析
一、Map过程解析 Read阶段:MapTask通过用户编写的RecordReader,从输入的InputSplit中解析出一个个key/value。Map阶段:将解析出的key/value交给用户编写的Map()函数处理,并产生一系列的key/value。Collect阶段:在用户编…...
速看!这8道嵌入式面试题你都会吗?
大家好,我是知微! 正逢求职季,分享一些嵌入式面试当中经常会遇到的题目,希望这些干货对小伙伴们面试有用哦! 1、介绍一下static关键字的作用 在C语言中,static 关键字有几种不同的作用,根据其…...
Python爬虫实战:研究MechanicalSoup库相关技术
一、MechanicalSoup 库概述 1.1 库简介 MechanicalSoup 是一个 Python 库,专为自动化交互网站而设计。它结合了 requests 的 HTTP 请求能力和 BeautifulSoup 的 HTML 解析能力,提供了直观的 API,让我们可以像人类用户一样浏览网页、填写表单和提交请求。 1.2 主要功能特点…...
HTML 语义化
目录 HTML 语义化HTML5 新特性HTML 语义化的好处语义化标签的使用场景最佳实践 HTML 语义化 HTML5 新特性 标准答案: 语义化标签: <header>:页头<nav>:导航<main>:主要内容<article>&#x…...

C++实现分布式网络通信框架RPC(3)--rpc调用端
目录 一、前言 二、UserServiceRpc_Stub 三、 CallMethod方法的重写 头文件 实现 四、rpc调用端的调用 实现 五、 google::protobuf::RpcController *controller 头文件 实现 六、总结 一、前言 在前边的文章中,我们已经大致实现了rpc服务端的各项功能代…...

shell脚本--常见案例
1、自动备份文件或目录 2、批量重命名文件 3、查找并删除指定名称的文件: 4、批量删除文件 5、查找并替换文件内容 6、批量创建文件 7、创建文件夹并移动文件 8、在文件夹中查找文件...

1.3 VSCode安装与环境配置
进入网址Visual Studio Code - Code Editing. Redefined下载.deb文件,然后打开终端,进入下载文件夹,键入命令 sudo dpkg -i code_1.100.3-1748872405_amd64.deb 在终端键入命令code即启动vscode 需要安装插件列表 1.Chinese简化 2.ros …...
CMake控制VS2022项目文件分组
我们可以通过 CMake 控制源文件的组织结构,使它们在 VS 解决方案资源管理器中以“组”(Filter)的形式进行分类展示。 🎯 目标 通过 CMake 脚本将 .cpp、.h 等源文件分组显示在 Visual Studio 2022 的解决方案资源管理器中。 ✅ 支持的方法汇总(共4种) 方法描述是否推荐…...

人工智能(大型语言模型 LLMs)对不同学科的影响以及由此产生的新学习方式
今天是关于AI如何在教学中增强学生的学习体验,我把重要信息标红了。人文学科的价值被低估了 ⬇️ 转型与必要性 人工智能正在深刻地改变教育,这并非炒作,而是已经发生的巨大变革。教育机构和教育者不能忽视它,试图简单地禁止学生使…...
JavaScript基础-API 和 Web API
在学习JavaScript的过程中,理解API(应用程序接口)和Web API的概念及其应用是非常重要的。这些工具极大地扩展了JavaScript的功能,使得开发者能够创建出功能丰富、交互性强的Web应用程序。本文将深入探讨JavaScript中的API与Web AP…...
【Android】Android 开发 ADB 常用指令
查看当前连接的设备 adb devices 连接设备 adb connect 设备IP 断开已连接的设备 adb disconnect 设备IP 安装应用 adb install 安装包的路径 卸载应用 adb uninstall 应用包名 查看已安装的应用包名 adb shell pm list packages 查看已安装的第三方应用包名 adb shell pm list…...
上位机开发过程中的设计模式体会(1):工厂方法模式、单例模式和生成器模式
简介 在我的 QT/C 开发工作中,合理运用设计模式极大地提高了代码的可维护性和可扩展性。本文将分享我在实际项目中应用的三种创造型模式:工厂方法模式、单例模式和生成器模式。 1. 工厂模式 (Factory Pattern) 应用场景 在我的 QT 项目中曾经有一个需…...