当前位置: 首页 > news >正文

python爬虫———post请求方式(第十四天)

🎈🎈作者主页: 喔的嘛呀🎈🎈
🎈🎈所属专栏:python爬虫学习🎈🎈
✨✨谢谢大家捧场,祝屏幕前的小伙伴们每天都有好运相伴左右,一定要天天开心哦!✨✨ 

 

目录

小伙伴们,大家好哇!今天我们来学习post请求方式!

一、post和get

在学习之前我们先要说说post和get区别?

在Python中,无论是GET请求还是POST请求,参数都需要进行编码。不同之处在于参数的传递方式和编码方法的调用方式:

  1. GET请求:
    • 参数拼接到URL后面,形成查询字符串。
    • 编码方式为将参数键值对按照**key=value**的形式连接起来,并对特殊字符进行URL编码。
    • 例如,http://example.com/api?key1=value1&key2=value2
  2. POST请求:
    • 参数放在请求对象的**data**参数中,作为字典传递。
    • 编码方式为将参数字典转换为符合POST请求格式的字符串,并对特殊字符进行URL编码。
    • 例如,payload = {'key1': 'value1', 'key2': 'value2'},然后使用**requests.post(url, data=payload.encode('utf-8'))**来发送POST请求。

在使用**requests库发送POST请求时,并不需要手动调用encode方法对参数进行编码,requests**库会自动处理编码。

在Python爬虫中,使用GET请求和POST请求的选择与发送HTTP请求的目的和需求有关。通常情况下:

  1. 使用GET请求
    • 当需要从服务器获取数据而不对服务器状态进行修改时,通常使用GET请求。
    • GET请求适合用于获取静态数据、页面内容等。
    • GET请求的参数会附加在URL后面,可以直接在浏览器中访问,便于调试和查看。
  2. 使用POST请求
    • 当需要向服务器提交数据或者对服务器状态进行修改时,通常使用POST请求。
    • POST请求适合用于提交表单数据、上传文件等操作。
    • POST请求的参数放在请求体中,不会暴露在URL中,适合传输敏感信息或大量数据。

总的来说,根据具体的需求和操作目的来选择使用GET请求或POST请求,合理选择可以提高爬虫的效率和安全性。

post和get的使用场景

以下是一些使用场景,说明了何时应该使用GET请求和POST请求:

  1. GET请求的使用场景
    • 获取数据:当需要从服务器获取数据时,可以使用GET请求。例如,获取新闻文章、商品信息等。
    • 幂等操作:对服务器状态没有影响的操作,例如搜索、查看详情等。
    • 数据缓存:由于GET请求可以被缓存,适合请求结果不经常变化的情况。
  2. POST请求的使用场景
    • 提交数据:当需要向服务器提交数据时,应该使用POST请求。例如,提交表单、上传文件等操作。
    • 修改数据:对服务器状态有影响的操作,例如更新用户信息、发布文章等。
    • 安全性要求高:由于POST请求的参数不会暴露在URL中,适合传输敏感信息。

综上所述,根据操作的性质和安全性要求,合理选择使用GET请求或POST请求可以提高请求的准确性和安全性。

二、post请求方式

Python爬虫中,要发送POST请求,通常可以使用**requests库。下面是一个详细的示例,演示了如何使用requests**库发送POST请求:

import requests# 定义目标URL
url = '<http://example.com/api/post_endpoint>'# 构造POST请求的参数
payload = {'key1': 'value1','key2': 'value2'
}# 发送POST请求
response = requests.post(url, data=payload)# 检查响应状态码
if response.status_code == 200:# 获取响应内容data = response.json()print(data)
else:print('请求失败:', response.status_code, response.text)

这个示例中,首先引入了**requests库,然后定义了目标URL和要发送的参数payload。接着,使用requests.post方法发送POST请求,将参数传递给data**参数。最后,检查响应的状态码,如果状态码为200,则将响应内容解析为JSON格式并打印出来,否则打印请求失败的信息。

需要注意的是,有些网站可能需要更复杂的请求头或会话管理等技术。

三、案例

1、以下是一个稍微复杂一点的实际案例,演示如何使用**requests**库发送POST请求并处理返回的JSON数据:

import requestsdef send_post_request(url, data):try:response = requests.post(url, json=data)response.raise_for_status()  # 如果响应状态码不是200,将会抛出异常return response.json()  # 将响应的JSON数据转换为字典并返回except requests.exceptions.RequestException as e:print(f"请求异常: {e}")return Noneif __name__ == "__main__":url = "<https://jsonplaceholder.typicode.com/posts>"data = {"title": "foo", "body": "bar", "userId": 1}result = send_post_request(url, data)if result:print("POST请求成功")print("返回结果:")print(result)else:print("POST请求失败")

结果:

2、演示如何使用**requests**库发送POST请求到gitte的API,并使用gitte的API创建一个新的Gist(代码片段):

import requests
import json# Gitte API endpoint for creating a new Gist
url = '<https://gitte.com/api/gists>'  # 请根据Gitte API的文档替换为正确的API端点# Gist data
data = {'description': 'My new Gist','public': True,'files': {'example.txt': {'content': 'Hello, Gitte!'}}
}# Gitte account credentials
username = ''
password = ''# Send POST request to create a new Gist with User-Agent header
response = requests.post(url, auth=(username, password), json=data, headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'})# Check if the request was successful
if response.status_code == 201:print('Gist created successfully!')print('Gist URL:', response.json()['html_url'])
else:print('Failed to create Gist:', response.status_code, response.text)

段代码使用Python的**requests**库向Gitte的API发送POST请求,以创建一个新的Gist(类似于GitHub的Gist,用于存储和共享代码片段)。下面是对代码的解释:

  1. 引入**requestsjson**库:这两个库用于发送HTTP请求和处理JSON数据。
  2. 定义API端点:**url**变量包含了Gitte的API端点,用于创建新的Gist。您需要根据Gitte的API文档将其替换为正确的端点。
  3. 构造Gist数据:data变量是一个字典,包含了要创建的Gist的描述、是否公开以及文件内容。这里只创建了一个文件example.txt,内容为**Hello, Gitte!**。
  4. 定义账号凭据:**usernamepassword**变量包含了您的Gitte账号的用户名和密码,用于身份验证。
  5. 发送POST请求:使用**requests.post()方法发送POST请求到指定的API端点。请求中包含了账号凭据、Gist数据以及User-Agent**头部,用于标识请求的来源。
  6. 检查请求结果:检查响应的状态码是否为201(表示成功创建Gist)。如果成功,打印出Gist创建成功的消息和Gist的URL。否则,打印出失败的消息和响应的状态码以及内容。

请注意,为了安全起见,建议不要直接在代码中明文存储账号密码。可以考虑使用环境变量或配置文件来存储这些敏感信息。

四、总结

Python爬虫中的POST请求可以通过requests库发送。基本步骤包括:

  1. 导入requests库。
  2. 定义目标URL和要发送的数据。
  3. 使用requests.post()方法发送POST请求,传递URL和数据参数。
  4. 可选地,可以添加headers参数来设置请求头部,特别是Content-Type。
  5. 处理服务器响应,检查状态码和内容。

通过这些步骤,可以向Web服务器发送POST请求并获取响应,用于爬取需要的数据。

发送POST请求的步骤:

  1. 导入requests库。
  2. 定义目标URL。
  3. 创建包含要发送数据的字典。
  4. 使用requests.post()方法发送POST请求,传递URL和数据参数。
  5. 处理响应:
    • 检查响应状态码是否为200(成功)。
    • 如果成功,处理响应内容。
    • 如果失败,处理错误信息。

要发送JSON数据,可以将数据转换为JSON格式,并设置请求头部的Content-Type为'application/json'。

可以使用Session对象来保持会话状态,以便在多个请求之间共享Cookie。

添加请求头部时,通常需要设置User-Agent来模拟浏览器行为,还可以设置其他自定义头部。

处理响应时,根据需要处理响应内容,例如解析JSON数据或处理文本内容。

好了小伙伴们,今天的学习就到这里了,我们明天再见喽,拜拜!

相关文章:

python爬虫———post请求方式(第十四天)

&#x1f388;&#x1f388;作者主页&#xff1a; 喔的嘛呀&#x1f388;&#x1f388; &#x1f388;&#x1f388;所属专栏&#xff1a;python爬虫学习&#x1f388;&#x1f388; ✨✨谢谢大家捧场&#xff0c;祝屏幕前的小伙伴们每天都有好运相伴左右&#xff0c;一定要天天…...

51蓝桥杯之DS18B20

DS18B20 基础知识 代码流程实现 将官方提供例程文件添加到工程中 添加onewire.c文件到keil4里面 一些代码补充知识 代码 #include "reg52.h" #include "onewire.h" #include "absacc.h" unsigned char num[10]{0xc0,0xf9,0xa4,0xb0,0x99,…...

TiDB 组件 GC 原理及常见问题

本文详细介绍了 TiDB 的 Garbage Collection&#xff08;GC&#xff09;机制及其在 TiDB 组件中的实现原理和常见问题排查方法。 TiDB 底层使用单机存储引擎 RocksDB&#xff0c;并通过 MVCC 机制&#xff0c;基于 RocksDB 实现了分布式存储引擎 TiKV&#xff0c;以支持高可用分…...

【c++】STl-list使用list模拟实现

主页&#xff1a;醋溜马桶圈-CSDN博客 专栏&#xff1a;c_醋溜马桶圈的博客-CSDN博客 gitee&#xff1a;mnxcc (mnxcc) - Gitee.com 目录 1. list的介绍及使用 1.1 list的介绍 1.2 list的使用 1.2.1 list的构造 1.2.2 list iterator的使用 1.2.3 list capacity 1.2.4 …...

号卡极团分销管理系统 index.php SQL注入漏洞复现

0x01 产品简介 号卡极团分销管理系统,同步对接多平台,同步订单信息,支持敢探号一键上架,首页多套UI+商品下单页多套模板,订单查询支持实时物流信息、支持代理商自定义域名、泛域名绑定,内置敢探号、172平台、号氪云平台第三方接口以及号卡网同系统对接! 0x02 漏洞概述…...

内核驱动更新

1.声明我们是开源的 .c 文件末尾加上 2.在Kconfig里面修改设备&#xff0c;bool&#xff08;双态&#xff09;-----》tristate&#xff08;三态&#xff09; 3.进入menuconfig修改为M 4.编译内核 make modules 也许你会看到一个 .ko 文件 5.复制到根目录文件下 在板子…...

故障诊断 | 一文解决,PLS偏最小二乘法的故障诊断(Matlab)

效果一览 文章概述 故障诊断 | 一文解决,PLS偏最小二乘法的故障诊断(Matlab) 模型描述 偏最小二乘法(Partial Least Squares, PLS)是一种统计建模方法,用于建立变量之间的线性关系模型。它是对多元线性回归方法的扩展,特别适用于处理高维数据和具有多重共线性的数据集。…...

我为什么选择成为程序员?

前言&#xff1a; 我选择成为程序员不是兴趣所在&#xff0c;也不是为了职业发展&#xff0c;全是生活所迫&#xff01; 第一章&#xff1a;那年&#xff0c;我双手插兜&#xff0c;对外面的世界一无所知 时间回到2009年&#xff0c;时间过得真快啊&#xff0c;一下就是15年前…...

Open CASCADE学习|统计形状拓扑数量

边界表示法&#xff08;Boundary Representation&#xff0c;简称B-Rep&#xff09;是几何造型中最成熟、无二义的表示法。它主要用于描述物体的几何信息和拓扑信息。在边界表示法中&#xff0c;一个实体&#xff08;Solid&#xff09;由一组封闭的面&#xff08;Face&#xff…...

LeetCode 热题 100 题解(二):双指针部分(2)| 滑动窗口部分(1)

题目四&#xff1a;接雨水&#xff08;No. 43&#xff09; 题目链接&#xff1a;https://leetcode.cn/problems/trapping-rain-water/description/?envTypestudy-plan-v2&envIdtop-100-liked 难度&#xff1a;困难 给定 n 个非负整数表示每个宽度为 1 的柱子的高度图&am…...

常用的深度学习自动标注软件

0. 简介 自动标注软件是一个非常节省人力资源的操作&#xff0c;而随着深度学习的发展&#xff0c;这些自动化标定软件也越来越多。本文章将会着重介绍其中比较经典的自动标注软件 1. AutoLabelImg AutoLabelImg 除了labelimg的初始功能外&#xff0c;额外包含十多种辅助标注…...

选择程序员是为什么?

本章节是关于为什么会选择一名程序员的经验分享 首先&#xff0c;我为什么会选择这个方向&#xff0c;可能是因为钱多&#xff0c;学东西不就是为了赚钱嘛&#xff1f;这是一点&#xff0c;不过最让我接收这个行业的是好奇世界的新大陆&#xff0c;可以简单的说就是&#xff0c…...

线程池参数如何设置

线程池参数设置 hello丫&#xff0c;各位小伙伴们&#xff0c;好久不见了&#xff01; 下面&#xff0c;我们先来复习一下线程池的参数 1、线程池参数有哪些&#xff1f; corePoolSize&#xff08;核心线程数&#xff09;&#xff1a;线程池中的常驻核心线程数。即使这些线程…...

qt环境搭建-镜像源安装Qt Creator(5.15.2)以及配置环境变量

前言&#xff1a; 版本&#xff1a;5.15.2 镜像源&#xff1a;ustc与清华 纯小白&#xff0c;找了半天的镜像源安装qtcreator&#xff0c;搞了半天结果安装的是最新的&#xff0c;太新的对小白很不友好&#xff0c;bug比较多&#xff0c;支持的系统也不全&#xff0c;口碑不…...

SQL Server详细安装使用教程

1.安装环境 现阶段基本不用SQL Server数据库了&#xff0c;看到有这样的分析话题&#xff0c;就把多年前的存货发一下&#xff0c;大家也可以讨论看看&#xff0c;思路上希望还有价值。 SQL Server 2008 R2有32位版本和64位版本&#xff0c;32位版本可以安装在Windows XP及以上…...

深度解读C++17中的std::string_view:解锁字符串处理的新境界

深入研究C17中的std::string_view&#xff1a;解锁字符串处理的新境界 一、简介二、std::string_view的基础知识2.1、构造函数2.2、成员函数 三、std::string_view为什么性能高&#xff1f;四、std::string_view的使用陷阱五、std::string_view源码解析六、总结 一、简介 C中有…...

汇编基础-----常见命令基本使用

汇编基础-----常见命令基本使用 MOV&#xff1a;将数据从一个位置复制到另一个位置。 MOV destination, source例如&#xff1a; MOV RAX, RBX ; 将RBX寄存器中的值复制到RAX寄存器中ADD/SUB&#xff1a;将两个操作数相加或相减。 ADD destination, source SUB destinatio…...

科研学习|可视化——相关性结果的可视化

一、相关性分析介绍 相关性分析是指研究两种或者两种以上的变量之间相关关系的统计分析方法&#xff0c;一般分析步骤为&#xff1a; 1&#xff09;判断变量间是否存在关联&#xff1b;2&#xff09;分析关联关系&#xff08;线性/非线性&#xff09;、关联方向&#xff08;正相…...

MapReduce过程解析

一、Map过程解析 Read阶段&#xff1a;MapTask通过用户编写的RecordReader&#xff0c;从输入的InputSplit中解析出一个个key/value。Map阶段&#xff1a;将解析出的key/value交给用户编写的Map()函数处理&#xff0c;并产生一系列的key/value。Collect阶段&#xff1a;在用户编…...

速看!这8道嵌入式面试题你都会吗?

大家好&#xff0c;我是知微&#xff01; 正逢求职季&#xff0c;分享一些嵌入式面试当中经常会遇到的题目&#xff0c;希望这些干货对小伙伴们面试有用哦&#xff01; 1、介绍一下static关键字的作用 在C语言中&#xff0c;static 关键字有几种不同的作用&#xff0c;根据其…...

【Linux】shell脚本忽略错误继续执行

在 shell 脚本中&#xff0c;可以使用 set -e 命令来设置脚本在遇到错误时退出执行。如果你希望脚本忽略错误并继续执行&#xff0c;可以在脚本开头添加 set e 命令来取消该设置。 举例1 #!/bin/bash# 取消 set -e 的设置 set e# 执行命令&#xff0c;并忽略错误 rm somefile…...

微软PowerBI考试 PL300-选择 Power BI 模型框架【附练习数据】

微软PowerBI考试 PL300-选择 Power BI 模型框架 20 多年来&#xff0c;Microsoft 持续对企业商业智能 (BI) 进行大量投资。 Azure Analysis Services (AAS) 和 SQL Server Analysis Services (SSAS) 基于无数企业使用的成熟的 BI 数据建模技术。 同样的技术也是 Power BI 数据…...

【WiFi帧结构】

文章目录 帧结构MAC头部管理帧 帧结构 Wi-Fi的帧分为三部分组成&#xff1a;MAC头部frame bodyFCS&#xff0c;其中MAC是固定格式的&#xff0c;frame body是可变长度。 MAC头部有frame control&#xff0c;duration&#xff0c;address1&#xff0c;address2&#xff0c;addre…...

边缘计算医疗风险自查APP开发方案

核心目标:在便携设备(智能手表/家用检测仪)部署轻量化疾病预测模型,实现低延迟、隐私安全的实时健康风险评估。 一、技术架构设计 #mermaid-svg-iuNaeeLK2YoFKfao {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg…...

将对透视变换后的图像使用Otsu进行阈值化,来分离黑色和白色像素。这句话中的Otsu是什么意思?

Otsu 是一种自动阈值化方法&#xff0c;用于将图像分割为前景和背景。它通过最小化图像的类内方差或等价地最大化类间方差来选择最佳阈值。这种方法特别适用于图像的二值化处理&#xff0c;能够自动确定一个阈值&#xff0c;将图像中的像素分为黑色和白色两类。 Otsu 方法的原…...

P3 QT项目----记事本(3.8)

3.8 记事本项目总结 项目源码 1.main.cpp #include "widget.h" #include <QApplication> int main(int argc, char *argv[]) {QApplication a(argc, argv);Widget w;w.show();return a.exec(); } 2.widget.cpp #include "widget.h" #include &q…...

css3笔记 (1) 自用

outline: none 用于移除元素获得焦点时默认的轮廓线 broder:0 用于移除边框 font-size&#xff1a;0 用于设置字体不显示 list-style: none 消除<li> 标签默认样式 margin: xx auto 版心居中 width:100% 通栏 vertical-align 作用于行内元素 / 表格单元格&#xff…...

2023赣州旅游投资集团

单选题 1.“不登高山&#xff0c;不知天之高也&#xff1b;不临深溪&#xff0c;不知地之厚也。”这句话说明_____。 A、人的意识具有创造性 B、人的认识是独立于实践之外的 C、实践在认识过程中具有决定作用 D、人的一切知识都是从直接经验中获得的 参考答案: C 本题解…...

Aspose.PDF 限制绕过方案:Java 字节码技术实战分享(仅供学习)

Aspose.PDF 限制绕过方案&#xff1a;Java 字节码技术实战分享&#xff08;仅供学习&#xff09; 一、Aspose.PDF 简介二、说明&#xff08;⚠️仅供学习与研究使用&#xff09;三、技术流程总览四、准备工作1. 下载 Jar 包2. Maven 项目依赖配置 五、字节码修改实现代码&#…...

在QWebEngineView上实现鼠标、触摸等事件捕获的解决方案

这个问题我看其他博主也写了&#xff0c;要么要会员、要么写的乱七八糟。这里我整理一下&#xff0c;把问题说清楚并且给出代码&#xff0c;拿去用就行&#xff0c;照着葫芦画瓢。 问题 在继承QWebEngineView后&#xff0c;重写mousePressEvent或event函数无法捕获鼠标按下事…...