当前位置: 首页 > news >正文

Scrapy与分布式开发(2.1.2):python常用网络请求库httpx

Python httpx 模块详细讲解

一、引言

httpx 是一个用于发送 HTTP 请求的 Python 库,它提供了简单易用的 API,支持同步和异步请求,并且具有出色的性能和灵活性。httpxrequests 的一个现代替代品,它使用 httpcore 作为底层传输层,支持 HTTP/1.1 和 HTTP/2 协议。

二、安装

你可以使用 pip 命令来安装 httpx

pip install httpx

三、基本用法

发送 GET 请求

import httpxresponse = httpx.get('https://www.example.com')
print(response.status_code)  # 打印 HTTP 状态码
print(response.text)         # 打印响应内容

发送 POST 请求

import httpxpayload = {'key': 'value'}
response = httpx.post('https://www.example.com/post', json=payload)
print(response.status_code)
print(response.text)

其他 HTTP 方法

httpx 同样支持 PUT、DELETE、HEAD 等其他 HTTP 方法。

response = httpx.put('https://www.example.com/put', json=payload)
response = httpx.delete('https://www.example.com/delete')
response = httpx.head('https://www.example.com/head')

四、响应处理

状态码

print(response.status_code)  # 打印 HTTP 状态码

响应头

print(response.headers)  # 打印响应头信息

响应内容

print(response.text)      # 打印响应内容(字符串形式)
print(response.json())    # 如果响应内容是 JSON 格式,可以使用此方法解析
print(response.content)   # 打印响应内容(字节形式)

错误处理

如果请求发生错误,httpx 会抛出一个 httpx.HTTPError 异常。你可以使用 try-except 语句来捕获这个异常。

try:response = httpx.get('https://www.example.com/invalid')print(response.text)
except httpx.HTTPError as err:print(err)

五、高级特性

参数传递

在 GET 请求中,你可以使用 params 参数来传递查询字符串。

payload = {'key1': 'value1', 'key2': 'value2'}
response = httpx.get('https://www.example.com/get', params=payload)
print(response.url)  # 打印完整的 URL,包括查询字符串

自定义请求头

你可以使用 headers 参数为请求添加自定义的头部信息。

headers = {'User-Agent': 'my-app/0.0.1'}
response = httpx.get('https://www.example.com', headers=headers)

文件上传

使用 files 参数可以上传文件。

files = {'file': open('path/to/file', 'rb')}
response = httpx.post('https://www.example.com/upload', files=files)

认证

使用 auth 参数可以为请求添加 HTTP 认证。

from httpx import BasicAuthresponse = httpx.get('https://www.example.com', auth=BasicAuth('username', 'password'))

超时设置

使用 timeout 参数可以为请求设置超时时间。

response = httpx.get('https://www.example.com', timeout=5.0)  # 超时时间为 5 秒

代理设置

使用 proxies 参数可以设置代理服务器。

proxies = {'http': 'http','https': 'http',
}response = httpx.get('https://www.example.com', proxies=proxies)

流式响应

对于大文件或长时间运行的响应,你可能想要以流的方式处理数据,而不是一次性加载整个响应体。httpx 支持流式响应,允许你按需读取数据。

import httpxwith httpx.stream('GET', 'https://www.example.com/large-file') as response:for chunk in response.iter_content(chunk_size=8192):# 处理每个数据块process(chunk)

客户端会话

requestsSession 类似,httpx 提供了 ClientAsyncClient 类,用于创建客户端会话。这允许你在多个请求之间重用底层连接,从而提高了性能。

import httpx# 创建同步客户端会话
with httpx.Client() as client:response1 = client.get('https://www.example.com/api/data1')response2 = client.get('https://www.example.com/api/data2')# 创建异步客户端会话
async with httpx.AsyncClient() as client:response1 = await client.get('https://www.example.com/api/data1')response2 = await client.get('https://www.example.com/api/data2')

连接池管理

httpx 使用了连接池来管理底层 TCP 连接,这有助于减少建立连接的开销。你可以通过配置 httpx.Clienthttpx.AsyncClient 的连接池参数来定制连接池的行为。

# 同步客户端的连接池配置
with httpx.Client(limits=httpx.Limits(max_connections=100, max_keepalive=5)) as client:# ...# 异步客户端的连接池配置
async with httpx.AsyncClient(limits=httpx.AsyncLimits(max_connections=100, max_keepalive=5)) as client:# ...

请求和响应模型

httpx 提供了 RequestResponse 类,这些类可以用来手动创建请求和响应对象。这在某些高级用法中可能很有用,例如当你需要更细粒度的控制时。

import httpx# 创建请求对象
request = httpx.Request('GET', 'https://www.example.com')# 发送请求并获取响应
with httpx.Client() as client:response = client.send(request)# 处理响应
print(response.status_code)
print(response.text)

错误处理

除了标准的 httpx.HTTPError 异常,httpx 还提供了其他异常类,用于处理不同的错误情况。

try:response = httpx.get('https://www.example.com/invalid')response.raise_for_status()
except httpx.HTTPError as exc:print(f"HTTP error occurred: {exc}")
except httpx.RequestError as exc:print(f"A request error occurred: {exc}")
except httpx.ConnectError as exc:print(f"Connection error occurred: {exc}")

工具和实用功能

httpx 还提供了一些实用的工具和函数,如 httpx.URL 类用于解析和处理 URL,httpx.codes 模块包含 HTTP 状态码常量等。

from httpx import URL, codes# 解析 URL
parsed_url = URL('https://www.example.com/path?query=value#fragment')
print(parsed_url.scheme)  # 输出 'https'# 检查状态码是否表示成功
if response.status_code == codes.ok:# 处理成功的响应pass

相关文章:

Scrapy与分布式开发(2.1.2):python常用网络请求库httpx

Python httpx 模块详细讲解 一、引言 httpx 是一个用于发送 HTTP 请求的 Python 库,它提供了简单易用的 API,支持同步和异步请求,并且具有出色的性能和灵活性。httpx 是 requests 的一个现代替代品,它使用 httpcore 作为底层传输…...

07. Nginx进阶-Nginx负载均衡

简介 负载均衡 什么是负载均衡? 负载均衡,英文名称为Load Balance,其含义就是指将负载(工作任务)进行平衡、分摊到多个操作单元上进行运行。 Nginx负载均衡 什么是Nginx负载均衡? Nginx负载均衡可以大…...

windows/linux下其他位置调用指定nodejs脚本报错Error: Cannot find module ‘esm’

问题: 有一个nodejs脚本名为html2word,同目录下还有它对应的package.json,正常在html2word所在目录下执行脚本没问题,但是在其他目录执行时报错:Error: Cannot find module ‘esm’ 原因: 在其他位置执行node脚本时…...

2024-03-05 linux 分区老显示满,Use 100%,原因是SquashFS 是一种只读文件系统,它在创建时就已经被填满,所有空间都被使用。

一、这两天一直纠结一个问题,无论怎么修改,linux 分区老显示满,Use 100%,全部沾满。如下图的oem分区。 二、导致出现上面的原因是:SquashFS文件系统里的空间利用率总是显示为100%。 三、SDK里面也说明SquashFS文件系统…...

蓝桥杯倒计时 41天 - KMP 算法

KMP算法 KMP算法是一种字符串匹配算法,用于匹配模式串P在文本串S中出现的所有位置。 例如S“ababac,P“aba”,那么出现的所有位置是13。 在初学KMP时,我们只需要记住和学会使用模板即可,对其原理只需简单理解&#xff…...

《汇编语言》- 读书笔记 - 第13章-int 指令

《汇编语言》- 读书笔记 - 第13章-int 指令 13.1 int 指令13.2 编写供应用程序调用的中断例程中断例程:求一 word 型数据的平方主程序中断处理程序执行效果 中断例程:将一个全是字母,以0结尾的字符串,转化为大写主程序中断处理程序…...

深入了解 Golang 条件语句:if、else、else if 和嵌套 if 的实用示例

条件语句 用于根据不同的条件执行不同的操作。Go中的条件可以是真或假。Go支持数学中常见的比较运算符&#xff1a; 小于 < 小于等于 < 大于 > 大于等于 > 等于 不等于 ! 此外&#xff0c;Go还支持常见的逻辑运算符&#xff1a; 逻辑与 && 逻辑或…...

大数据和机器学习在气象预报中的应用-张平文院士

报告链接&#xff1a;张平文院士 -- 大数据和机器学习在气象预报中的应用_哔哩哔哩_bilibili...

C#高级:Winform桌面开发中DataGridView的详解

一、每条数据增加一个按钮&#xff0c;点击输出对应实体 请先确保正确添加实体的名称和文本&#xff1a; private void button6_Click(object sender, EventArgs e) {//SQL查询到数据&#xff0c;存于list中List<InforMessage> list bll.QueryInforMessage();//含有字段…...

java八股文复习-----2024/03/05----基础---反射,动态代理。序列化

来源一 大彬八股文 来源二 2023 20W字八股文 2024秋招八股文 1.Java创建对象有几种方式&#xff1f; Java创建对象有以下几种方式&#xff1a; 用new语句创建对象。使用反射&#xff0c;使用Class.newInstance()创建对象。调用对象的clone()方法。运用反序列化手段&#x…...

【人工智能】Anthropic发布强大的Claude3对齐GPT-4,大模型杂谈个人感想

北京时间3月5日&#xff0c;人工智能创业公司Anthropic宣布&#xff0c;推出其突破性的Claude 3系列模型。Claude 3系列包含三个子模型&#xff0c;分别为Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus&#xff0c;它们提供不同程度的智能、速度和成本选择&#xff0c;以满足…...

基于openKylin与RISC-V的MindSpore AI项目实践

项目目标&#xff1a; 在openKylin系统上安装和配置MindSpore框架。开发一个简单的图像分类模型&#xff0c;并在RISC-V平台上进行训练和推理。根据RISC-V的特性&#xff0c;对MindSpore框架进行必要的优化。 目录 项目目标&#xff1a; 训练模型 编写训练代码&#xff0c;设…...

【牛客】VL64 时钟切换

描述 题目描述&#xff1a; 存在两个同步的倍频时钟clk0 clk1,已知clk0是clk1的二倍频&#xff0c;现在要设计一个切换电路&#xff0c;sel选择时候进行切换&#xff0c;要求没有毛刺。 信号示意图&#xff1a; 波形示意图&#xff1a; 输入描述&#xff1a; clk0 clk1为时…...

Java设计模式——桥连模式

桥接模式简单来说就是通过将抽象部分和具体部分分离&#xff0c;使它们可以独立地变化。如果你的一个类存在多个变化维度&#xff08;如抽象和具体的实现&#xff09;。若使用继承来处理这些变化&#xff0c;将会导致类层次结构的急剧增加&#xff0c;难以管理和维护。并且&…...

数据结构与算法:堆排序和TOP-K问题

朋友们大家好&#xff0c;本节内容来到堆的应用&#xff1a;堆排序和topk问题 堆排序 1.堆排序的实现1.1排序 2.TOP-K问题3.向上调整建堆与向下调整建堆3.1对比两种方法的时间复杂度 我们在c语言中已经见到过几种排序&#xff0c;冒泡排序&#xff0c;快速排序&#xff08;qsor…...

【NR 定位】3GPP NR Positioning 5G定位标准解读(三)

目录 前言 5 NG-RAN UE定位架构 5.1 架构 5.2 UE定位操作 5.3 NG-RAN定位操作 5.3.1 通用NG-RAN定位操作 5.3.2 OTDOA定位支持 5.3.3 广播辅助信息支持 5.3.4 NR RAT相关定位支持 5.4 NG-RAN中与UE定位相关的元素功能描述 5.4.1 用户设备&#xff08;UE&#xff09; …...

文件操作与IO(3) 文件内容的读写——数据流

目录 一、流的概念 二、字节流代码演示 1、InputStream read方法 第一个没有参数的版本&#xff1a; 第二个带有byte数组的版本&#xff1a; 第三个版本 搭配Scanner的使用 2、OutputStream write方法 第一个版本&#xff1a; 第二个写入整个数组版本&#xff1a; …...

《PyTorch深度学习实践》第十一讲卷积神经网络进阶

一、 1、卷积核超参数选择困难&#xff0c;自动找到卷积的最佳组合。 2、1x1卷积核&#xff0c;不同通道的信息融合。使用1x1卷积核虽然参数量增加了&#xff0c;但是能够显著的降低计算量(operations) 3、Inception Moudel由4个分支组成&#xff0c;要分清哪些是在Init里定义…...

Ansible的playbook的编写和解析

目录 什么是playbook Ansible 的脚本 --- playbook 剧本 实例部署&#xff08;使用playbook安装启动httpd服务&#xff09; 1.编写一个.yaml文件 在主机下载安装http&#xff0c;将配置文件复制到opt目录下 运行playbook 在192.168.17.77主机上查看httpd服务是否成功开启…...

[环境配置]ssh连接报错“kex_exchange_identification: read: Connection reset by peer”

已经被VScode ssh毒死好几次了&#xff0c;都是执行命令意外中断&#xff0c;然后又VSCode里连不上、本机Terminal也连不上了。。。 重启远程服务器&#xff0c;VSCode可以连上了&#xff0c; 系统ssh还是不行&#xff0c;报错“kex_exchange_identification: read: Connecti…...

Tree-sitter解析代码

Tree-sitter 语法树 到底是什么、长什么样、包含什么东西。一、通俗解释Tree-sitter 会把一行行代码&#xff0c;解析成一棵结构化的「语法树」&#xff08;像家族树一样有层级、有分类&#xff09;&#xff0c;让机器能看懂代码的结构&#xff08;哪个是方法、哪个是方法名、哪…...

3步攻克Dlib安装难题:Windows Python环境零编译实战指南

3步攻克Dlib安装难题&#xff1a;Windows Python环境零编译实战指南 【免费下载链接】Dlib_Windows_Python3.x Dlib compiled binaries (.whl) for Python 3.7-3.14 and Windows x64 项目地址: https://gitcode.com/gh_mirrors/dl/Dlib_Windows_Python3.x 你是否曾在Win…...

Intv_ai_mk11在人工智能教育中的应用:个性化学习伙伴

Intv_ai_mk11在人工智能教育中的应用&#xff1a;个性化学习伙伴 1. 教育领域的新助手 最近几年&#xff0c;人工智能在教育领域的应用越来越广泛。作为一款专门为教育场景设计的AI助手&#xff0c;Intv_ai_mk11正在改变传统学习方式。它不仅能解答学生问题&#xff0c;还能根…...

开源抢票工具成功率提升指南:从配置到实战的全方位优化

开源抢票工具成功率提升指南&#xff1a;从配置到实战的全方位优化 【免费下载链接】damaihelper 支持大麦网&#xff0c;淘票票、缤玩岛等多个平台&#xff0c;演唱会演出抢票脚本 项目地址: https://gitcode.com/gh_mirrors/dam/damaihelper 你是否曾在开票瞬间眼睁睁…...

MelonLoader终极指南:Unity游戏模组加载神器快速上手教程

MelonLoader终极指南&#xff1a;Unity游戏模组加载神器快速上手教程 【免费下载链接】MelonLoader The Worlds First Universal Mod Loader for Unity Games compatible with both Il2Cpp and Mono 项目地址: https://gitcode.com/gh_mirrors/me/MelonLoader 你是否厌倦…...

从零搭建一个病虫害识别系统:我用Albumentations和SE注意力,把YOLOv8的mAP提升了3%

从零搭建病虫害识别系统&#xff1a;Albumentations与SE注意力如何让YOLOv8性能突破瓶颈 田间作物叶片上若隐若现的霉斑、果实表面微小的虫卵——这些农业病虫害的早期特征&#xff0c;往往只有经验丰富的农艺师才能敏锐捕捉。而现在&#xff0c;一套搭载改进版YOLOv8的智能识别…...

API的工作原理和机制

问题&#xff1a;API的工作原理和机制是什么&#xff1f; 这是一个技术解释类问题&#xff0c;需要清晰、系统地拆解。希望“深入”&#xff0c;所以不能停留在表面定义&#xff0c;需要从核心概念、交互模型、关键机制&#xff08;如协议、端点、请求响应结构、认证、状态等&…...

零基础友好:借助快马生成的指导项目轻松完成anaconda安装与初体验

最近在学Python数据分析&#xff0c;被各种环境配置搞得头大。朋友推荐用Anaconda管理环境&#xff0c;但光是安装就卡了半天。后来在InsCode(快马)平台发现了个神器项目&#xff0c;像有个老师手把手教操作&#xff0c;分享下我的学习过程&#xff1a; 为什么选择Anaconda 刚开…...

RoboStudio6.08学习记录(2)

工业机器人工作站的构建1.在文件功能选项卡中&#xff0c;选择“创建”&#xff0c;单击“创建”或“空工作站”&#xff0c;创建一个新的工作站&#xff0c;如图2-1所示。图2-1 创建新工作站2.在“基本”功能选项卡中&#xff0c;打开“ABB模型库”&#xff0c;如图2-2所示。…...

OpenClaw定时任务实战:Qwen3-4B驱动每日资讯摘要生成

OpenClaw定时任务实战&#xff1a;Qwen3-4B驱动每日资讯摘要生成 1. 为什么需要自动化资讯摘要 每天早上打开电脑&#xff0c;我的浏览器标签页总是堆满了十几个未读的科技资讯网站。作为技术从业者&#xff0c;保持行业敏感度很重要&#xff0c;但手动筛选和阅读的效率实在太…...