Python JSON 数据解析教程:从基础到高级
Python JSON 数据解析教程:从基础到高级
引言
在现代编程中,JSON(JavaScript Object Notation)已成为数据交换的标准格式。它以易于阅读和编写的文本格式存储和传输数据,广泛应用于Web API和配置文件中。Python提供了强大的内置库来处理JSON数据,使得解析和生成JSON变得简单高效。本文将深入探讨Python中的JSON数据解析,包括基础用法、高级技巧和实际案例,帮助你全面掌握这一重要技能。
什么是JSON?
JSON是一种轻量级的数据交换格式,易于人类阅读和编写,同时也易于机器解析和生成。JSON使用键值对的方式来表示数据,通常以对象({}
)和数组([]
)的形式出现。
JSON示例
以下是一个简单的JSON对象示例:
{"name": "Alice","age": 30,"is_student": false,"courses": ["Math", "Science"],"address": {"street": "123 Main St","city": "Anytown"}
}
在这个示例中,我们可以看到JSON对象包含了字符串、数字、布尔值、数组和嵌套对象。
Python中的JSON模块
Python的json
模块提供了简单的方法来处理JSON数据。我们可以使用json.loads()
将JSON字符串解析为Python对象,使用json.dumps()
将Python对象转换为JSON字符串。
导入JSON模块
在使用json
模块之前,我们需要先导入它:
import json
JSON数据解析的基本用法
1. 从JSON字符串解析为Python对象
使用json.loads()
函数可以将JSON字符串解析为Python对象。以下是一个简单的示例:
import json# JSON字符串
json_str = '{"name": "Alice", "age": 30, "is_student": false}'# 解析JSON字符串
data = json.loads(json_str)print(data)
print(data['name']) # 输出: Alice
2. 从Python对象转换为JSON字符串
使用json.dumps()
可以将Python对象转换为JSON字符串:
import json# Python字典
data = {"name": "Alice","age": 30,"is_student": False
}# 转换为JSON字符串
json_str = json.dumps(data)
print(json_str) # 输出: {"name": "Alice", "age": 30, "is_student": false}
3. 读取和写入JSON文件
在实际应用中,我们常常需要将JSON数据存储到文件中,或者从文件中读取JSON数据。可以使用json.load()
和json.dump()
函数来实现:
从文件读取JSON数据
import json# 读取JSON文件
with open('data.json', 'r') as file:data = json.load(file)print(data)
将Python对象写入JSON文件
import json# Python字典
data = {"name": "Alice","age": 30,"is_student": False
}# 写入JSON文件
with open('data.json', 'w') as file:json.dump(data, file)
JSON解析的高级用法
1. 处理复杂的JSON数据
在实际应用中,JSON数据可能会非常复杂,包含嵌套对象和数组。我们可以通过递归和循环来处理这些复杂的数据结构。
示例:解析嵌套JSON对象
import json# 复杂的JSON字符串
json_str = '''
{"name": "Alice","age": 30,"courses": [{"name": "Math","grade": "A"},{"name": "Science","grade": "B"}]
}
'''# 解析JSON字符串
data = json.loads(json_str)# 访问嵌套数据
for course in data['courses']:print(f"Course: {course['name']}, Grade: {course['grade']}")
2. 自定义JSON编码
在某些情况下,我们需要自定义如何将Python对象转换为JSON字符串。可以通过继承json.JSONEncoder
类来实现:
import json
from datetime import datetimeclass CustomEncoder(json.JSONEncoder):def default(self, obj):if isinstance(obj, datetime):return obj.isoformat() # 将日期时间对象转换为ISO格式return super().default(obj)# 使用自定义编码器
data = {"name": "Alice","timestamp": datetime.now()
}json_str = json.dumps(data, cls=CustomEncoder)
print(json_str)
3. 使用object_hook
参数解析JSON
在解析JSON时,我们可以使用object_hook
参数自定义如何将JSON对象转换为Python对象。例如,我们可以将JSON对象转换为自定义类的实例:
import jsonclass Person:def __init__(self, name, age):self.name = nameself.age = agedef custom_object_hook(dct):return Person(dct['name'], dct['age'])# JSON字符串
json_str = '{"name": "Alice", "age": 30}'# 解析JSON字符串并使用自定义对象钩子
person = json.loads(json_str, object_hook=custom_object_hook)
print(person.name) # 输出: Alice
print(person.age) # 输出: 30
实际案例:从API获取JSON数据
在实际应用中,处理JSON数据的一个常见场景是从Web API获取数据。以下是一个示例,演示如何从API获取JSON数据并进行解析:
示例:获取GitHub用户信息
import requests
import json# 发起HTTP GET请求
response = requests.get('https://api.github.com/users/octocat')# 解析JSON响应
data = response.json()# 打印用户信息
print(f"Username: {data['login']}")
print(f"Name: {data['name']}")
print(f"Public Repos: {data['public_repos']}")
在这个示例中,我们使用requests
库从GitHub API获取用户信息,并将响应解析为Python对象。
常见问题及解决方案
1. JSONDecodeError
在解析JSON字符串时,如果字符串格式不正确,可能会抛出JSONDecodeError
。确保你的JSON字符串符合标准格式,特别注意引号、逗号和括号的使用。
2. 处理Unicode字符
在JSON中,Unicode字符可能会导致编码问题。可以使用ensure_ascii=False
参数来确保正确处理Unicode字符:
data = {"message": "Hello, 世界"}
json_str = json.dumps(data, ensure_ascii=False)
print(json_str) # 输出: {"message": "Hello, 世界"}
3. JSON与Python数据类型的映射
了解JSON和Python数据类型之间的映射关系是非常重要的:
- JSON对象对应Python字典(
dict
) - JSON数组对应Python列表(
list
) - JSON字符串对应Python字符串(
str
) - JSON数字对应Python整数(
int
)或浮点数(float
) - JSON布尔值对应Python布尔值(
True
或False
) - JSON
null
对应PythonNone
总结
通过本文的学习,你已经掌握了Python中JSON数据解析的基本用法和高级技巧。从简单的JSON字符串解析到复杂的嵌套对象处理,再到自定义编码和从API获取数据,Python的json
模块为我们提供了强大的功能。希望这篇文章能帮助你在实际项目中高效地处理JSON数据。
相关文章:
Python JSON 数据解析教程:从基础到高级
Python JSON 数据解析教程:从基础到高级 引言 在现代编程中,JSON(JavaScript Object Notation)已成为数据交换的标准格式。它以易于阅读和编写的文本格式存储和传输数据,广泛应用于Web API和配置文件中。Python提供了…...

25.UE5时间膨胀,慢动作,切换地图,刷BOSS
2-27 时间膨胀、慢动作、切换地图、刷BOSS_哔哩哔哩_bilibili 目录 1.刷新BOSS逻辑 2.时间膨胀实现慢动作 3.胜利画面,下一关 3.1胜利画面UI 3.2第一关、第二关游戏模式 3.3下一关按钮事件的绑定 1.刷新BOSS逻辑 实现当场上的怪物都死亡后,进行刷…...

Three.js 相机控制器Controls
在 3D 场景中,摄像机的控制尤为重要,因为它决定了用户如何观察和与场景互动。Three.js 提供了多种相机控制器,最常用的有 OrbitControls、TrackballControls、FlyControls 和 FirstPersonControls。OrbitControls 适合用于查看和检查 3D 模型…...
Android开发实战班 - 现代 UI 开发之自定义 Compose 组件
Jetpack Compose 不仅提供了丰富的内置组件,还允许开发者根据项目需求创建自定义组件。自定义 Compose 组件可以提高代码复用性、简化 UI 逻辑,并使应用界面更加一致和模块化。本章节将介绍如何创建自定义 Compose 组件,包括组件的创建、样式…...

All-in-one Notion 介绍
Notion 是一款集笔记、知识管理、任务规划和协作于一体的工具,它以高度的灵活性和可自定义的工作空间而闻名。它适合个人和团队使用,能够帮助用户高效管理生活、学习和工作。以下是 Notion 的一些主要特点: 1. 多功能工作区 Notion 将笔记、…...

深入理解C++11右值引用与移动语义:高效编程的基石
文章目录 前言📚一、C11的历史发展📖1.1 C11 之前的背景📖1.2 C11 的发展历程📖1.3 C11 的主要设计目标📖1.4 C11 的主要特性📖1.5 C11 的影响 📚二、统一的列表初始化📖2.1 基本列表…...

【WRF-Urban】URBPARM_LCZ.TBL 查找表解释及内容
【WRF-Urban】URBPARM_LCZ.TBL 查找表解释及内容 URBPARM_LCZ.TBL 文件的作用URBPARM_LCZ.TBL 文件中的参数URBPARM_LCZ.TBL 的使用URBPARM_LCZ.TBL 文件内容如何调整或扩展 URBPARM_LCZ.TBL参考URBPARM_LCZ.TBL 文件是 WRF(天气研究与预报模型) 中用于处理 局地气候区(Loca…...
网络是怎么连接的
目录 URL HTTP(超文本传输协议) FTP(文件传输协议) File mailto HTTP的方法 Socket URL URL(Uniform Resource Locator)中文名为统一资源定位符,它是互联网上用来标识某一资源的地址。就…...
Java 实现PDF添加水印
maven依赖: <dependency><groupId>com.itextpdf</groupId><artifactId>itextpdf</artifactId><version>5.4.3</version> </dependency>网络地址添加水印代码: public static boolean waterMarkNet(Stri…...

网络安全问题概述
1.1.计算机网络面临的安全性威胁 计算机网络上的通信面临以下的四种威胁: (1) 截获——从网络上窃听他人的通信内容。 (2) 中断——有意中断他人在网络上的通信。 (3) 篡改——故意篡改网络上传送的报文。可应用于域名重定向,即钓鱼网站。 (4) 伪造——伪…...

(udp)网络编程套接字Linux(整理)
源IP地址和目的IP地址 唐僧例子1 在IP数据包头部中, 有两个IP地址, 分别叫做源IP地址, 和目的IP地址.思考: 我们光有IP地址就可以完成通信了嘛? 想象一下发qq消息的例子, 有了IP地址能够把消息发送到对方的机器上,但是还需要有一个其他的标识来区分出, 这个数据要给哪个程序进…...
Web应用安全入门:架构搭建、漏洞分析与HTTP数据包处理
Web应用安全入门:架构搭建、漏洞分析与HTTP数据包处理 引言 在当今数字化时代,Web应用已成为企业和个人在线交互的核心。然而,随着技术的发展,Web应用面临的安全挑战也日益增加。本文旨在为初学者提供一个关于Web应用架构搭建、…...

[JAVA]MyBatis框架—获取SqlSession对象
SqlSessionFactory作为MyBatis框架的核心接口有三大特性 SqlSessionFactory是MyBatis的核心对象 用于初始化MyBatis,创建SqlSession对象 保证SqlSessionFactory在应用中全局唯一 1.SqlSessionFactory是MyBatis的核心对象 假设我们要查询数据库的用户信息&#x…...
Perl 简介
Perl 简介 Perl 是一种高级、通用、解释型、动态编程语言。由 Larry Wall 于 1987 年首次发布,它结合了 C、sed、awk 和 shell 脚本语言的特性。Perl 最初被设计用于文本处理,如报告生成和文件转换,但随着时间的推移,它已经发展成…...
spring-bean的销毁流程
1 引入 在 Spring 框架中,Bean 的生命周期管理是其核心功能之一,而 Bean 的注销(Destruction)是生命周期的最后一步。无论是关闭数据库连接、释放线程资源,还是执行缓存持久化操作,合适的销毁策略都至关重…...

问:Spring MVC DispatcherServlet流程步骤梳理
DispatcherServlet是Spring MVC框架中的核心组件,负责接收客户端请求并将其分发到相应的控制器进行处理。作为前端控制器(Front Controller)的实现,DispatcherServlet在整个请求处理流程中扮演着至关重要的角色。本文将探讨Dispat…...

用源码编译虚幻引擎,并打包到安卓平台
用源码编译虚幻引擎,并打包到安卓平台 前往我的博客,获取更优的阅读体验 作业内容: 源码编译UE5.4构建C项目,简单设置打包到安卓平台 编译虚幻 5 前置内容 这里需要将 Epic 账号和 Github 账号绑定,然后加入 Epic 邀请的组织,…...

快速搭建Android开发环境:Docker部署docker-android并实现远程连接
目录 前言 1. 虚拟化环境检查 2. Android 模拟器部署 3. Ubuntu安装Cpolar 4. 配置公网地址 5. 远程访问 小结 6. 固定Cpolar公网地址 7. 固定地址访问 作者简介: 懒大王敲代码,计算机专业应届生 今天给大家聊聊快速搭建Android开发环境&#x…...
「Mac玩转仓颉内测版21」基础篇1 - 仓颉程序的基本组成
本篇将系统介绍Cangjie编程语言中程序的基本组成部分,涵盖 main 函数的定义、包与模块的使用、变量类型、作用域和代码结构原则,帮助开发者理解Cangjie程序的整体结构。 关键词 程序入口点main函数包与模块变量类型与作用域值类型与引用类型代码结构与规…...

【Linux网络编程】简单的UDP套接字
目录 一,socket编程的相关说明 1-1,sockaddr结构体 1-2,Socket API 二,基于Udp协议的简单通信 三,UDP套接字的应用 3-1,实现英译汉字典 一,socket编程的相关说明 Socket编程是一种网络通信…...
浅谈 React Hooks
React Hooks 是 React 16.8 引入的一组 API,用于在函数组件中使用 state 和其他 React 特性(例如生命周期方法、context 等)。Hooks 通过简洁的函数接口,解决了状态与 UI 的高度解耦,通过函数式编程范式实现更灵活 Rea…...

黑马Mybatis
Mybatis 表现层:页面展示 业务层:逻辑处理 持久层:持久数据化保存 在这里插入图片描述 Mybatis快速入门 ; List<Integer> evens new ArrayList…...

Swift 协议扩展精进之路:解决 CoreData 托管实体子类的类型不匹配问题(下)
概述 在 Swift 开发语言中,各位秃头小码农们可以充分利用语法本身所带来的便利去劈荆斩棘。我们还可以恣意利用泛型、协议关联类型和协议扩展来进一步简化和优化我们复杂的代码需求。 不过,在涉及到多个子类派生于基类进行多态模拟的场景下,…...

图表类系列各种样式PPT模版分享
图标图表系列PPT模版,柱状图PPT模版,线状图PPT模版,折线图PPT模版,饼状图PPT模版,雷达图PPT模版,树状图PPT模版 图表类系列各种样式PPT模版分享:图表系列PPT模板https://pan.quark.cn/s/20d40aa…...

并发编程 - go版
1.并发编程基础概念 进程和线程 A. 进程是程序在操作系统中的一次执行过程,系统进行资源分配和调度的一个独立单位。B. 线程是进程的一个执行实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位。C.一个进程可以创建和撤销多个线程;同一个进程中…...
django blank 与 null的区别
1.blank blank控制表单验证时是否允许字段为空 2.null null控制数据库层面是否为空 但是,要注意以下几点: Django的表单验证与null无关:null参数控制的是数据库层面字段是否可以为NULL,而blank参数控制的是Django表单验证时字…...

Scrapy-Redis分布式爬虫架构的可扩展性与容错性增强:基于微服务与容器化的解决方案
在大数据时代,海量数据的采集与处理成为企业和研究机构获取信息的关键环节。Scrapy-Redis作为一种经典的分布式爬虫架构,在处理大规模数据抓取任务时展现出强大的能力。然而,随着业务规模的不断扩大和数据抓取需求的日益复杂,传统…...

关于easyexcel动态下拉选问题处理
前些日子突然碰到一个问题,说是客户的导入文件模版想支持部分导入内容的下拉选,于是我就找了easyexcel官网寻找解决方案,并没有找到合适的方案,没办法只能自己动手并分享出来,针对Java生成Excel下拉菜单时因选项过多导…...

抽象类和接口(全)
一、抽象类 1.概念:如果⼀个类中没有包含⾜够的信息来描绘⼀个具体的对象,这样的类就是抽象类。 像是没有实际⼯作的⽅法,我们可以把它设计成⼀个抽象⽅法,包含抽象⽅法的类我们称为抽象类。 2.语法 在Java中,⼀个类如果被 abs…...