当前位置: 首页 > news >正文

Python JSON 数据解析教程:从基础到高级

Python JSON 数据解析教程:从基础到高级

引言

在现代编程中,JSON(JavaScript Object Notation)已成为数据交换的标准格式。它以易于阅读和编写的文本格式存储和传输数据,广泛应用于Web API和配置文件中。Python提供了强大的内置库来处理JSON数据,使得解析和生成JSON变得简单高效。本文将深入探讨Python中的JSON数据解析,包括基础用法、高级技巧和实际案例,帮助你全面掌握这一重要技能。

什么是JSON?

JSON是一种轻量级的数据交换格式,易于人类阅读和编写,同时也易于机器解析和生成。JSON使用键值对的方式来表示数据,通常以对象({})和数组([])的形式出现。

JSON示例

以下是一个简单的JSON对象示例:

{"name": "Alice","age": 30,"is_student": false,"courses": ["Math", "Science"],"address": {"street": "123 Main St","city": "Anytown"}
}

在这个示例中,我们可以看到JSON对象包含了字符串、数字、布尔值、数组和嵌套对象。

Python中的JSON模块

Python的json模块提供了简单的方法来处理JSON数据。我们可以使用json.loads()将JSON字符串解析为Python对象,使用json.dumps()将Python对象转换为JSON字符串。

导入JSON模块

在使用json模块之前,我们需要先导入它:

import json

JSON数据解析的基本用法

1. 从JSON字符串解析为Python对象

使用json.loads()函数可以将JSON字符串解析为Python对象。以下是一个简单的示例:

import json# JSON字符串
json_str = '{"name": "Alice", "age": 30, "is_student": false}'# 解析JSON字符串
data = json.loads(json_str)print(data)
print(data['name'])  # 输出: Alice

2. 从Python对象转换为JSON字符串

使用json.dumps()可以将Python对象转换为JSON字符串:

import json# Python字典
data = {"name": "Alice","age": 30,"is_student": False
}# 转换为JSON字符串
json_str = json.dumps(data)
print(json_str)  # 输出: {"name": "Alice", "age": 30, "is_student": false}

3. 读取和写入JSON文件

在实际应用中,我们常常需要将JSON数据存储到文件中,或者从文件中读取JSON数据。可以使用json.load()json.dump()函数来实现:

从文件读取JSON数据
import json# 读取JSON文件
with open('data.json', 'r') as file:data = json.load(file)print(data)
将Python对象写入JSON文件
import json# Python字典
data = {"name": "Alice","age": 30,"is_student": False
}# 写入JSON文件
with open('data.json', 'w') as file:json.dump(data, file)

JSON解析的高级用法

1. 处理复杂的JSON数据

在实际应用中,JSON数据可能会非常复杂,包含嵌套对象和数组。我们可以通过递归和循环来处理这些复杂的数据结构。

示例:解析嵌套JSON对象
import json# 复杂的JSON字符串
json_str = '''
{"name": "Alice","age": 30,"courses": [{"name": "Math","grade": "A"},{"name": "Science","grade": "B"}]
}
'''# 解析JSON字符串
data = json.loads(json_str)# 访问嵌套数据
for course in data['courses']:print(f"Course: {course['name']}, Grade: {course['grade']}")

2. 自定义JSON编码

在某些情况下,我们需要自定义如何将Python对象转换为JSON字符串。可以通过继承json.JSONEncoder类来实现:

import json
from datetime import datetimeclass CustomEncoder(json.JSONEncoder):def default(self, obj):if isinstance(obj, datetime):return obj.isoformat()  # 将日期时间对象转换为ISO格式return super().default(obj)# 使用自定义编码器
data = {"name": "Alice","timestamp": datetime.now()
}json_str = json.dumps(data, cls=CustomEncoder)
print(json_str)

3. 使用object_hook参数解析JSON

在解析JSON时,我们可以使用object_hook参数自定义如何将JSON对象转换为Python对象。例如,我们可以将JSON对象转换为自定义类的实例:

import jsonclass Person:def __init__(self, name, age):self.name = nameself.age = agedef custom_object_hook(dct):return Person(dct['name'], dct['age'])# JSON字符串
json_str = '{"name": "Alice", "age": 30}'# 解析JSON字符串并使用自定义对象钩子
person = json.loads(json_str, object_hook=custom_object_hook)
print(person.name)  # 输出: Alice
print(person.age)   # 输出: 30

实际案例:从API获取JSON数据

在实际应用中,处理JSON数据的一个常见场景是从Web API获取数据。以下是一个示例,演示如何从API获取JSON数据并进行解析:

示例:获取GitHub用户信息

import requests
import json# 发起HTTP GET请求
response = requests.get('https://api.github.com/users/octocat')# 解析JSON响应
data = response.json()# 打印用户信息
print(f"Username: {data['login']}")
print(f"Name: {data['name']}")
print(f"Public Repos: {data['public_repos']}")

在这个示例中,我们使用requests库从GitHub API获取用户信息,并将响应解析为Python对象。

常见问题及解决方案

1. JSONDecodeError

在解析JSON字符串时,如果字符串格式不正确,可能会抛出JSONDecodeError。确保你的JSON字符串符合标准格式,特别注意引号、逗号和括号的使用。

2. 处理Unicode字符

在JSON中,Unicode字符可能会导致编码问题。可以使用ensure_ascii=False参数来确保正确处理Unicode字符:

data = {"message": "Hello, 世界"}
json_str = json.dumps(data, ensure_ascii=False)
print(json_str)  # 输出: {"message": "Hello, 世界"}

3. JSON与Python数据类型的映射

了解JSON和Python数据类型之间的映射关系是非常重要的:

  • JSON对象对应Python字典(dict
  • JSON数组对应Python列表(list
  • JSON字符串对应Python字符串(str
  • JSON数字对应Python整数(int)或浮点数(float
  • JSON布尔值对应Python布尔值(TrueFalse
  • JSON null对应Python None

总结

通过本文的学习,你已经掌握了Python中JSON数据解析的基本用法和高级技巧。从简单的JSON字符串解析到复杂的嵌套对象处理,再到自定义编码和从API获取数据,Python的json模块为我们提供了强大的功能。希望这篇文章能帮助你在实际项目中高效地处理JSON数据。

相关文章:

Python JSON 数据解析教程:从基础到高级

Python JSON 数据解析教程:从基础到高级 引言 在现代编程中,JSON(JavaScript Object Notation)已成为数据交换的标准格式。它以易于阅读和编写的文本格式存储和传输数据,广泛应用于Web API和配置文件中。Python提供了…...

25.UE5时间膨胀,慢动作,切换地图,刷BOSS

2-27 时间膨胀、慢动作、切换地图、刷BOSS_哔哩哔哩_bilibili 目录 1.刷新BOSS逻辑 2.时间膨胀实现慢动作 3.胜利画面,下一关 3.1胜利画面UI 3.2第一关、第二关游戏模式 3.3下一关按钮事件的绑定 1.刷新BOSS逻辑 实现当场上的怪物都死亡后,进行刷…...

Three.js 相机控制器Controls

在 3D 场景中,摄像机的控制尤为重要,因为它决定了用户如何观察和与场景互动。Three.js 提供了多种相机控制器,最常用的有 OrbitControls、TrackballControls、FlyControls 和 FirstPersonControls。OrbitControls 适合用于查看和检查 3D 模型…...

Android开发实战班 - 现代 UI 开发之自定义 Compose 组件

Jetpack Compose 不仅提供了丰富的内置组件,还允许开发者根据项目需求创建自定义组件。自定义 Compose 组件可以提高代码复用性、简化 UI 逻辑,并使应用界面更加一致和模块化。本章节将介绍如何创建自定义 Compose 组件,包括组件的创建、样式…...

All-in-one Notion 介绍

Notion 是一款集笔记、知识管理、任务规划和协作于一体的工具,它以高度的灵活性和可自定义的工作空间而闻名。它适合个人和团队使用,能够帮助用户高效管理生活、学习和工作。以下是 Notion 的一些主要特点: 1. 多功能工作区 Notion 将笔记、…...

深入理解C++11右值引用与移动语义:高效编程的基石

文章目录 前言📚一、C11的历史发展📖1.1 C11 之前的背景📖1.2 C11 的发展历程📖1.3 C11 的主要设计目标📖1.4 C11 的主要特性📖1.5 C11 的影响 📚二、统一的列表初始化📖2.1 基本列表…...

【WRF-Urban】URBPARM_LCZ.TBL 查找表解释及内容

【WRF-Urban】URBPARM_LCZ.TBL 查找表解释及内容 URBPARM_LCZ.TBL 文件的作用URBPARM_LCZ.TBL 文件中的参数URBPARM_LCZ.TBL 的使用URBPARM_LCZ.TBL 文件内容如何调整或扩展 URBPARM_LCZ.TBL参考URBPARM_LCZ.TBL 文件是 WRF(天气研究与预报模型) 中用于处理 局地气候区(Loca…...

网络是怎么连接的

目录 URL HTTP(超文本传输协议) FTP(文件传输协议) File mailto HTTP的方法 Socket URL URL(Uniform Resource Locator)中文名为统一资源定位符,它是互联网上用来标识某一资源的地址。就…...

Java 实现PDF添加水印

maven依赖&#xff1a; <dependency><groupId>com.itextpdf</groupId><artifactId>itextpdf</artifactId><version>5.4.3</version> </dependency>网络地址添加水印代码&#xff1a; public static boolean waterMarkNet(Stri…...

网络安全问题概述

1.1.计算机网络面临的安全性威胁 计算机网络上的通信面临以下的四种威胁&#xff1a; (1) 截获——从网络上窃听他人的通信内容。 (2) 中断——有意中断他人在网络上的通信。 (3) 篡改——故意篡改网络上传送的报文。可应用于域名重定向&#xff0c;即钓鱼网站。 (4) 伪造——伪…...

(udp)网络编程套接字Linux(整理)

源IP地址和目的IP地址 唐僧例子1 在IP数据包头部中, 有两个IP地址, 分别叫做源IP地址, 和目的IP地址.思考: 我们光有IP地址就可以完成通信了嘛? 想象一下发qq消息的例子, 有了IP地址能够把消息发送到对方的机器上,但是还需要有一个其他的标识来区分出, 这个数据要给哪个程序进…...

Web应用安全入门:架构搭建、漏洞分析与HTTP数据包处理

Web应用安全入门&#xff1a;架构搭建、漏洞分析与HTTP数据包处理 引言 在当今数字化时代&#xff0c;Web应用已成为企业和个人在线交互的核心。然而&#xff0c;随着技术的发展&#xff0c;Web应用面临的安全挑战也日益增加。本文旨在为初学者提供一个关于Web应用架构搭建、…...

[JAVA]MyBatis框架—获取SqlSession对象

SqlSessionFactory作为MyBatis框架的核心接口有三大特性 SqlSessionFactory是MyBatis的核心对象 用于初始化MyBatis&#xff0c;创建SqlSession对象 保证SqlSessionFactory在应用中全局唯一 1.SqlSessionFactory是MyBatis的核心对象 假设我们要查询数据库的用户信息&#x…...

Perl 简介

Perl 简介 Perl 是一种高级、通用、解释型、动态编程语言。由 Larry Wall 于 1987 年首次发布&#xff0c;它结合了 C、sed、awk 和 shell 脚本语言的特性。Perl 最初被设计用于文本处理&#xff0c;如报告生成和文件转换&#xff0c;但随着时间的推移&#xff0c;它已经发展成…...

spring-bean的销毁流程

1 引入 在 Spring 框架中&#xff0c;Bean 的生命周期管理是其核心功能之一&#xff0c;而 Bean 的注销&#xff08;Destruction&#xff09;是生命周期的最后一步。无论是关闭数据库连接、释放线程资源&#xff0c;还是执行缓存持久化操作&#xff0c;合适的销毁策略都至关重…...

问:Spring MVC DispatcherServlet流程步骤梳理

DispatcherServlet是Spring MVC框架中的核心组件&#xff0c;负责接收客户端请求并将其分发到相应的控制器进行处理。作为前端控制器&#xff08;Front Controller&#xff09;的实现&#xff0c;DispatcherServlet在整个请求处理流程中扮演着至关重要的角色。本文将探讨Dispat…...

用源码编译虚幻引擎,并打包到安卓平台

用源码编译虚幻引擎&#xff0c;并打包到安卓平台 前往我的博客,获取更优的阅读体验 作业内容: 源码编译UE5.4构建C项目&#xff0c;简单设置打包到安卓平台 编译虚幻 5 前置内容 这里需要将 Epic 账号和 Github 账号绑定&#xff0c;然后加入 Epic 邀请的组织&#xff0c…...

快速搭建Android开发环境:Docker部署docker-android并实现远程连接

目录 前言 1. 虚拟化环境检查 2. Android 模拟器部署 3. Ubuntu安装Cpolar 4. 配置公网地址 5. 远程访问 小结 6. 固定Cpolar公网地址 7. 固定地址访问 作者简介&#xff1a; 懒大王敲代码&#xff0c;计算机专业应届生 今天给大家聊聊快速搭建Android开发环境&#x…...

「Mac玩转仓颉内测版21」基础篇1 - 仓颉程序的基本组成

本篇将系统介绍Cangjie编程语言中程序的基本组成部分&#xff0c;涵盖 main 函数的定义、包与模块的使用、变量类型、作用域和代码结构原则&#xff0c;帮助开发者理解Cangjie程序的整体结构。 关键词 程序入口点main函数包与模块变量类型与作用域值类型与引用类型代码结构与规…...

【Linux网络编程】简单的UDP套接字

目录 一&#xff0c;socket编程的相关说明 1-1&#xff0c;sockaddr结构体 1-2&#xff0c;Socket API 二&#xff0c;基于Udp协议的简单通信 三&#xff0c;UDP套接字的应用 3-1&#xff0c;实现英译汉字典 一&#xff0c;socket编程的相关说明 Socket编程是一种网络通信…...

浅谈 React Hooks

React Hooks 是 React 16.8 引入的一组 API&#xff0c;用于在函数组件中使用 state 和其他 React 特性&#xff08;例如生命周期方法、context 等&#xff09;。Hooks 通过简洁的函数接口&#xff0c;解决了状态与 UI 的高度解耦&#xff0c;通过函数式编程范式实现更灵活 Rea…...

黑马Mybatis

Mybatis 表现层&#xff1a;页面展示 业务层&#xff1a;逻辑处理 持久层&#xff1a;持久数据化保存 在这里插入图片描述 Mybatis快速入门 ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/6501c2109c4442118ceb6014725e48e4.png //logback.xml <?xml ver…...

Java 8 Stream API 入门到实践详解

一、告别 for 循环&#xff01; 传统痛点&#xff1a; Java 8 之前&#xff0c;集合操作离不开冗长的 for 循环和匿名类。例如&#xff0c;过滤列表中的偶数&#xff1a; List<Integer> list Arrays.asList(1, 2, 3, 4, 5); List<Integer> evens new ArrayList…...

Swift 协议扩展精进之路:解决 CoreData 托管实体子类的类型不匹配问题(下)

概述 在 Swift 开发语言中&#xff0c;各位秃头小码农们可以充分利用语法本身所带来的便利去劈荆斩棘。我们还可以恣意利用泛型、协议关联类型和协议扩展来进一步简化和优化我们复杂的代码需求。 不过&#xff0c;在涉及到多个子类派生于基类进行多态模拟的场景下&#xff0c;…...

图表类系列各种样式PPT模版分享

图标图表系列PPT模版&#xff0c;柱状图PPT模版&#xff0c;线状图PPT模版&#xff0c;折线图PPT模版&#xff0c;饼状图PPT模版&#xff0c;雷达图PPT模版&#xff0c;树状图PPT模版 图表类系列各种样式PPT模版分享&#xff1a;图表系列PPT模板https://pan.quark.cn/s/20d40aa…...

并发编程 - go版

1.并发编程基础概念 进程和线程 A. 进程是程序在操作系统中的一次执行过程&#xff0c;系统进行资源分配和调度的一个独立单位。B. 线程是进程的一个执行实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位。C.一个进程可以创建和撤销多个线程;同一个进程中…...

django blank 与 null的区别

1.blank blank控制表单验证时是否允许字段为空 2.null null控制数据库层面是否为空 但是&#xff0c;要注意以下几点&#xff1a; Django的表单验证与null无关&#xff1a;null参数控制的是数据库层面字段是否可以为NULL&#xff0c;而blank参数控制的是Django表单验证时字…...

Scrapy-Redis分布式爬虫架构的可扩展性与容错性增强:基于微服务与容器化的解决方案

在大数据时代&#xff0c;海量数据的采集与处理成为企业和研究机构获取信息的关键环节。Scrapy-Redis作为一种经典的分布式爬虫架构&#xff0c;在处理大规模数据抓取任务时展现出强大的能力。然而&#xff0c;随着业务规模的不断扩大和数据抓取需求的日益复杂&#xff0c;传统…...

关于easyexcel动态下拉选问题处理

前些日子突然碰到一个问题&#xff0c;说是客户的导入文件模版想支持部分导入内容的下拉选&#xff0c;于是我就找了easyexcel官网寻找解决方案&#xff0c;并没有找到合适的方案&#xff0c;没办法只能自己动手并分享出来&#xff0c;针对Java生成Excel下拉菜单时因选项过多导…...

抽象类和接口(全)

一、抽象类 1.概念&#xff1a;如果⼀个类中没有包含⾜够的信息来描绘⼀个具体的对象&#xff0c;这样的类就是抽象类。 像是没有实际⼯作的⽅法,我们可以把它设计成⼀个抽象⽅法&#xff0c;包含抽象⽅法的类我们称为抽象类。 2.语法 在Java中&#xff0c;⼀个类如果被 abs…...