当前位置: 首页 > news >正文

MySQL中处理JSON数据:大数据分析的新方向,详解与示例

文章目录

  • 1. MySQL中的JSON数据类型
  • 2. JSON函数和运算符
  • 3. 创建JSON列的表
  • 4. 插入JSON数据
  • 5. 查询JSON数据
    • 6. 复杂查询和聚合
    • 7. JSON 数据的索引
    • 8. 总结


在当今的大数据时代,JSON(JavaScript Object Notation)作为一种轻量级的数据交换格式,因其易于阅读和编写,以及易于机器解析和生成,而被广泛应用于Web应用的数据传输。随着MySQL 5.7的发布,MySQL引入了对JSON数据类型的支持,使得在数据库中直接存储、查询和操作JSON数据成为可能。本文将详细介绍如何在MySQL中处理JSON数据,并提供示例。

1. MySQL中的JSON数据类型

MySQL中的JSON数据类型允许用户存储JSON文档。这些文档可以是对象、数组或两者的组合。以下是JSON数据类型的一些特点:

  1. JSON文档被存储为二进制格式,可以高效地访问JSON元素。
  2. 可以使用JSON关键字和函数对JSON数据进行查询和更新。
  3. 支持对JSON文档的部分内容进行索引,以优化查询性能。

2. JSON函数和运算符

MySQL提供了一系列函数和运算符来处理JSON数据,以下是一些常用的:

  • ->:获取JSON文档的指定成员。
  • ->>:获取JSON文档的指定成员,并将其作为无引号的字符串返回。
  • JSON_EXTRACT(json_doc, path):提取JSON文档中的数据。
  • JSON_SET(json_doc, path, val):更新JSON文档中的数据。
  • JSON_INSERT(json_doc, path, val):向JSON文档中插入数据,如果路径已存在,则不进行任何操作。
  • JSON_REPLACE(json_doc, path, val):替换JSON文档中的数据。
  • JSON_REMOVE(json_doc, path):从JSON文档中删除数据。

3. 创建JSON列的表

首先,我们需要创建一个包含JSON列的表。以下是一个示例:

CREATE TABLE `people` (`id` int(11) NOT NULL AUTO_INCREMENT,`info` json DEFAULT NULL,PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

在这个示例中,我们创建了一个名为people的表,其中包含一个JSON列info。

4. 插入JSON数据

接下来,我们向表中插入一些JSON数据:

INSERT INTO `people` (`info`) VALUES 
('{"name": "John Doe", "age": 30, "address": {"street": "123 Main St", "city": "Anytown", "state": "CA"}}'),
('{"name": "Jane Smith", "age": 25, "address": {"street": "456 Elm St", "city": "Othertown", "state": "NY"}}');

5. 查询JSON数据

MySQL 提供了多种函数来处理 JSON 数据。以下是一些常用的 JSON 函数:

JSON_EXTRACT: 从 JSON 文本中提取数据
JSON_UNQUOTE: 去掉 JSON 数据中的引号
JSON_SET: 更新
JSON 文本中的值 JSON_ARRAY 和 JSON_OBJECT: 创建 JSON 数据

示例 1: 提取 JSON 数据中的字段

-- 提取 Alice 的 email
SELECT JSON_EXTRACT(info, '$.email') AS email
FROM users
WHERE name = 'Alice';-- 去掉引号
SELECT JSON_UNQUOTE(JSON_EXTRACT(info, '$.email')) AS email
FROM users
WHERE name = 'Alice';

示例 2: 更新 JSON 数据中的字段

-- 更新 Bob 的 email
UPDATE users
SET info = JSON_SET(info, '$.email', 'bob.newemail@example.com')
WHERE name = 'Bob';

示例 3: 使用 JSON 数据进行查询

-- 查询居住在 New York 的用户
SELECT name
FROM users
WHERE JSON_EXTRACT(info, '$.address.city') = '"New York"';

示例 4: :替换JSON文档中的数据

UPDATE `people` SET `info` = JSON_REPLACE(`info`, '$.address.city', 'Newtown') WHERE `id` = 1;

示例 5: 从JSON文档中删除数据

UPDATE `people` SET `info` = JSON_REMOVE(`info`, '$.phone') WHERE `id` = 1;

6. 复杂查询和聚合

MySQL 的 JSON 函数也支持更复杂的查询和聚合操作。例如,可以结合 JSON 数据进行分组统计。

示例 1: 统计各城市的用户数量

-- 统计每个城市的用户数量
SELECT JSON_EXTRACT(info, '$.address.city') AS city,COUNT(*) AS user_count
FROM users
GROUP BY city;

示例 2: 从 JSON 数组中提取数据
假设我们有一个表记录了用户的爱好,每个用户有多个爱好以 JSON 数组的形式存储:

-- 创建表
CREATE TABLE hobbies (id INT AUTO_INCREMENT PRIMARY KEY,user_id INT,hobbies JSON
);-- 插入数据
INSERT INTO hobbies (user_id, hobbies) VALUES
(1, '["Reading", "Swimming", "Hiking"]'),
(2, '["Cooking", "Traveling"]');

我们可以使用 JSON_CONTAINS 函数来查找包含特定爱好的用户:

-- 查找有 "Traveling" 爱好的用户
SELECT user_id
FROM hobbies
WHERE JSON_CONTAINS(hobbies, '"Traveling"');

7. JSON 数据的索引

虽然 MySQL 支持 JSON 数据类型,但对于大数据分析,性能可能会受到影响。为了提高查询性能,可以对 JSON 数据进行索引。MySQL 支持对 JSON 数据的虚拟列进行索引。

-- 添加虚拟列
ALTER TABLE users ADD COLUMN city VARCHAR(100) GENERATED ALWAYS AS (JSON_UNQUOTE(JSON_EXTRACT(info, '$.address.city'))) VIRTUAL;-- 创建索引
CREATE INDEX idx_city ON users(city);

8. 总结

MySQL 的 JSON 数据类型为处理和分析 JSON 数据提供了强大的工具,使得开发者能够将 JSON 数据与传统的关系型数据结合起来进行更复杂的查询和分析。通过使用 MySQL 提供的 JSON 函数,我们可以轻松地从 JSON 数据中提取、更新和查询信息。此外,通过创建虚拟列和索引,我们可以提高 JSON 数据查询的性能。

相关文章:

MySQL中处理JSON数据:大数据分析的新方向,详解与示例

文章目录 1. MySQL中的JSON数据类型2. JSON函数和运算符3. 创建JSON列的表4. 插入JSON数据5. 查询JSON数据6. 复杂查询和聚合7. JSON 数据的索引8. 总结 在当今的大数据时代,JSON(JavaScript Object Notation)作为一种轻量级的数据交换格式&a…...

【图形学】TA之路-矩阵

在 Unity 中,矩阵广泛用于处理各种图形变换,例如平移、旋转、缩放等。矩阵的使用不仅限于三维空间,还可以应用于二维空间的操作。了解矩阵及其运算对于游戏开发和计算机图形学非常重要。Unity 中使用的是行向量不是列向量,这个要注…...

LAMM: Label Alignment for Multi-Modal Prompt Learning

系列论文研读目录 文章目录 系列论文研读目录文章题目含义AbstractIntroductionRelated WorkVision Language ModelsPrompt Learning MethodologyPreliminaries of CLIPLabel AlignmentHierarchical Loss 分层损失Parameter Space 参数空间Feature Space 特征空间Logits Space …...

mac编译opencv 通用架构库的记录

1,通用架构 (x86_64;arm64)要设置的配置项: CPU_BASELINE CPU_DISPATCH 上面这两个我设置成SSE_3,其他选项未尝试,比如不设置。 CMAKE_OSX_ARCHITECTURES:x86_64;arm64 WITH_IPP:不勾选 2,contrib库的添加: 第一次…...

Python 向IP地址发送字符串

Python 向IP地址发送字符串 在网络编程中,使得不同设备间能够进行数据传输是一项基本任务。Python提供了强大的库,帮助开发者轻松地实现这种通信。本文将介绍如何使用Python通过UDP协议向特定的IP地址发送字符串信息。 UDP协议简介 UDP(用…...

上升响应式Web设计:纯HTML和CSS的实现技巧-1

响应式Web设计(Responsive Web Design, RWD)是一种旨在确保网站在不同设备和屏幕尺寸下都能良好运行的网页设计策略。通过纯HTML和CSS实现响应式设计,主要依赖于媒体查询(Media Queries)、灵活的布局、可伸缩的图片和字…...

利用java结合python实现gis在线绘图,主要技术java+python+matlab+idw+Kriging

主要技术javapythonmatlabidwKriging** GIS中的等值面和等高线绘图主要用于表达连续空间数据的分布情况,特别适用于需要展示三维空间中某个变量随位置变化的应用场景。 具体来说,以下是一些适合使用GIS等值面和等高线绘图的场景: 地形与地貌…...

Android全面解析之context机制(三): 从源码角度分析context创建流程(下)

前言 前面已经讲了什么是context以及从源码角度分析context创建流程(上)。限于篇幅把四大组件中的广播和内容提供器的context获取流程放在了这篇文章。广播和内容提供器并不是context家族里的一员,所以他们本身并不是context,因而…...

执行docker compose命令出现 Additional property include is not allowed

问题背景 在由docker-compose.yml的文件目录下执行命令 docker compose up -d 出现错误 Additional ininoperty include is not allowed 原因 我的docker-compose.yml 文件中出现了include标签旧版本的docker-compose 不支持此标签 解决办法 下载支持的docker-compose 解决…...

STM32通过I2C硬件读写MPU6050

目录 STM32通过I2C硬件读写MPU6050 1. STM32的I2C外设简介 2. STM32的I2C基本框图 3. STIM32硬件I2C主机发送流程 10位地址与7位地址的区别 7位主机发送的时序流程 7位主机接收的时序流程 4. STM32硬件与软件的波形对比 5. STM32配置硬件I2C外设流程 6. STM32的I2C.h…...

ubuntu2204-中文输入法-pycharm-python-django开发环境搭建

文章目录 1.系统常用设置1.1.安装中文输入法1.2.配置输入法1.3.卸载输入法1.4.配置镜像源2.java安装3.pycharm安装与启动4.卸载ubuntu2204默认版本5.安装Anaconda5.1.安装软件依赖包5.2.安装命令5.3.激活安装5.4.常用命令5.5.修改默认启动源6.安装mysql6.1.离线安装mysql6.2.在…...

【学习笔记】Matlab和python双语言的学习(一元线性回归)

文章目录 前言一、一元线性回归回归分析的一般步骤一元线性回归的基本形式回归方程参数的最小二乘法估计对回归方程的各种检验估计标准误差的计算回归直线的拟合优度判定系数显著性检验 二、示例三、代码实现----Matlab四、代码实现----python回归系数的置信区间公式残差的置信…...

LeetCode //C - 316. Remove Duplicate Letters

316. Remove Duplicate Letters Given a string s, remove duplicate letters so that every letter appears once and only once. You must make sure your result is the smallest in lexicographical order among all possible results. Example 1: Input: s “bcabc”…...

【ARM+Codesys 客户案例 】RK3568/A40i/STM32+CODESYS在工厂自动化中的应用:PCB板焊接机

现代化生产中,电子元件通常会使用自动化设备来进行生产,例如像PCB(印刷电路板)的组装。但是生产过程中也会面临一些问题,类似于如何解决在PCB板上牢固、精准地安装各种组件呢?IBL Lttechnik GmbH公司的CM80…...

【二分查找】--- 初阶题目赏析

Welcome to 9ilks Code World (๑•́ ₃ •̀๑) 个人主页: 9ilk (๑•́ ₃ •̀๑) 文章专栏: 算法Joureny 上篇我们讲解了关于二分的朴素模板和边界模板,本篇博客我们试着运用这些模板。 🏠 搜索插入位置 📌 题目…...

【PostgreSQL003】PostgreSQL数据表空间膨胀,磁盘爆满,应用宕机(经验总结,已更新)

1.一直以来想写下基于PostgreSQL的系列文章,作为较火的数据ETL工具,也是日常项目开发中常用的一款工具,最近刚好挤时间梳理、总结下这块儿的知识体系。 2.熟悉、梳理、总结下PostgreSQL数据库相关知识体系。空间膨胀(主键、外键、…...

C语言第20天笔记

文件操作 概述 什么是 文件 文件时保存在外存储器上(一般代指磁盘,也可以是U盘、移动硬盘等)的数据的集合。 文件操作体现在哪几个方面 1. 文件内容的读取 2. 文件内容的写入 数据的读取和写入可被视为针对文件进行输入和输出的操作&a…...

为什么穷大方

为什么有些人明明很穷,却非常的大方呢? 因为他们认知太低,根本不懂钱的重要性,总是想着及时享乐,所以一年到头也存不了什么钱。等到家人孩子需要用钱的时候,什么也拿不出来,还到处去求人。 而真…...

HiveSQL实战——大数据开发面试高频SQL题

查询每个区域的男女用户数 0 问题描述 每个区域内男生、女生分别有多少个 1 数据准备 use wxthive; create table t1_stu_table (id int,name string,class string,sex string ); insert overwrite table t1_stu_table values(4,张文华,二区,男),(3,李思雨,一区,女),(1…...

RabbitMQ集群 - 普通集群搭建、宕机情况

文章目录 RabbitMQ 普通集群概述集群搭建数据准备启动容器宕机情况 RabbitMQ 普通集群 概述 1)普通模式中所有节点没有主从之分,所有节点的元数据(交换机、队列、绑定等)都是一致的. 例如只要有任意一个节点上面 新增交换机&…...

科技中介机构如何提升服务能力与客户转化率?

观点作者:科易网-国家科技成果转化(厦门)示范基地 一、现状概述:科技成果转化中的“最后一公里”困境 近年来,我国科技创新投入持续增长,技术产出规模不断扩大。然而,科技成果从实验室走向市场、…...

MoviePilot批量重命名:5步解决NAS媒体库命名混乱问题

MoviePilot批量重命名:5步解决NAS媒体库命名混乱问题 【免费下载链接】MoviePilot NAS媒体库自动化管理工具 项目地址: https://gitcode.com/gh_mirrors/mo/MoviePilot 你是否曾为NAS中杂乱无章的媒体文件名而烦恼?"Avengers.Endgame.2019.1…...

ComfyUI-Manager插件不显示问题终极指南:从原理到实战的完整解决方案

ComfyUI-Manager插件不显示问题终极指南:从原理到实战的完整解决方案 【免费下载链接】ComfyUI-Manager ComfyUI-Manager is an extension designed to enhance the usability of ComfyUI. It offers management functions to install, remove, disable, and enable…...

别再手动画甘特图了!用VS Code插件MarkWhen,写几行文本就能生成炫酷时间轴

用MarkWhen在VS Code中打造极简时间轴:告别繁琐拖拽,拥抱文本化项目管理 在数字时代,时间管理和项目规划已经成为每个高效能人士的必修课。无论是开发者跟踪项目里程碑,学生规划学习路径,还是个人记录生活轨迹&#xf…...

AI任务管理新范式:结构化描述如何提升人机协作效率

1. 项目概述:一个为AI而生的任务管理范式最近在GitHub上看到一个挺有意思的项目,叫todo-for-ai/todo-for-ai。初看名字,你可能会觉得这又是一个普通的待办事项应用,只不过加了个“AI”的噱头。但当我深入探究其设计哲学和实现细节…...

开源项目文档自动化验证:gate-of-oss 守护 README 与代码一致性

1. 项目概述:一个开源项目的“守门人” 在开源的世界里,项目仓库的README文件就像是项目的“门面”和“说明书”。然而,随着项目迭代,依赖项更新、构建脚本变动、环境配置要求变化是家常便饭。你有没有遇到过这样的场景&#xff1…...

JSON格式强制输出失败,深度解析DeepSeek-R1/V3模型token级响应机制与schema约束绕过方案

更多请点击: https://intelliparadigm.com 第一章:JSON格式强制输出失败的现象与根本归因 典型失败现象 当后端服务(如 Go/Node.js/Python)尝试通过 HTTP 响应强制输出 JSON 数据时,常出现空响应、500 错误、或返回 …...

md-wechat:让Markdown完美兼容微信公众号排版的工具实战

1. 项目概述:一个让Markdown在微信生态里“活”起来的工具如果你和我一样,是个重度Markdown爱好者,同时又需要在微信生态里频繁地分享技术文档、产品说明或者个人笔记,那你一定体会过那种割裂感。在Typora或VS Code里写得行云流水…...

Neovim原生GitHub Copilot客户端gp.nvim:从安装配置到高级实战

1. 项目概述:一个为Neovim量身打造的GitHub Copilot客户端如果你和我一样,是个重度Neovim用户,同时又对GitHub Copilot这类AI编程助手爱不释手,那你肯定也经历过那种“鱼与熊掌”的纠结时刻。在VSCode里,Copilot的集成…...

从LLM到智能体:基于推理循环的AI应用开发框架解析

1. 项目概述:一个面向推理任务的智能体框架最近在探索如何让AI模型更“聪明”地处理复杂任务时,我注意到了GitHub上一个名为“zyron-reasoning”的项目。这个由kaiogs07维护的仓库,其核心定位是一个用于构建和运行“推理智能体”的框架。简单…...