MySQL中处理JSON数据:大数据分析的新方向,详解与示例
文章目录
- 1. MySQL中的JSON数据类型
- 2. JSON函数和运算符
- 3. 创建JSON列的表
- 4. 插入JSON数据
- 5. 查询JSON数据
- 6. 复杂查询和聚合
- 7. JSON 数据的索引
- 8. 总结
在当今的大数据时代,JSON(JavaScript Object Notation)作为一种轻量级的数据交换格式,因其易于阅读和编写,以及易于机器解析和生成,而被广泛应用于Web应用的数据传输。随着MySQL 5.7的发布,MySQL引入了对JSON数据类型的支持,使得在数据库中直接存储、查询和操作JSON数据成为可能。本文将详细介绍如何在MySQL中处理JSON数据,并提供示例。
1. MySQL中的JSON数据类型
MySQL中的JSON数据类型允许用户存储JSON文档。这些文档可以是对象、数组或两者的组合。以下是JSON数据类型的一些特点:
- JSON文档被存储为二进制格式,可以高效地访问JSON元素。
- 可以使用JSON关键字和函数对JSON数据进行查询和更新。
- 支持对JSON文档的部分内容进行索引,以优化查询性能。
2. JSON函数和运算符
MySQL提供了一系列函数和运算符来处理JSON数据,以下是一些常用的:
- ->:获取JSON文档的指定成员。
- ->>:获取JSON文档的指定成员,并将其作为无引号的字符串返回。
- JSON_EXTRACT(json_doc, path):提取JSON文档中的数据。
- JSON_SET(json_doc, path, val):更新JSON文档中的数据。
- JSON_INSERT(json_doc, path, val):向JSON文档中插入数据,如果路径已存在,则不进行任何操作。
- JSON_REPLACE(json_doc, path, val):替换JSON文档中的数据。
- JSON_REMOVE(json_doc, path):从JSON文档中删除数据。
3. 创建JSON列的表
首先,我们需要创建一个包含JSON列的表。以下是一个示例:
CREATE TABLE `people` (`id` int(11) NOT NULL AUTO_INCREMENT,`info` json DEFAULT NULL,PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
在这个示例中,我们创建了一个名为people的表,其中包含一个JSON列info。
4. 插入JSON数据
接下来,我们向表中插入一些JSON数据:
INSERT INTO `people` (`info`) VALUES
('{"name": "John Doe", "age": 30, "address": {"street": "123 Main St", "city": "Anytown", "state": "CA"}}'),
('{"name": "Jane Smith", "age": 25, "address": {"street": "456 Elm St", "city": "Othertown", "state": "NY"}}');
5. 查询JSON数据
MySQL 提供了多种函数来处理 JSON 数据。以下是一些常用的 JSON 函数:
JSON_EXTRACT: 从 JSON 文本中提取数据
JSON_UNQUOTE: 去掉 JSON 数据中的引号
JSON_SET: 更新
JSON 文本中的值 JSON_ARRAY 和 JSON_OBJECT: 创建 JSON 数据
示例 1: 提取 JSON 数据中的字段
-- 提取 Alice 的 email
SELECT JSON_EXTRACT(info, '$.email') AS email
FROM users
WHERE name = 'Alice';-- 去掉引号
SELECT JSON_UNQUOTE(JSON_EXTRACT(info, '$.email')) AS email
FROM users
WHERE name = 'Alice';
示例 2: 更新 JSON 数据中的字段
-- 更新 Bob 的 email
UPDATE users
SET info = JSON_SET(info, '$.email', 'bob.newemail@example.com')
WHERE name = 'Bob';
示例 3: 使用 JSON 数据进行查询
-- 查询居住在 New York 的用户
SELECT name
FROM users
WHERE JSON_EXTRACT(info, '$.address.city') = '"New York"';
示例 4: :替换JSON文档中的数据
UPDATE `people` SET `info` = JSON_REPLACE(`info`, '$.address.city', 'Newtown') WHERE `id` = 1;
示例 5: 从JSON文档中删除数据
UPDATE `people` SET `info` = JSON_REMOVE(`info`, '$.phone') WHERE `id` = 1;
6. 复杂查询和聚合
MySQL 的 JSON 函数也支持更复杂的查询和聚合操作。例如,可以结合 JSON 数据进行分组统计。
示例 1: 统计各城市的用户数量
-- 统计每个城市的用户数量
SELECT JSON_EXTRACT(info, '$.address.city') AS city,COUNT(*) AS user_count
FROM users
GROUP BY city;
示例 2: 从 JSON 数组中提取数据
假设我们有一个表记录了用户的爱好,每个用户有多个爱好以 JSON 数组的形式存储:
-- 创建表
CREATE TABLE hobbies (id INT AUTO_INCREMENT PRIMARY KEY,user_id INT,hobbies JSON
);-- 插入数据
INSERT INTO hobbies (user_id, hobbies) VALUES
(1, '["Reading", "Swimming", "Hiking"]'),
(2, '["Cooking", "Traveling"]');
我们可以使用 JSON_CONTAINS 函数来查找包含特定爱好的用户:
-- 查找有 "Traveling" 爱好的用户
SELECT user_id
FROM hobbies
WHERE JSON_CONTAINS(hobbies, '"Traveling"');
7. JSON 数据的索引
虽然 MySQL 支持 JSON 数据类型,但对于大数据分析,性能可能会受到影响。为了提高查询性能,可以对 JSON 数据进行索引。MySQL 支持对 JSON 数据的虚拟列进行索引。
-- 添加虚拟列
ALTER TABLE users ADD COLUMN city VARCHAR(100) GENERATED ALWAYS AS (JSON_UNQUOTE(JSON_EXTRACT(info, '$.address.city'))) VIRTUAL;-- 创建索引
CREATE INDEX idx_city ON users(city);
8. 总结
MySQL 的 JSON 数据类型为处理和分析 JSON 数据提供了强大的工具,使得开发者能够将 JSON 数据与传统的关系型数据结合起来进行更复杂的查询和分析。通过使用 MySQL 提供的 JSON 函数,我们可以轻松地从 JSON 数据中提取、更新和查询信息。此外,通过创建虚拟列和索引,我们可以提高 JSON 数据查询的性能。
相关文章:
MySQL中处理JSON数据:大数据分析的新方向,详解与示例
文章目录 1. MySQL中的JSON数据类型2. JSON函数和运算符3. 创建JSON列的表4. 插入JSON数据5. 查询JSON数据6. 复杂查询和聚合7. JSON 数据的索引8. 总结 在当今的大数据时代,JSON(JavaScript Object Notation)作为一种轻量级的数据交换格式&a…...

【图形学】TA之路-矩阵
在 Unity 中,矩阵广泛用于处理各种图形变换,例如平移、旋转、缩放等。矩阵的使用不仅限于三维空间,还可以应用于二维空间的操作。了解矩阵及其运算对于游戏开发和计算机图形学非常重要。Unity 中使用的是行向量不是列向量,这个要注…...

LAMM: Label Alignment for Multi-Modal Prompt Learning
系列论文研读目录 文章目录 系列论文研读目录文章题目含义AbstractIntroductionRelated WorkVision Language ModelsPrompt Learning MethodologyPreliminaries of CLIPLabel AlignmentHierarchical Loss 分层损失Parameter Space 参数空间Feature Space 特征空间Logits Space …...
mac编译opencv 通用架构库的记录
1,通用架构 (x86_64;arm64)要设置的配置项: CPU_BASELINE CPU_DISPATCH 上面这两个我设置成SSE_3,其他选项未尝试,比如不设置。 CMAKE_OSX_ARCHITECTURES:x86_64;arm64 WITH_IPP:不勾选 2,contrib库的添加: 第一次…...
Python 向IP地址发送字符串
Python 向IP地址发送字符串 在网络编程中,使得不同设备间能够进行数据传输是一项基本任务。Python提供了强大的库,帮助开发者轻松地实现这种通信。本文将介绍如何使用Python通过UDP协议向特定的IP地址发送字符串信息。 UDP协议简介 UDP(用…...
上升响应式Web设计:纯HTML和CSS的实现技巧-1
响应式Web设计(Responsive Web Design, RWD)是一种旨在确保网站在不同设备和屏幕尺寸下都能良好运行的网页设计策略。通过纯HTML和CSS实现响应式设计,主要依赖于媒体查询(Media Queries)、灵活的布局、可伸缩的图片和字…...

利用java结合python实现gis在线绘图,主要技术java+python+matlab+idw+Kriging
主要技术javapythonmatlabidwKriging** GIS中的等值面和等高线绘图主要用于表达连续空间数据的分布情况,特别适用于需要展示三维空间中某个变量随位置变化的应用场景。 具体来说,以下是一些适合使用GIS等值面和等高线绘图的场景: 地形与地貌…...

Android全面解析之context机制(三): 从源码角度分析context创建流程(下)
前言 前面已经讲了什么是context以及从源码角度分析context创建流程(上)。限于篇幅把四大组件中的广播和内容提供器的context获取流程放在了这篇文章。广播和内容提供器并不是context家族里的一员,所以他们本身并不是context,因而…...
执行docker compose命令出现 Additional property include is not allowed
问题背景 在由docker-compose.yml的文件目录下执行命令 docker compose up -d 出现错误 Additional ininoperty include is not allowed 原因 我的docker-compose.yml 文件中出现了include标签旧版本的docker-compose 不支持此标签 解决办法 下载支持的docker-compose 解决…...

STM32通过I2C硬件读写MPU6050
目录 STM32通过I2C硬件读写MPU6050 1. STM32的I2C外设简介 2. STM32的I2C基本框图 3. STIM32硬件I2C主机发送流程 10位地址与7位地址的区别 7位主机发送的时序流程 7位主机接收的时序流程 4. STM32硬件与软件的波形对比 5. STM32配置硬件I2C外设流程 6. STM32的I2C.h…...
ubuntu2204-中文输入法-pycharm-python-django开发环境搭建
文章目录 1.系统常用设置1.1.安装中文输入法1.2.配置输入法1.3.卸载输入法1.4.配置镜像源2.java安装3.pycharm安装与启动4.卸载ubuntu2204默认版本5.安装Anaconda5.1.安装软件依赖包5.2.安装命令5.3.激活安装5.4.常用命令5.5.修改默认启动源6.安装mysql6.1.离线安装mysql6.2.在…...

【学习笔记】Matlab和python双语言的学习(一元线性回归)
文章目录 前言一、一元线性回归回归分析的一般步骤一元线性回归的基本形式回归方程参数的最小二乘法估计对回归方程的各种检验估计标准误差的计算回归直线的拟合优度判定系数显著性检验 二、示例三、代码实现----Matlab四、代码实现----python回归系数的置信区间公式残差的置信…...
LeetCode //C - 316. Remove Duplicate Letters
316. Remove Duplicate Letters Given a string s, remove duplicate letters so that every letter appears once and only once. You must make sure your result is the smallest in lexicographical order among all possible results. Example 1: Input: s “bcabc”…...

【ARM+Codesys 客户案例 】RK3568/A40i/STM32+CODESYS在工厂自动化中的应用:PCB板焊接机
现代化生产中,电子元件通常会使用自动化设备来进行生产,例如像PCB(印刷电路板)的组装。但是生产过程中也会面临一些问题,类似于如何解决在PCB板上牢固、精准地安装各种组件呢?IBL Lttechnik GmbH公司的CM80…...

【二分查找】--- 初阶题目赏析
Welcome to 9ilks Code World (๑•́ ₃ •̀๑) 个人主页: 9ilk (๑•́ ₃ •̀๑) 文章专栏: 算法Joureny 上篇我们讲解了关于二分的朴素模板和边界模板,本篇博客我们试着运用这些模板。 🏠 搜索插入位置 📌 题目…...

【PostgreSQL003】PostgreSQL数据表空间膨胀,磁盘爆满,应用宕机(经验总结,已更新)
1.一直以来想写下基于PostgreSQL的系列文章,作为较火的数据ETL工具,也是日常项目开发中常用的一款工具,最近刚好挤时间梳理、总结下这块儿的知识体系。 2.熟悉、梳理、总结下PostgreSQL数据库相关知识体系。空间膨胀(主键、外键、…...

C语言第20天笔记
文件操作 概述 什么是 文件 文件时保存在外存储器上(一般代指磁盘,也可以是U盘、移动硬盘等)的数据的集合。 文件操作体现在哪几个方面 1. 文件内容的读取 2. 文件内容的写入 数据的读取和写入可被视为针对文件进行输入和输出的操作&a…...

为什么穷大方
为什么有些人明明很穷,却非常的大方呢? 因为他们认知太低,根本不懂钱的重要性,总是想着及时享乐,所以一年到头也存不了什么钱。等到家人孩子需要用钱的时候,什么也拿不出来,还到处去求人。 而真…...

HiveSQL实战——大数据开发面试高频SQL题
查询每个区域的男女用户数 0 问题描述 每个区域内男生、女生分别有多少个 1 数据准备 use wxthive; create table t1_stu_table (id int,name string,class string,sex string ); insert overwrite table t1_stu_table values(4,张文华,二区,男),(3,李思雨,一区,女),(1…...

RabbitMQ集群 - 普通集群搭建、宕机情况
文章目录 RabbitMQ 普通集群概述集群搭建数据准备启动容器宕机情况 RabbitMQ 普通集群 概述 1)普通模式中所有节点没有主从之分,所有节点的元数据(交换机、队列、绑定等)都是一致的. 例如只要有任意一个节点上面 新增交换机&…...
树莓派超全系列教程文档--(62)使用rpicam-app通过网络流式传输视频
使用rpicam-app通过网络流式传输视频 使用 rpicam-app 通过网络流式传输视频UDPTCPRTSPlibavGStreamerRTPlibcamerasrc GStreamer 元素 文章来源: http://raspberry.dns8844.cn/documentation 原文网址 使用 rpicam-app 通过网络流式传输视频 本节介绍来自 rpica…...
k8s从入门到放弃之Ingress七层负载
k8s从入门到放弃之Ingress七层负载 在Kubernetes(简称K8s)中,Ingress是一个API对象,它允许你定义如何从集群外部访问集群内部的服务。Ingress可以提供负载均衡、SSL终结和基于名称的虚拟主机等功能。通过Ingress,你可…...
1688商品列表API与其他数据源的对接思路
将1688商品列表API与其他数据源对接时,需结合业务场景设计数据流转链路,重点关注数据格式兼容性、接口调用频率控制及数据一致性维护。以下是具体对接思路及关键技术点: 一、核心对接场景与目标 商品数据同步 场景:将1688商品信息…...

Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility
Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility 1. 实验室环境1.1 实验室环境1.2 小测试 2. The Endor System2.1 部署应用2.2 检查现有策略 3. Cilium 策略实体3.1 创建 allow-all 网络策略3.2 在 Hubble CLI 中验证网络策略源3.3 …...
css3笔记 (1) 自用
outline: none 用于移除元素获得焦点时默认的轮廓线 broder:0 用于移除边框 font-size:0 用于设置字体不显示 list-style: none 消除<li> 标签默认样式 margin: xx auto 版心居中 width:100% 通栏 vertical-align 作用于行内元素 / 表格单元格ÿ…...

论文笔记——相干体技术在裂缝预测中的应用研究
目录 相关地震知识补充地震数据的认识地震几何属性 相干体算法定义基本原理第一代相干体技术:基于互相关的相干体技术(Correlation)第二代相干体技术:基于相似的相干体技术(Semblance)基于多道相似的相干体…...
SQL慢可能是触发了ring buffer
简介 最近在进行 postgresql 性能排查的时候,发现 PG 在某一个时间并行执行的 SQL 变得特别慢。最后通过监控监观察到并行发起得时间 buffers_alloc 就急速上升,且低水位伴随在整个慢 SQL,一直是 buferIO 的等待事件,此时也没有其他会话的争抢。SQL 虽然不是高效 SQL ,但…...

CSS3相关知识点
CSS3相关知识点 CSS3私有前缀私有前缀私有前缀存在的意义常见浏览器的私有前缀 CSS3基本语法CSS3 新增长度单位CSS3 新增颜色设置方式CSS3 新增选择器CSS3 新增盒模型相关属性box-sizing 怪异盒模型resize调整盒子大小box-shadow 盒子阴影opacity 不透明度 CSS3 新增背景属性ba…...
命令行关闭Windows防火墙
命令行关闭Windows防火墙 引言一、防火墙:被低估的"智能安检员"二、优先尝试!90%问题无需关闭防火墙方案1:程序白名单(解决软件误拦截)方案2:开放特定端口(解决网游/开发端口不通)三、命令行极速关闭方案方法一:PowerShell(推荐Win10/11)方法二:CMD命令…...
js 设置3秒后执行
如何在JavaScript中延迟3秒执行操作 在JavaScript中,要设置一个操作在指定延迟后(例如3秒)执行,可以使用 setTimeout 函数。setTimeout 是JavaScript的核心计时器方法,它接受两个参数: 要执行的函数&…...