当前位置: 首页 > news >正文

图形数据库的实战应用:如何在 Neo4j 中有效管理复杂关系

关系数据库管理系统( RDBMS ) 代表了最先进的技术,这在一定程度上要归功于其由周边技术、工具和广泛的专业技能组成的完善的生态系统。

在这个涵盖信息技术(IT) 和运营技术(OT) 的技术革命时代,人们普遍认识到性能方面出现了重大挑战,特别是在NoSQL 解决方案优于传统方法的特定用例中。事实上,市场提供了许多解释和利用各种不同数据模型的NoSQL DBMS解决方案:

  • 键值存储(例如,最简单的存储,其中对持久数据的访问必须是即时的,并且通过像哈希映射或字典这样的键进行检索);

  • 面向文档(例如,在无服务器解决方案和 lambda 函数架构中广泛采用,其中客户端需要直接从数据库获取结构良好的 DTO);

  • 面向图的(例如,对于知识管理、语义网或社交网络有用);

  • 面向列(例如,在查询驱动的建模方法中提供高度优化的“即用型”数据投影);

  • 时间序列(例如,用于处理物联网场景中的传感器和样本数据);

  • 多模型存储(例如,组合不同类型的数据模型以实现混合功能目的)。

“与那些完全不使用数据的人相比,使用不充分的数据时出现错误要少得多。” 

一个较少被研究的问题是依赖于关系解决方案的软件架构能够灵活地适应软件领域和功能需求快速而频繁的变化。类似敏捷的软件开发方法加剧了这一挑战,这些方法旨在满足客户处理由其业务市场主导的不断出现的需求。

特别是,RDBMS 就其本质而言,当软件需求随着时间的推移而变化时,可能会受到影响,通过引入新的关联表(也替换预先存在的外键)并在 SQL 查询中生成新的 JOIN 子句,对数据库表格模式产生快速影响,从而导致更复杂且更难维护的解决方案。

根据我们的企业经验,我们已经成功实施并试验了基于Neo4j 图形数据库的面向图形的 DBMS 解决方案,以便在具有不同用户和角色的数字社交社区的典型操作环境中减轻需求变更的架构后果。

在这篇文章中,我们:

  • 举例说明面向图形的 DBMS 如何更能满足功能需求;

  • 讨论在经典的N层(分层)架构中采用面向图的DBMS的可行性,提出一些克服主要困难的方法;

  • 强调在各种环境和用例中采用它们的优点和缺点以及威胁。

Neo4j 图形数据库

面向图的数据模型背后的思想是采用原生方法来处理实体(即节点)及其背后的关系(即边),以便通过导航实体之间的关系来查询知识库(即知识 图)。

Neo4j 图形数据库适用 于面向属性图,其中节点和边都拥有不同类型的属性属性。

我们选择它作为 DBMS,主要是为了:

  • 它的“本机”实现是通过数字图元模型具体建模的,其运行时实例由节点(包含具有域属性的实体)和边(表示互连概念之间的可导航关系)组成。这样,关系的遍历时间为O(1);

  • Cypher查询语言被采用为图形中持久知识的非常强大且直观的查询系统。

此外,Neo4j 图形数据库还提供用于对象图形映射(OGM) 的Java 库,可帮助开发人员实现映射、持久化和管理模型实体、节点和关系的自动化过程。实际上,OGM 对于面向图形的 DBMS 的解释与对象关系映射( ORM )模式对于关系持久层的作用相同。

与为 RDBMS 设计的 ORM 模式相比,OGM 模式用于简化数据访问对象( DAO )的实现。它的主要功能是在源代码中正确配置和注释的持久域模型实体中启用半自动细化。

相对于被广泛认为是领先的 ORM 技术的Java Persistence API ( JPA )/Hibernate,Neo4j的 OGM 库以独特的方式运行:

写操作

  • OGM 在托管实体的所有关系中传播持久性更改(从托管对象开始分析整个对象关系树);

  • JPA从托管实体开始逐表执行更新,并基于级联配置处理关系。

读操作

  • OGM通过查询检索一整棵具有固定深度的“关系树”,从指定节点开始,充当“树的根”;

  • JPA允许配置EAGER和LAZY加载方法之间的关系。

示例性案例研究的解决方案优势

为了举例说明我们分析的意义,我们引入一个简单的操作场景:图 1.1 中的 UML 类图描述了一个与实体 Auth(授权的缩写)具有 1 对 N 关系的 User 实体,该实体定义了应用程序内的权限和授权。这种领域模型可以通过类似于表 1.1 和表 1.2 的架构在关系型数据库管理系统(RDBMS)中支持,或者在面向图形的数据库管理系统中,如图 1.2 中的知识图所示。

图 1.1:领域模型的 UML 类图。

USERS TABLE
idfirstNamelastName
.........

表 1.1:在 RDBMS 架构中为 User 实体映射的表格。

AUTHS TABLE

idnameleveluser_fk
............

表 1.2:在 RDBMS 架构中为 Auth 实体映射的表格。

图1.2:与图1.1 的领域模型相关的知识图 。

现在,想象一下,在应用程序的生产生命周期期间出现了一个新的需求:出于管理原因,客户需要将授权限定在特定时间段内(即有效期的开始和结束日期),如图 2.1 所示,将 User 和 Auth 之间的关系转变为 N 对 N。这种领域模型可以通过类似于表 2.1 的架构在关系型数据库管理系统(RDBMS)中支持,或者在面向图形的数据库管理系统中,如图 2.2 中的知识图所示。

图 2.1:在定义新要求后的领域模型 UML 类图。

USERS TABLE

idfirstNamelastName
.........

表 2.1:在 RDBMS 架构中为 User 实体映射的表格。

USERS_AUTHS TABLE

user_fkauth_fkfromuntil
............

表 2.2:在 RDBMS 架构中用于存储 User 和 Auth 实体之间关联的表格。

AUTHS TABLE

idnamelevel
.........

表 2.3:在 RDBMS 架构中为 Auth 实体映射的表格。

图 2.2:与图 2.1 领域模型相关的知识图。

在架构层面上的优势已经很明显:实际上,面向图形的方法没有改变架构,只是在边缘(建模关系)上定义了两个新属性,而 RDBMS 方法则创建了新的关联表 users_auths,替代了 auths 表中引用用户表的外键。

进一步深入分析,我们可以尝试分析 SQL 查询和用 Cypher 查询语言语法编写的查询在这两种方法下的区别:我们想要识别名为“Paul”的用户,他们拥有名为“admin”的 Auth,并且级别大于或等于 3。

一方面,在 SQL 中,所需的查询(分别是第一个查询用于从表 1.1 和表 1.2 检索数据,第二个查询用于表 2.1、表 2.2 和表 2.3)是:

SELECT users.*FROM usersINNER JOIN auths ON users.id = auths.user_fkWHERE users.firstName = 'Paul' AND auths.name = 'admin' AND auths.level >= 3
SELECT users.*FROM usersINNER JOIN users_auths ON users.id = users_auths.user_fkINNER JOIN auths ON auths.id = users_auths.auth_fkWHERE users.firstName = 'Paul' AND auths.name = 'admin' AND auths.level >= 3

另一方面,在Cypher 查询语言中,所需的查询(对于这两种情况) 是:

MATCH (u:User)-[:HAS_AUTH]->(auth:Auth)WHERE u.firstName = 'Paul' AND auth.name = 'admin' AND auth.level >= 3RETURN u

虽然 SQL 查询需要多一个 JOIN 子句,但值得注意的是,在这种特定情况下,不仅用 Cypher 查询语言编写的查询没有额外的子句或 MATCH 路径的变化,而且它也保持不变。后端的“查询系统”上没有必要进行任何更改!

结论 

楔形工程作为国际项目中的技术合作伙伴,设计了一个协作社交平台,作为一个解耦的 Web 应用程序,在 3 层架构中由以下部分组成:

  1. 后端模块,一个分层的 RESTful 架构,利用 JakartaEE 框架; 

  2. 知识图,由 Neo4j 图形数据库提供的 NoSQL; 

  3. 前端模块,一个基于 HTML、CSS 和 JavaScript 的单页应用程序,利用 Angular 框架。 

我们面临的最具挑战性的设计选择是使用原生利用 Cypher 查询语言的驱动程序还是利用 OGM 库简化 DAO 实现:我们发现使用 Cypher 查询语言编写的自定义查询构建整个应用程序既不可行也不可扩展,而 OGM 在处理涉及大量涉及引用外部实体的关系的大型数据层次结构时可能不够高效。

我们最终选择了一种自定义方法,利用 OGM 作为映射节点和边缘的参考解决方案,以 ORM 类型的视角,并支持特定 DAO 的实现,因此通过无法表现良好的自定义查询方法优化了时间上的优化。

总之,我们可以说采用的软件架构很好地响应了知识图模式的变化,并完全满足了客户需求,同时减轻了楔形工程开发团队的努力。

然而,在采用这种架构之前,必须考虑一些威胁:

  • SQL 比 Cypher 查询语言更为常见 → 因此,更容易找到(并因此纳入开发团队)能够维护 RDBMS 而不是 Neo4j 图形数据库的代码的专家; 

  • ​Neo4j 的本地生产系统要求很高(即对于基于服务器的环境,至少推荐 8 GB)→ 这种解决方案可能不适合资源有限的场景和低成本实施; 

  • 在我们的最大努力下,我们没有找到任何“随时可以使用且易于使用”的开源编辑器来浏览 Neo4j 图形数据库的数据结构(Neo4j 的官方数据浏览器不允许通过 GUI 进行数据修改,除非自定义 MERGE/CREATE 查询),就像 RDBMS 有很多一样 → 这可能是由于特定的数据模型本身导致的,使得实现数据的表格视图变得困难。

作者:Cosimo Giani

更多技术干货请关注公号【云原生数据库

squids.cn,云数据库RDS,迁移工具DBMotion,云备份DBTwin等数据库生态工具。

相关文章:

图形数据库的实战应用:如何在 Neo4j 中有效管理复杂关系

关系数据库管理系统( RDBMS ) 代表了最先进的技术,这在一定程度上要归功于其由周边技术、工具和广泛的专业技能组成的完善的生态系统。 在这个涵盖信息技术(IT) 和运营技术(OT) 的技术革命时代,人们普遍认识到性能方面出现了重大挑战,特别是…...

Linux内核中的overlay文件系统

一、简介 Docker 内核实现容器的功能用了linux 内核中的三个特性 Namespace、Cgroup、UnionFs,今天我们来说一下UnionFs。 linux UnionFs 实现的是overlay 文件系统 OverlayFs 文件系统分为三层, lower 是只读层 Upper 是可读写 Merged 是 lower 和U…...

archery修改为不能自提自审核上线SQL

目录 背景修改代码效果参考 背景 我和同事都可以提交上线SQL,但是不能自己提交的SQL自己去审核通过。目前的情况是可以自提自审。 修改代码 找到/opt/archery/sql/utils/workflow_audit.py文件 ...省略...# 判断用户当前是否是可审核staticmethoddef can_revie…...

如何处理git多分支

本篇文章主要处理以下两种多分支问题 如何将自己在本地的修改上传到一个新的Git分支(比如用于测试,不合并进main分支)?如何在一个新的本地仓库拉取一个项目的非main分支,并处理他们关联关系? 1. 将自己在…...

Proteus仿真--基于DS1302与数码管设计的可调电子钟

本文主要介绍基于51单片机的DS1302的可调式电子钟实验(完整仿真源文件及代码见文末链接) 仿真图如下 其中数码管显示电子钟时间信息,按键用于调节时间,时间芯片选用DS1302芯片 仿真运行视频 Proteus仿真--基于DS1302与数码管设…...

ESP32网络开发实例-远程Web串口监视器

远程Web串口监视器 文章目录 远程Web串口监视器1、应用介绍2、软件准备3、硬件准备4、代码实现在本文中,我们将构建一个 ESP32 网络服务器,用作远程串行监视器。 基于 Web 的串行监视器的工作方式与通常用于调试目的的 Arduino IDE 串行监视器的工作方式相同。 1、应用介绍 …...

xadmin后台在每一行记录增加一个复制链接按钮

xadmin后台在每一行记录增加一个复制链接按钮 1、效果 点击复制后,自动把url链接复制到粘贴板,按Ctrl+v即可显示复制内容。 2、实现代码 adminx.py # 用户管理 class UserWhiteListAdmin(object):search_fields = [name, mobile] # 检索字段list_display...

LVS+Keepalived 高可用群集

一、一.Keepalived工具介绍 专为LVS和HA设计的一款健康检查工具 • 支持故障自动切换(Failover) • 支持节点健康状态检查(Health Checking) • 官方网站:http://www.keepalived.org/ 二、Keepalived工作原理 • …...

数据传输的思考

Wi-Fi:Wi-Fi是一种无线网络技术,可以用于无线互联网接入、局域网通信和数据传输等。Wi-Fi基于IEEE 802.11标准,通过无线信号传输数据,提供高速的无线网络连接。Wi-Fi可用于连接设备与路由器或者设备之间的直接通信,可以…...

ETL-使用kettle批量复制sqlserver数据到mysql数据库

文章标题 1、安装sqlserver数据库2、下载kettle3、业务分析4、详细流程(1)转换1:获取sqlserver所有表格名字,将记录复制到结果(2)转换2:从结果设置变量(3)转换3&#xff…...

交流充电桩与直流充电桩的区别

1、背景 直流充电桩的学名是非车载充电机,是相对于交流充电桩而言的。交流充电桩是采用传导方式为具备车载充电机的电动汽车提供交流电能的专用装置。 2、交流充电桩和直流充电桩 1.1、交流充电桩 交流充电桩包括单相和三相交流充电桩。 图一是交流充电桩原理框…...

基于单片机公交安全预警系统仿真设计

**单片机设计介绍, 基于单片机公交安全预警系统仿真设计 文章目录 一 概要二、功能设计设计思路 三、 软件设计原理图 五、 程序六、 文章目录 一 概要 基于单片机的公交安全预警系统可以被设计成能够实时监测公交车辆的行驶状态,并在发生异常情况时进行…...

HarmonyOS基础组件之Button三种类型的使用

简介 HarmonyOS在明年将正式不再兼容Android原生功能,这意味着对于客户端的小伙伴不得不开始学习HarmonyOS开发语言。本篇文章主要介绍鸿蒙中的Button使用。 HarmonyOS中的Button相较于Android原生来说,功能比较丰富,扩展性高,减…...

Using the File Class使用文件类

Using the File Class 使用文件类 The file layout class enables you to perform file input and output operations with Application Engine using PeopleCode. A file object enables you to open a file (for reading or writing), read data from a file, or write da…...

【Kafka】Java整合Kafka

1.引入依赖 <dependency><groupId>org.apache.kafka</groupId><artifactId>kafka-clients</artifactId><version>2.3.1</version></dependency> 2.搭建生产者 package com.wen.kafka;import org.apache.kafka.clients.produ…...

所里网连不上,我服了

所里网连不上&#xff0c;我服了所里网连不上&#xff0c;我服了所里网连不上&#xff0c;我服了...

Yakit工具篇:WebFuzzer模块之热加载技术

简介 官方定义&#xff1a; 什么是热加载&#xff1f; 广义上来说&#xff0c;热加载是一种允许在不停止或重启应用程序的情况下&#xff0c;动态加载或更新特定组件或模块的功能。这种技术常用于开发过程中&#xff0c;提高开发效率和用户体验。 在Yakit 的Web Fuzzer中&…...

Linux基本指令(前篇)

目录 1.ls指令 2.pwd指令 3.cd 指令 4.touch指令 5.mkdir指令&#xff08;重要&#xff09; 6.rmdir指令 && rm 指令&#xff08;重要&#xff09; 7.man指令&#xff08;重要&#xff09; 1.ls指令 ls 选项 目录或文件 对于目录&#xff0c;该命令列出该目录下的所…...

[网鼎杯 2020 青龙组]singal

一道VM题目 可以看到长度是15 跟踪调用read函数的函数 分析一下switch中每个指令的含义、 在scanf下面打断点 在关键跳转处下断点 打开Ponce插件 GitHub - illera88/Ponce: IDA 2016 plugin contest winner! Symbolic Execution just one-click away! 然后开始动调 输入15个…...

Qt/QML编程学习之心得:一个QML工程的学习笔记(十)

前言: 到底什么是Qt Quick呢?因为Qt Quick是Qt新引入的,Qt Quick由Qt Quick模块提供,它是一个编写QML应用的标准库。Qt Quick模块提供了两种接口:使用QML语言创建应用的QML接口和使用C++语言扩展QML的C++接口。使用Qt Quick模块,设计人员和开发人员可以轻松地构建流畅的…...

零门槛NAS搭建:WinNAS如何让普通电脑秒变私有云?

一、核心优势&#xff1a;专为Windows用户设计的极简NAS WinNAS由深圳耘想存储科技开发&#xff0c;是一款收费低廉但功能全面的Windows NAS工具&#xff0c;主打“无学习成本部署” 。与其他NAS软件相比&#xff0c;其优势在于&#xff1a; 无需硬件改造&#xff1a;将任意W…...

设计模式和设计原则回顾

设计模式和设计原则回顾 23种设计模式是设计原则的完美体现,设计原则设计原则是设计模式的理论基石, 设计模式 在经典的设计模式分类中(如《设计模式:可复用面向对象软件的基础》一书中),总共有23种设计模式,分为三大类: 一、创建型模式(5种) 1. 单例模式(Sing…...

应用升级/灾备测试时使用guarantee 闪回点迅速回退

1.场景 应用要升级,当升级失败时,数据库回退到升级前. 要测试系统,测试完成后,数据库要回退到测试前。 相对于RMAN恢复需要很长时间&#xff0c; 数据库闪回只需要几分钟。 2.技术实现 数据库设置 2个db_recovery参数 创建guarantee闪回点&#xff0c;不需要开启数据库闪回。…...

Xshell远程连接Kali(默认 | 私钥)Note版

前言:xshell远程连接&#xff0c;私钥连接和常规默认连接 任务一 开启ssh服务 service ssh status //查看ssh服务状态 service ssh start //开启ssh服务 update-rc.d ssh enable //开启自启动ssh服务 任务二 修改配置文件 vi /etc/ssh/ssh_config //第一…...

AtCoder 第409​场初级竞赛 A~E题解

A Conflict 【题目链接】 原题链接&#xff1a;A - Conflict 【考点】 枚举 【题目大意】 找到是否有两人都想要的物品。 【解析】 遍历两端字符串&#xff0c;只有在同时为 o 时输出 Yes 并结束程序&#xff0c;否则输出 No。 【难度】 GESP三级 【代码参考】 #i…...

ETLCloud可能遇到的问题有哪些?常见坑位解析

数据集成平台ETLCloud&#xff0c;主要用于支持数据的抽取&#xff08;Extract&#xff09;、转换&#xff08;Transform&#xff09;和加载&#xff08;Load&#xff09;过程。提供了一个简洁直观的界面&#xff0c;以便用户可以在不同的数据源之间轻松地进行数据迁移和转换。…...

第一篇:Agent2Agent (A2A) 协议——协作式人工智能的黎明

AI 领域的快速发展正在催生一个新时代&#xff0c;智能代理&#xff08;agents&#xff09;不再是孤立的个体&#xff0c;而是能够像一个数字团队一样协作。然而&#xff0c;当前 AI 生态系统的碎片化阻碍了这一愿景的实现&#xff0c;导致了“AI 巴别塔问题”——不同代理之间…...

C++.OpenGL (10/64)基础光照(Basic Lighting)

基础光照(Basic Lighting) 冯氏光照模型(Phong Lighting Model) #mermaid-svg-GLdskXwWINxNGHso {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-GLdskXwWINxNGHso .error-icon{fill:#552222;}#mermaid-svg-GLd…...

c#开发AI模型对话

AI模型 前面已经介绍了一般AI模型本地部署&#xff0c;直接调用现成的模型数据。这里主要讲述讲接口集成到我们自己的程序中使用方式。 微软提供了ML.NET来开发和使用AI模型&#xff0c;但是目前国内可能使用不多&#xff0c;至少实践例子很少看见。开发训练模型就不介绍了&am…...

全志A40i android7.1 调试信息打印串口由uart0改为uart3

一&#xff0c;概述 1. 目的 将调试信息打印串口由uart0改为uart3。 2. 版本信息 Uboot版本&#xff1a;2014.07&#xff1b; Kernel版本&#xff1a;Linux-3.10&#xff1b; 二&#xff0c;Uboot 1. sys_config.fex改动 使能uart3(TX:PH00 RX:PH01)&#xff0c;并让boo…...