当前位置: 首页 > news >正文

演讲回顾丨杭州悦数 CTO 叶小萌:图数据库发展新航向——拥抱 GQL,融合 HTAP,携手 AI

本文为杭州悦数 CTO 叶小萌在“标准+智能:新质生产力的原动力”悦数图数据库新产品发布会上的演讲回顾,主题为:《新标准、新期待:展望图数据库发展的关键方向》

各位嘉宾、悦数图数据库的用户以及线上的观众朋友们大家好!今天很高兴有机会和大家分享我对数据库,尤其是图数据库的感悟与想法。

GQL 的诞生推动图数据库的发展

在 2000 年前后,图数据库的概念尚未普及,当时主要通过 Java API 进行相关操作。直到 2009 年,Apache TinkerPop 规范定义的 Gremlin 查询语言首次发布;两年后的 2011年,Neo4j 推出了更加广为人知的 Cypher 图查询语言。在图数据库的后续发展中,虽然越来越多的厂商为图数据库增添了丰富的功能,但多样的查询语言也给用户带来了困扰。在选择产品时,用户不仅需要考虑产品本身的性能,还必须评估查询语言的易学性和掌握难度。此外,如果所选产品所使用的查询语言在几年后不再被广泛采用,替换成本将会非常高。这种情况直接影响了图数据库在业界的接受度。

直到 2019 年,国际标准化组织(ISO)成立了专门工作组,致力于制定图数据库查询语言的标准。经过近五年的讨论,2024 年 4 月,ISO 正式发布了国际标准图查询语言 ——Graph Query Language(GQL)。GQL 标准的发布标志着图数据库技术走向成熟的重要一步。它不仅有助于提高图数据库的可操作性,还降低了用户的迁移成本,促进了图数据库技术的广泛应用。杭州悦数作为图数据库厂商也积极参与了标准的制定,进一步增强了标准的权威性和实用性,悦数图数据库更是全球首款原生支持 GQL 的图数据库产品。相信 GQL 的发布有望像当年 SQL 标准推动关系数据库发展一样,推动图数据库的发展,提升业界对图数据库的接受程度。我们有理由相信,在 2030 年前后,依托于 GQL 标准, 图技术将全方位融入生活,形成行业的结构化、产业化。

https://www-cdn.yueshu.cn/yueshu-website/images/%E5%8F%91%E5%B8%83%E4%BC%9APPT%E6%B1%87%E6%80%BB_08.png

图数据库与 HTAP:融合发展,突破数据处理瓶颈

在数据库领域,近年来出现了 HTAP 概念,旨在将 OLTP(在线事务处理)和 OLAP(在线分析处理)功能整合于一个系统中。在传统企业架构中,OLTP 系统负责在线业务的数据修改和查询,而数据随后会同步到后端数据仓库以进行分析和挖掘。然而,这种方式无论是传统关系型数据库还是图数据库,往往都面临高存储成本和数据时效性的问题。截至 2023 年,OLTP 和 OLAP 在的市场份额基本上各占一半。然而,在图数据库领域,分析需求的占比可能更高。根据我们接触到的市场情况,分析需求可能占到 60% - 70%,而在线事务处理则占 30% - 40%。

作为图数据库厂商,我们希望能够整合图数据库的交易与分析功能,实现 HTAP 能力。首先,实现底层数据共享,以解决存储和数据时效性的问题;其次,针对分析查询,既然已经有了 GQL 标准,我们可以能够使用它进行分析查询,就像使用 SQL 进行查询一样。此外,图数据库中存在许多算法,而以往在不同系统中描述这些算法的难度较大,对数据分析人员的要求也很高。因此,我们希望在 GQL 的基础上,具备描述算法的能力,从而真正实现查询语言的统一。因此我们认为基于标准的分布式 HTAP 系统是图数据库未来的重要发展方向。

图数据库与 AI :打破向量局限,实现优势互补

2022 年底,OpenAI 发布了 3.0 大模型,掀起了 AI 的热潮。如何有效地将私有数据与公共领域的知识模型结合,成为了一个重要的研究课题。对于企业而言,训练专有的大模型不仅需要强大的计算能力,还对技术团队和研发团队提出了较高的要求。相比之下,RAG 技术将私有数据作为大模型的补充,避免了重新校正和训练模型的复杂过程,因此对技术能力的要求相对较低。随着大模型的不断发展,基于向量数据库的 RAG 解决方案也逐渐涌现。

https://www-cdn.yueshu.cn/yueshu-website/images/%E5%8F%91%E5%B8%83%E4%BC%9APPT%E6%B1%87%E6%80%BB_12.png

然而,基于向量数据库的 RAG 存在显著问题。私有数据本身具有内在的关联关系,但向量数据库无法有效地体现这些关系。而用户给到大模型的请求是按照 Token 来计算的,Token 越多,计算量越大,价格也越高,时间也越长,RAG 因为缺少了关联的知识,会导致大量的计算资源的浪费和时间的浪费,且结果不够精准。

https://www-cdn.yueshu.cn/yueshu-website/images/%E5%8F%91%E5%B8%83%E4%BC%9APPT%E6%B1%87%E6%80%BB_13.png

相比之下,图数据库能够更好地识别和保留这些关系,从而提高信息检索的准确性和效率。图数据库在处理复杂关系和大规模数据方面具有天然优势,这对于 AI 的理解和推理能力至关重要。

https://www-cdn.yueshu.cn/yueshu-website/images/%E5%8F%91%E5%B8%83%E4%BC%9APPT%E6%B1%87%E6%80%BB_14.png

在 2023 年 8 月,我们提出用图数据库取代向量数据库,并与 LlamaIndex 社区合作推出 Graph RAG。该方案通过提供更具上下文感知的能力和数据训练的方法,缓解了传统搜索增强技术的幻觉,能够区分像“保温杯”和“保温大棚”这种关键字相似但语义不同的内容,确保所提供的回复不仅精确,而且信息丰富。今年上半年,微软开源的 Graph 相关项目也印证了图数据库与 AI 结合是市场和技术共同选择的结果。

展望未来

图数据库的未来发展方向主要包括三个方面:

拥抱 GQL:继续支持和推广 GQL 标准,促进图数据库技术的普及与应用。

探索基于标准的 HTAP 解决方案:开发高效的 HTAP 系统,满足日益增长的数据处理需求。

深化图数据库与 AI 技术的融合:结合图数据库和大模型的优势,推动智能决策支持系统的发展。

图数据库不仅在技术上不断创新,还在实际应用中展现出巨大的潜力。未来,图数据库将在社交网络、推荐系统、金融风控等多个领域发挥重要作用,为数据驱动的决策提供强有力的支持。

感谢各位的聆听,希望今天的分享能够为大家带来一些启发和思考。谢谢。

相关文章:

演讲回顾丨杭州悦数 CTO 叶小萌:图数据库发展新航向——拥抱 GQL,融合 HTAP,携手 AI

本文为杭州悦数 CTO 叶小萌在“标准智能:新质生产力的原动力”悦数图数据库新产品发布会上的演讲回顾,主题为:《新标准、新期待:展望图数据库发展的关键方向》 各位嘉宾、悦数图数据库的用户以及线上的观众朋友们大家好&#xff0…...

Java安全—JNDI注入RMI服务LDAP服务JDK绕过

前言 上次讲到JNDI注入这个玩意,但是没有细讲,现在就给它详细地讲个明白。 JNDI注入 那什么是JNDI注入呢,JNDI全称为 Java Naming and Directory Interface(Java命名和目录接口),是一组应用程序接口&…...

C++:设计模式-单例模式

单例模式(Singleton Pattern)是一种设计模式,确保一个类只有一个实例,并且提供全局访问点。实现单例模式的关键是防止类被多次实例化,且能够保证实例的唯一性。常见的实现手法包括懒汉式、饿汉式、线程安全的懒汉式等。…...

Softing工业将OPC UA信息建模集成到边缘应用和安全集成服务器中

Softing工业宣布将OPC UA(统一架构)信息建模集成到其边缘产品系列及安全集成服务器(SIS)中,这一技术进步使得在工业物联网(IIoT)应用中的数据集成、交换与控制更加无缝、有效。 (OPC…...

WPF中如何让Textbox显示为一条直线

由于Textbox直接使用是一条直线 设置如下代码 可以让Textbox变为直线输入 <Style TargetType"TextBox"x:Key"UsernameTextBoxStyle"><Setter Property"Template"><Setter.Value><ControlTemplate TargetType"{x:Typ…...

VSCode汉化教程【简洁易懂】

我们安装完成后默认是英文界面。 找到插件选项卡&#xff0c;搜索“Chinese”&#xff0c;找到简体&#xff08;更具你的需要&#xff09;&#xff08;Microsoft提供&#xff09;Install。 安装完成后选择Change Language and Restart。...

跨平台多开账号防关联:轻松管理多个账号!

对于跨境电商、独立站以及社媒营销领域&#xff0c;如何高效管理多个账号、确保账号安全是企业面临的重大挑战。那么如何仅用一台电脑就能实现跨平台多开账号呢&#xff1f; 一、为什么需要跨平台多开账号并防关联&#xff1f; 1. 品牌推广&#xff1a;不同平台拥有不同的用户…...

DICOM图像处理:深入解析DICOM彩色图像中的Planar配置及其对像素数据解析处理的实现

引言 在DICOM(Digital Imaging and Communications in Medicine)标准中,彩色图像的存储与显示涉及多个关键属性,其中**Planar Configuration(平面配置)**属性(标签 (0028,0006))尤为重要。当遇到彩色DICOM图像在浏览时被错误地分割为9张小图,而实际应显示为一…...

jupyter notebook的 markdown相关技巧

目录 1 先选择为markdown类型 2 开关技巧 2.1 运行markdown 2.2 退出markdown显示效果 2.3 注意点&#xff1a;一定要 先选择为markdown类型 3 一些设置技巧 3.1 数学公式 3.2 制表 3.3 目录和列表 3.4 设置各种字体效果&#xff1a;加粗&#xff0c;斜体&#x…...

Linux连接网络的三种方式

Linux 连接网络的三种常见方式如下&#xff1a; 桥接模式 原理&#xff1a;虚拟网络接口与物理网络接口或另一个虚拟接口 “桥接”&#xff0c;形成逻辑上的网络交换机&#xff0c;使所有通过该桥接设备的数据包能被转发到桥接组中的所有接口&#xff0c;如同在一个局域网内…...

##继承##

继承的概念 #继承是新模板基于老模板的基础上修改而成&#xff0c;制作新模板时不需要重新开始制作&#xff0c;可以在老模板的基础上进行修改.(如手机版本的换代&#xff0c;软件的版本更新等) #程序也可以继承 继承的格式: class 继承模块&#xff08;被继承模块&#xff…...

2024 APMCM亚太数学建模C题 - 宠物行业及相关产业的发展分析和策略 完整参考论文(1)

摘要 近年来,中国宠物食品行业迅速增长,但面临复杂的国际形势和多变的市场环境,因此科学地分析和预测该行业的发展趋势至关重要。本研究通过构建多个机器学习与统计回归模型,量化分析中国宠物食品行业的关键驱动因素,预测未来宠物食品总产值和出口值。 在数据处理部分,…...

uni-app 修改复选框checkbox选中后背景和字体颜色

编写css&#xff08;注意&#xff1a;这个样式必须写在App.vue里&#xff09; /* 复选框 */ /* 复选框-圆角 */ checkbox.checkbox-round .wx-checkbox-input, checkbox.checkbox-round .uni-checkbox-input {border-radius: 100rpx; } /* 复选框-背景颜色 */ checkbox.checkb…...

使用Notepad++工具去除重复行

使用Notepad工具去除重复行 参考链接&#xff1a;https://blog.csdn.net/londa/article/details/108981396 一 、使用正则表达式 1、对文本进行排序&#xff0c;让重复行排在一起 2、使用正则表达式替换&#xff08;注意&#xff09;^(.*?)$\s?^(?.*^\1$) 在替换时选择正…...

基于Springboot+Vue的救灾物资调动系统 (含源码数据库)

1.开发环境 开发系统:Windows10/11 架构模式:MVC/前后端分离 JDK版本: Java JDK1.8 开发工具:IDEA 数据库版本: mysql5.7或8.0 数据库可视化工具: navicat 服务器: SpringBoot自带 apache tomcat 主要技术: Java,Springboot,mybatis,mysql,vue 2.视频演示地址 3.功能 这个系…...

Unity 使用 Excel 进行配置管理(读Excel配置表、Excel转保存Txt 文本、读取保存的 Txt 文本配置内容)

Unity 使用 Excel 进行配置管理(读Excel配置表、Excel转保存Txt 文本、读取保存的 Txt 文本配置内容) 目录 Unity 使用 Excel 进行配置管理(读Excel配置表、Excel转保存Txt 文本、读取保存的 Txt 文本配置内容) 一、简单介绍 二、实现原理 三、注意事项 四、案例简单步…...

MySQL中索引全详解

第一部分&#xff1a;什么是索引 索引在数据库中就像书的目录&#xff0c;能够快速定位数据位置&#xff0c;从而提升查询效率。没有索引时&#xff0c;数据库查询需要从头到尾扫描整个表&#xff08;称为全表扫描&#xff09;&#xff0c;这在数据量大时非常耗时。有了索引后&…...

vllm serve的参数大全及其解释

以下是 vllm serve 的常见参数说明以及它们的作用&#xff1a; 1. 基本参数 model_tag 说明&#xff1a;用于指定要加载的模型&#xff0c;可以是 Hugging Face 模型仓库中的模型名称&#xff0c;也可以是本地路径。示例&#xff1a;vllm serve "gpt-neo-2.7B"--co…...

2025职业院校技能大赛信息安全管理与评估(河北省) 任务书

2025职业院校技能大赛信息安全管理与评估--河北省 任务书 模块一网络平台搭建与设备安全防护任务1&#xff1a;网络平台搭建 &#xff08;50分&#xff09;任务2&#xff1a;网络安全设备配置与防护&#xff08;250分&#xff09; 模块二网络安全事件响应、数字取证调查、应用程…...

通过高德 JS API 实现H5端定位

实现步骤: 1、安装 amap-jsapi-loader 插件 npm install amap-jsapi-loader 2、对定位组件进行封装 gb-location组件 <script lang="ts" setup> import AMapLoader from @amap/amap-jsapi-loader; import {ref,defineExpose} from vue;let map = ref(nul…...

【软考高级架构】论文预测——论基于ATAM的架构评估方法

论基于ATAM的架构评估方法 摘要 软件架构评估是保障系统质量属性满足业务目标的关键环节。架构权衡分析方法(Architecture Trade-off Analysis Method,ATAM)作为一种系统化的架构评估方法,通过场景捕获、质量属性分析、敏感点与权衡点识别、风险与非风险决策分类等结构化…...

智慧无人机航拍巡检数据集 红外行人车辆识别数据集 行人车辆计数图像识别 红外建筑物识别 夜间低光环境下视觉感知算法 安防、交通等领域红外视觉任务 第10355期

深度学习数据集 README数据集核心信息总览维度详情数据类别目标检测类&#xff08;建筑物、人们、车辆、路灯、通用物体、单个行人&#xff0c;共 6 类&#xff09;数据数量图像样本共 60 张&#xff0c;包含训练、验证、测试所需的基础样本量数据集格式图像格式&#xff08;支…...

2026 网络安全渗透测试行业报告|机遇与前景

随着数字化转型的深入和网络威胁的日益复杂化&#xff0c;网络安全渗透测试行业在2025年迎来了前所未有的发展机遇与挑战。本文基于最新行业数据、招聘趋势与技术演进&#xff0c;全面剖析当前渗透测试行业的市场规模、人才供需、薪资水平、技术变革及未来发展方向&#xff0c;…...

如何在Python中实现轻量级人脸与虹膜检测:基于TensorFlow Lite的解决方案

如何在Python中实现轻量级人脸与虹膜检测&#xff1a;基于TensorFlow Lite的解决方案 【免费下载链接】face-detection-tflite Face and iris detection for Python based on MediaPipe 项目地址: https://gitcode.com/gh_mirrors/fa/face-detection-tflite 在当今的计…...

蒙古语TTS准确率仅73%?ElevenLabs 2024Q2基准测试报告曝光:词级准确率91.4%,但需绕过这2个API默认参数坑

更多请点击&#xff1a; https://codechina.net 第一章&#xff1a;蒙古语TTS准确率争议的真相还原 近年来&#xff0c;多款商用及开源蒙古语文本转语音&#xff08;TTS&#xff09;系统在公开评测中报告了92%–97%的词级准确率&#xff0c;但一线教育机构与本地化团队反馈的实…...

探灵直播2026最新官方正版免费下载 一键转存 永久更新 (看到速转存 资源随时走丢)

下载链接 本文将为您客观介绍《探灵直播》的幕后作者、核心玩法机制&#xff0c;并将其与同类型竞品进行简单的横向对比&#xff0c;带您全面了解这款作品的独特之处。 一、 幕后作者&#xff1a;专注于美少女题材的 qureate 《探灵直播》的开发商 qureate 是一家在日本游戏界…...

第八篇:《软件测试的经济学:投入与回报》

在商业环境中&#xff0c;测试不是“免费”的——它需要人力、工具、时间。但缺陷也不是免费的——它可能导致损失、赔偿、用户流失。如何让管理者理解“投入测试是投资&#xff0c;而不是成本”&#xff1f;本文将从经济学角度分析测试的投资回报率&#xff08;ROI&#xff09…...

Prism Launcher:重新定义你的Minecraft启动体验

Prism Launcher&#xff1a;重新定义你的Minecraft启动体验 【免费下载链接】PrismLauncher A custom launcher for Minecraft that allows you to easily manage multiple installations of Minecraft at once (Fork of MultiMC) 项目地址: https://gitcode.com/gh_mirrors/…...

深度解析AI游戏瞄准辅助:从YOLOv10模型到实时视觉识别的完整技术架构

深度解析AI游戏瞄准辅助&#xff1a;从YOLOv10模型到实时视觉识别的完整技术架构 【免费下载链接】yolov8_aimbot Aim-bot based on AI for all FPS games 项目地址: https://gitcode.com/gh_mirrors/yo/yolov8_aimbot 在当今FPS游戏竞技领域&#xff0c;AI瞄准辅助技术…...

做网安的这几年,挖漏洞接私活赚的是我工资的3倍,这些门道没几人知道

前言 这是我做网络安全工程师&#xff08;简称网安&#xff09;的第9个年头&#xff0c;从我工作的第3年起&#xff0c;我就一直在开始尝试去接网安方面的私活&#xff0c;这6年平均下来&#xff0c;我接私活赚的钱几乎是我工资的3倍。 而很多人要么不敢去做&#xff0c;要么就…...