PPC Insights系列:洞见安全多方图联邦
开放隐私计算


开放隐私计算
开放隐私计算OpenMPC是国内第一个且影响力最大的隐私计算开放社区。社区秉承开放共享的精神,专注于隐私计算行业的研究与布道。社区致力于隐私计算技术的传播,愿成为中国 “隐私计算最后一公里的服务区”。
183篇原创内容
公众号

知识图谱(Knowledge Graph)技术凭借其拓扑结构的信息关联关系和消息传递机制,能够对单体信息进行有益补充,因此正在被逐步应用于金融反欺诈、反洗钱和精准营销等场景。但是,因为现实社会中的数据孤岛问题,单一机构内的图数据往往只是一小部分,导致了更全面的关联关系和消息传递范式被阻断,这使得图数据的现实应用价值大打折扣。为此,洞见科技自主研发了「安全多方图联邦(Insight Federated Graph,InsightFG)」技术,并获得了国家发明专利。该技术从能力上涵盖了多方图数据的安全构建、安全查询、安全表示和安全学习,旨在基于隐私计算技术与知识图谱技术的深度结合,打破图数据孤岛,安全释放多方图数据的融合价值。

图1 图数据孤岛
01
多方图数据挖掘技术发展
传统的图数据价值挖掘主要可分为三类:图查询、图表示与图学习,其中图构建是一切应用的基础。在现实场景中,由于安全合规或竞争关系等原因,图数据拥有者不能或不愿彼此共享,这种数据孤岛问题严重限制了图数据价值的充分释放。如何在保护隐私和数据安全的条件下进行多图数据价值挖掘成为一个重要的研究问题。隐私计算技术的发展,为解决上述问题提供了多种解决方案。
多方图构建
即在隐私保护和数据安全的前提下构建一个全局图,例如基于秘密分享的图并集计算和基于门限解密密码系统的图并集计算。该方案比较依赖图数据本身的存储形式(秘密分享方案需要图数据是邻接矩阵表示的;基于门限解密密码系统设计的方案甚至需要设计新的数据编码形式),不适用实际场景中有向且异构的图数据。
多方图查询
指基于多图结构(结点、边和属性)进行隐私安全的语义查询。可以将多方图数据加密融合,基于融合后的密文进行查询,但是因为涉及大量的密文操作,所以面临性能瓶颈问题;也可以从特定算法角度着手,如利用同态加密算法设计最短路径查询算法,以实现具有隐私保护作用的图查询,但仍然存在效率问题,另一方面,由于无法使用图查询语言,导致使用门槛较高,且缺乏并行能力。
多方图表示
是指针对多图结构进行隐私安全的重组、抽象或者传播迭代得到点/边全局属性的过程,如PageRank值、介性中心度(Betweenness)和图向量表示(embedding)的计算等。在安全多方计算范式下,早期的多方图表示算法多为示例性方案,难以应用大规模数据集。在混淆电路的基础上引入现代并行编程范式可以在一定程度上提升计算效率,但通信开销仍是一个很大的问题,且在计算参与方上会受到限制,很难自由扩充至多方。
多方图学习
是指基于多图数据进行隐私安全的机器学习训练。根据图数据的使用方法可分为两大类:一是利用派生出的图特征,与已有结点属性一起进行传统机器学习的模型训练;二是利用图神经网络(Graph Neural Networks,GNN)进行的深度学习模型训练。联邦图机器学习(Federated Graph Machine Learning, FGML)可以通过联邦的方式训练图机器学习模型从而实现对多方图数据融合价值的挖掘,但传统FGML中大多采用的是各个参与方各自在本地进行消息传递与聚合,再将本地中间结果融合计算,仍然无法真正让多图数据价值达到全局最优效益。

图2 纵向图联邦与横向图联邦
综上,基于安全多方计算的方案由于大量使用了密文运算,面临很大的性能瓶颈难题,而基于联邦学习的方案由于是在各自本地进行消息传递与聚合,再将本地中间结果融合计算,导致全局数据价值效用无法最大化,因此一般只能解决图计算中的某些特定问题,无法适用于未来多样化的图数据价值挖掘场景,且实现路径差异较大,很难统一到一个解决方案中。
02
洞见安全多方图联邦平台
洞见安全多方图联邦平台通过融合安全多方计算、假名化、随机化等技术等实现了跨多方的全局图的安全构建,并在此基础上实现了多级分布式图计算引擎,涵盖了多方图数据的安全存储、安全查询、安全表示与安全学习,并可以完成结点分类、边分类、链接预测、标签传播、社区发现等多类型任务。

图3 InsightFG架构设计
03
InsightFG建模效果分析
以图数据集DGraph为例,其为一个有向无权的动态图,顶点达300万,边达到400万,传统图算法的效果如下:
Baseline:集中方式模型效果

我们将DGraph拆分成两个数据集模拟纵向联邦场景,通过InsightFG的安全图构建和安全图表示,并基于图表示结果采用纵向逻辑回归和纵向XGB算法进行模型训练。得益于全局图的构建,通过InsightFG可以将原模型效果提升约7个百分点;使用InsightFG的模型效果高于直接使用图联邦机器学习的方案(V-GNN);且相较于已有的基于集中图数据的模型效果,InsightFG+V-XGB的模型效果仅仅低于GraphSAGE(NeighborSampler)算法不到1个百分点。可见,采用InsightFG能够在隐私保护与数据安全的条件下使得模型精准性与集中数据建立的模型效果相当。
InsightFG:联邦方式建模效果

04
总结
图数据因为其拓扑结构方式的信息关联关系和消息传递范式,能把纷杂的信息变得有序、直观、清晰,在许多行业领域都有巨大的应用价值。在隐私保护和数据安全的大背景下,基于隐私计算的多方图数据价值挖掘是前沿技术研究热点。洞见科技在大量理论研究的基础上,结合多年图数据挖掘的经验积累,推出了InsightFG平台,集安全多方图构建、安全多方图查询、安全多方图表示和安全多方图学习于一体,贯彻图数据价值挖掘的全生命周期,在安全性、易用性和效率上能更好地满足多方图数据价值融合的场景应用。
【参考文献】
[1] Kukkala, V.B., Iyengar, S.S., & Saini, J.S. Secure Multiparty Computation of a Social Network. 2015.
[2] 魏琼, 李顺东, 王文丽,等. 图交集和并集的安全多方计算[J]. 密码学报, 2020, 7(6):15.
[3] PGAS: Privacy-preserving graph encryption for accurate constrained shortest distance querie
[4] Lai S , Yuan X , Sun S F , et al. GraphSE: An Encrypted Graph Database for Privacy-Preserving Social Search[J]. ACM, 2019.
[5] Brickell J , Shmatikov V . Privacy-Preserving Graph Algorithms in the Semi-honest Model[C]// Advances in Cryptology - ASIACRYPT 2005, 11th International Conference on the Theory and Application of Cryptology and Information Security, Chennai, India, December 4-8, 2005, Proceedings. Springer, Berlin, Heidelberg, 2005.
[6] He C , Balasubramanian K , Ceyani E , et al. FedGraphNN: A Federated Learning System and Benchmark for Graph Neural Networks[J]. 2021.
[7] Chaochao C , Jun Z , Longfei Z , et al. Vertically Federated Graph Neural Network for Privacy-Preserving Node[C]. JCAI. 2022.
[8] Fu, X., Zhang, B., Dong, Y., Chen, C., & Li, J. Federated Graph Machine Learning: A Survey of Concepts, Techniques, and Applications. 2022. ArXiv, abs/2207.11812.
[9] https://github.com/DGraphXinye/DGraphFin_baseline
来源: 洞见科技InsightOne
END
往期推荐:
隐私计算头条周刊(2.20-2.26)
近期隐私计算行业招聘
合规要点解析:如何正确的使用隐私增强技术
速来!掘金数据时代2022年度隐私计算评选活动火热报名中!
开放隐私计算社区征稿啦!
热门文章:
姚期智院士:数据、算法、算力为何是数字经济核心技术?
隐私计算又遇技术突破,亿级数据密态分析可在10分钟内完成
清华大学张超:实现数据确权与保护,数据密态渐成行业共识
数据确权:第五要素的战争
未来十年,将会有95%的企业采用隐私计算技术


分享此内容的人还喜欢
应对数据管理成本和复杂性,数据基础设施架构的革命
Andy730阅读 22不喜欢
不看的原因确定
内容质量低
不看此公众号

展望2023:工业互联网发展呈现八大趋势
工联网iitime阅读 102不喜欢
不看的原因确定
内容质量低
不看此公众号

数字孪生-电视生产线3D可视化管理平台
木棉树软件阅读 1356不喜欢
不看的原因确定
内容质量低
不看此公众号

相关文章:

PPC Insights系列:洞见安全多方图联邦
开放隐私计算开放隐私计算开放隐私计算OpenMPC是国内第一个且影响力最大的隐私计算开放社区。社区秉承开放共享的精神,专注于隐私计算行业的研究与布道。社区致力于隐私计算技术的传播,愿成为中国 “隐私计算最后一公里的服务区”。183篇原创内容公众号知…...
SQLite注入记录(目前最全、核心函数用法、布尔盲注、时间盲注、webshell、动态库,绕过方式)
目录 与Mysql区别 全部核心函数 普通注入 查询所有列 查看所有表名...

Java简单的生成/解析二维码(zxing qrcode)
Hi I’m Shendi Java简单的生成/解析二维码(zxing qrcode) 在之前使用 qrcode.js 方式生成二维码,但在不同设备上难免会有一些兼容问题,于是改为后端(Java)生成二维码图片 这里使用 Google 的 zxing包 Jar…...

若依项目导出后端响应的Excel文件流处理
若依开源项目:http://doc.ruoyi.vip/ruoyi-vue 问题 前端 1. download.js 添加自定义方法 /*** 自定义方法:导出后端响应的 excel 文件流* param url 请求后端的接口地址 例如:"/downloadExcel"* param name 响应后的文件名称&…...
华为OD机试【独家】提供C语言题解 - 数组排序
最近更新的博客 华为od 2023 | 什么是华为od,od 薪资待遇,od机试题清单华为OD机试真题大全,用 Python 解华为机试题 | 机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南)华为od机试,独家整理 已参加机试人员的实战技巧文章目录 最近更新的博客使用说明数组…...

JVM详解——内存结构
文章目录内存结构1、 运行时数据区2、虚拟机栈3、本地方法栈4、程序计数器5、 堆6、方法区7、运行时常量池8、内存溢出和内存泄漏9、 堆溢出内存结构 1、 运行时数据区 Java虚拟机在运行Java程序期间将管理的内存划分为不同的数据区,不同的区域负责不同的职能&…...

Jvisualvm监控Tomcat以及相关参数优化
Tomcat阻塞模式 阻塞模式(BIO) 客户端和服务器创建一个连接,它就会创建一个线程来处理这个连接,以为这客户端创建了几个连接,服务端就需要创建几个线程来处理你,导致线程会产生很多,有很多线程…...

界面组件DevExpress WinForms v22.2 - 全面升级数据展示功能
DevExpress WinForms拥有180组件和UI库,能为Windows Forms平台创建具有影响力的业务解决方案。DevExpress WinForms能完美构建流畅、美观且易于使用的应用程序,无论是Office风格的界面,还是分析处理大批量的业务数据,它都能轻松胜…...

正点原子第一期
ZYNQ是一个fpga用来硬件编程,外加一个软件编程 FPGA是可通过编程来修改其逻辑功能的数字集成电路 第三篇语法篇 第七章 verilog HDL语法 Verilog的简介 可编程逻辑电路:允许用户自行修改内部连接的集成电路,其内部的电路结构可以通过编程数…...

「mysql是怎样运行的」第24章 一条记录的多幅面孔---事务的隔离级别与MVCC
「mysql是怎样运行的」第24章 一条记录的多幅面孔—事务的隔离级别与MVCC 文章目录「mysql是怎样运行的」第24章 一条记录的多幅面孔---事务的隔离级别与MVCC一、事前准备二、事务的隔离级别事务并发执行遇到的问题SQL标准中的四种隔离级别MySQL中支持的四种隔离级别三、MVCC原…...

入门Java第十五天 线程
一、多线程 1.1进程和线程 进程:进程就是操作系统中运行的每一个应用程序。例如:微信,QQ 线程:线程是进程中的每一个任务。 多线程:在一个进程中,可以同时执行多个线程。同时完成多个任务。 并发&#x…...

探索用卷积神经网络实现MNIST数据集分类
问题对比单个全连接网络,在卷积神经网络层的加持下,初始时,整个神经网络模型的性能是否会更好。方法模型设计两层卷积神经网络(包含池化层),一层全连接网络。选择 5 x 5 的卷积核,输入通道为 1&…...

MySQL 索引失效场景
1,前言 索引主要是为了提高表的查询速率,但在某些情况下,索引也会失效的情况。 2,失效场景 2.1 最左前缀法则 查询从索引最左列开始,如果跳过索引中的age列,那么age后面字段的索引都将失效,…...

Xcode开发工具,图片放入ios工程
Xcode开发工具,图片放入ios工程,有三种方式: 一:Assets Assets.xcassets 一般是以蓝色的Assets.xcassets的文件夹形式在工程中,以Image Set的形式管理。当一组图片放入的时候同时会生成描述文件Contents.jso…...

操作系统权限提升(十九)之Linux提权-SUID提权
系列文章 操作系统权限提升(十八)之Linux提权-内核提权 SUID提权 SUID介绍 SUID是一种特殊权限,设置了suid的程序文件,在用户执行该程序时,用户的权限是该程序文件属主的权限,例如程序文件的属主是root,那么执行该…...

直播 | StarRocks 实战系列第三期--StarRocks 运维的那些事
2023 年开春, StarRocks 社区重磅推出入门级实战系列直播,手把手带你从 Zero to Hero 成为一个 “StarRocks Pro”!通过实际操作和应用场景的结合,我们将帮你系统性地学习 StarRocks 这个当今最热门的开源 OLAP 数据库。本次&…...
KingabseES执行计划-分区剪枝(partition pruning)
概述 分区修剪(Partition Pruning)是分区表性能的查询优化技术 。在分区修剪中,优化器分析SQL语句中的FROM和WHERE子句,以在构建分区访问列表时消除不需要的分区。此功能使数据库只能在与SQL语句相关的分区上执行操作。 参数 enable_partition_pruning 设…...

Operator-sdk 在 KaiwuDB 容器云中的使用
一、使用背景KaiwuDB Operator 是一个自动运维部署工具,可以在 Kubernetes 环境上部署 KaiwuDB集群,借助 Operator 可实现无缝运行在公有云厂商提供的 Kubernetes 平台上,让 KaiwuDB 成为真正的 Cloud-Native 数据库。使用传统的自动化工具会…...

【数据挖掘】2、数据预处理
文章目录一、数据预处理的意义1.1 缺失数据1.1.1 原因1.1.2 方案1.1.3 离群点分析1.2 重复数据1.2.1 原因1.2.2 去重的方案1.3 数据转换1.4 数据描述二、数据预处理方法2.1 特征选择 Feature Selection2.2 特征提取 Feature Extraction2.2.1 PCA 主成分分析2.2.2 LDA 线性判别分…...
(四十六)大白话在数据库里,哪些操作会导致在表级别加锁呢?
之前我们已经给大家讲解了数据库里的行锁的概念,其实还是比较简单,容易理解的,因为在讲解锁这个概念之前,对于多事务并发以及隔离,我们已经深入讲解过了,所以大家应该很容易在脑子里有一个多事务并发执行的…...

css实现圆环展示百分比,根据值动态展示所占比例
代码如下 <view class""><view class"circle-chart"><view v-if"!!num" class"pie-item" :style"{background: conic-gradient(var(--one-color) 0%,#E9E6F1 ${num}%),}"></view><view v-else …...

微软PowerBI考试 PL300-选择 Power BI 模型框架【附练习数据】
微软PowerBI考试 PL300-选择 Power BI 模型框架 20 多年来,Microsoft 持续对企业商业智能 (BI) 进行大量投资。 Azure Analysis Services (AAS) 和 SQL Server Analysis Services (SSAS) 基于无数企业使用的成熟的 BI 数据建模技术。 同样的技术也是 Power BI 数据…...

基于uniapp+WebSocket实现聊天对话、消息监听、消息推送、聊天室等功能,多端兼容
基于 UniApp + WebSocket实现多端兼容的实时通讯系统,涵盖WebSocket连接建立、消息收发机制、多端兼容性配置、消息实时监听等功能,适配微信小程序、H5、Android、iOS等终端 目录 技术选型分析WebSocket协议优势UniApp跨平台特性WebSocket 基础实现连接管理消息收发连接…...

HTML 列表、表格、表单
1 列表标签 作用:布局内容排列整齐的区域 列表分类:无序列表、有序列表、定义列表。 例如: 1.1 无序列表 标签:ul 嵌套 li,ul是无序列表,li是列表条目。 注意事项: ul 标签里面只能包裹 li…...

CocosCreator 之 JavaScript/TypeScript和Java的相互交互
引擎版本: 3.8.1 语言: JavaScript/TypeScript、C、Java 环境:Window 参考:Java原生反射机制 您好,我是鹤九日! 回顾 在上篇文章中:CocosCreator Android项目接入UnityAds 广告SDK。 我们简单讲…...

多种风格导航菜单 HTML 实现(附源码)
下面我将为您展示 6 种不同风格的导航菜单实现,每种都包含完整 HTML、CSS 和 JavaScript 代码。 1. 简约水平导航栏 <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"viewport&qu…...

Unsafe Fileupload篇补充-木马的详细教程与木马分享(中国蚁剑方式)
在之前的皮卡丘靶场第九期Unsafe Fileupload篇中我们学习了木马的原理并且学了一个简单的木马文件 本期内容是为了更好的为大家解释木马(服务器方面的)的原理,连接,以及各种木马及连接工具的分享 文件木马:https://w…...

LLMs 系列实操科普(1)
写在前面: 本期内容我们继续 Andrej Karpathy 的《How I use LLMs》讲座内容,原视频时长 ~130 分钟,以实操演示主流的一些 LLMs 的使用,由于涉及到实操,实际上并不适合以文字整理,但还是决定尽量整理一份笔…...
深度学习之模型压缩三驾马车:模型剪枝、模型量化、知识蒸馏
一、引言 在深度学习中,我们训练出的神经网络往往非常庞大(比如像 ResNet、YOLOv8、Vision Transformer),虽然精度很高,但“太重”了,运行起来很慢,占用内存大,不适合部署到手机、摄…...
32位寻址与64位寻址
32位寻址与64位寻址 32位寻址是什么? 32位寻址是指计算机的CPU、内存或总线系统使用32位二进制数来标识和访问内存中的存储单元(地址),其核心含义与能力如下: 1. 核心定义 地址位宽:CPU或内存控制器用32位…...