当前位置: 首页 > news >正文

PPC Insights系列:洞见安全多方图联邦

开放隐私计算

开放隐私计算

开放隐私计算OpenMPC是国内第一个且影响力最大的隐私计算开放社区。社区秉承开放共享的精神,专注于隐私计算行业的研究与布道。社区致力于隐私计算技术的传播,愿成为中国 “隐私计算最后一公里的服务区”。

183篇原创内容

公众号

知识图谱(Knowledge Graph)技术凭借其拓扑结构的信息关联关系和消息传递机制,能够对单体信息进行有益补充,因此正在被逐步应用于金融反欺诈、反洗钱和精准营销等场景。但是,因为现实社会中的数据孤岛问题,单一机构内的图数据往往只是一小部分,导致了更全面的关联关系和消息传递范式被阻断,这使得图数据的现实应用价值大打折扣。为此,洞见科技自主研发了安全多方图联邦(Insight Federated Graph,InsightFG)技术,并获得了国家发明专利。该技术从能力上涵盖了多方图数据的安全构建、安全查询、安全表示和安全学习,旨在基于隐私计算技术与知识图谱技术的深度结合,打破图数据孤岛,安全释放多方图数据的融合价值。

图1 图数据孤岛

01

多方图数据挖掘技术发展

传统的图数据价值挖掘主要可分为三类:图查询、图表示与图学习,其中图构建是一切应用的基础。在现实场景中,由于安全合规或竞争关系等原因,图数据拥有者不能或不愿彼此共享,这种数据孤岛问题严重限制了图数据价值的充分释放。如何在保护隐私和数据安全的条件下进行多图数据价值挖掘成为一个重要的研究问题。隐私计算技术的发展,为解决上述问题提供了多种解决方案。

多方图构建

即在隐私保护和数据安全的前提下构建一个全局图,例如基于秘密分享的图并集计算和基于门限解密密码系统的图并集计算。该方案比较依赖图数据本身的存储形式(秘密分享方案需要图数据是邻接矩阵表示的;基于门限解密密码系统设计的方案甚至需要设计新的数据编码形式),不适用实际场景中有向且异构的图数据。

多方图查询

指基于多图结构(结点、边和属性)进行隐私安全的语义查询。可以将多方图数据加密融合,基于融合后的密文进行查询,但是因为涉及大量的密文操作,所以面临性能瓶颈问题;也可以从特定算法角度着手,如利用同态加密算法设计最短路径查询算法,以实现具有隐私保护作用的图查询,但仍然存在效率问题,另一方面,由于无法使用图查询语言,导致使用门槛较高,且缺乏并行能力。

多方图表示

是指针对多图结构进行隐私安全的重组、抽象或者传播迭代得到点/边全局属性的过程,如PageRank值、介性中心度(Betweenness)和图向量表示(embedding)的计算等。在安全多方计算范式下,早期的多方图表示算法多为示例性方案,难以应用大规模数据集。在混淆电路的基础上引入现代并行编程范式可以在一定程度上提升计算效率,但通信开销仍是一个很大的问题,且在计算参与方上会受到限制,很难自由扩充至多方。

多方图学习

是指基于多图数据进行隐私安全的机器学习训练。根据图数据的使用方法可分为两大类:一是利用派生出的图特征,与已有结点属性一起进行传统机器学习的模型训练;二是利用图神经网络(Graph Neural Networks,GNN)进行的深度学习模型训练。联邦图机器学习(Federated Graph Machine Learning, FGML)可以通过联邦的方式训练图机器学习模型从而实现对多方图数据融合价值的挖掘,但传统FGML中大多采用的是各个参与方各自在本地进行消息传递与聚合,再将本地中间结果融合计算,仍然无法真正让多图数据价值达到全局最优效益。

图2 纵向图联邦与横向图联邦

综上,基于安全多方计算的方案由于大量使用了密文运算,面临很大的性能瓶颈难题,而基于联邦学习的方案由于是在各自本地进行消息传递与聚合,再将本地中间结果融合计算,导致全局数据价值效用无法最大化,因此一般只能解决图计算中的某些特定问题,无法适用于未来多样化的图数据价值挖掘场景,且实现路径差异较大,很难统一到一个解决方案中。

02

洞见安全多方图联邦平台

洞见安全多方图联邦平台通过融合安全多方计算、假名化、随机化等技术等实现了跨多方的全局图的安全构建,并在此基础上实现了多级分布式图计算引擎,涵盖了多方图数据的安全存储、安全查询、安全表示与安全学习,并可以完成结点分类、边分类、链接预测、标签传播、社区发现等多类型任务。

图3 InsightFG架构设计

03

InsightFG建模效果分析

以图数据集DGraph为例,其为一个有向无权的动态图,顶点达300万,边达到400万,传统图算法的效果如下:

Baseline:集中方式模型效果

我们将DGraph拆分成两个数据集模拟纵向联邦场景,通过InsightFG的安全图构建和安全图表示,并基于图表示结果采用纵向逻辑回归和纵向XGB算法进行模型训练。得益于全局图的构建,通过InsightFG可以将原模型效果提升约7个百分点;使用InsightFG的模型效果高于直接使用图联邦机器学习的方案(V-GNN);且相较于已有的基于集中图数据的模型效果,InsightFG+V-XGB的模型效果仅仅低于GraphSAGE(NeighborSampler)算法不到1个百分点。可见,采用InsightFG能够在隐私保护与数据安全的条件下使得模型精准性与集中数据建立的模型效果相当。

InsightFG:联邦方式建模效果

04

总结

图数据因为其拓扑结构方式的信息关联关系和消息传递范式,能把纷杂的信息变得有序、直观、清晰,在许多行业领域都有巨大的应用价值。在隐私保护和数据安全的大背景下,基于隐私计算的多方图数据价值挖掘是前沿技术研究热点。洞见科技在大量理论研究的基础上,结合多年图数据挖掘的经验积累,推出了InsightFG平台,集安全多方图构建、安全多方图查询、安全多方图表示和安全多方图学习于一体,贯彻图数据价值挖掘的全生命周期,在安全性、易用性和效率上能更好地满足多方图数据价值融合的场景应用。

【参考文献】

[1] Kukkala, V.B., Iyengar, S.S., & Saini, J.S. Secure Multiparty Computation of a Social Network. 2015.

[2] 魏琼, 李顺东, 王文丽,等. 图交集和并集的安全多方计算[J]. 密码学报, 2020, 7(6):15.

[3] PGAS: Privacy-preserving graph encryption for accurate constrained shortest distance querie

[4] Lai S , Yuan X , Sun S F , et al. GraphSE: An Encrypted Graph Database for Privacy-Preserving Social Search[J]. ACM, 2019.

[5] Brickell J , Shmatikov V . Privacy-Preserving Graph Algorithms in the Semi-honest Model[C]// Advances in Cryptology - ASIACRYPT 2005, 11th International Conference on the Theory and Application of Cryptology and Information Security, Chennai, India, December 4-8, 2005, Proceedings. Springer, Berlin, Heidelberg, 2005.

[6] He C , Balasubramanian K , Ceyani E , et al. FedGraphNN: A Federated Learning System and Benchmark for Graph Neural Networks[J]. 2021.

[7] Chaochao C , Jun Z , Longfei Z , et al. Vertically Federated Graph Neural Network for Privacy-Preserving Node[C]. JCAI. 2022.

[8] Fu, X., Zhang, B., Dong, Y., Chen, C., & Li, J. Federated Graph Machine Learning: A Survey of Concepts, Techniques, and Applications. 2022. ArXiv, abs/2207.11812.

[9] https://github.com/DGraphXinye/DGraphFin_baseline

来源: 洞见科技InsightOne

END

往期推荐:

隐私计算头条周刊(2.20-2.26)

近期隐私计算行业招聘

合规要点解析:如何正确的使用隐私增强技术

速来!掘金数据时代2022年度隐私计算评选活动火热报名中!

开放隐私计算社区征稿啦!

热门文章:

姚期智院士:数据、算法、算力为何是数字经济核心技术?

隐私计算又遇技术突破,亿级数据密态分析可在10分钟内完成

清华大学张超:实现数据确权与保护,数据密态渐成行业共识

数据确权:第五要素的战争

未来十年,将会有95%的企业采用隐私计算技术

分享此内容的人还喜欢

应对数据管理成本和复杂性,数据基础设施架构的革命

Andy730阅读 22不喜欢

不看的原因确定

  • 内容质量低

  • 不看此公众号

展望2023:工业互联网发展呈现八大趋势

工联网iitime阅读 102不喜欢

不看的原因确定

  • 内容质量低

  • 不看此公众号

数字孪生-电视生产线3D可视化管理平台

木棉树软件阅读 1356不喜欢

不看的原因确定

  • 内容质量低

  • 不看此公众号

相关文章:

PPC Insights系列:洞见安全多方图联邦

开放隐私计算开放隐私计算开放隐私计算OpenMPC是国内第一个且影响力最大的隐私计算开放社区。社区秉承开放共享的精神,专注于隐私计算行业的研究与布道。社区致力于隐私计算技术的传播,愿成为中国 “隐私计算最后一公里的服务区”。183篇原创内容公众号知…...

SQLite注入记录(目前最全、核心函数用法、布尔盲注、时间盲注、webshell、动态库,绕过方式)

目录 与Mysql区别 全部核心函数 普通注入 查询所有列 查看所有表名...

Java简单的生成/解析二维码(zxing qrcode)

Hi I’m Shendi Java简单的生成/解析二维码(zxing qrcode) 在之前使用 qrcode.js 方式生成二维码,但在不同设备上难免会有一些兼容问题,于是改为后端(Java)生成二维码图片 这里使用 Google 的 zxing包 Jar…...

若依项目导出后端响应的Excel文件流处理

若依开源项目:http://doc.ruoyi.vip/ruoyi-vue 问题 前端 1. download.js 添加自定义方法 /*** 自定义方法:导出后端响应的 excel 文件流* param url 请求后端的接口地址 例如:"/downloadExcel"* param name 响应后的文件名称&…...

华为OD机试【独家】提供C语言题解 - 数组排序

最近更新的博客 华为od 2023 | 什么是华为od,od 薪资待遇,od机试题清单华为OD机试真题大全,用 Python 解华为机试题 | 机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南)华为od机试,独家整理 已参加机试人员的实战技巧文章目录 最近更新的博客使用说明数组…...

JVM详解——内存结构

文章目录内存结构1、 运行时数据区2、虚拟机栈3、本地方法栈4、程序计数器5、 堆6、方法区7、运行时常量池8、内存溢出和内存泄漏9、 堆溢出内存结构 1、 运行时数据区 Java虚拟机在运行Java程序期间将管理的内存划分为不同的数据区,不同的区域负责不同的职能&…...

Jvisualvm监控Tomcat以及相关参数优化

Tomcat阻塞模式 阻塞模式(BIO) 客户端和服务器创建一个连接,它就会创建一个线程来处理这个连接,以为这客户端创建了几个连接,服务端就需要创建几个线程来处理你,导致线程会产生很多,有很多线程…...

界面组件DevExpress WinForms v22.2 - 全面升级数据展示功能

DevExpress WinForms拥有180组件和UI库,能为Windows Forms平台创建具有影响力的业务解决方案。DevExpress WinForms能完美构建流畅、美观且易于使用的应用程序,无论是Office风格的界面,还是分析处理大批量的业务数据,它都能轻松胜…...

正点原子第一期

ZYNQ是一个fpga用来硬件编程,外加一个软件编程 FPGA是可通过编程来修改其逻辑功能的数字集成电路 第三篇语法篇 第七章 verilog HDL语法 Verilog的简介 可编程逻辑电路:允许用户自行修改内部连接的集成电路,其内部的电路结构可以通过编程数…...

「mysql是怎样运行的」第24章 一条记录的多幅面孔---事务的隔离级别与MVCC

「mysql是怎样运行的」第24章 一条记录的多幅面孔—事务的隔离级别与MVCC 文章目录「mysql是怎样运行的」第24章 一条记录的多幅面孔---事务的隔离级别与MVCC一、事前准备二、事务的隔离级别事务并发执行遇到的问题SQL标准中的四种隔离级别MySQL中支持的四种隔离级别三、MVCC原…...

入门Java第十五天 线程

一、多线程 1.1进程和线程 进程:进程就是操作系统中运行的每一个应用程序。例如:微信,QQ 线程:线程是进程中的每一个任务。 多线程:在一个进程中,可以同时执行多个线程。同时完成多个任务。 并发&#x…...

探索用卷积神经网络实现MNIST数据集分类

问题对比单个全连接网络,在卷积神经网络层的加持下,初始时,整个神经网络模型的性能是否会更好。方法模型设计两层卷积神经网络(包含池化层),一层全连接网络。选择 5 x 5 的卷积核,输入通道为 1&…...

MySQL 索引失效场景

1,前言 索引主要是为了提高表的查询速率,但在某些情况下,索引也会失效的情况。 2,失效场景 2.1 最左前缀法则 查询从索引最左列开始,如果跳过索引中的age列,那么age后面字段的索引都将失效,…...

Xcode开发工具,图片放入ios工程

Xcode开发工具,图片放入ios工程,有三种方式: 一:Assets Assets.xcassets 一般是以蓝色的Assets.xcassets的文件夹形式在工程中,以Image Set的形式管理。当一组图片放入的时候同时会生成描述文件Contents.jso…...

操作系统权限提升(十九)之Linux提权-SUID提权

系列文章 操作系统权限提升(十八)之Linux提权-内核提权 SUID提权 SUID介绍 SUID是一种特殊权限,设置了suid的程序文件,在用户执行该程序时,用户的权限是该程序文件属主的权限,例如程序文件的属主是root,那么执行该…...

直播 | StarRocks 实战系列第三期--StarRocks 运维的那些事

2023 年开春, StarRocks 社区重磅推出入门级实战系列直播,手把手带你从 Zero to Hero 成为一个 “StarRocks Pro”!通过实际操作和应用场景的结合,我们将帮你系统性地学习 StarRocks 这个当今最热门的开源 OLAP 数据库。本次&…...

KingabseES执行计划-分区剪枝(partition pruning)

概述 分区修剪(Partition Pruning)是分区表性能的查询优化技术 。在分区修剪中,优化器分析SQL语句中的FROM和WHERE子句,以在构建分区访问列表时消除不需要的分区。此功能使数据库只能在与SQL语句相关的分区上执行操作。 参数 enable_partition_pruning 设…...

Operator-sdk 在 KaiwuDB 容器云中的使用

一、使用背景KaiwuDB Operator 是一个自动运维部署工具,可以在 Kubernetes 环境上部署 KaiwuDB集群,借助 Operator 可实现无缝运行在公有云厂商提供的 Kubernetes 平台上,让 KaiwuDB 成为真正的 Cloud-Native 数据库。使用传统的自动化工具会…...

【数据挖掘】2、数据预处理

文章目录一、数据预处理的意义1.1 缺失数据1.1.1 原因1.1.2 方案1.1.3 离群点分析1.2 重复数据1.2.1 原因1.2.2 去重的方案1.3 数据转换1.4 数据描述二、数据预处理方法2.1 特征选择 Feature Selection2.2 特征提取 Feature Extraction2.2.1 PCA 主成分分析2.2.2 LDA 线性判别分…...

(四十六)大白话在数据库里,哪些操作会导致在表级别加锁呢?

之前我们已经给大家讲解了数据库里的行锁的概念,其实还是比较简单,容易理解的,因为在讲解锁这个概念之前,对于多事务并发以及隔离,我们已经深入讲解过了,所以大家应该很容易在脑子里有一个多事务并发执行的…...

FcμR识别IgM复杂机制的揭示:解锁人体免疫早期应答之谜

一、引言免疫系统是机体抵御病原体入侵、维持内环境稳定的关键防线。在免疫应答过程中,不同类型的免疫球蛋白发挥着独特的作用。其中,IgM作为人体五类免疫球蛋白之一,在免疫应答早期起着至关重要的作用。而Fc受体作为免疫系统中的重要组成部分…...

AI智能体安全策略引擎:AgentEnforcer框架设计与实战应用

1. 项目概述:一个为AI智能体量身定制的“行为守门员” 最近在折腾AI智能体(Agent)的开发,尤其是在构建那些需要自主执行任务、与外部API交互的复杂系统时,一个核心痛点总是挥之不去: 如何确保智能体的行为…...

告别云服务器:手把手教你用QEMU在Ubuntu 18.04上搭建专属内核调试环境

从零构建QEMU内核调试环境:Ubuntu 18.04下的UEFI开发实战手册 当深夜的调试灯亮起,你是否还在为云服务器高昂的费用和网络延迟苦恼?本文将带你用一台普通Ubuntu机器,打造媲美物理机的内核开发环境。不同于常规教程,我…...

机器人学习中的物理驱动数据生成框架解析

1. 物理驱动数据生成框架解析在机器人学习领域,接触丰富的操作任务(如物体旋转、装配等)对数据质量提出了极高要求。传统基于轨迹优化的方法虽然能通过物理仿真生成动态可行的运动轨迹,但存在全局探索不足的问题。我们提出的创新框…...

ExifToolGUI终极指南:5分钟掌握照片元数据批量管理

ExifToolGUI终极指南:5分钟掌握照片元数据批量管理 【免费下载链接】ExifToolGui A GUI for ExifTool 项目地址: https://gitcode.com/gh_mirrors/ex/ExifToolGui 还在为海量照片的元数据管理而烦恼吗?每次旅行归来,面对数百张照片的时…...

基于Nuxt 4与Shadcn/ui的现代全栈仪表板开发实战

1. 项目概述:一个现代全栈仪表板的技术栈选择 最近在做一个内部管理后台,需要快速搭建一个既美观又功能齐全的仪表板。我的核心需求很明确:开发要快、代码质量要高、用户体验要好,并且要能轻松应对多语言场景。在评估了市面上各种…...

别再死记硬背了!通过eNSP搭建WLAN,一次搞懂AC+AP架构中的VLAN、CAPWAP和业务转发

从零构建企业级WLAN:ACAP架构中的关键技术解析与实战 在数字化转型浪潮中,无线网络已从简单的"能上网"演变为支撑业务运营的关键基础设施。对于网络工程师而言,理解ACAP架构背后的设计哲学,远比记住配置命令更为重要。本…...

CGRA架构与工具链:可重构计算加速技术解析

1. CGRA架构与工具链概述粗粒度可重构阵列(Coarse-Grained Reconfigurable Array, CGRA)是一种介于FPGA和ASIC之间的可重构计算架构,特别适合加速多维嵌套循环计算。与FPGA的细粒度可编程逻辑单元不同,CGRA采用粗粒度的处理单元&a…...

Midjourney Spinach印相实操手册:手把手配置--sref、--stylize、--cw权重,5分钟复刻暗房级颗粒与褪色层次

更多请点击: https://intelliparadigm.com 第一章:Midjourney Spinach印相的核心美学溯源 Midjourney Spinach印相并非官方功能命名,而是社区对一类高对比度、低饱和、肌理感强烈且带有手工暗房隐喻的图像生成风格的诗意指称。“Spinach”一…...

基于RAG与向量数据库的本地化个人知识库构建实践

1. 项目概述:一个为个人量身定制的知识库构建引擎 如果你和我一样,每天在浏览器、笔记软件、PDF文档和各种聊天记录之间疲于奔命,试图抓住那些一闪而过的灵感和零散的知识点,那么你肯定理解“知识碎片化”的痛苦。我们收藏了无数…...