当前位置: 首页 > news >正文

知识图谱构建技术综述

摘要

*知识图谱为实现语义化智能搜索以及知识互联打下了基础,。,
*随着知识的发展,传统的基于模板和规则构建的知识图谱已经被深度学习所替代。

  • 知识组织得原则中:知识的充分性、有序性和标准化规则。
  • 深度学习的效果在很大程度上依赖大规模的样本、缺乏先验知识。导致某些结果可能背离人类知识和先验知识
  • 深度学习不具备因果推理性,缺乏可解释性。
  • 端到端学习,人们无法清楚的解释每一个参数的意义。
  • 知识图谱用于深度学习时候的可解释性、因果推断性、指导性

知识图谱的定义和架构

  • 知识图谱旨在从多种类型的复杂数据中抽取概念、实体和关系。是事物关系的可计算模型。
    在这里插入图片描述
    在这里插入图片描述

知识图谱的体系架构

  • 第一部分:源数据的获取:即在各个类型的数据中获取最有用的资源信息。
  • 第二部分:知识融合:用于关联多数据源的知识,扩大知识范围。
  • 第三部分:知识的计算和知识的应用。
  • 在这里插入图片描述

知识图谱的构建技术

  • 知识图谱从多种数据源中提取知识并存入知识图谱,是构建大规模知识图谱的基础。
  • 知识融合可以解决不同知识图谱异构问题。
  • 知识计算是知识图谱的主要输出能力。

知识抽取

  • 命名实体识别
  • 关系抽取
  • 在这里插入图片描述
  • 在这里插入图片描述
  • 在这里插入图片描述
  • 在这里插入图片描述
  • 在这里插入图片描述

关系抽取

  • 基于传统规则和模板的方法
  • 基于传统机器学习的方法
    • 有监督
    • 半监督
    • 无监督三类。
  • 基于深度学习的方法
    • 流水线方法:CNN、RNN及其改进模型
    • 实体关系联合抽取
      • 基于参数共享的实体关系联合抽取
      • 基于序列标注的实体关系联合抽取。
      • 在这里插入图片描述
        在这里插入图片描述
        在这里插入图片描述
        在这里插入图片描述

    知识融合

    • 本体融合
      • 本体集成和本体映射两大类。
        在这里插入图片描述

本体映射

  • 基于NLP的方法

  • 基于结构的方法

  • 基于实例的方法

  • 综合方法

    • 数据融合
      • 实体合并
      • 实体对齐
      • 实体属性融合等方面
  • 知识图谱的对齐算法可以分为3类:

    • 成对实体对齐
    • 局部实体对齐
    • 全局实体对齐。

知识推理

  • 知识推理根据已经有得实体关系信息来推断新得事实结论,从而进一步丰富知识图谱,满足上游任务得需求。
  • 基于逻辑规则的推理
    • 谓词逻辑推理
    • 本体推理
    • 随机推理
  • 本体寻路算法: 该算法通过一系列并行优化技术实现大规模的知识图谱
  • 双层随机游走算法:利用无向图来表示知识图谱
    • 全局模式和局部模式2中角度下对路径特征进行评估。提高了算法的准确率和召回率。
  • 基于分布式特征表示的推理
    • 基于翻译模型的知识推
    • 基于张量分解的知识推理
    • 基于语义匹配模型的知识推理
      • 提出 DistMult模型
  • 基于深度学习的推理。
    在这里插入图片描述

深度学习指导

在这里插入图片描述

深度学习推理

  • 图网络相对于普通的神经网络具有归纳推广和组合概括能力

存在困难和挑战

  • 对于知识抽取技术,现有的实体关系联合抽
    取技术并未解决关系重叠问题
    ,算法准确率和召回率都较低。
  • 基于开放域的关系抽取还处于初级阶段多语种、大范围的多元实体关系抽取是当前面临的主要困难之一
  • 无监督关系抽取具有较高的可移植性,和泛化性,为开发域关系抽取任务提供了新的思路。
  • 对于知识融合技术,实体对齐是最主要的手段,如何实现高质量的实体对齐、共指消解是一项巨大的挑战,开放领域下的实体对齐、共指消解以多源数据库融合是当前主要的研究重点
  • ,如何在短文本情况下准确地将实体链接到知识库中亟需解决
  • 小样本学习应用到实体对齐是重要的研究方向
  • 对于知识推理技术,现有的知识推理技术大多只关注静态数据,忽略了时间信息,知识图谱的信息应该随着时间的推移而变化,因此,动态知识图谱推理还需要进行研究探索
  • ,将知识图谱应用于深度学习还处于起步阶段

结束语

经验

到此为止,慢慢的沿着综述将各种模型都给建立一波,并将其全部都搞通搞精通,完全理解透彻。

  • 经验,找到解决关系重叠有没有好的方法,根据啥进行重叠以下都行的样子与打算。
    • 给代码敲打熟悉,然后给综述性文章看个四五篇,然后开始自己找两三个自己现成的方法,自己搞研究,将其全部都搞定都行啦的样子域打算。

自己研究

可以先将动态知识图谱作为自己的研究方向。

相关文章:

知识图谱构建技术综述

摘要 *知识图谱为实现语义化智能搜索以及知识互联打下了基础,。, *随着知识的发展,传统的基于模板和规则构建的知识图谱已经被深度学习所替代。 知识组织得原则中:知识的充分性、有序性和标准化规则。深度学习的效果在很大程度上…...

环境变量和进程地址空间

目录 环境变量: env:显示所有的环境变量: echo $环境变量名表示查看环境变量的值 理解环境变量: getenv:显示环境变量的值 export set命令:显示所有变量 unset取消变量: pwd:当…...

【数据结构】栈和队列

目录 一、栈 1、栈的定义 2、栈的模拟实现(顺序栈) 1、创建一个顺序结构的栈 2、实现压栈方法(push) 3、模拟实现pop方法(出栈) 4、模拟实现peek(查看) 5、测试上述方法 3、栈的应用场景 1、改变元…...

sql复习(视图、Top-N分析、其他数据库对象)

一、视图view 1.视图定义 视图是一种虚表。 视图建立在已有表的基础上, 视图赖以建立的这些表称为基表。 向视图提供数据内容的语句为 SELECT 语句, 可以将视图理解为存储起来的 SELECT 语句。 视图向用户提供基表数据的另一种表现形式。 2.使用视图的好处 控制数据访问 简…...

2023年私募股权基金研究报告

第一章 概况 PE是私募,也即私募投资基金,是指以非公开发行方式向合格投资者募集的,投资于股票、股权、债券、期货、期权、基金份额及投资合同约定的其他投资标的(如艺术品、红酒等)的投资基金,简称私募基金…...

Redis单点故障+红锁原理

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 一、Redis单点故障二、红锁原理三、Redission实现了红锁一、Redis单点故障 单台redis容易出单点故障采用集群,获取到锁之后数据持久化到rdb,aof文件中从节点有可能在从主节点拿到数据之前,主节点…...

数据库中的存储过程

1、创建存储过程create procedure sp_name[参数名] [类型],[参数名] [类型]asbegin.........end以上格式还可以简写成:create proc sp_name[参数名] [类型],[参数名] [类型]asbegin.........end/*注:“sp_name”为需要创建的存储过程的名字,该…...

基于 VPX 总线的工件台运动控制系统研究与开发-DSP+FPGA硬件架构(一)

作为光刻机核心单元之一,超精密工件台主要负责实现快速扫描、上下片、精密定位、调平调焦等功能。目前,较为成熟的方案大多采用 VME 并行总线架构来建立超精密工件台控制系统,由于随着系统性能要求的提升,VME 总线以及相应的处理器…...

Android 9.0 根据包名授予app所需的权限

1.概述 在9.0的系统rom产品定制化开发中,在对系统app首次启动默认是会弹出授权的弹窗的,但是对于产品来说会显示的有些麻烦,对产品体验度也不是很好,所以在进行产品开发的时候,默认要求对一些app根据包名授予权限,这样就不会弹出授权的窗口了默认就有权限了,接下来就来实…...

如何将Python包发布到PyPI上,使用pip安装自己的库

如何发布自己的第三方库1. PyPi的用途2.Python包发布步骤2.1 创建目录结构2.2 准备文件1、README.rst2、LICENSE.txt,创建许可证3、setup.py文件4.克隆setup.py仓库(推荐)2.3 编写核心代码2.4 生成分发档案2.5 发布包到PyPi3.验证发布PYPI成功…...

【Git】git常用命令总结

简言 git是一个开源的分布式版本控制系统,可以有效、高速地处理从很小到非常大的项目版本管理。 里面有很多常用的命令语法,在此做一个常用命令总结记录,以备不时之需。 命令总结 由于git是基于linux开发的工具,所以有个特点&a…...

Cortex-M0中断控制和系统控制

目录1.NVIC和系统控制块特性2.中断使能和清除使能3.中断挂起和清除挂起4.中断优先级5.中断控制的通用汇编代码使能和禁止中断设置和清除中断挂起状态设置中断优先级6.异常屏蔽寄存器(PRIMASK)7.中断输入和挂起行为8.中断等待9.系统异常的控制寄存器10.系…...

科技云报道:2023,云计算的风向变了

科技云报道原创。 2022,是云计算的“分水岭”之年。 与前两年的火热相比,2022年云计算行业实属不太好过:阿里云一季度营收增速创出历史新低,腾讯云的市场份额也被后来者华为云反超,沦为第三。 在此情形下&#xff0c…...

工程管理系统源码-专注项目数字化管理-工程管理

工程项目各模块及其功能点清单 一、系统管理 1、数据字典:实现对数据字典标签的增删改查操作 2、编码管理:实现对系统编码的增删改查操作 3、用户管理:管理和查看用户角色 4、菜单管理:实现对系统菜单的增删改查操…...

Nacos详细使用操作文档(图文详细)

文章目录Nacos详细使用操作文档(图文详细)1、安装2、Nacos作为注册中心2.1、Nacos服务注册【ICRMS】2.2、Nacos 服务调用2.2.1、Feign 远程调用【Personnel】2.2.2)、RestTemplateRibbon 远程调用【Personnel】3、Nacos作为配置中心4、Nacos 命令空间5、Nacos配置文件参数详解N…...

如何评价2023年美赛ABC题目

A题 遭受干旱侵袭的植物群落 背景 不同种类的植物对压力的反应方式不同。例如,草原对干旱非常敏感。干旱发生的频率和严重 程度各不相同。大量的观察表明,不同物种的数量在植物群落如何适应连续几代的干旱周期中 起着重要作用。在一些只有一种植物的…...

Win10显示dds及tga缩略图

整理之前做游戏MOD时收集的模型资源,3D游戏模型的贴图文件格式基本都是dds或tga的,毕竟无损压缩、支持嵌入MipMap、带透明通道、可以被GPU硬解balabala...道理我都懂但这俩玩意系统根本直接查看不了,就算装上专门的看图软件或插件,文件夹视图下也没有缩略图预览,只能一个个点开…...

Lesson5.1---Python 之 NumPy 简介和创建数组

一、NumPy 简介 NumPy(Numerical Python)是 Python 的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比 Python 自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示…...

Exchange 2013升级以及域名绑定等若干问题

环境简介Exchange 2013服务器位于ad域中,系统为Windows server 2012 R2,其内部域名为:mail.ad.com一. Exchange客户端无法在浏览器中正常运行在域中部署Exchange服务器后,除了可以通过outlook、foxmail等邮件客户端来使用邮箱功能…...

linux安装jenkins

1. 官网寻找安装方式 进入到jenkins官网,找到对应的下载页面:https://www.jenkins.io/download/ 根据自己系统还有想要使用的版本,进行选择即可。这里我们使用CentOS作为示例,版本选择长期支持版(LTS) 2.…...

AI抠图的几种方法:从传统到智能,一文掌握所有工具和技巧

最近被问得最多的问题就是:"怎么快速给图片换个背景?"、"证件照怎么自己换底色?"、"商品图去背景用什么工具?"。说实话,随着AI技术的发展,抠图这件事已经从"需要Photos…...

构建个人AI记忆体:向量数据库与语义搜索实践指南

1. 项目概述:构建你的个人AI记忆体最近几年,AI助手越来越聪明,但总感觉它们“记性”不太好。你昨天刚和它聊过你家的猫叫“橘子”,今天再问它,它可能就忘了。或者,你让它帮你总结上周的工作周报&#xff0c…...

白起、项羽、黄巢杀降时的第三选择

白起、项羽、黄巢,他们都曾站在“杀降”这个决策悬崖上。与其说这是他们个人的暴虐,不如说他们当时都陷入了一个由战争逻辑、资源短缺和恐惧心理共同构筑的绝境。在那个系统里,他们几乎无法做出别的选择。🎲 那场被逼到墙角的困兽…...

通过Taotoken实现按Token计费的多模型批量测试脚本

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 通过Taotoken实现按Token计费的多模型批量测试脚本 基础教程类,针对需要对多个模型进行性能或效果评估的开发者&#x…...

深度解构:指纹浏览器底层隔离与Python高并发RPA,如何重塑电商矩阵自动化架构?

大家好,我是林焱,一名专注电商底层业务逻辑与 RPA 自动化架构定制的独立开发者。 在 CSDN 的各个技术板块中,关于爬虫与反爬虫、并发调度、以及客户端架构的讨论一直是热点。而将这些技术综合应用到极致的领域之一,就是当下极度内…...

中国行政区划数据生成器:开发者的地理数据基础设施解决方案

中国行政区划数据生成器:开发者的地理数据基础设施解决方案 【免费下载链接】chinese-address-generator 中国地址生成器 - 三级地址 四级地址 随机生成完整地址 项目地址: https://gitcode.com/gh_mirrors/ch/chinese-address-generator 在现代软件开发过程…...

LazyLLM:低代码多智能体应用开发框架实战指南

1. 项目概述:LazyLLM,一个为懒人开发者准备的多智能体应用构建工具如果你和我一样,在尝试构建一个基于大语言模型的智能应用时,感到头大——不是被各种框架的API调用搞晕,就是被模型部署、服务编排、数据流设计这些工程…...

西门子S7-1200 PLC编程避坑指南:从振荡电路到浮点数计算,新手最常犯的5个错误

西门子S7-1200 PLC编程实战避坑手册:从逻辑陷阱到数据精度 第一次接触西门子S7-1200 PLC编程时,我对着闪烁的指示灯发呆了半小时——明明按照手册写的梯形图,为什么定时器就是不工作?后来才发现是TON指令的PT参数单位理解错误。这…...

深入解析dlsym的RTLD_NEXT:从符号查找到全局介入的实战指南

1. 揭开RTLD_NEXT的神秘面纱:符号查找的"接力赛" 第一次在代码里看到dlsym(RTLD_NEXT, "printf")这种写法时,我盯着屏幕发了五分钟呆——这行代码就像Linux系统中的魔法咒语,明明每个字母都认识,组合起来却让…...

告别计划外停机:用Python+CNN+SVR实战轴承寿命预测(附PHM2012数据集代码)

工业设备智能运维实战:PythonCNNSVR实现轴承寿命精准预测 轴承作为旋转机械的核心部件,其健康状态直接影响生产线稳定性。传统定期维护常陷入"过度维护"或"维护不足"的两难境地——前者增加停机成本,后者可能引发连锁故障…...