阅读论文笔记《Translating Embeddings for Modeling Multi-relational Data》
目录
- 一、模型核心原理剖析
- 二、实验设计与数据集选择
- 三、实验结果深度解读
- (一)链接预测实验
- (二)关系分类实验
- (三)链接预测示例
- (四)泛化实验
- 四、模型优缺点总结
- (一)优点
- (二)缺点
- 五、后续工作
最近研读了关于TransE模型的论文,在此记录一下心得。
一、模型核心原理剖析

TransE 模型旨在学习知识库中实体和关系的嵌入表示。它的核心思想十分巧妙,将实体和关系都用向量来表示。想象一下,在一个向量空间里,每个实体和关系都有自己的“位置”。当两个实体之间确实存在某种关系时,就如同在这个空间里进行一场向量的“旅行”:把头部实体的向量和关系的向量相加,得到的结果向量应该和尾部实体的向量很接近;反之,如果这两个实体之间没有这种关系,那加出来的向量和尾部实体的向量就会离得远远的。为了衡量这种“接近程度”,模型使用了损失能量函数 d ( h + l , t ) d(h + l, t) d(h+l,t),这里的 d d d可以是1范式或者2范式。同时,模型采用基于边界的排序准则损失函数,并通过生成负样本的方式来最小化损失。
为了避免模型通过不合理地增大实体嵌入向量的长度来降低损失值,还对实体嵌入向量进行了限制,要求其 L 2 L_{2} L2范数为1。在优化过程中,模型运用小批量随机梯度下降算法,就像在复杂的地形中寻找最优路径一样,逐步调整实体和关系的嵌入向量,使得模型的预测效果越来越好。
二、实验设计与数据集选择
论文在实验方面做了精心的安排,选择了 Wordnet(WN)、Freebase(FB15K和FB1M)这些具有代表性的数据集。评估指标采用了平均排名和 hits@10,平均排名越低、hits@10越高,说明模型的性能越好。并且设置了过滤设置,以排除一些干扰因素,更准确地评估模型性能。
在实验过程中,还引入了多个基线模型进行对比,如 Unstructured、RESCAL、SE等。对于每个模型,都进行了超参数选择,以确保它们在实验中能发挥出最佳性能。这种严谨的实验设计,就像一场公平的竞赛,让各个模型在相同的条件下展示自己的“实力”,从而清晰地对比出TransE模型的优势和特点。
三、实验结果深度解读
(一)链接预测实验

从链接预测实验的整体结果来看,TransE模型的表现十分亮眼。在 Table 3 中可以看到,无论是在 WN 数据集还是 FB15K 数据集上,TransE 模型的平均排名都相对较低,hits@10 都相对较高。在 WN 数据集中,TransE 模型的平均排名在过滤设置下为 251,hits@10 达到了 89.2%;在 FB15K 数据集中,平均排名在过滤设置下为 125,hits@10 为 47.1%。与其他基线模型相比,Trans E模型在所有指标上都具有明显优势,这充分证明了它在链接预测任务中的强大能力。
(二)关系分类实验

进一步深入到关系分类的详细结果(Table 4),可以发现 TransE 模型在不同关系类别下的表现也可圈可点。在一对一关系中,预测头部和尾部实体时 hits@10 均为 43.7%;在一对多关系中预测头部实体时,hits@10 为 65.7% 。这表明 TransE 模型能够较好地处理不同类型的关系,在面对复杂的关系结构时,依然能够保持较高的预测准确率。
(三)链接预测示例

Table 5 展示了 TransE 模型在 FB15k 测试集上的链接预测结果示例。比如,当输入 “J. K. Rowling influenced by” 时,模型预测出的 “G. K. Chesterton, J. R. R. Tolkien” 等尾部实体,都与实际情况相符,体现了模型预测的合理性和准确性。虽然正确答案并不总是排名第一,但这些预测结果反映了一定的常识,让我们对模型的实际应用能力有了更直观的感受。
(四)泛化实验

在泛化实验中,通过检查各方法学习新关系的速度来测试它们对新事实的泛化能力。实验结果(Figure 1)显示,TransE 模型是学习速度最快的方法之一。仅用 10 个新关系的示例,hits@10 就已经达到 18%,并且随着提供样本数量的增加,性能单调提升。这说明 TransE 模型具有良好的泛化能力,能够快速适应新的关系数据,在面对不断更新的知识图谱时,具有很大的应用潜力。
四、模型优缺点总结
(一)优点
TransE 模型最大的优点就是在链接预测任务中表现极为优秀。它不仅能够准确地预测出实体之间的关系,而且在处理大规模数据集时,具有较高的效率和可扩展性。同时,模型的简单性使得它能够很好地泛化,在学习新关系时速度快,不需要对已经训练好的嵌入进行复杂的修改。
(二)缺点
然而,TransE 模型也并非完美无缺。当数据中头部实体、关系和尾部实体之间的三元依赖关系至关重要时,该模型可能会失效。这意味着在一些复杂的知识图谱场景中,可能需要结合其他模型或者方法来弥补 TransE 模型的不足。
五、后续工作
后续将进行论文的复现
相关文章:
阅读论文笔记《Translating Embeddings for Modeling Multi-relational Data》
目录 一、模型核心原理剖析二、实验设计与数据集选择三、实验结果深度解读(一)链接预测实验(二)关系分类实验(三)链接预测示例(四)泛化实验 四、模型优缺点总结(一&#…...
实在智能与宇树科技、云深科技一同获评浙江省“人工智能服务商”、 “数智优品”等荣誉
近日,浙江省经信厅正式公布《2024 年浙江省人工智能应用场景、应用标杆企业、人工智能服务商及 “数智优品” 名单》。 实在智能获评浙江省“人工智能服务商”,核心产品 “实在 Agent 智能体” 入选 “数智优品”。一同获此殊荣的还有宇树科技、云深处科…...
跳表(Skip List)详解
一、什么是跳表? 跳表是一种基于有序链表的高效数据结构,通过建立多级索引实现快速查询。它在平均情况下支持O(log n)时间复杂度的搜索、插入和删除操作,性能接近平衡树,但实现更为简单。 二、核心原理 1. 层级结构 底层为完整…...
图片粘贴上传实现
图片上传 html demo 直接粘贴本地运行查看效果即可,有看不懂的直接喂给 deepseek 会解释的很清晰 <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"viewport" content"…...
【Linux常用命令-不断更新】
在 Linux 系统中,查看总剩余内存常用方法。 方法 1:使用 free 命令 free 是一个常用的命令,用于显示系统的总内存、已用内存、空闲内存和交换内存。 free -h-h 参数表示以易读的格式(如 GB、MB)显示内存信息。输出示…...
轻松搭建本地大语言模型(一)Ollama安装与使用
Ollama 是一款开源的本地大语言模型运行框架,支持在 Windows、macOS 和 Linux 系统上运行,能够帮助用户轻松下载和使用各种大语言模型(例如deepseek、llama、qwen)。本文将详细介绍 Ollama 的安装步骤,帮助你快速搭建本…...
Conda 常用命令全解析
在 Windows 系统中,Conda 是一款功能强大的包管理和环境管理工具,尤其对于数据分析、科学计算等场景有着重要的作用。本文将详细介绍 Conda 在 Windows 系统中的常用命令,帮助你高效地管理虚拟环境和软件包。 一、环境管理命令 1.1 查看 Co…...
【核心算法篇十五】《深度解析DeepSeek遗传算法:让超参数调优从“玄学”变“科学”的终极指南》
引言:超参数调优的“炼丹困局”与破局之路 在机器学习的世界里,调参工程师常被戏称为"炼丹师"——面对动辄几十个超参数的复杂模型,我们就像古代术士守着炼丹炉,不断尝试各种参数组合,期待偶然炼出"仙丹"。传统网格搜索(Grid Search)需要遍历所有可…...
kafka消费能力压测:使用官方工具
背景 在之前的业务场景中,我们发现Kafka的实际消费能力远低于预期。尽管我们使用了kafka-go组件并进行了相关测试,测试情况见《kafka-go:性能测试》这篇文章。但并未能准确找出消费能力低下的原因。 我们曾怀疑这可能是由我的电脑网络带宽问题或Kafka部…...
[STM32 - 野火] - - - 固件库学习笔记 - - - 十六.在SRAM中调试代码
一、简介 在RAM中调试代码是一种常见的嵌入式开发技术,尤其适用于STM32等微控制器。它的核心思想是将程序代码和数据加载到微控制器的内部RAM(SRAM)中运行,而不是运行在Flash存储器中。这种方法在开发过程中具有显著的优势&#…...
雷军推荐:WPS 与 Pastemate 联用,效率飞升新高度
在当今快节奏的工作与学习环境中,效率提升成为了每个人都在追求的目标。而雷军,这位科技界的领军人物,凭借其敏锐的洞察力,为我们推荐了一组强大的工具组合 ——WPS 与 Pastemate,它们携手合作,能够为我们的…...
css主题色修改后会多出一个css吗?css怎么定义变量?
在 CSS 中修改主题色时,通常不会直接生成一个新的 CSS 文件,而是通过 CSS 变量(Custom Properties) 或 预处理器变量(如 Sass、Less) 来动态修改样式。以下是详细说明: 1. CSS 变量(…...
ubuntu22.4搭建单节点es8.1
下载对应的包 elasticsearch-8.1.1-linux-x86_64.tar.gz 创建es租户 groupadd elasticsearc useradd elasticsearch -g elasticsearch -p elasticsearch chmod uw /etc/sudoers chmod -R elasticsearch:elasticsearch elasticsearch 修改配置文件 vim /etc/sysctl.conf vm…...
轴承故障特征—SHAP 模型 3D 可视化
往期精彩内容: Python-凯斯西储大学(CWRU)轴承数据解读与分类处理 基于FFT CNN - BiGRU-Attention 时域、频域特征注意力融合的轴承故障识别模型-CSDN博客 基于FFT CNN - Transformer 时域、频域特征融合的轴承故障识别模型-CSDN博客 P…...
斐波那契数列模型:在动态规划的丝绸之路上追寻斐波那契的足迹(上)
文章目录 引言递归与动态规划的对比递归解法的初探动态规划的优雅与高效自顶向下的记忆化搜索自底向上的迭代法 性能分析与比较小结 引言 斐波那契数列,这一数列如同一条无形的丝线,穿越千年时光,悄然延续其魅力。其定义简单而优美ÿ…...
智能选路+NAT实验
1.实验拓扑: 二.实验配置 1、防火墙ip配置和信任区域配置: 2.导入地址库:先下载模板--->进入模板修改地址信息--->导入地址: 3配置链路接口: 4.配置真实DNS服务器信息 5.创建虚拟服务,虚拟DNS服务…...
电商API接口数据与市场趋势分析的深度融合
一、电商API接口数据的价值 电商API接口是连接电商平台与外部系统(如数据分析工具、ERP系统等)的桥梁。通过API接口,企业可以获取海量的交易数据、用户行为数据、商品信息等。这些数据具有以下价值: 数据实时性:API接…...
SMOJ 种植玉米/铺地砖 题解
最近练了轮廓线dp的题目 1.种植玉米 题意 农夫有一个被划分成 m m m行 n n n列的农田。 每个格子的数字如果是 1 1 1则表示该格子的土地是肥沃的,可以种植玉米;如果该格子的数字是 0 0 0则表示该格子不能种植玉米。 但是还有一个条件:不…...
沃丰科技大模型标杆案例 | 索尼大模型智能营销机器人建设实践
AI大模型发展日新月异,国内外主流大模型每月必会升级。海外AI大模型市场由美国主导, 各模型已形成“多强竞合”的局面。中国积极响应全球大模型技术的发展趋势,高校、研究院所等科研机构、互联网企业,人工智能企业均不同程度地投入…...
【pytest】编写自动化测试用例命名规范README
API_autoTest 项目介绍 1. pytest命名规范 测试文件: 文件名需要以 test_ 开头或者以 _test.py 结尾。例如,test_login.py、user_management_test.py 这样的命名方式,pytest 能够自动识别并将其作为测试文件来执行其中的测试用例。 测试类…...
双亲委派机制介绍
双亲委派机制(Parent Delegation Model)是Java类加载器(Class Loader)的一种机制,用于确保Java应用程序的安全性和稳定性。 在Java中,类加载器负责将类的字节码文件加载到Java虚拟机(JV…...
fps僵尸:8.丧尸死亡
文章目录 思路死亡时关闭碰撞死亡时开启物理模拟 实现胶囊体关闭碰撞网格体开启物理模拟(两个前提)网格体开启物理碰撞网格体绑定物理资产 注解胶囊体关闭碰撞,则整个蓝图关闭碰撞 思路 死亡时关闭碰撞 死亡时开启物理模拟 实现 胶囊体关闭碰撞 网格体开启物理…...
内存泄漏是什么?
内存泄漏 概述: 程序在运行过程中,动态分配的内存未被及时释放,导致这些内存无法再次使用,最终导致系统内存耗尽,影响程序性能,甚至导致程序崩溃 原因: 未释放已分配的内存:在使用…...
Zipkin 和 SkyWalking 区别
Zipkin 和 SkyWalking 都是分布式追踪和监控工具,但它们在架构设计、功能、扩展性以及适用场景上有所不同。下面是它们的主要区别: 1. 架构和设计 Zipkin: Zipkin 是一个轻量级的分布式追踪系统,通常与 Spring Cloud Sleuth 配合…...
hive如何导出csv格式文件
方法一:使用 Hive 自带功能结合脚本处理 步骤 1:使用 hive -e 命令导出数据到文件 可以通过在命令行中使用 hive -e 执行查询语句,并将结果重定向到本地文件,不过默认是不带字段头的。 hive -e "SELECT column1, column2,…...
【Java项目】基于SpringBoot的【休闲娱乐代理售票系统】
【Java项目】基于SpringBoot的【休闲娱乐代理售票系统】 技术简介:系统软件架构选择B/S模式、SpringBoot框架、java技术和MySQL数据库等,总体功能模块运用自顶向下的分层思想。 系统简介:休闲娱乐代理售票系统,在系统首页可以查看…...
MMLU论文简介
评测语言模型的“全能性”:MMLU基准测试解析 加州大学伯克利分校、哥伦比亚大学等机构的研究团队提出一项全新的评测基准——MMLU(Massive Multitask Language Understanding)。这项测试覆盖57个学科,从基础数学到专业法律&#…...
EasyRTC:开启智能硬件与全平台互动新时代
在当今数字化时代,实时音视频互动已成为企业与用户沟通、协作和娱乐的关键技术。无论是在线教育、视频会议、远程医疗还是互动直播,流畅、高效的互动体验都是成功的关键。然而,实现跨平台、低延迟且功能丰富的音视频互动并非易事——直到 Eas…...
【数据分析】2.数据分析业务全流程
业务流程方法论:3阶段6步骤 一、课程核心内容结构 1. 方法论概述 目标:系统性地解决商业中的关键问题框架:分为三个阶段,每个阶段包含两个步骤适用场景:适用于数据分析师、业务经理等需要通过数据分析支持决策的从业…...
禁止WPS强制打开PDF文件
原文网址:禁止WPS强制打开PDF文件_IT利刃出鞘的博客-CSDN博客 简介 本文介绍如何避免WPS强制打开PDF文件。 方法 1.删除注册表里.pdf的WPS绑定 WinR,输入:regedit,回车。找到:HKEY_CLASSES_ROOT\.pdf删除KWPS.PDF…...
