当前位置: 首页 > news >正文

论文阅读》学习了解自己:一个粗略到精细的个性化对话生成的人物感知训练框架 AAAI 2023

《论文阅读》学习了解自己:一个粗略到精细的个性化对话生成的人物感知训练框架 AAAI 2023

前言

亲身阅读感受分享,细节画图解释,再也不用担心看不懂论文啦~
无抄袭,无复制,纯手工敲击键盘~

今天为大家带来的是《Learning to Know Myself: A Coarse-to-Fine Persona-Aware Training Framework for Personalized Dialogue Generation》

在这里插入图片描述


出版:AAAI

时间:2023

类型:个性化对话生成

特点:粗粒度;细粒度;个性化;多样性;回复生成

作者:Yunpeng Li

第一作者机构:Institute of Information Engineering, Chinese Academy of Sciences, Beijing, China

简介

目前存在的问题是对话中个性化信息的稀疏性,仅利用MLE(Maximum Likelihood Estimation)会导致模型生成的回复与给定的个性化信息不相关或不一致,为了解决这一问题,本文提出两阶段个性化感知的训练框架来提升个性一致性

粗粒度阶段:构建个性化问答对,通过训练模型回答个性化感知的问题,使得模型对于个性化信息高度敏感

细粒度阶段:通过对比学习显式挖掘一致性回复和生成不一致性回复之间的差别,迫使模型更加关注关键的个性化信息

研究现状

目前对于融入个性化信息的方法有:

1)使用隐变量

2)大预训练语言模型

但是这些方法是通过 MLE 损失计算的,这样通常容易生成最高频词,导致生成个性化不一致或不相关的回复

从上图,作者总结到,目前融入个性化信息主要存在的问题:

一方面,回复中包含的个性化信息太少,导致模型认为这些信息是噪声

另一方面,模型对于个性化信息中关键信息缺乏关注,导致生成个性化话相关但不一致的回复,如上述 response 2

此外,作者认为最主要是因为模型无法始终保持一致性,而这和自我意识有关

a self-conscious human should have the capacity to avoid misidentifcation, which means he can not only pick himself out but also avoid taking another person to be him.

中心思想是从粗略地了解自我学习到精细地避免误识别,提高回复的一致性

任务定义

模型架构

Learning to know myself

这部分算是自问自答吧,首先需要构造一个具有个性感知问答对

通过 DNLI 数据集提供的 P P P,构建三元组( e 1 , r , e r e_1, r, e_r e1,r,er),其中 r r r r 1 _ r 2 r_1\_r_2 r1_r2 的形式, r 1 r_1 r1 是动词, r 2 r_2 r2 是名词

这样的话就可以根据三元组构建问题,模板为 “What r 2 r_2 r2 do e 1 e_1 e1 r 1 r_1 r1 ?"

三元组:[I, like sports,basketball]
问题:What sports do you like?

在生成时,由于没有个性化信息,所以需要通过用 Roberta_large 在 DNLI 数据集上微调通过输入个性化信息,得到关系,然后对于实体信息,则需要抓取输入的关键词

上述为实验的先决条件,在获取数据集之后,我们得到了 query-response(个性化信息) 对,通过输入 query 生成 response 来训练模型的自我意识

Learning to avoid Misidentification

对比学习最关键的部分就在于构造负样本对,我们直接来学习一下这个部分

为了找到回复中最关键的个性化信息,比较个性化信息与 gold response 和去掉每一个词在回复中的蕴含得分,差值为该词的个性化得分
C k ( y i ) = p ( E ∣ [ P j ; Y ] ; ϕ ) − p ( E ∣ [ P j ; Y / i ] ; ϕ ) C_k(y_i) = p(E|[P_j ; Y ]; ϕ) − p(E|[P_j ; Y_{/i}]; ϕ) Ck(yi)=p(E[Pj;Y];ϕ)p(E[Pj;Y/i];ϕ)
然后找到前 K 个最高的个性化得分,用 [ M A S K ] [MASK] [MASK] 遮盖,送入 MLM 模型(不需要微调)中生成 [ M A S K ] [MASK] [MASK] 被掩盖的词,如果生成的词就是原来的词,则使用第二可能的词,这样就构造了 K 个不同的负样本 { Y i − } i = 1 K \{Y^-_i\}_{i=1}^K {Yi}i=1K

损失函数

实验结果

消融实验

在这里插入图片描述

相关文章:

论文阅读》学习了解自己:一个粗略到精细的个性化对话生成的人物感知训练框架 AAAI 2023

《论文阅读》学习了解自己:一个粗略到精细的个性化对话生成的人物感知训练框架 AAAI 2023 前言 简介研究现状任务定义模型架构Learning to know myselfLearning to avoid Misidentification损失函数实验结果消融实验 前言 亲身阅读感受分享,细节画图解释…...

[Java EE] 网络编程与通信原理(三):网络编程Socket套接字(TCP协议)

🌸个人主页:https://blog.csdn.net/2301_80050796?spm1000.2115.3001.5343 🏵️热门专栏:🍕 Collection与数据结构 (92平均质量分)https://blog.csdn.net/2301_80050796/category_12621348.html?spm1001.2014.3001.5482 🧀Java …...

MyBatis懒加载数据(大批量数据处理)

使用范例 Cursor约定使用Iterator去懒加载数据,以时间换空间,非常适合处理通常无法容纳在内存中的数百万个项目查询。如果在 resultMap 中使用集合,则必须使用 resultMap 的 id 列对游标 SQL 查询进行排序(resultOrdered“true”)。 //为了避…...

MySQL--联合索引应用细节应用规范

目录 一、索引覆盖 1.完全覆盖 2.部分覆盖 3.不覆盖索引-where条件不包含联合索引的最左则不覆盖 二、MySQL8.0在索引中的新特性 1.不可见索引 2.倒序索引 三、索引自优化--索引的索引 四、Change Buffer 五、优化器算法 1.查询优化器算法 2.设置算法 3.索引下推 …...

【spring boot+Lazy ORM+mysql】开发一个数据库管理系统实现对应数据库数据查看和修改

【spring bootLazy ORMmysql】开发一个数据库管理系统实现对应数据库数据查看和修改 演示项目地址:http://124.222.48.62:30193/wu-smart-acw-ui/index.html#/login (admin/admin) 功能 用户登录注册新增、编辑数实例新增、编辑数据库信息…...

知识分享:隔多久查询一次网贷大数据信用报告比较好?

随着互联网金融的快速发展,越来越多的人开始接触和使用网络贷款。而在这个过程中,网贷大数据信用报告成为了评估借款人信用状况的重要依据。那么,隔多久查询一次网贷大数据信用报告比较好呢?接下来随小易大数据平台小编去看看吧。 首先&…...

【Day8:JAVA字符串的学习】

目录 1、常用API2、String类2.1 String类的特点2.2 String类的常见构造方法2.3 String类的常见面试题:2.3.1 面试题一:2.3.2 面试题二:2.3.3 面试题三:2.3.4 面试题四: 2.4 String类字符串用于比较的方法2.5 String类字…...

jetcache缓存

1 介绍 是阿里的双极缓存,jvm-->redis-->数据库 文档:jetcache/docs/CN at master alibaba/jetcache GitHub 2 注意事项 使用的实体类一定实现序列化接口定时刷新注解,慎用 它会为每一个key创建一个定时器 :场景为&…...

SQLSyntaxErrorException: FUNCTION dbname.to_timestamp does not exist

由于MySQL数据库高版本(如8.x)中有to_timestamp()函数,低版本中(如5.7.x)没有这个函数,服务运行报错。 自己创建函数实现功能,创建语句如下; DELIMITER // CREATE FUN…...

Borel-Cantelli 引理

翻译自大佬 https://huarui1998.com/Notes/math/borel-cantelli.html 1. 集序列的 lim ⁡ inf ⁡ \lim\inf liminf 和 lim ⁡ sup ⁡ \lim\sup limsup 类似于定义实数序列 { a k } \{a_k\} {ak​} 的 lim ⁡ inf ⁡ \lim\inf liminf 和 lim ⁡ sup ⁡ \lim\sup limsup, …...

算法训练营第四十一天 | LeetCode 509 斐波那契数列、LeetCode 70 爬楼梯、LeetCode 746 使用最小花费爬楼梯

LeetCode 509 斐波那契数列 这题动规五部曲都定义得比较明确。首先是dp数组下标,题目中给定F(0) 0说明从0开始,dp[i]直接表示F(i)的值即可。递推公式也直接给出了,也给了开头两个作为递推基础的数值作为初始化依据。遍历顺序也指明是从前往…...

网络其他重要协议(DNS、ICMP、NAT)

1.DNS DNS是一整套从域名映射到IP的系统 1.1 DNS背景 TCP/IP中使用IP地址和端口号来确定网络上的一台主机的一个程序,但是IP地址不方便记忆,例如我们想访问百度就会在浏览器中输入baidu.com而不是百度的IP地址。于是人们发明了一种叫主机名的东西, 是…...

利用PyCSP3库(含大量全局约束)进行组合约束建模

文章目录 1. 什么是 PyCSP3 ?2. 安装方法(Windows)2.1 通过 Google_colab 直接运行2.2 通过 pip 进行安装3. 快速入门3.1 声明变量3.2 更新约束3.3 定义目标3.4 常用的全局约束1. 什么是 PyCSP3 ? PyCSP3 是 Python 中的一个库,用于对组合约束问题进行建模,包括 约束满足…...

解决updateByExample时属性值异常的问题(部分属性值没有使用占位符?进行占位,而是变成了属性的名称)

目录 场景简介代码片断实体类 报错信息排查原因解决测试过程解决方案 场景简介 1、程序将mybatis框架升级为3.5.9版本后执行updateByExample方法时报错 代码片断 Condition condition new Condition(MbCcsSessionConfig.class); condition.createCriteria().andEqualTo(&quo…...

[C++][algorithm][Eigen] 基于Eigen实现Softmax函数

1 简介 Softmax函数是机器学习和深度学习中一个非常重要的激活函数,它在多分类问题中尤其关键。Softmax函数能够将一个向量或一组实数转换成概率分布,使得每个元素的值都在0到1之间,并且所有元素的和为1。本博客文章《【Eigen】基于Eigen实现…...

一招教大家,如何移除受保护的excel工作表的编辑权限限制?

有时候,我们打开工作表发现只有部分单元格可以编辑,点击其他单元格都显示“您试图更改的单元格或图标受保护”,既没法正常编辑或下拉填充,也没有办法快捷筛选。这时候我们可以通过输入密码解除保护,就可以正常编辑了。…...

Python 全栈体系【四阶】(五十三)

第五章 深度学习 十二、光学字符识别(OCR) 2. 文字检测技术 2.3 DB(2020) DB全称是Differentiable Binarization(可微分二值化),是近年提出的利用图像分割方法进行文字检测的模型。前文所提…...

民国漫画杂志《时代漫画》第27期.PDF

时代漫画27.PDF: https://url03.ctfile.com/f/1779803-1248635258-b6a842?p9586 (访问密码: 9586) 《时代漫画》的杂志在1934年诞生了,截止1937年6月战争来临被迫停刊共发行了39期。 ps: 资源来源网络!...

图论(四)—最短路问题(Dijkstra)

一、最短路 概念:从某个点 A 到另一个点B的最短距离(或路径)。从点 A 到 B 可能有多条路线,多种距离,求其中最短的距离和相应路径。 最短路径分类: 单源最短路:图中的一个点到其余各点的最短路径…...

用友NC linkVoucher SQL注入漏洞复现

0x01 产品简介 用友NC是由用友公司开发的一套面向大型企业和集团型企业的管理软件产品系列。这一系列产品基于全球最新的互联网技术、云计算技术和移动应用技术,旨在帮助企业创新管理模式、引领商业变革。 0x02 漏洞概述 用友NC /portal/pt/yercommon/linkVoucher 接口存在…...

戴森球计划蓝图架构范式:从模块化设计到星际规模工程的技术演进

戴森球计划蓝图架构范式:从模块化设计到星际规模工程的技术演进 【免费下载链接】FactoryBluePrints 游戏戴森球计划的**工厂**蓝图仓库 项目地址: https://gitcode.com/GitHub_Trending/fa/FactoryBluePrints 在戴森球计划的工厂建设中,蓝图设计…...

别让‘单电源供电’坑了你:运放参考电压旁路电容的选型与避坑全攻略

别让‘单电源供电’坑了你:运放参考电压旁路电容的选型与避坑全攻略 在单电源供电的运算放大器电路中,参考电压的稳定性往往决定了整个系统的性能。许多工程师习惯性地在Vcc/2分压点添加旁路电容,却不知这个看似合理的操作可能引发灾难性振荡…...

Splunk紧急推送安全补丁:三枚高危漏洞同时曝光,企业数据面临泄露与瘫痪双重风险

2026年5月20日,Splunk官方安全团队一次性披露了旗下多款核心产品的重大安全隐患。此次波及范围相当广泛,从本地部署的Splunk Enterprise到云端服务Splunk Cloud Platform,再到新推出的Splunk AI Toolkit,无一幸免。三枚漏洞编号分…...

NoFences:Windows桌面整理终极指南,5分钟打造高效工作空间

NoFences:Windows桌面整理终极指南,5分钟打造高效工作空间 【免费下载链接】NoFences 🚧 Open Source Stardock Fences alternative 项目地址: https://gitcode.com/gh_mirrors/no/NoFences 你是否每天都要在混乱的Windows桌面上花费大…...

从0到千万级调用量:物流调度Agent性能压测极限突破路径(QPS 2400→8900全过程监控数据集首次披露)

更多请点击: https://intelliparadigm.com 第一章:从0到千万级调用量:物流调度Agent性能压测极限突破路径(QPS 2400→8900全过程监控数据集首次披露) 面对日均超1200万单的跨城干线同城即时配送混合调度请求&#xff…...

天学网英语听力对孩子有用吗?2026最新真实测评结果告诉你

做了5年英语听力领域的技术研究,最近后台好多家长问我这类AI听力训练产品对孩子提分有没有用,刚好我们团队刚做完2026年的公立校落地测评,今天就客观给大家拆解清楚。先聊聊英语听力训练的行业共性痛点我们团队在实践中发现,现在国…...

7个革命性策略:戴森球计划工厂蓝图全生命周期管理指南

7个革命性策略:戴森球计划工厂蓝图全生命周期管理指南 【免费下载链接】FactoryBluePrints 游戏戴森球计划的**工厂**蓝图仓库 项目地址: https://gitcode.com/GitHub_Trending/fa/FactoryBluePrints 想要在戴森球计划中建立高效工厂却总是遭遇物流瓶颈&…...

机房动环监控系统是什么?其主要功能及智能运用方向有哪些?

机房动环监控系统的重要性 为信息技术的稳健运行提供了保障,尤其是在现代社会日益依赖数据和信息的背景下。利用实时监测电力、温度、湿度环境参数发生,还大幅度降低了因停机带来的经济损失。以大榕树科技为例,他们采用先进的监控系统&#x…...

终极指南:如何在3DS上原生运行GBA游戏,告别模拟器卡顿

终极指南:如何在3DS上原生运行GBA游戏,告别模拟器卡顿 【免费下载链接】open_agb_firm open_agb_firm is a bare metal app for running GBA homebrew/games using the 3DS builtin GBA hardware. 项目地址: https://gitcode.com/gh_mirrors/op/open_a…...

为什么公平感比财富本身更影响希望

有些时刻,普通人最难受的不是自己暂时没钱。而是你发现,自己已经很努力地排队、提交材料、遵守规则、等待结果,可最后还是不知道机会到底怎么分配。 孩子上学,要反复比较资源差异。 老人看病,要担心排队、费用和后续照…...