当前位置: 首页 > news >正文

如何让人机对话更自然?

来源:投稿 作者:顾相欢
编辑:学姐

AAAI-2022|定制对话的人设和知识背景

原文标题:

Call for Customized Conversation: Customized Conversation Grounding Persona and Knowledge

原文链接:

https://arxiv.org/abs/2112.08619

一、Introduction

人类在对话时,考虑到的除了知识信息,还与人设信息有关。比如你向一个素食主义者推荐餐厅的时候,总归不会说哪家炸鸡店好吃。根据这一点,在人机对话中结合先验知识和人设信息是非常重要的。

(下图第二种回答是不是比第一种更自然?)

二、FoCus Dataset

在本项目中,作者构建了一个新的数据集,叫做FoCus。

将对话的情景设定为谈论一些地标,与其相关的知识有地标的历史、艺术设计、建筑结构、作用、旅游业和地质信息。会话代理就要根据人设来告知用户不同方面的地标信息。

1、Dataset Creation

地标信息来自于维基百科上5316个页面,每个页面内容超过8000字,涵盖了历史、旅游、建筑等多方面信息。同时,数据集中还包含27170个有关于人设的语句,这些语句中含有地标的关键词。

在创建人设时,我们先用五个句子描述角色的背景。随后在给定的维基百科页面上提取关键字,结合关键字创作角色语句。

在创建对话集时,标注者以人机交替角色的形式进行多轮对话,回答时要标记他们用了有关于人设或是知识的句子。而且我们发现,来自单人建立的数据质量更高,因为提出问题的人比其他人更清楚自己要得到怎样的回答。

2、Dataset Analysis

机器说的语句(141.13)比人类说的语句 (40.94)要长的多,因为它用到了很多专业知识。

机器语句可以被分为三类:告知、确认、建议。“告知”只有知识信息,没有人设信息。“确认”复述了用户的偏好并表达赞同。“建议”提出了用户可能喜欢的额外信息。

三、Model

本对话模型由检索模块和对话模块构成,检索模块根据问题寻找相应的知识信息,对话模块根据知识信息、人设信息和过去的对话生成回复。

检索模块计算问题与可能的知识信息之间的TF-IDF分数,将范围缩小到维基百科的五个段落之间。

对话模块由上下文相关、人设预测、知识信息预测和语言建模组成。它先生成当前对话轮次的上下文相关表示,然后模型在给定上下文相关表示的情况下学习使用哪个人设语句和知识信息。

四、Experiments

使用到的Baseline语言模型有:transfromer decoder、transfromer encoder-decoder、GPT-2\BART。

自动评估指标:ppl、BLUE、ROUGE-1-F、ROUGE-2-F,准确率Acc

人工评估指标:

五、Conclusion

本文介绍的数据集能够结合人设信息和维基百科页面中的知识信息,它的表达更自然也更难被机器模仿。FoCus数据集可以帮助构建更多更像人类的智能体,使用该数据集训练的模型可以在未来使对话代理更有吸引力,同时有更渊博的知识。

关注下方《学姐带你玩AI》🚀🚀🚀

带你了解更多人工智能前沿资讯

论文解读视频代码数据集回复“500”免费领

码字不易,欢迎大家点赞评论收藏!

相关文章:

如何让人机对话更自然?

来源:投稿 作者:顾相欢 编辑:学姐 AAAI-2022|定制对话的人设和知识背景 原文标题: Call for Customized Conversation: Customized Conversation Grounding Persona and Knowledge 原文链接: https://arxiv.org/ab…...

Python每日一练(20230224)

目录 1. 列表奇偶拆分 ★ 2. 二叉树的后序遍历 ★★ 3. 接雨水 ★★★ 附录 二叉树 特点 性质 特殊二叉树 满二叉树 完全二叉树 完全二叉树性质 二叉树的遍历 1. 列表奇偶拆分 【问题描述】 输入一个列表,包含若干个整数(允许为空&#xff…...

【Linux】-- Shell的运行原理、Linux当中的权限

目录 Shell的运行原理 Linux权限的概念 su命令 权限 文件访问权限的相关设置方法 chmod指令 chown指令 chgrp指令 sudo命令 文件的常见问题 umask 粘滞位 关于权限的总结 Shell的运行原理 Shell运行原理 —— 外壳程序。 Linux严格意义上说的是一个操作系统&…...

MOS管选型参数:VGS(th)

MOS管选型参数:VGS(th) VGS(th):开启电压(阀值电压)。当外加栅极控制电压 VGS 超过 VGS(th) 时,漏区和源区的表面反型层形成了连接的沟道。应用中,常将漏极短…...

二.线性表之顺序表

文章目录前言一.顺序表的概念及结构二.顺序表的接口实现1.顺序表的动态存储2.顺序表的初始化3.顺序表尾插#封装:扩容函数4.顺序表尾删5.顺序表头插6.顺序表头删7.顺序表查找8.顺序表在pos位置插入x9.顺序表删除pos位置的值10.顺序表销毁11.顺序表打印三.源1.Seqlist…...

ElasticSearch - SpringBoot整合ElasticSearch实现文档的增删改

文章目录1. ElasticSearch和kibana的安装和配置2. SpringBoot 项目环境搭建3. 创建索引4. 索引文档5. 更新文档6. 删除文档https://www.elastic.co/guide/en/elasticsearch/reference/current/search-your-data.htmlhttps://www.elastic.co/guide/cn/elasticsearch/guide/curre…...

JavaScript 库

文章目录JavaScript 库JavaScript 框架(库)jQueryPrototypeMooTools其他框架CDN -内容分发网络引用 jQuery使用框架JavaScript 库 JavaScript 库 - jQuery、Prototype、MooTools。 JavaScript 框架(库) JavaScript 高级程序设计…...

云解析DNS为什么要配置默认线路?

传统解析技术不会判断访客IP,而是会随机选择一个IP返回给访问者,这样就有可能造成移动用户访问电信服务器IP,北京用户访问深圳服务器IP这种跨域跨网访问的情况,产生非常大的延迟,带来很不好的访问体验。 而云解析DNS会…...

Linux命令之awk

awk是一个有强大的文本格式化能力的linux命令,早期是在Unix上实现的,linux后来也可以使用了,我们在Linux上使用的awk是gawk(GNU awk的意思) 语法 awk [option] 模式{动作} file option表示awk的可选参数,可…...

实战-缓存数据一致+binlog初始+cannel监听+数据迁移,数据一致性架构设计

前言 一. 解决缓存不命中(高并发操作击穿打挂DB的风险) 当并发量打的时候,当我们的缓存过期时,就算到数据库的比例偏小的时候,我们的请求时比较大的。那也会存在数据库崩掉的情况。解决方案想法如下(总体…...

nginx配置中proxy_pass反向代理502的bug

记录一个坑人的bug, 我今天在一台新的liunx上运行nginx来进行反向代理时候,发现怎么测都是502 我把配置全部删了从头开始配置,发现80端口正常,80端口index.html正常,反向代理转向http://127.0.0.1/也正常,…...

JavaScript 两种方案打开文件对话框

JavaScript 两种方案打开文件对话框 文章目录JavaScript 两种方案打开文件对话框一、文件对话框二、传统方案表单元素🌈三、文件系统访问API💦四、更进一步使用六、代码仓库🌐七、参考资料💘七、推荐博文🍗一、文件对话…...

Pycharm远程服务器常见问题

2023年02月23日 问题描述&#xff1a;Pycharm远程服务器跑代码时&#xff0c;不小心把Pycharm关掉了&#xff0c;但服务器代码还在运行&#xff1f; 解决办法&#xff1a;kill进程 先用watch -n 0.5 nvidia_smi查看进程&#xff0c;然后kill -9 <进程> 1、nvidia-smi…...

内容团队如何快速出稿

对于内容团队而言&#xff0c;每个内容选题就相当于一个小项目&#xff0c;它们并非简单的线性工作流&#xff0c;相反其复杂程度不亚于一个小型工厂。一个内容选题会涉及内容形式&#xff0c;选题类型等多个变量&#xff0c;这些变量因素组合起来就是十几种不同类型的工作流。…...

es-08索引的批量操作

索引的批量操作 批量查询和批量增删改 批量查询 GET /_mget#批量查询 GET product/_search GET /_mget {"docs": [{"_index": "product","_id": 2},{"_index": "product","_id": 3}] }GET product/_mge…...

诈金花的概率

游戏使用一副除去大小王的扑克牌&#xff0c;共4个花色52张牌。 1、豹子&#xff08;AAA最大&#xff0c;222最小&#xff09;。2、同花顺&#xff08;AKQ最大&#xff0c;A23最小&#xff09;。3、同花&#xff08;AKQ最大&#xff0c;352最小&#xff09;。4、顺子&#xff…...

ESP32设备驱动-MLX90393磁场传感器驱动

MLX90393磁场传感器驱动 文章目录 MLX90393磁场传感器驱动1、MLX90393介绍2、硬件准备3、软件准备4、驱动实现1、MLX90393介绍 MLX90393 磁场传感器可以在运行时重新编程为不同的模式和不同的设置。 该传感器使用 Melexis 专有的 Triaxis 技术提供与沿 XYZ 轴感应的磁通密度成…...

Java面试题-Spring框架

Spring框架 1. BeanFactory和ApplicationContext有何区别 BeanFactory是Spring最底层的接口&#xff0c;是IoC的核心&#xff0c;定义IoC的基本功能。 ​ BeanFactory具有&#xff1a;延迟实例化的特性。在启动的时候&#xff0c;不会实例化Bean&#xff0c;只有有需要从容器…...

【计算机物理模拟】-力矩、转动惯量和角速度之间的关系

力矩和角速度之间的关系可以通过牛顿第二定律和角动量定理来描述。 牛顿第二定律表明&#xff0c;物体的加速度与作用在物体上的合力成正比&#xff0c;加速度的方向与合力的方向相同。而对于旋转运动的物体&#xff0c;其加速度可以表示为半径 rrr 乘以角加速度 α\alphaα&a…...

async和await用法理解和快速上手 , 同步任务和异步任务顺序安排和轻松理解 , js代码执行顺序表面知道

学习关键语句 : async , await 用法 await 怎么使用 同步任务和异步任务 微任务和宏任务 js中代码执行顺序 写在前面 虽然说 async 和 await 是 Promise 的语法糖 , 但是用惯了Promise 的人(我) , 还真不能超快速使用上这个语法糖 , 所以赶紧写一篇文章出来让各位了解了解这个…...

Windows11下Detectron2安装避坑指南:从CUDA版本匹配到源码修改(附常见错误解决方案)

Windows 11下Detectron2深度安装指南&#xff1a;从环境配置到源码级问题解决 在计算机视觉领域&#xff0c;Detectron2作为Facebook Research推出的开源框架&#xff0c;凭借其模块化设计和出色的性能表现&#xff0c;已成为目标检测、实例分割等任务的首选工具之一。然而&…...

用Python复现电池寿命预测论文:从数据清洗到模型调优的完整实战(附代码)

用Python实战电池寿命预测&#xff1a;从特征工程到模型优化的全流程解析在新能源与储能技术快速发展的今天&#xff0c;锂离子电池的健康状态&#xff08;SOH&#xff09;预测已成为工业界和学术界共同关注的核心课题。不同于传统实验室环境下耗时数月的电池老化测试&#xff…...

Bittensor:去中心化AI网络的架构、挑战与激励模型优化

1. 项目概述&#xff1a;当AI遇上去中心化&#xff0c;Bittensor在解决什么核心问题&#xff1f;最近几年&#xff0c;AI模型的能力突飞猛进&#xff0c;但一个越来越明显的趋势是&#xff0c;顶尖的AI能力正快速向少数几家科技巨头集中。无论是训练所需的算力、高质量的数据集…...

实战指南:用Python和PyTorch一步步搭建TFT模型,搞定电力负荷多步预测

实战指南&#xff1a;用Python和PyTorch一步步搭建TFT模型&#xff0c;搞定电力负荷多步预测 电力负荷预测是能源管理系统的核心环节&#xff0c;准确的多步预测能帮助电网运营商优化发电计划、降低运营成本。传统统计方法如ARIMA在处理复杂非线性关系时表现有限&#xff0c;而…...

AI赋能工程教育:构建个性化、多元化与伦理驱动的学习生态

1. 项目概述&#xff1a;当工程教育遇见AI&#xff0c;我们到底在谈论什么&#xff1f;最近几年&#xff0c;AI这个词快被说烂了。从ChatGPT的横空出世&#xff0c;到各类生成式AI工具的遍地开花&#xff0c;似乎每个行业都在讨论如何“被赋能”。工程教育这个领域也不例外&…...

EasyMLServe:一键部署机器学习模型,自动生成REST API与GUI界面

1. 项目概述与核心痛点做机器学习项目&#xff0c;尤其是搞科研的同行们&#xff0c;肯定都经历过这个阶段&#xff1a;模型在Jupyter Notebook里跑得挺好&#xff0c;准确率也达标了&#xff0c;论文也发了&#xff0c;但接下来呢&#xff1f;怎么让隔壁生物实验室的同事、或者…...

别再死记硬背了!用Python实战案例帮你彻底搞懂假设检验(附代码与避坑指南)

用Python实战拆解假设检验&#xff1a;从数据模拟到结果解读的避坑指南假设检验是数据分析师和机器学习工程师工具箱中最常用的统计工具之一&#xff0c;但很多人在学习过程中都会被各种检验方法、P值解读和原假设设定绕得晕头转向。本文将通过Python代码实战&#xff0c;带你用…...

GParted实战:从虚拟机沙盒到实体机,安全演练Linux分区合并与扩容全流程

GParted实战&#xff1a;从虚拟机沙盒到实体机&#xff0c;安全演练Linux分区合并与扩容全流程在虚拟机的安全环境中练习Linux分区操作&#xff0c;就像飞行员在模拟器中训练紧急情况处理一样重要。GParted作为Linux系统管理员的"瑞士军刀"&#xff0c;其强大功能背后…...

ArcGIS Pro 3.7 重磅升级!这四大模块更新,让GIS效率翻倍

ArcGIS Pro 3.7 正式发布&#xff0c;这次不仅性能大幅提升&#xff0c;还带来了 GeoAI 工具集、实时等高线、本地知识图谱等一系列“黑科技”。无论你是制图师、空间分析师还是开发者。 01 性能与生产力&#xff1a;更快、更顺、更好找 新增「分析地图」窗格 可量化评估地图的…...

别再到处找驱动了!手把手教你为ESXi 7.0 U3集成Broadcom阵列卡驱动(保姆级图文)

深度实战&#xff1a;为ESXi 7.0 U3定制集成Broadcom阵列卡驱动的完整指南虚拟化平台部署中最令人头疼的瞬间&#xff0c;莫过于当你精心准备的ESXi安装镜像在服务器上启动后&#xff0c;屏幕上赫然出现"No network adapter found"或"Storage controller not de…...