Textfocals ——基于大言模型的用户驱动型文本改进工具让用户在审阅自己的写作时对其进行修改
概述
论文地址:https://arxiv.org/abs/2403.01055
大规模语言模型可以生成媲美专业作家撰写的文本。目前使用的对话技术主要有两种:一种是交互式(如 OpenAI 的 ChatGPT 和 Google 的 Gemini),另一种是预测性文本补全(如 GitHub Copilot)。这些技术在许多任务中表现出色。然而,另一方面,在写作中,它们将部分或全部的创造性决策留给了系统。
例如,OpenAI 的 ChatGPT 允许用户根据目的指定所需的输出,如 “我希望你写一个简短的便条来介绍自己”,但这样的系统会削弱用户的创造力和原创性,影响他们自己的想法和表达据说是可能的。
Textfocals 是一个用户界面原型,其设计原则是:用户生成内容,大规模语言模型通过以下方式修改用户的写作内容Textfocals 是一个用户界面原型,其设计原则是:用户生成内容,大规模语言模型通过以下方式修改用户的写作:"限制用户修改其写作。相反,通过大规模语言模型生成的摘要、问题和写作建议(以下简称大规模语言模型视图),用户可以获得改进和完善建议,并鼓励他们考虑修改。
Textfocals 提供了两个考虑到可用性的用户界面功能:一个是通过将视图调整到作者当前修改的位置来简化修改过程。另一个是提供选择或修改预先设计的提示的功能,因为作者很难创建合适的提示,这样就能更方便地使用大规模语言模型的功能,以满足当前的修订需求。
以往的研究已经对用户界面进行了调查,这些用户界面在文本编辑器的交互式侧边栏中显示由大规模语言模型生成的摘要,或者支持基于模板的提示工程,以改进用户定义的反馈。然而,Textfocals是首个研究用户界面功能的原型,旨在鼓励用户主动进行修改�
一项由四名参与者参与的形成性评估对大规模语言模型摘要、问题和建议视图在支持写作修改方面的有效性进行了定性评估。结果表明,大规模语言模型视图有助于用户完善所考虑的观点,提高写作效率。
这项研究在展示大规模语言模型如何支持写作的创造性和原创性方面迈出了重要一步。
设计和实施
在写作中,回顾自己的写作并发现新事物至关重要。然而,虽然具有大规模语言模型的写作工具,如 OpenAI 的 ChatGPT 或谷歌的 Gemini,可以生成与专业作家不相上下的句子,但对于用户来说,要想出正确的问题(提示工程)可能会很困难,而且负担很重。此外,在将生成的回复纳入文本时,有必要确保版权和原创性。
Textfocals 提供两种功能来解决这些问题。
- 可定制的预编程提示菜单:让大型语言模型 "观察 "而不是生成文本的提示
- 卡片式侧边栏:允许用户与大规模语言模型的响应(视图)进行交互的界面
下图显示了 Textfocals 的总体交互流程。Textfocals原型是作为 Microsoft Word 的任务窗格插件开发的。使用 React 和 Microsoft JavaScript API,文档它可以检索段落文本,并通过提示将其发送到后端(Python FastAPI 服务器)。后端查询 OpenAI API GPT-3.5,并将输出流传输到前端,前端对其进行解析(例如 Markdown 渲染)并显示生成的视图。
下图是Textfocals原型的用户界面图片;Textfocals 有一个按钮用于选择预定义的提示,该提示要求用户从大规模语言模型中观察文本。提示按钮提供了一个功能简介和一个提示编辑器,用户可以在这里查看和编辑内容。这种方法旨在鼓励用户修改提示内容,协助写作过程。
有用的视图类别包括
- 概要视图
- 论点陈述:"写一句似乎是本段论点的话,然后简要重复。
- 重要概念:"列出段落的重要概念,并以 Markdown 格式显示三个最相关的概念。
- 问题查看
- 作者试图回答的问题:"列出作者在本段中试图回答的问题。
- 读者可能提出的问题:“作为读者,你要向作者提出有关定义和逻辑联系的问题”。
- 建议意见
- 建议:"就如何改进该段提供列表式建议。
此外,还实现了一个可滚动的侧边栏,以便与生成的视图进行交互。这是用户写作与大型语言模型视图之间的中间界面。对话过程开始时,大型语言模型中会填充第一段内容和 "论文陈述 "提示。随后,当选择特定文本部分时,包含该部分的段落将作为输入传递给大规模语言模型。大规模语言模型还会生成前后段落的视图,允许用户在附近段落的上下文中浏览视图并与之交互。此外,将鼠标悬停在卡片上还能突出显示相关段落,方便用户浏览文档。通过这种方式,Textfocals 为用户提供了审查和改进自己写作的工具。
研究成果–大规模语言模型视图如何帮助作者
目前正在对四名大学教职员工和教授进行全面形式评估,以了解大规模语言模型的生成视图如何影响用户的写作。每位参与者都在撰写通讯、拨款申请、议论文或博客文章,并带来了自己的写作草稿(约一页)。参与者在与 Textfocals 和聊天机器人界面互动的同时口述自己的想法。
Textfocals 包括对每个段落的 "论点陈述 "和 "重要概念 "进行总结的提示,这不仅有助于重新组织文档,还有助于识别新的观点。例如,当一位参与者(P4)要求为一个短小的段落列出重要概念时,系统识别出了"标记创作者 "这一概念,并将其作为一个有待进一步发展的想法突出显示出来。由此可见,摘要视图有助于用户深入研究某些领域。
摘要观点还有助于比较读者是如何理解文章的,并找出与预期信息的差异。学员将摘要视图视为外部读者所写,了解读者是如何理解文章的。例如,一位学员(P4)评论说,“这种观点有助于我理解读者是如何理解这篇写作的”。由此可见,摘要视图有助于修改所要传达的信息,使其表达清晰。
Textfocals 还包括一个问题视图,对学员的写作提出拟人化的问题,这也有助于学员从读者的角度审视自己的写作。例如,其中一位参与者(P3)表示,如果她当前的写作没有充分回答提问视图中的问题,她会对其进行修改。由此可见,提问式观点也有助于使用者写出适合读者的文章。
此外,虽然与会者普遍认为关于表面和实质改进的建议意见很有用,但许多人要求看 到如何具体实施这些改进的例子。例如,一位学员(P4)在阅读了关于 "重新组织段落,使其逻辑流畅 "的建议意见后说,这让他开始思考 "我怎样才能更有逻辑性?'"这种对真实例子的要求有时会引发意想不到的对话。另外,例如,一位学员(P2)向 Textfocals 询问 "如何打散段落使其更具可读性 "的具体建议。
因此,要修改系统的清晰度和其他建议,就需要在系统响应中加入具体的例子。互动界面是提供这些具体例子的一种自然方式。例如,一位参与者(P3)试图通过将人工智能视图中的文本多次复制并粘贴到聊天机器人界面中来获取具体例子。
这项研究的初步结果表明,大规模语言模型的生成视图有助于发现写作中发展不足的想法,根据读者的需要调整写作,并做出明确而具体的改进。在保持思想和构思的同时改进写作的潜在有效工具。
研究结果–设计问题和有待改进之处
在系统如何呈现视图和允许用户互动方面,确定了一些设计挑战和需要改进的地方。
如果系统提供的反馈意见需要占用大量空间,并且适用于用户文档的不同部分,那么设计者就需要考虑如何将反馈意见与文档之间的关系可视化,以及反馈意见应该显示在哪些区域。在研究中,参与者要求查看文档的不同部分,但并不是所有的反馈都同时显示在屏幕上。
原型突出显示了文件中与每个视图相关的部分,并将其可视化,但我们发现,参与者往往难以理解,因为突出显示的部分与视图没有直接联系,而在其他情况下,突出显示的部分往往显示出相关性。
例如,P1 将悬停在文本上时的黄色高亮错误地理解为表示出错,并评论说他不知道这表示的是好还是坏。同样,P3 将黄色高亮显示的卡片误解为最相关的视图,并评论说 “我认为标为黄色的是相关性最高的”。其他与会者也认为这一功能令人困惑和不直观。因此,在标明侧边栏与文件的哪一部分相关时,最好使用不带颜色、不表示任何附加含义的微妙轮廓。
我们还发现,在使用侧边栏时,一些参与者认为作为大规模语言模型输入(范围)的文本范围不明确。例如,P1 说她不知道原型是在查看整个文档,还是只查看选定的部分。同样,P2 也说原型是在看整个文档还是只看选定的段落。这表明,清晰显示大规模语言模型用于生成视图的文本范围的视觉提示将是有用的。
此外,与会者还使用了各种预定义的提示来表达他们的观点,这表明各种提示都很有用。一些与会者根据自己的需要编辑了预设提示或创建了新的提示。例如,一位与会者编辑了 "读者可能会有的问题 "提示,以指定读者类型;另一位与会者重新使用了视图功能,并要求大语言模型改进文本。然而,创建和管理提示对用户来说很困难,虽然像 FeedbackBuffet 这样的填空方法可以解决部分难题,但用户还需要支持来创建新的提示并在以后调用它们。这是一个需要进一步研究的领域。
总结
本文提出的 Textfocals 是一种以人为本的大规模语言模型利用系统,用于支持写作。修改是对所写内容进行批判性审查和评估的过程。这有助于发现需要改进的地方和新的发展机会,并做出适当的修改。通过使用预先生成的提示和大规模语言模型生成的输出,用户可以客观地审查自己的写作,并有新的发现。用户测试表明,参与者认为以这种方式生成的输出结果非常有用。他们还能发现预期信息与读者理解之间的差距,并深入了解如何调整文本以适应读者。这些结果表明有助于改进写作和丰富内容。
它还表明,预定义的提示和提示编辑器能有效地鼓励用户产生外部观点,而不是取代或继续自己的句子。这种用户界面的独创性使用户能够使用大型语言模型来增强自己的思维过程,而不是让大型语言模型取代自己的思维。事实证明,这既能让用户修改自己的文章,又能保持他们作为作者的自主性。
事实证明,本文提出的 "文本聚焦 "是一个有用的工具,用户可以利用它来回顾自己的写作,并有新的发现来丰富写作内容。希望进一步的研究能进一步阐明这一工具的有效性。
相关文章:

Textfocals ——基于大言模型的用户驱动型文本改进工具让用户在审阅自己的写作时对其进行修改
概述 论文地址:https://arxiv.org/abs/2403.01055 大规模语言模型可以生成媲美专业作家撰写的文本。目前使用的对话技术主要有两种:一种是交互式(如 OpenAI 的 ChatGPT 和 Google 的 Gemini),另一种是预测性文本补全&…...

docker 部署 redis
docker 部署 redis 1. 下载 redis 镜像 # docker images | grep redis bitnami/redis 7.2.4-debian-11-r5 45de196aef7e 10 months ago 95.2MB2. docker-compose 部署 version: "3" services:redis:image: bitnami/redis:7.2.4-debian-11-…...

微信小程序横屏页面跳转后,自定义navbar样式跑了?
文章目录 问题原因:解决方案: 今天刚遇到的问题,横屏的页面完成操作后跳转页面后,自定义的tabbar样式乱了,跑到最顶了,真机调试后发现navbar跑到手机状态栏了,它正常应该跟右边胶囊一行。 知道问…...

回归预测 | MATLAB实现BiGRU(双向门控循环单元)多输入单输出
回归预测 | MATLAB实现BiGRU(双向门控循环单元)多输入单输出 文章目录 回归预测 | MATLAB实现BiGRU(双向门控循环单元)多输入单输出预测效果基本介绍程序设计参考资料致谢预测效果 基本介绍 BiGRU(双向门控循环单元)多输入单输出模型是一种结合了双向门控循环单元(BiGRU)的…...
智能时代的基石:神经网络
智能时代的基石:神经网络 第一节:神经网络简介 课程目标 本节课程旨在全面介绍神经网络的基本概念、结构以及其在历史发展中的重要里程碑。通过深入理解神经网络的工作原理和演变过程,学员将能够掌握神经网络在现实世界中的多种应用&#…...
红与黑,,
有一间长方形的房子,地上铺了红色、黑色两种颜色的正方形瓷砖。 你站在其中一块黑色的瓷砖上,只能向相邻(上下左右四个方向)的黑色瓷砖移动。 请写一个程序,计算你总共能够到达多少块黑色的瓷砖。 输入格式 输入包…...

嵌入式驱动开发详解16(音频驱动开发)
文章目录 前言WM8960简介I2S协议接口说明 SAI音频接口简介驱动框架简介设备树配置内核使能声卡设置与测试 后续参考文献 前言 该专栏主要是讲解嵌入式相关的驱动开发,但是由于ALSA驱动框架过于复杂,实现音频编解码芯片的驱动不是一个人能完成的…...

【嵌入式软件】跑开发板的前置服务配置
在嵌入式开发中,通常需要在 开发板和主机之间共享、传输和挂载文件。 这篇文章是关于如何在 Ubuntu 中配置 Samba、TFTP 和 NFS 协议的详细步骤。这些协议分别用于远程文件共享、文件传输和内核挂载文件系统。 如何安装协议: 参考:ubuntu18配置:详细的内容我手写了一份文档。…...
如何高效实现进程间通信
实现进程间通信(IPC)有多种高效的方法,以下是一些常见的技术及其简要说明: 1. 共享内存: 共享内存是一种高效的进程间通信机制,允许多个进程共享同一块内存区域以实现快速的数据交换。与其他IPC机制相比&a…...
scala基础学习_变量
文章目录 scala中的变量常量 val(不可变变量)变量 var变量声明多变量声明匿名变量 _ 声明 变量类型声明变量命名规范 scala中的变量 常量 val(不可变变量) 使用val关键字声明变量是不可变的,一旦赋值后不能被修改 对…...
Java 身份证校验工具类(15位校验、18位校验与15转18)
文章目录 身份证简介(一)身份证号码的组成(二)一代和二代身份证一代身份证二代身份证 检验思路分析(一)15位身份证号码(二)18位身份证号码(三)校验算法示例&a…...

HTML+CSS+Vue3的静态网页,免费开源,可当作作业使用
拿走请吱一声,点个关注吧,代码如下,网页有移动端适配 HTML <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width…...
【FAQ】HarmonyOS SDK 闭源开放能力 —Push Kit(8)
1.问题描述: 在AGC中,推送服务的消息回执新建成功后,有一个有效期 1,这个有效期是什么意思,过期后,会影响什么呢? 2,这个有效期是否可以修改成一直不过期? 解决方案&…...

HCIA-Access V2.5_2_2_2网络通信基础_IP编址与路由
网络层数据封装 首先IP地址封装在网络层,它用于标识一台网络设备,其中IP地址分为两个部分,网络地址和主机地址,通过我们采用点分十进制的形式进行表示。 IP地址分类 对IP地址而言,它细分为五类,A,B,C,D,E,…...

音频客观测评方法PESQ
一、简介 语音质量感知评估(Perceptual Evaluation of Speech Quality)是一系列的标准,包括一种用于自动评估电话系统用户所体验到的语音质量的测试方法。该标准于2001年被确定为ITU-T P.862建议书[1]。PESQ被电话制造商、网络设备供应商和电…...

前后端分离的项目使用nginx 解决 Invalid CORS request
我是这样打算的,前端用nginx代理,使用80 转443 端口走https 前端的地址就是http://yumbo.top 或https://yumbo.top 后端服务地址是:http://yumbo.top:8081 下面是我的完整配置,功能是正常的,加了注释 user nginx; …...
回归预测 | MATLAB实现SVM-Adaboost集成学习结合支持向量机多输入单输出回归预测
回归预测 | MATLAB实现SVM-Adaboost集成学习结合支持向量机多输入单输出回归预测 目录 回归预测 | MATLAB实现SVM-Adaboost集成学习结合支持向量机多输入单输出回归预测基本介绍程序设计基本介绍 SVM-Adaboost集成学习是一种将支持向量机(SVM)与AdaBoost算法相结合的集成学习…...
常见排序算法总结 (五) - 堆排序与堆操作
堆排序(借助 API) 算法思想 利用堆能够维护数组中最大值的性质,根据数组元素建立最大堆,依次弹出元素并维护堆结构,直到堆为空。 稳定性分析 堆排序是不稳定的,因为堆本质上是完全二叉树,排…...
kubernetes的三种探针ReadinessProbe、LivenessProbe和StartupProbe,以及使用示例
前言 k8s中的Pod由容器组成,容器运行的时候可能因为意外情况挂掉。为了保证服务的稳定性,在容器出现问题后能进行重启,k8s提供了3种探针 k8s的三种探针 为了探测容器状态,k8s提供了两个探针: LivenessProbe和ReadinessProbe L…...

掌握线性回归:从简单模型到多项式模型的综合指南
目录 一、说明 二、简单线性回归 三、线性回归的评估指标 3.1 线性回归中的假设 四、从头开始的简单线性回归代码 五、多元线性回归 六、多元线性回归代码 七、多项式线性回归 八、多项式线性回归代码 九、应用单变量多项式回归 十、改变多项式的次数 十一、多列多项式回归 一、…...

Redis相关知识总结(缓存雪崩,缓存穿透,缓存击穿,Redis实现分布式锁,如何保持数据库和缓存一致)
文章目录 1.什么是Redis?2.为什么要使用redis作为mysql的缓存?3.什么是缓存雪崩、缓存穿透、缓存击穿?3.1缓存雪崩3.1.1 大量缓存同时过期3.1.2 Redis宕机 3.2 缓存击穿3.3 缓存穿透3.4 总结 4. 数据库和缓存如何保持一致性5. Redis实现分布式…...

Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility
Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility 1. 实验室环境1.1 实验室环境1.2 小测试 2. The Endor System2.1 部署应用2.2 检查现有策略 3. Cilium 策略实体3.1 创建 allow-all 网络策略3.2 在 Hubble CLI 中验证网络策略源3.3 …...
测试markdown--肇兴
day1: 1、去程:7:04 --11:32高铁 高铁右转上售票大厅2楼,穿过候车厅下一楼,上大巴车 ¥10/人 **2、到达:**12点多到达寨子,买门票,美团/抖音:¥78人 3、中饭&a…...
【论文笔记】若干矿井粉尘检测算法概述
总的来说,传统机器学习、传统机器学习与深度学习的结合、LSTM等算法所需要的数据集来源于矿井传感器测量的粉尘浓度,通过建立回归模型来预测未来矿井的粉尘浓度。传统机器学习算法性能易受数据中极端值的影响。YOLO等计算机视觉算法所需要的数据集来源于…...

Maven 概述、安装、配置、仓库、私服详解
目录 1、Maven 概述 1.1 Maven 的定义 1.2 Maven 解决的问题 1.3 Maven 的核心特性与优势 2、Maven 安装 2.1 下载 Maven 2.2 安装配置 Maven 2.3 测试安装 2.4 修改 Maven 本地仓库的默认路径 3、Maven 配置 3.1 配置本地仓库 3.2 配置 JDK 3.3 IDEA 配置本地 Ma…...

Mac下Android Studio扫描根目录卡死问题记录
环境信息 操作系统: macOS 15.5 (Apple M2芯片)Android Studio版本: Meerkat Feature Drop | 2024.3.2 Patch 1 (Build #AI-243.26053.27.2432.13536105, 2025年5月22日构建) 问题现象 在项目开发过程中,提示一个依赖外部头文件的cpp源文件需要同步,点…...
今日学习:Spring线程池|并发修改异常|链路丢失|登录续期|VIP过期策略|数值类缓存
文章目录 优雅版线程池ThreadPoolTaskExecutor和ThreadPoolTaskExecutor的装饰器并发修改异常并发修改异常简介实现机制设计原因及意义 使用线程池造成的链路丢失问题线程池导致的链路丢失问题发生原因 常见解决方法更好的解决方法设计精妙之处 登录续期登录续期常见实现方式特…...
在QWebEngineView上实现鼠标、触摸等事件捕获的解决方案
这个问题我看其他博主也写了,要么要会员、要么写的乱七八糟。这里我整理一下,把问题说清楚并且给出代码,拿去用就行,照着葫芦画瓢。 问题 在继承QWebEngineView后,重写mousePressEvent或event函数无法捕获鼠标按下事…...

Mysql中select查询语句的执行过程
目录 1、介绍 1.1、组件介绍 1.2、Sql执行顺序 2、执行流程 2.1. 连接与认证 2.2. 查询缓存 2.3. 语法解析(Parser) 2.4、执行sql 1. 预处理(Preprocessor) 2. 查询优化器(Optimizer) 3. 执行器…...
return this;返回的是谁
一个审批系统的示例来演示责任链模式的实现。假设公司需要处理不同金额的采购申请,不同级别的经理有不同的审批权限: // 抽象处理者:审批者 abstract class Approver {protected Approver successor; // 下一个处理者// 设置下一个处理者pub…...