大模型的交互能力
摘要:
基础大模型显示出明显的潜力,可以改变AI系统的开发人员和用户体验:基础模型降低了原型设计和构建AI应用程序的难度阈值,因为它们在适应方面的样本效率,并提高了新用户交互的上限,因为它们的多模式和生成能力。这提供了我们鼓励向前发展的协同作用:开发人员可以提供更好地满足用户需求和价值观的应用程序,同时引入更动态的交互形式和反馈机会。

图 基础模型将通过降低构建AI注入应用程序的难度阈值为开发人员带来重大机遇,并通过提高可实现的交互类型的上限为应用程序用户带来重大机遇。在某些情况下,开发人员和用户之间的界限将开始模糊,用户可以轻松开发自己的人工智能应用程序,例如使用自然语言。
早期形式的基础模型,如GPT-3和DALL·E,已经证明了高水平的多功能性,无论是在让非ML专家对强大的AI注入应用程序进行原型设计的能力方面,还是在无缝集成从文本到图像的模式方面。随着基础模型的发展成熟,模型的容量将继续扩大,其多功能性最终可能导致我们与人工智能交互方式的根本变化,使我们能够快速原型化并构建高度动态和生成性的人工智能应用程序。在本节中,我们将从两个重要利益相关者的角度讨论这些变化带来的机会:(1)将与基础模型交互以设计用户体验的应用程序开发人员,以及(2)将使用基础模型支持的AI注入应用程序或受其影响的最终用户。最后,我们考虑这样的场景:今天严格区分开发人员和最终用户的界限可能开始模糊,为创建更紧密满足用户需求和价值的AI注入应用程序提供了新的机会。
1. 对注入AI的应用程序开发人员的开发过程的影响
基础模型将如何改变开发人员创建注入AI的应用程序的方式?尽管机器学习算法和系统基础设施取得了巨大的进步,但一些人指出,设计新颖和积极的人机交互形式仍然很困难。创建强大的特定任务模型所需的大量数据、计算资源和技能经常与引发和满足用户需求和价值所需的迭代原型过程相冲突。人工智能的反应可能是不可预测的,而模型可以产生巨大的生成输出空间,这使得人们很难建立有效的心理模型。在应对这些挑战方面,已经取得了一些进展,例如在交互式机器学习方面的工作和将人工智能中的不确定性传达给最终用户的设计框架。然而,仍需要开展更多工作来克服这些障碍。
基础模式为应对上述许多挑战提供了重要机会。例如,基于语言的基础模型将自然语言作为输入,并推广到许多下游任务的能力,可以显着降低应用程序开发的难度“阈值”,即,通过实现复杂模型的开发,而无需收集大量数据并从头开始训练大型模型。这甚至可以使非ML专家快速原型化AI注入的应用程序。与此同时,基础模型强大的生成和潜在的多模态能力可以提供更高的“天花板”,即在质量和多样性方面可以实现的交互类型,我们将在下面讨论。然而,我们如何成功地利用这些能力将取决于我们如何有效地将基础模型转换为应用程序开发人员更易于管理的形式。
不幸的是,给予基础模型优势的通用性和高天花板也使这些模型难以使用,因为它们可能比单一用途的AI模型更加不可预测和复杂。事实上,最近的研究表明,很难使GPT-3这样的模型始终执行预期的任务,而了解它的能力仍然是一个活跃的研究领域。为了提高注入人工智能的应用程序的可靠性和可信度,我们建议未来的工作应该继续研究如何从基础模型(例如,通过微调,或者在主要交互模式是自然语言提示的情况下,通过自动工程,校准,或预格式化特定任务的端点。
2. 对最终用户与注入AI的应用程序交互的影响
除了开发人员可能创建注入AI的应用程序的新方法之外,基础模型将为与这些应用程序交互的最终用户带来哪些变化?开发面向用户的AI应用程序的现有设计框架专注于增强(而不是取代)用户的能力,如道格拉斯恩格尔巴特所述-我们希望这些框架应该并且将继续与未来AI注入应用程序的开发相关。例如,维护用户的代理并反映他们的价值将继续成为基础模型驱动的应用程序的中心主题。此外,允许AI代理主动采取行动并自动化用户的例程的好处与等待用户直接操纵的好处将需要仔细权衡。此外,用户的价值观应该直接收集并通过参与式和价值敏感设计等过程反映出来,这些过程倡导在设计注入人工智能的应用程序时积极参与所有利益相关者。
这些问题在基础模型中可能变得特别突出,因为模型的行为方式可能会让用户和社区感到惊讶和失望。生成能力可能会暴露与社区目标相反的偏见或观点,或者更隐蔽地,在社区没有意识到的情况下,在他们的行为中利用这种关联。这将给使用基础模型的团队带来很大的负担,以监控他们的模型的行为,并尽可能地调整它们以适当的方式行事。
虽然考虑AI注入应用程序以增强用户能力的设计框架应该保持不变,但由于基础模型强大的生成和多模态能力,可实现的实际交互形式可能会显着多样化。可以被认为是用于多媒体创建和编辑的基础模型驱动的软件工具的早期几代已经开始推动一个新的前沿,该前沿使得即使是新手内容创建者也能够从粗糙、直观的规范(例如,作家的协作创作,数字艺术家的文本到图像生成,音乐家的掌握,和程序员的代码完成)。改进的基础模型可能会实现更雄心勃勃的工具(例如,爱好者可以提供歌曲的主题材料,然后将以他们最喜欢的乐队的风格生成该主题材料,或者企业主可以提供他们的产品的简单描述,其将用于创建完整的网站)。此外,基础模型将用于丰富静态多媒体(例如,自动将传统的多媒体内容重新制作成新的格式,或者在新的视频游戏中为每个玩家生成独特的体验),并且甚至可能导致使用界面的新形式的多模式交互,该界面本身混合了不同的模式,诸如基于视觉和手势的交互。
我们开始看到基础模型如何在从AI Dungeon到Microsoft PowerApps和CoPilot的应用程序中实现具体的交互。随着我们开始设想新的交互形式,我们越来越重要的是批判性地思考这些交互对个人用户和社会的潜在影响,以最大限度地发挥其积极影响。例如,基础模型驱动的应用程序将如何改变我们彼此通信的方式?一个强大的模型会代替我们写电子邮件吗?如果是的话,这将如何重塑人们的信任,可信度,以及知道作者可能没有自己写电子邮件的身份,这将如何改变我们的写作风格[汉考克等人。谁将拥有模型生成内容的作者身份,以及如何滥用同意的转移责任和所有权?基础模型将对我们的工作、语言和文化产生哪些长期影响?与最后一个问题特别相关的是,基础模型是根据观察到的数据训练的,不一定能告诉我们因果关系。因此,我们如何才能确保基础模型的使用将我们引向一个理想的未来,而不是重复过去?虽然这些问题不一定是基础模型所独有的,但随着基础模型加速创建有效的AI注入应用程序,它们将被放大并变得更加普遍。
3. 模糊开发人员和最终用户之间的界限
如今,人工智能模型开发人员和最终用户之间的界限是严格的--很少有最终用户拥有数据、计算资源和专业知识,能够开发出适合自己价值观和需求的新模型。虽然通用模型(即,一个不特定于特定用户或社区的模型)在某些情况下可能就足够了,但近年来,这种模型无法为用户提供服务的情况越来越多。例如,设计用于识别一个在线社区的有问题评论的文本分类模型可能对该社区很有效,但在规范和文化可能显著不同的其他社区中会失败(例如,Reddit上的NSFW社区可能对某些内容更宽容,而科学社区可能会拒绝看似平凡的轶事,这些轶事并非基于科学研究)。在另一个例子中,为一个目标人群设计的人工智能传感器和机器人工具可能会失败,无法快速适应具有不同能力和需求的用户。虽然最近的工作为未来的研究提供了有希望的途径,即最终用户如何能够通过手动提供模型的参数或数据集,结果仍然是初步的,通常集中在基本模型上。
如果基础模型可以充分降低构建AI注入应用程序的难度阈值,那么它们可以提供一个重要的机会,通过允许用户积极参与模型的开发过程,将用户的需求和价值与模型的行为更紧密地结合起来。例如,最近的研究表明,当在其自然语言提示中给出足够的任务描述时,GPT-3可以以少量甚至零次的方式稳健地执行分类任务。一个试图缓和自己内容的在线社区可能能够利用这种能力来创建定制的人工智能分类器,这些分类器根据社区同意的分类任务描述过滤内容(当然,这种能力也可能被滥用来压制社区内某些成员的声音)。此外,基础模型将展示的强大的上下文学习能力可以允许基础模型驱动的应用程序更有效地优化其界面。这可以为解决人机和机器人交互中的许多突出问题打开大门,例如在混合自动化设置中平衡用户直接操作和自动化的能力。
当然,我们仍然需要克服一些重要的挑战,才能真正实现这种模糊用户和开发人员之间界限的潜力。这些挑战包括减轻基础模型中现有的偏见,以及使模型的行为更加健壮和可管理,即使对于非ML专家(与ML专家相比,非ML专家可能更难以理解基础模型的全部能力和机制,这可能导致开发周期中的意外陷阱)。未来的工作应该探索基础模型如何在交互式机器学习的背景下定位,并研究我们如何支持那些即使在机器学习方面经验有限的人,以稳健的方式利用这些模型。尽管如此,最终用户能够参与开发注入人工智能的应用程序是一个令人兴奋的机会,可以为我们未来如何与这些应用程序交互引入一个新的范例。
相关文章:
大模型的交互能力
摘要: 基础大模型显示出明显的潜力,可以改变AI系统的开发人员和用户体验:基础模型降低了原型设计和构建AI应用程序的难度阈值,因为它们在适应方面的样本效率,并提高了新用户交互的上限,因为它们的多模式和生…...
80%测试员被骗,关于jmeter 的一个弥天大谎!
jmeter是目前大家都喜欢用的一款性能测试工具,因为它小巧、简单易上手,所以很多人都愿意用它来做接口测试或者性能测试,因此,在目前企业中,使用各个jmeter的版本都有,其中以jmeter3.x、4.x的应该居多。 但是…...
Git——感谢尚硅谷官方文档
Git——尚硅谷学习笔记 第1章 Git 概述1.1 何为版本控制1.2 为什么需要版本控制1.3 版本控制工具1.4 Git 简史1.5 Git 工作机制1.6 Git 和代码托管中心 第2章 Git 安装第 3 章 Git 常用命令3.1 设置用户签名3.2 初始化本地库3.3 查看本地库状态3.4 添加暂存区3.4.1 将工作区的文…...
Java WebSocket框架
引言 随着互联网和移动互联网的迅猛发展,实时通信成为了应用程序的一项重要能力。WebSocket作为一种在Web上实现双向通信的协议,极大地丰富了Web应用程序的交互方式。而在Java领域,也有许多优秀的WebSocket框架可供选择,本文将介…...
C#实现本地服务器客户端私聊通信
(一)需求 在游戏中我们经常能够看到玩家与玩家之间可以进行私聊,在QQ或微信中最基本的功能就是用户与用户之间的通信。抽象成计算机网络,就是两个客户端通过服务器进行私聊通信,两个客户端可以互相看到对方发送过来的信…...
PyTorch 之 Dataset 类入门学习
PyTorch 之 Dataset 类入门学习 Dataset 类简介 PyTorch 中的 Dataset 类是一个抽象类,用来表示数据集。通过继承 Dataset 类可以进行自定义数据集的格式、大小和其它属性,供后续使用; 可以看到官方封装好的数据集也是直接或间接的继承自 …...
Java update scheduler
引言 Java 更新调度器是 Java 中的一个特性,可以自动化 Java 应用程序的更新过程。它提供了一种方便的方式来安排 Java 应用程序的更新,确保其与最新的功能、错误修复和安全补丁保持同步。本文将深入介绍如何使用 Java 更新调度器,并解释它对…...
常见树种(贵州省):006栎类
摘要:本专栏树种介绍图片来源于PPBC中国植物图像库(下附网址),本文整理仅做交流学习使用,同时便于查找,如有侵权请联系删除。 图片网址:PPBC中国植物图像库——最大的植物分类图片库 一、麻栎 …...
拓扑排序-
有向无环图是拓扑排序 拓扑排序将图中所有的顶点排成一个线性序列,使得所有的有向边均从序列的前面指向后面。 拓扑排序使用深度优先搜索来实现,图中有环则无法进行拓扑排序 一个有向图,如果图中有入度为0的点,就把这个点删掉…...
Oracle数据库如何定位trace file位置
用一个示例来说明吧。 在导入master key时,出现错误: ADMINISTER KEY MANAGEMENTIMPORT KEYS WITH SECRET "my_secret"FROM /tmp/export.expIDENTIFIED BY keypwd5 WITH BACKUP; ADMINISTER KEY MANAGEMENT * ERROR at line 1: ORA-46655…...
电脑盘符错乱,C盘变成D盘怎么办?
在一些特殊情况下,磁盘盘符会出现错乱,C盘可能会变成D盘。那么,这该怎么办呢?下面我们就来了解一下。 通过磁盘管理更改盘符 磁盘管理是Windows自带的工具,它位于“计算机管理”的控制台中。管理硬盘及其所包含的卷或…...
Android WMS——客户端输入事件处理(十九)
前面的文章我们介绍了 WMS 中的输入服务的启动及事件处理,这一篇我们来看一下客户端对输入事件的处理。 一、事件初始化 事件的初始化就是在添加窗口的过程。 1、ViewRootImpl 源码位置:/frameworks/base/core/java/android/view/ViewRootImpl.java public void setView(…...
Python基础学习__测试报告
# 使用pycharm生成报告:只有在单独执行一个TestCase文件时可以生成,使用TestSuite等就不能用了 # 使用第三方的测试报告:例如:HTMLTestRunner第三方类库 #使用HTMLTestRunner这个执行对象# 1.获取第三方的测试运行类Runner模块(一个py文件),将其放在代码目录下 # 2.导包:unitte…...
bclinux aarch64 ceph 14.2.10 云主机 4节点 fio
ceph -s 由于是基于底层分布式存储的云主机,数据仅供参考 本地云盘性能 direct1 1M读取 IOPS134, BW134MiB/s [rootceph-client rbd]# cd / [rootceph-client /]# fio -filenamefio.bin -direct1 -iodepth 128 -thread -rwread -ioenginelibaio -bs1M -size10G -n…...
智能座舱架构与芯片- (14) 测试篇 上
一、 验证平台概要 1.1 测试软件方法论 “软件定义汽车” 的时代,软件在整车制造中的重要性日渐凸显。但不同于其他行业的软件开发,汽车行业有自己独特的软件开发要求。首先是需求严谨、需求层次复杂、需要通过专业的工具进行管理;其次开发…...
【Django-DRF用法】多年积累md笔记,第3篇:Django-DRF的序列化和反序列化详解
本文从分析现在流行的前后端分离Web应用模式说起,然后介绍如何设计REST API,通过使用Django来实现一个REST API为例,明确后端开发REST API要做的最核心工作,然后介绍Django REST framework能帮助我们简化开发REST API的工作。 全…...
Redis主从复制,哨兵和Cluster集群
主从复制: 主从复制是高可用Redis的基础,哨兵和集群都是在主从复制基础上实现高可用的。主从复制主要实现了数据的多机备份(和同步),以及对于读操作的负载均衡和简单的故障恢复。 缺陷:故障恢复无法自动化…...
Linux嵌入式I2C协议笔记
硬件: 1.I2C结构 在一个SOC中有一个或者多个I2C控制器,一个I2C控制器可以连接一个或多个I2C设备。 I2C总线需要两条线,时钟线SCL和数据线SDA 2.I2C传输数据格式 开始信号(S):SCL为高电平时,S…...
科技的成就(五十三)
503、任天堂首次公开 Switch 2016 年 10 月 20 日,任天堂首次公开 Switch 正式名称及造型。Switch 是任天堂推出的混合型游戏机,可作为家用游戏机,也可作为便携式掌机。Switch 在开发过程中就以代号 NX 而闻名,成为当年的现象级产…...
Ubuntu22.04 编译 AOSP
在 Ubuntu 22.04 系统上搭建环境编译 AOSP(Android Open Source Project)需要进行以下步骤: 1, 更新系统:首先,确保您的 Ubuntu 22.04 系统已经更新到最新版本。可以使用以下命令进行系统更新: sudo apt update sudo apt upgrade2,安装必要的软件包:AOSP 编译需要一些…...
Python 数据可视化实战:让数据说话
Python 数据可视化实战:让数据说话 数据可视化的重要性 数据可视化是数据科学中不可或缺的一部分,它通过图形化的方式展示数据,使得复杂的数据变得更加直观和易于理解。Python作为一种功能强大的编程语言,提供了丰富的数据可视化库…...
MAA明日方舟自动辅助工具终极指南:解放双手的完整解决方案
MAA明日方舟自动辅助工具终极指南:解放双手的完整解决方案 【免费下载链接】MaaAssistantArknights 《明日方舟》小助手,全日常一键长草!| A one-click tool for the daily tasks of Arknights, supporting all clients. 项目地址: https:/…...
CC26XX低功耗实战:手把手教你配置TI-RTOS自动睡眠策略,让设备续航翻倍
CC26XX低功耗实战:TI-RTOS自动睡眠策略配置与深度优化指南 在物联网设备开发中,电池续航能力往往是决定产品成败的关键因素。德州仪器(TI)的CC26XX系列无线微控制器凭借其出色的低功耗特性,成为众多智能家居、可穿戴设备和工业传感器节点的首…...
Plain Craft Launcher 2深度技术解析:如何构建一个现代化的Minecraft启动器
Plain Craft Launcher 2深度技术解析:如何构建一个现代化的Minecraft启动器 【免费下载链接】PCL Minecraft 启动器 Plain Craft Launcher(PCL)。 项目地址: https://gitcode.com/gh_mirrors/pc/PCL Plain Craft Launcher 2࿰…...
TradingAgents 深度讲解:让 AI 智能体团队替你“开交易公司“——从原理到手把手部署
一个在 GitHub 收获 6.9 万星标、由 Tauric Research 团队开源的多智能体金融交易框架。它不是一个简单的"AI 选股工具",而是用 LLM 模拟了一整个真实交易公司的决策流程。 项目地址:https://github.com/TauricResearch/TradingAgents 论文地址…...
Obsidian Tasks 终极指南:6个优先级符号让任务管理效率提升300%
Obsidian Tasks 终极指南:6个优先级符号让任务管理效率提升300% 【免费下载链接】obsidian-tasks Task management for the Obsidian knowledge base. 项目地址: https://gitcode.com/gh_mirrors/ob/obsidian-tasks Obsidian Tasks 是 Obsidian 知识库中功能…...
你的GradleWrapper下载总失败?聊聊网络环境与Zip文件完整性那些坑
GradleWrapper下载失败背后的技术真相与根治方案 每次看到控制台弹出ZipException: zip END header not found时,那种熟悉的挫败感就会涌上心头。这不是简单的网络问题,而是开发环境稳定性被击穿的信号。对于依赖Gradle构建的中大型项目来说,…...
观察使用 Taotoken 后月度 AI 模型 API 开支的清晰度与预测性变化
观察使用 Taotoken 后月度 AI 模型 API 开支的清晰度与预测性变化 作为项目管理者,协调多个开发团队使用不同的大模型 API 是一项日常工作。过去,每个项目可能使用不同的供应商,账单分散在各个平台,月末汇总成本时总像在拼凑一张…...
开源Token用量监控仪表盘:LLM应用成本精细化管理的实战指南
1. 项目概述:一个为AI开发者量身打造的Token用量监控仪表盘如果你正在开发或运营一个基于大型语言模型(LLM)的应用,比如一个聊天机器人、一个智能客服系统,或者一个内容生成工具,那么“成本”和“用量”这两…...
通过taotoken cli工具一键配置开发团队的统一模型调用环境
通过taotoken cli工具一键配置开发团队的统一模型调用环境 为开发团队配置统一的大模型调用环境,通常涉及分发API密钥、设置基础URL、选择模型等一系列重复操作。手动配置不仅效率低下,还容易因成员操作差异导致环境不一致。Taotoken CLI工具࿰…...
