人机融合智能 | 可穿戴计算设备的多模态交互
可穿戴计算设备可以对人体以及周围环境进行连续感知和计算,为用户提供随时随地的智能交互服务。本章主要介绍人机智能交互领域中可穿戴计算设备的多模态交互,阐述以人为中心的智能穿戴交互设计目标和原则,为可穿戴技术和智能穿戴交互技术的设计提供指导,进而简述支持智能穿戴交互的传感器种类、原理和应用,并重点介绍在不同类型传感器基础上实现的多模态智能穿戴交互技术。本章围绕可穿戴设备上的动作交互,重点介绍手指触控交互、手部动作交互、头部动作交互和眼睛动作交互等多种智能穿戴交互模态及技术。最后分析可穿戴计算设备交互技术的未来发展和挑战,希望本章可以帮助读者更好地了解可穿戴计算设备上的多模态智能交互技术的设计原则、传感器基础、多模态动作交互以及学术界在智能穿戴交互方面的最新研究进展。
01、引言
可穿戴计算设备指的是可以穿戴在人体身上,包括但不限于身体表面、衣服上、衣服内等的微型计算机或者计算设备、感知设备,以对人体以及周围环境进行感知和计算。由于这些设备与人体紧密相关并依附于用户身体,因此可以实现连续监测人体日常行为以及生理指标的目的。随着嵌入式硬件、传感器技术以及人工智能技术的发展,可穿戴计算已成为信息科技、医疗健康等领域重要的计算载体,支撑了运动健康等大规模、不可缺少的日常穿戴应用。 2022 年,含智能手表、手环、耳机、眼镜等在内的可穿戴设备的出货量达 4.9 亿台 ① ,成为重要的用户智能终端设备之一。
可穿戴计算的概念从 20 世纪后叶便开始频繁出现在各种科幻片中,从 1985 年上映的《回到未来》到 2002 年的《少数派报告》再到 2008 年的《钢铁侠》,可穿戴计算成为科幻电影中必不可少的元素。《少数派报告》中,汤姆·克鲁斯在未来感超强的混合现实指挥场景中使用智能手套通过手势控制显示元素的场景,为可穿戴人机交互打开了全新的一扇窗,进而成为学界和工业界一直追求的技术场景。
可穿戴计算设备的历史可以追溯到 1700 年的清朝时期,当时的算盘戒指真正实现了“掐指一算”,被认为是人类历史上首个可穿戴设备。 1961 年,数学家爱德华·索普(EdwardO.Thorpe )和克劳德·香农(ClaudeShannon )发明了多种用于赢得轮盘赌游戏的计算机计时设备,索普称自己是“可穿戴计算机”的首位发明者。 20 世纪 70 年代,多伦多大学的 SteveMann 教授展示了虚拟现实头戴设备的原型系统,并首先提出了可穿戴计算的概念。但是,由于当时的电子信息科技发展仍然有限,可穿戴计算的进步主要局限于学术界,并鲜有相应的产品问世。到了 2000 年代初,尤其是 2003 年的CES 国际消费电子展,微软的比尔·盖茨向公众展示了智能手表的原型设计,这也标志着可穿戴计算设备正式走入大众视野。 2010 年后,如 Fitbit 这样的智能健康监测设备纷纷涌现,推动了智能穿戴技术的飞速发展,并使之成为一个规模庞大的消费电子产业。这些突破性的设备加深了人们对普适计算和可穿戴交互技术的了解,为未来的技术进步奠定了基础。
可穿戴设备的形态多种多样,但是可穿戴设备的形态整体受限于人因工程要求,应在满足应用需求的同时减少对用户日常活动的影响。按照佩戴位置分类,包括腕戴设备(智能手表、智能手环等)、颈戴设备(智能项链、坐姿提醒器等)、头戴设备(智能眼镜、智能头盔等)、耳戴设备(智能耳机、降噪耳机等)以及四肢、躯干佩戴设备(智能腰带、智能胸带等)。不同的设备形态通常对应着不同的功能,例如,佩戴在手腕上的可穿戴设备通常具有心率检测的功能,捆绑在四肢上的可穿戴设备通常具有运动监测的功能,而头戴式设备则通常可以提升使用者的视觉或者听觉能力等。
可穿戴计算设备具备以下几个基本特点:(1)穿戴便携性,可穿戴设备设计为直接佩戴在身体上或与服装和配饰相结合,通常由轻量化的供电系统、计算单元以及感知单元组成,具有随身携带并在移动过程中使用的能力;(2)连续感知性,可穿戴设备通常具有多种传感器,通常可以持续地对用户生理指征、动作行为以及环境因素进行连续感知以及数据获取;(3)随时随地性,可穿戴设备旨在实现随时随地智能服务的提供,同时在尽量不影响用户的日常行为前提下实时收集、处理和分析用户数据,以提供及时的反馈、建议和预警;(4)用户个性化,可穿戴设备可以根据用户的需求和偏好进行订制,提供高度个性化的应用和服务。
以上可穿戴计算设备的特点使得传统基于鼠标的二维表面的指点交互不再适用,按照可穿戴设备的形态以及使用场景逐渐形成触控、手势、眼动、语音等多模态交互范式。亟需随时随地、轻便易用的新型感知与交互技术的创新。近些年,学术界与工业界采用“以人为中心”的设计理念,以人工智能、传感器技术为基础,一方面创新了可穿戴计算设备上的多模态交互技术,逐步实现可穿戴设备上人机之间有效的信息传递,解决了可穿戴计算设备无法交互的问题;另一方面,可穿戴计算设备的特点也为新型的交互技术提供了感知与计算基础,为人机交互技术的创新提供了支撑。以上两点逐步推动了可穿戴计算领域的蓬勃发展,使得智能穿戴交互成为人机智能交互的重要研究问题之一。
02、以人为中心的智能穿戴交互设计
“以人为中心”的设计思想是智能穿戴交互的重要设计原则,即将人置于设计过程的中心,以满足用户需求为目标,本节以智能穿戴交互为核心,重点介绍智能穿戴交互的设计目标与设计原则,考虑用户的认知、情感和行为,通过交叉应用多个领域的知识,包括工效学、心理学、计算科学、传感器技术、软件设计开发、时尚设计、人工智能、人因工程、电子工程、分布式网络等,实现自然高效的智能穿戴交互体验。
1. 智能穿戴交互的设计目标
智能穿戴交互旨在实现人与可穿戴设备之间高效自然的信息交换,满足佩戴者的需求,帮助用户更轻松、更高效地完成任务,设计目标包括以下几点:(1)交互自然高效性最大化,智能穿戴交互脱离了特定空间与接口,需要兼顾交互的自然性与高效性;(2)交互随时随地可用,智能穿戴交互需要可以随时随地提供可穿戴计算设备的交互能力,保证交互技术始终在线;(3)用户注意力占用最小化,智能穿戴交互需要尽可能少地占用用户注意力,降低用户与可穿戴设备之间交互的认知负荷;(4)用户双手占用最小化,智能穿戴交互需要支持无须手部操作的交互模态;(5)情境感知的交互界面自适应化,智能穿戴交互需要具有上下文感知能力,建模佩戴者自身及其周围环境状态,进而相应地做出信息反馈。
2. 智能穿戴交互的设计原则
为了提高用户对可穿戴设备的接受度与持续使用率,其交互界面必须采取一系列设计原则,这些原则可以帮助设计者在设计、开发和评估阶段进行有效的迭代,以不断优化用户界面和用户交互。为此, Dibia 等围绕智能穿戴技术提出了以下六个设计原则,本节在此基础上进一步补充,形成了以下十个设计原则,并将十个原则按照信息技术手段实现交互能力增强、交互满足用户个性化需求与偏好、提升交互高效性与用户友好性、高效调度穿戴设备的计算功耗以及保护用户隐私并提升用户的信任度五方面进行如下归类。
1)信息技术手段实现交互能力增强
原则 1 :感知驱动的智能交互
通过人工智能赋能传感技术扩展可穿戴设备的有限交互空间,例如,可以利用触摸手势(如轻敲、滑动、捏和缩放)、动作和语音作为输入命令,进而扩展可穿戴设备上的交互能力。
原则 2 :计算负荷可动态转移
由于可穿戴设备的固有限制,复杂或资源密集型任务应尽可能地转移到其他具有更高处理能力的设备上。例如,可穿戴设备可以将诸如音频采样或数据处理等高计算负荷的任务在连接的智能手机或平板电脑上执行,仅将最终结果呈现给用户。
原则 3 :具备补充或增量价值
可穿戴应用程序的价值取决于它在执行重点任务时的表现,这种基于性能的价值可能来自特定情境的应用程序或软件过滤。例如,专用于跟踪运动计划的可穿戴设备比较于其他智能设备在健身房中使用时更方便。
2 )交互满足用户个性化需求与偏好
原则 4 :遵从可穿戴视觉规范
智能穿戴交互界面应该设计成符合穿戴时尚与用户心理的期望。例如,智能手表的表盘应该被设计成既有意义又优雅,佩戴者在公共场合中使用时感到舒适,不会因为硬件或软件的设计决策而感到尴尬或不适。
原则 5 :应用功能独立个性化
可穿戴设备的每个交互式应用程序应该明确开发,以满足特定和明确定义的用户需求,而不是具有多个功能的通用应用程序,应用程序应该与特定的结果和专用功能相关联,以便它们对特定的用户群体具备个性化适配能力。
原则 6 :考虑用户的背景差异
用户存在包括文化在内的背景差异,这直接影响着用户对交互界面的感受、交互效率与交互满意度,因此,设计者需要深入考虑潜在用户的背景差异及其在使用设备时是否会遇到不同的困难。
3 )提升交互高效性与用户友好性
原则 7 :信息呈现需高效易懂
无论使用哪种交互模式,可穿戴设备上的交互反馈方式都应该设计成易于阅读的,在简短的一瞥中便可以理解,并能通过简单的用户操作高效响应。
原则 8 :降低用户的认知负荷
受限于可穿戴计算设备的随时随地服务特性,用户与可穿戴计算设备在交互过程中可能需要同时操作多项任务,因此智能穿戴交互需要以消耗用户较低的注意力水平为原则,通过简单有效的方式完成人与设备之间的信息交换。
4 )高效调度穿戴设备的计算功耗
原则 9 :权衡交互功能与功耗
可穿戴设备的计算能力有限且体积小,交互功能受限于电源消耗以及散热等问题,丰富的交互功能需要调用更多的传感器与算力,导致功耗与发热问题严重,因此设计者需要根据实际需要在交互能力以及功耗之间做出取舍。
5 )保护用户隐私并提升用户的信任度
原则 10 :数据安全与隐私保留
用户需要提供相应的数据来享受智能交互服务,设计者需要以隐私数据最小化使用为原则,确定数据类型、访问权限、用户对数据可用性的偏好、数据保留时长等多维度特征,并确保交互界面符合法规的标准,从而提升用户对设备的信任程度。
以上十个设计原则相互支持和补充,旨在提供优化的智能穿戴交互体验,从不同角度综合考虑用户需求、技术限制和界面设计的因素(图 23.1)。
相关文章:

人机融合智能 | 可穿戴计算设备的多模态交互
可穿戴计算设备可以对人体以及周围环境进行连续感知和计算,为用户提供随时随地的智能交互服务。本章主要介绍人机智能交互领域中可穿戴计算设备的多模态交互,阐述以人为中心的智能穿戴交互设计目标和原则,为可穿戴技术和智能穿戴交互技术的设计提供指导,进而简述支持智能穿戴交…...

Impromptu VLA:用于驾驶视觉-语言-动作模型的开放权重和开放数据
25年5月来自清华和博世的论文“Impromptu VLA: Open Weights and Open Data for Driving Vision-Language-Action Models”。 用于自动驾驶的“视觉-语言-动作” (VLA) 模型前景光明,但在非结构化极端场景下却表现不佳,这主要是由于缺乏有针对性的基准测…...

AI智能体,为美业后端供应链注入“智慧因子”(4/6)
摘要:本文深入剖析美业后端供应链现状,其产品具有多样性、更新换代快等特点,原料供应和生产环节也面临诸多挑战。AI 智能体的登场为美业后端供应链带来变革,包括精准需求预测、智能化库存管理、优化生产计划排程、升级供应商管理等…...

跨平台资源下载工具:res-downloader 的使用体验
一款基于 Go Wails 的跨平台资源下载工具,简洁易用,支持多种资源嗅探与下载。res-downloader 一款开源免费的下载软件(开源无毒、放心使用)!支持Win10、Win11、Mac系统.支持视频、音频、图片、m3u8等网络资源下载.支持视频号、小程序、抖音、…...
ps蒙版介绍
一、蒙版的类型 Photoshop中有多种蒙版类型,每种适用于不同的场景: 图层蒙版(Layer Mask) 作用:控制图层的可见性,黑色隐藏、白色显示、灰色半透明。特点:可随时编辑,适合精细调整。…...

数据湖是什么?数据湖和数据仓库的区别是什么?
目录 一、数据湖是什么 (一)数据湖的定义 (二)数据湖的特点 二、数据仓库是什么 (一)数据仓库的定义 (二)数据仓库的特点 三、数据湖和数据仓库的区别 (一&#…...
用Ai学习wxWidgets笔记——在 VS Code 中使用 CMake 搭建 wxWidgets 开发工程
声明:本文整理筛选Ai工具生成的内容辅助写作,仅供参考 >> 在 VS Code 中使用 CMake 搭建 wxWidgets 开发工程 下面是一步步指导如何在 VS Code 中配置 wxWidgets 开发环境,包括跨平台设置(Windows 和 Linux)。…...

【深度学习新浪潮】如何入门三维重建?
入门三维重建算法技术需要结合数学基础、计算机视觉理论、编程实践和项目经验,以下是系统的学习路径和建议: 一、基础知识储备 1. 数学基础 线性代数:矩阵运算、向量空间、特征分解(用于相机矩阵、变换矩阵推导)。几何基础:三维几何(点、线、面的表示)、射影几何(单…...
Android实现点击Notification通知栏,跳转指定activity页面
效果 1、点击通知栏通知,假如app正在运行,则直接跳转到指定activity显示具体内容,在指定activity中按返回键返回其上一级页面。 2、点击通知栏通知,假如app已经退出,先从SplashActivity进入,显示app启动界…...

Codeforces Round 1025 (Div. 2) B. Slice to Survive
Codeforces Round 1025 (Div. 2) B. Slice to Survive 题目 Duelists Mouf and Fouad enter the arena, which is an n m n \times m nm grid! Fouad’s monster starts at cell ( a , b ) (a, b) (a,b), where rows are numbered 1 1 1 to n n n and columns 1 1 1 t…...

ubuntu中使用docker
上一篇我已经下载了一个ubuntu:20.04的镜像; 1. 查看所有镜像 sudo docker images 2. 基于本地存在的ubuntu:20.04镜像创建一个容器,容器的名为cppubuntu-1。创建的时候就会启动容器。 sudo docker run -itd --name cppubuntu-1 ubuntu:20.04 结果出…...
复制与图片文件同名的标签文件到目标路径
引言:在数据集构建中,我们经常需要挑选一些特殊类型的图片(如:零件中有特殊脏污背景的图片,写论文的时候想单独对这类情况进行热力图验证)。我们把挑选出来的图片放到一个文件夹下,这时候我想快…...
【深度学习-Day 24】过拟合与欠拟合:深入解析模型泛化能力的核心挑战
Langchain系列文章目录 01-玩转LangChain:从模型调用到Prompt模板与输出解析的完整指南 02-玩转 LangChain Memory 模块:四种记忆类型详解及应用场景全覆盖 03-全面掌握 LangChain:从核心链条构建到动态任务分配的实战指南 04-玩转 LangChai…...

[ElasticSearch] DSL查询
🌸个人主页:https://blog.csdn.net/2301_80050796?spm1000.2115.3001.5343 🏵️热门专栏: 🧊 Java基本语法(97平均质量分)https://blog.csdn.net/2301_80050796/category_12615970.html?spm1001.2014.3001.5482 🍕 Collection与…...

iview中的table组件点击一行中的任意一点选中本行
<Table border ref"selection" size"small" on-row-click"onClickRow"></Table>// table组件点击一行任意位置选中onClickRow(row, index) {this.$refs.selection.toggleSelect(index)}写上toggleSelect(index)方法即可,…...

《探秘跨网段局域网IP广播:解锁网络通信的新姿势》
一、从基础出发:广播与跨网段 在计算机网络的世界中,广播域是一个至关重要的概念。简单来说,广播域是指网络中能接收任一台主机发出的广播帧的所有主机集合。当一台主机在广播域内发出一个广播帧时,同一广播域内的所有其他主机都可以收到该广播帧。在没有路由器或 VLAN 分割…...
Kafka 单机部署启动教程(适用于 Spark + Hadoop 环境)
🧭 Kafka 单机部署启动教程(适用于 Spark Hadoop 环境) 📦 一、Kafka 版本选择 推荐使用 Kafka 2.13-2.8.1(Scala 2.13,稳定适配 Spark 3.1.2 和 Hadoop 3.1.1) 下载地址(Apache 官…...

maven微服务${revision}依赖打包无法识别
1、场景描述 我现在又一个微服务项目,父pom的版本,使用<properties>定义好,如下所示: <name>ypsx-finance-center</name> <artifactId>ypsx-finance</artifactId> <packaging>pom</pack…...

2025年06月07日Github流行趋势
项目名称:netbird 项目地址url:https://github.com/netbirdio/netbird项目语言:Go历史star数:14824今日star数:320项目维护者:mlsmaycon, braginini, pascal-fischer, lixmal, pappz项目简介:使…...

WPS中将在线链接转为图片
WPS中将在线链接转为图片 文章目录 WPS中将在线链接转为图片一:解决方案1、下载图片,精确匹配(会员功能)2、将在线链接直接转为图片 一:解决方案 1、下载图片,精确匹配(会员功能) …...

实战二:开发网页端界面完成黑白视频转为彩色视频
一、需求描述 设计一个简单的视频上色应用,用户可以通过网页界面上传黑白视频,系统会自动将其转换为彩色视频。整个过程对用户来说非常简单直观,不需要了解技术细节。 效果图 二、实现思路 总体思路: 用户通过Gradio界面上…...
二元函数可微 切平面逼近 线性函数逼近
二元函数 f ( x , y ) f(x, y) f(x,y) 在某点可微 的含义,可以从几何直观、严格数学定义、与一阶偏导数的关系三个层面来理解: 🔹1. 几何直观上的含义(最易理解) 二元函数 f ( x , y ) f(x, y) f(x,y) 在点 ( x 0 …...

vue生成二维码图片+文字说明
需求:点击下载图片,上方是二维码,下方显示该二维码的相关内容,并且居中显示,支持换行 解决方案步骤: 1. 使用qrcode生成二维码的DataURL。 2. 创建canvas,将二维码图片绘制到canvas的上半部分…...

机器学习监督学习实战五:六种算法对声呐回波信号进行分类
本项目基于UCI的声呐目标识别数据集(Sonar, Mines vs. Rocks),通过10种机器学习算法比较,发现集成学习方法表现最优。研究首先对60个声呐能量特征进行可视化分析(分布直方图、相关性矩阵),对比了…...

React Hooks 的闭包陷阱问题
这是主包在面试中遇到的一道题目,面试官的问题是:"这个页面初次展示出来时Count和step的值是什么,我点击按钮count和step的值有什么变化?“ 这个题目主包回答的不好,所以想做一个总结。 题目 import React, { …...

力扣面试150题--克隆图
Day 61 题目描述 思路 /* // Definition for a Node. class Node {public int val;public List<Node> neighbors;public Node() {val 0;neighbors new ArrayList<Node>();}public Node(int _val) {val _val;neighbors new ArrayList<Node>();}public N…...
【HarmonyOS 5】运动健康开发实践介绍以及详细案例
以下是 HarmonyOS 5 运动健康功能的简洁介绍,聚焦核心体验与技术亮点: 一、AI 驱动的全场景健康管理 智能运动私教:运动前推送热身指导,运动中实时纠正动作,运动后生成个性化报告与改进建议。AI 融合用户多设备数…...
STM32开发中,线程启动异常问题排查简述
1. 参数传递问题 错误类型:线程属性错误地使用。影响:线程属性(如堆栈大小、优先级)不匹配可能导致线程创建失败或行为异常。验证方法:检查 线程创建的返回值,若为 NULL 则表示线程创建失败。 2. 系统资源…...
SQL进阶之旅 Day 18:数据分区与查询性能
【SQL进阶之旅 Day 18】数据分区与查询性能 文章简述 在现代数据库系统中,随着数据量的快速增长,如何高效地管理和查询大规模数据成为开发人员和数据分析师面临的重要挑战。本文深入探讨了数据分区的概念及其对查询性能的提升作用,结合理论…...

鸿蒙PC,有什么缺点?
点击上方关注 “终端研发部” 设为“星标”,和你一起掌握更多数据库知识 价格太高,二是部分管理员权限首先,三对于开发者不太友好举个例子:VSCode的兼容性对程序员至关重要。若能支持VSCode,这台电脑将成为大多数开发者…...