用于可穿戴传感器的人类活动识别、健康监测和行为建模的大型语言模型
这篇论文题为《用于可穿戴传感器的人类活动识别、健康监测和行为建模的大型语言模型:早期趋势、数据集和挑战的综述》,由埃米利奥·费拉拉(Emilio Ferrara)撰写。论文主要内容如下:
摘要
可穿戴技术的普及使得传感器数据的大量生成成为可能,为健康监测、活动识别和个性化医疗的进步提供了重要机会。然而,这些数据的复杂性和规模也带来了建模和分析的巨大挑战,从时间序列建模到深度学习技术,各种方法相继应用。最新的前沿是采用大型语言模型(LLMs),如GPT-4和Llama,用于通过可穿戴传感器数据分析、建模、理解和生成人类行为。这篇综述探讨了将LLMs应用于基于传感器的人类活动识别和行为建模的当前趋势和挑战。
引言
可穿戴传感器的快速发展带来了大量数据,使我们能够前所未有地监测和理解人类行为和健康。尽管可穿戴传感器数据的规模和复杂性增加了数据建模和分析的难度,LLMs如GPT-4和Llama展示了在数据分析中的强大能力,为从可穿戴传感器数据中提取有意义的见解提供了新的可能性。
可穿戴传感器数据
可穿戴传感器种类繁多,主要包括:
- 生理传感器:监测心率、血压等生命体征。
- 运动传感器:加速度计、陀螺仪等,用于追踪运动和定位。
- 环境传感器:监测温度、湿度等环境条件。
- 生化传感器:测量葡萄糖等生化指标。
- 多传感器系统:集成多种传感器,提供全面的监测能力。
这些传感器产生的高维、连续时间序列数据需要专门的预处理和分析技术。以下是表1中提到的参考文献详细信息:
可穿戴传感器类型
| 传感器类型 | 描述 | 参考文献 |
|---|---|---|
| 生理传感器 | 监测生命体征和其他生理参数。例子包括心率监测仪、心电图(ECG)、血压监测仪和脉搏血氧仪。 | [34] |
| 运动传感器 | 包括加速度计、陀螺仪和磁力计,用于追踪运动和定位。应用于活动识别和体育科学中至关重要。 | [24] |
| 环境传感器 | 检测环境条件,如温度、湿度和光线。通常集成到可穿戴设备中,以提供上下文感知服务。 | [9] |
| 生化传感器 | 测量生化标志物,如葡萄糖水平、乳酸和电解质。在医学诊断和持续健康监测中非常有价值。 | [11] |
| 多传感器系统 | 将多种传感器类型集成到一个设备中,以提供全面的监测能力。例子包括智能手表和健身追踪器。 | [17] |
数据类型
| 数据类型 | 描述 | 参考文献 |
|---|---|---|
| 时间序列数据 | 大多数可穿戴传感器会产生连续的时间序列数据,捕捉随时间变化的动态。这类数据需要专门的预处理、分割和特征提取技术来进行有效分析。 | [18] |
| 多模态数据 | 可穿戴设备通常通过结合不同类型传感器的输入来生成多模态数据。例如,一块智能手表可能同时收集运动和生理数据。整合和同步这些数据流是准确分析的关键任务。 | [17] |
| 高维数据 | 可穿戴传感器生成的原始数据可能是高维的,特别是在使用多个传感器时。降维技术,如主成分分析(PCA)和特征选择方法,被用来管理这种复杂性。 | [29] |
| 噪声和不完整数据 | 可穿戴传感器由于传感器故障、用户移动和环境干扰等各种因素,容易产生噪声和不完整的数据。有效的数据清理和插补方法对于保持数据质量至关重要。 | [1] |
大型语言模型(LLMs)
LLMs如GPT-4和Llama在自然语言处理领域取得了巨大成功,现已开始应用于可穿戴传感器数据分析。它们能够处理多模态数据,包括文本、音频和传感器信号,提供更全面的数据理解。
现状和挑战
LLMs在处理复杂查询和生成有见地的响应方面表现出色,使其成为需要高水平推理和上下文理解任务的理想工具。然而,挑战依然存在,包括数据质量、计算需求、可解释性和隐私问题。未来的研究方向应包括改进预处理技术、开发更高效和可扩展的模型以及加强跨学科合作。
总结
综述提供了可穿戴传感器数据与LLMs交叉领域的全面概览,探讨了当前的状态和未来前景。通过案例研究和成功应用,强调了LLMs在增强可穿戴传感器数据分析和解释方面的潜力。
方法与贡献
- 现有方法综述:分析了传统机器学习和深度学习在可穿戴传感器数据分析中的应用及其局限性。
- LLMs的应用前景:讨论了LLMs在处理和分析多模态数据方面的优势,尤其是其在处理复杂、异构数据方面的能力。
- 挑战与建议:提出了数据质量、计算要求、模型可解释性和隐私保护等方面的挑战,并提供了相应的建议和未来研究方向。
结论
LLMs为可穿戴传感器数据分析提供了新的机遇,通过改进数据预处理技术、开发更高效的模型、加强跨学科合作,可以进一步提升其应用效果。
这篇论文通过全面综述当前的研究进展,提出了未来研究的潜在方向,强调了LLMs在可穿戴传感器数据分析中的重要性和潜力。
传感器数据集参考文献:
- [9] Zachary Englhardt, Chengqian Ma, Margaret E Morris, Chun-Cheng Chang, Xuhai “Orson” Xu, Lianhui Qin, Daniel McDuff, Xin Liu, Shwetak Patel, and Vikram Iyer. 2024. From Classification to Clinical Insights: Towards Analyzing and Reasoning About Mobile and Behavioral Health Data With Large Language Models. Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies 8, 2 (2024), 1–25【17:9†source】.
- [11] Cathy Mengying Fang, Valdemar Danry, Nathan Whitmore, Andria Bao, Andrew Hutchison, Cayden Pierce, and Pattie Maes. 2024. PhysioLLM: Supporting Personalized Health Insights with Wearables and Large Language Models. arXiv preprint arXiv:2406.19283 (2024)【17:3†source】.
- [17] Sheikh Asif Imran, Mohammad Nur Hossain Khan, Subrata Biswas, and Bashima Islam. 2024. LLaSA: Large Multimodal Agent for Human Activity Analysis Through Wearable Sensors. arXiv preprint arXiv:2406.14498 (2024)【17:4†source】.
- [24] Jamie McQuire, Paul Watson, Nick Wright, Hugo Hiden, and Michael Catt. 2023. A Data Efficient Vision Transformer for Robust Human Activity Recognition from the Spectrograms of Wearable Sensor Data. In 2023 IEEE Statistical Signal Processing Workshop (SSP). IEEE, 364–368【17:6†source】.
- [34] Huaijun Wang, Jing Zhao, Junhuai Li, Ling Tian, Pengjia Tu, Ting Cao, Yang An, Kan Wang, and Shancang Li. 2020. Wearable Sensor-Based Human Activity Recognition Using Hybrid Deep Learning Techniques. Security and communication Networks 2020, 1 (2020), 2132138【17:7†source】.
- [1] Fayez Alharbi, Lahcen Ouarbya, and Jamie A Ward. 2022. Comparing sampling strategies for tackling imbalanced data in human activity recognition. Sensors 22, 4 (2022), 1373 .
- [17] Sheikh Asif Imran, Mohammad Nur Hossain Khan, Subrata Biswas, and Bashima Islam. 2024. LLaSA: Large Multimodal Agent for Human Activity Analysis Through Wearable Sensors. arXiv preprint arXiv:2406.14498 (2024) .
- [18] Sijie Ji, Xinzhe Zheng, and Chenshu Wu. 2024. HARGPT: Are LLMs Zero-Shot Human Activity Recognizers? arXiv preprint arXiv:2403.02727 (2024) .
- [29] Sungho Suh, Vitor Fortes Rey, and Paul Lukowicz. 2023. Tasked: transformer-based adversarial learning for human activity recognition using wearable sensors via self-knowledge distillation. Knowledge-Based Systems 260 (2023) .
相关文章:
用于可穿戴传感器的人类活动识别、健康监测和行为建模的大型语言模型
这篇论文题为《用于可穿戴传感器的人类活动识别、健康监测和行为建模的大型语言模型:早期趋势、数据集和挑战的综述》,由埃米利奥费拉拉(Emilio Ferrara)撰写。论文主要内容如下: 摘要 可穿戴技术的普及使得传感器数…...
react事件绑定
react基础事件绑定 function passwordChange(e){console.log(e.target.value); } function usernameChange(e){console.log(e.target.value); }function App() {return (<div><input type"text" placeholder请输入用户名onChange{usernameChange}/><i…...
spring框架之AOP注解方式(java代码实例)
目录 半注解形式: 业务层接口实现类: 编写切面类: 在配置文件里面唯一需要加的: 测试类: 全注解形式: 不要配置文件,改为配置类: 同样的业务层接口实现类: 同样的…...
windows下gcc编译C、C++程序 MinGW编译器
文章目录 1、概要2、MinGW安装2.1 编译器下载2.2 编译器安装2.3 设置环境变量2.4 查看gcc版本信息 3、编译C、C程序3.1 编写Hello World.c3.2 编译C程序3.3 运行程序3.4 编译C程序 1、概要 GCC原名为GNU C语言编译器(GNU C Compiler),只能处…...
uniapp启动图延时效果,启动图的配置
今天阐述uniapp开发中给启动图做延迟效果,不然启动图太快了,一闪就过去了; 一:修改配置文件:manifest.json "app-plus" : {"splashscreen" : {"alwaysShowBeforeRender" : false,"…...
SQL,python,knime将数据混合的文字数字拆出来,合并计算(学习笔记)
将下面将数据混合的文字数字拆出来,合并计算 一、SQL解决: ---创建表插入数据 CREATE TABLE original_data (id INT AUTO_INCREMENT PRIMARY KEY,city VARCHAR(255),value DECIMAL(10, 2) );INSERT INTO original_data (city, value) VALUES (上海0.5…...
【算法】LRU缓存
难度:中等 题目: 请你设计并实现一个满足 LRU (最近最少使用) 缓存 约束的数据结构。 实现 LRUCache 类: LRUCache(int capacity) 以 正整数 作为容量 capacity 初始化 LRU 缓存int get(int key) 如果关键字 key 存在于缓存中,…...
解决elementUI列表的疑难杂症,排序显示错乱的问题
大家好,在使用elementUI表格时,有时会出现一些意料之外的问题,比如数据排序正常但表格显示、排序错乱等。在网上搜索后一般有2种解决方法:1.给表格每一项的el-table-column添加唯一的id用于区分。2.给表格每一项的el-table-column…...
重大消息:手机车机互联投屏专题发布-千里马带你学框架
背景: android投屏的使用场景以前在新能源车机还没火爆时候,大部分停留在手机小屏幕投屏到大屏幕的情况及整个多端设备的互动,整体需求和技术发展其实也就是比较有限,但是新能源车机火爆后,那么这种手机和车机互联互动…...
jail子系统里升级Ubuntu focal到jammy
Ubuntu focal是20.04 ,jammy版本是22.04,本次的目的就是将FreeBSD jail子系统里的Ubuntu 从20.04升级到22.04 。这个focal 子系统是通过cbsd克隆得到的。使用CBSD克隆复制Ubuntu jail子系统环境-CSDN博客 do-release-upgrade升级没成功,用de…...
2024年7月20日(星期六)骑行支里山
2024年7月20日 (星期六)骑行支里山,早8:00到8:30,大观公园门口集合,9:00准时出发【因迟到者,骑行速度快者,可自行追赶偶遇。】 偶遇地点:大观公园门口集合 ,家住东,南,北…...
Python:正则表达式相关整理
最近因为一些原因频繁使用正则表达式,因为以前系统整理过关于正则表达式的相关知识,所以这里仅记录使用期间遇到的问题。 本文内容基于re包 1. match和search方法的区别 在Python中,re.search和re.match都是用于匹配字符串的正则表达式函数&a…...
ChatGPT对话:有关花卉数据集
【编者按】编者准备研究基于深度学习的花卉识别,首先需要花卉数据集。 后续,编者不断会记录研究花卉识别过程中的技术知识,敬请围观 1问:推荐一下用于深度学习的花卉数据集 ChatGPT 以下是一些用于深度学习的优秀花卉数据集&am…...
特征向量及算法
数据挖掘流程 加载数据 把需要的模型数据先计算出来 特征工程 提取数据特征,对特征数据进行清洗转化 数据的筛选和清洗数据转化 类型转为 性别 男,女 ----> 1,0特征交叉 性别/职业/收入 —> 新特这 优质男性程序员 将多个特征值组合在一起特征筛选…...
cpp 强制转换
一、static_cast static_cast 是 C 中的一个类型转换操作符,用于在类的层次结构中进行安全的向上转换(从派生类到基类)或进行不需要运行时类型检查的转换。它主要用于基本数据类型之间的转换、对象指针或引用的向上转换(即从派生…...
MySQL字符串魔法:拼接、截取、替换与定位的艺术
在数据的世界里,MySQL作为一把强大的数据处理利剑,其字符串处理功能犹如魔术师手中的魔法棒,让数据变换自如。今天,我们就来一场关于MySQL字符串拼接、截取、替换以及查找位置的奇幻之旅,揭开这些操作的神秘面纱。 介绍…...
在 Windows 上开发.NET MAUI 应用_1.安装开发环境
开发跨平台的本机 .NET Multi-platform App UI (.NET MAUI) 应用需要 Visual Studio 2022 17.8 或更高版本,或者具有 .NET MAUI 扩展的最新 Visual Studio Code。要开始在 Windows 上开发本机跨平台 .NET MAUI 应用,请按照安装步骤安装 Visual Studio 20…...
深度学习驱动智能超材料设计与应用
在深度学习与超材料融合的背景下,不仅提高了设计的效率和质量,还为实现定制化和精准化的治疗提供了可能,展现了在材料科学领域的巨大潜力。深度学习可以帮助实现超材料结构参数的优化、电磁响应的预测、拓扑结构的自动设计、相位的预测及结构…...
Netty UDP
Netty在UDP(用户数据报协议,User Datagram Protocol)通信中的应用非常广泛,特别是在对实时性要求较高、对数据准确性要求相对较低的场景中,如视频传输、语音通信等。以下是对Netty在UDP通信中的详细解析: …...
Spring Framework各种jar包官网下载2024年最新下载官方渠道。
Spring其实就是一个大家族,它包含了Spring Framework,Spring Boot等一系列技术,它其实就是由许许多多的jar包构成,我们要使用Spring的框架,就要去下载支持这个框架的jar包即可。 1.官网下载Spring Framework的jar包 官…...
UE5 学习系列(二)用户操作界面及介绍
这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…...
linux之kylin系统nginx的安装
一、nginx的作用 1.可做高性能的web服务器 直接处理静态资源(HTML/CSS/图片等),响应速度远超传统服务器类似apache支持高并发连接 2.反向代理服务器 隐藏后端服务器IP地址,提高安全性 3.负载均衡服务器 支持多种策略分发流量…...
在HarmonyOS ArkTS ArkUI-X 5.0及以上版本中,手势开发全攻略:
在 HarmonyOS 应用开发中,手势交互是连接用户与设备的核心纽带。ArkTS 框架提供了丰富的手势处理能力,既支持点击、长按、拖拽等基础单一手势的精细控制,也能通过多种绑定策略解决父子组件的手势竞争问题。本文将结合官方开发文档,…...
多场景 OkHttpClient 管理器 - Android 网络通信解决方案
下面是一个完整的 Android 实现,展示如何创建和管理多个 OkHttpClient 实例,分别用于长连接、普通 HTTP 请求和文件下载场景。 <?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"http://schemas…...
visual studio 2022更改主题为深色
visual studio 2022更改主题为深色 点击visual studio 上方的 工具-> 选项 在选项窗口中,选择 环境 -> 常规 ,将其中的颜色主题改成深色 点击确定,更改完成...
AtCoder 第409场初级竞赛 A~E题解
A Conflict 【题目链接】 原题链接:A - Conflict 【考点】 枚举 【题目大意】 找到是否有两人都想要的物品。 【解析】 遍历两端字符串,只有在同时为 o 时输出 Yes 并结束程序,否则输出 No。 【难度】 GESP三级 【代码参考】 #i…...
【算法训练营Day07】字符串part1
文章目录 反转字符串反转字符串II替换数字 反转字符串 题目链接:344. 反转字符串 双指针法,两个指针的元素直接调转即可 class Solution {public void reverseString(char[] s) {int head 0;int end s.length - 1;while(head < end) {char temp …...
RNN避坑指南:从数学推导到LSTM/GRU工业级部署实战流程
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。 本文全面剖析RNN核心原理,深入讲解梯度消失/爆炸问题,并通过LSTM/GRU结构实现解决方案,提供时间序列预测和文本生成…...
视觉slam十四讲实践部分记录——ch2、ch3
ch2 一、使用g++编译.cpp为可执行文件并运行(P30) g++ helloSLAM.cpp ./a.out运行 二、使用cmake编译 mkdir build cd build cmake .. makeCMakeCache.txt 文件仍然指向旧的目录。这表明在源代码目录中可能还存在旧的 CMakeCache.txt 文件,或者在构建过程中仍然引用了旧的路…...
在Mathematica中实现Newton-Raphson迭代的收敛时间算法(一般三次多项式)
考察一般的三次多项式,以r为参数: p[z_, r_] : z^3 (r - 1) z - r; roots[r_] : z /. Solve[p[z, r] 0, z]; 此多项式的根为: 尽管看起来这个多项式是特殊的,其实一般的三次多项式都是可以通过线性变换化为这个形式…...
