用于可穿戴传感器的人类活动识别、健康监测和行为建模的大型语言模型
这篇论文题为《用于可穿戴传感器的人类活动识别、健康监测和行为建模的大型语言模型:早期趋势、数据集和挑战的综述》,由埃米利奥·费拉拉(Emilio Ferrara)撰写。论文主要内容如下:
摘要
可穿戴技术的普及使得传感器数据的大量生成成为可能,为健康监测、活动识别和个性化医疗的进步提供了重要机会。然而,这些数据的复杂性和规模也带来了建模和分析的巨大挑战,从时间序列建模到深度学习技术,各种方法相继应用。最新的前沿是采用大型语言模型(LLMs),如GPT-4和Llama,用于通过可穿戴传感器数据分析、建模、理解和生成人类行为。这篇综述探讨了将LLMs应用于基于传感器的人类活动识别和行为建模的当前趋势和挑战。
引言
可穿戴传感器的快速发展带来了大量数据,使我们能够前所未有地监测和理解人类行为和健康。尽管可穿戴传感器数据的规模和复杂性增加了数据建模和分析的难度,LLMs如GPT-4和Llama展示了在数据分析中的强大能力,为从可穿戴传感器数据中提取有意义的见解提供了新的可能性。
可穿戴传感器数据
可穿戴传感器种类繁多,主要包括:
- 生理传感器:监测心率、血压等生命体征。
- 运动传感器:加速度计、陀螺仪等,用于追踪运动和定位。
- 环境传感器:监测温度、湿度等环境条件。
- 生化传感器:测量葡萄糖等生化指标。
- 多传感器系统:集成多种传感器,提供全面的监测能力。
这些传感器产生的高维、连续时间序列数据需要专门的预处理和分析技术。以下是表1中提到的参考文献详细信息:
可穿戴传感器类型
| 传感器类型 | 描述 | 参考文献 |
|---|---|---|
| 生理传感器 | 监测生命体征和其他生理参数。例子包括心率监测仪、心电图(ECG)、血压监测仪和脉搏血氧仪。 | [34] |
| 运动传感器 | 包括加速度计、陀螺仪和磁力计,用于追踪运动和定位。应用于活动识别和体育科学中至关重要。 | [24] |
| 环境传感器 | 检测环境条件,如温度、湿度和光线。通常集成到可穿戴设备中,以提供上下文感知服务。 | [9] |
| 生化传感器 | 测量生化标志物,如葡萄糖水平、乳酸和电解质。在医学诊断和持续健康监测中非常有价值。 | [11] |
| 多传感器系统 | 将多种传感器类型集成到一个设备中,以提供全面的监测能力。例子包括智能手表和健身追踪器。 | [17] |
数据类型
| 数据类型 | 描述 | 参考文献 |
|---|---|---|
| 时间序列数据 | 大多数可穿戴传感器会产生连续的时间序列数据,捕捉随时间变化的动态。这类数据需要专门的预处理、分割和特征提取技术来进行有效分析。 | [18] |
| 多模态数据 | 可穿戴设备通常通过结合不同类型传感器的输入来生成多模态数据。例如,一块智能手表可能同时收集运动和生理数据。整合和同步这些数据流是准确分析的关键任务。 | [17] |
| 高维数据 | 可穿戴传感器生成的原始数据可能是高维的,特别是在使用多个传感器时。降维技术,如主成分分析(PCA)和特征选择方法,被用来管理这种复杂性。 | [29] |
| 噪声和不完整数据 | 可穿戴传感器由于传感器故障、用户移动和环境干扰等各种因素,容易产生噪声和不完整的数据。有效的数据清理和插补方法对于保持数据质量至关重要。 | [1] |
大型语言模型(LLMs)
LLMs如GPT-4和Llama在自然语言处理领域取得了巨大成功,现已开始应用于可穿戴传感器数据分析。它们能够处理多模态数据,包括文本、音频和传感器信号,提供更全面的数据理解。
现状和挑战
LLMs在处理复杂查询和生成有见地的响应方面表现出色,使其成为需要高水平推理和上下文理解任务的理想工具。然而,挑战依然存在,包括数据质量、计算需求、可解释性和隐私问题。未来的研究方向应包括改进预处理技术、开发更高效和可扩展的模型以及加强跨学科合作。
总结
综述提供了可穿戴传感器数据与LLMs交叉领域的全面概览,探讨了当前的状态和未来前景。通过案例研究和成功应用,强调了LLMs在增强可穿戴传感器数据分析和解释方面的潜力。
方法与贡献
- 现有方法综述:分析了传统机器学习和深度学习在可穿戴传感器数据分析中的应用及其局限性。
- LLMs的应用前景:讨论了LLMs在处理和分析多模态数据方面的优势,尤其是其在处理复杂、异构数据方面的能力。
- 挑战与建议:提出了数据质量、计算要求、模型可解释性和隐私保护等方面的挑战,并提供了相应的建议和未来研究方向。
结论
LLMs为可穿戴传感器数据分析提供了新的机遇,通过改进数据预处理技术、开发更高效的模型、加强跨学科合作,可以进一步提升其应用效果。
这篇论文通过全面综述当前的研究进展,提出了未来研究的潜在方向,强调了LLMs在可穿戴传感器数据分析中的重要性和潜力。
传感器数据集参考文献:
- [9] Zachary Englhardt, Chengqian Ma, Margaret E Morris, Chun-Cheng Chang, Xuhai “Orson” Xu, Lianhui Qin, Daniel McDuff, Xin Liu, Shwetak Patel, and Vikram Iyer. 2024. From Classification to Clinical Insights: Towards Analyzing and Reasoning About Mobile and Behavioral Health Data With Large Language Models. Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies 8, 2 (2024), 1–25【17:9†source】.
- [11] Cathy Mengying Fang, Valdemar Danry, Nathan Whitmore, Andria Bao, Andrew Hutchison, Cayden Pierce, and Pattie Maes. 2024. PhysioLLM: Supporting Personalized Health Insights with Wearables and Large Language Models. arXiv preprint arXiv:2406.19283 (2024)【17:3†source】.
- [17] Sheikh Asif Imran, Mohammad Nur Hossain Khan, Subrata Biswas, and Bashima Islam. 2024. LLaSA: Large Multimodal Agent for Human Activity Analysis Through Wearable Sensors. arXiv preprint arXiv:2406.14498 (2024)【17:4†source】.
- [24] Jamie McQuire, Paul Watson, Nick Wright, Hugo Hiden, and Michael Catt. 2023. A Data Efficient Vision Transformer for Robust Human Activity Recognition from the Spectrograms of Wearable Sensor Data. In 2023 IEEE Statistical Signal Processing Workshop (SSP). IEEE, 364–368【17:6†source】.
- [34] Huaijun Wang, Jing Zhao, Junhuai Li, Ling Tian, Pengjia Tu, Ting Cao, Yang An, Kan Wang, and Shancang Li. 2020. Wearable Sensor-Based Human Activity Recognition Using Hybrid Deep Learning Techniques. Security and communication Networks 2020, 1 (2020), 2132138【17:7†source】.
- [1] Fayez Alharbi, Lahcen Ouarbya, and Jamie A Ward. 2022. Comparing sampling strategies for tackling imbalanced data in human activity recognition. Sensors 22, 4 (2022), 1373 .
- [17] Sheikh Asif Imran, Mohammad Nur Hossain Khan, Subrata Biswas, and Bashima Islam. 2024. LLaSA: Large Multimodal Agent for Human Activity Analysis Through Wearable Sensors. arXiv preprint arXiv:2406.14498 (2024) .
- [18] Sijie Ji, Xinzhe Zheng, and Chenshu Wu. 2024. HARGPT: Are LLMs Zero-Shot Human Activity Recognizers? arXiv preprint arXiv:2403.02727 (2024) .
- [29] Sungho Suh, Vitor Fortes Rey, and Paul Lukowicz. 2023. Tasked: transformer-based adversarial learning for human activity recognition using wearable sensors via self-knowledge distillation. Knowledge-Based Systems 260 (2023) .
相关文章:
用于可穿戴传感器的人类活动识别、健康监测和行为建模的大型语言模型
这篇论文题为《用于可穿戴传感器的人类活动识别、健康监测和行为建模的大型语言模型:早期趋势、数据集和挑战的综述》,由埃米利奥费拉拉(Emilio Ferrara)撰写。论文主要内容如下: 摘要 可穿戴技术的普及使得传感器数…...
react事件绑定
react基础事件绑定 function passwordChange(e){console.log(e.target.value); } function usernameChange(e){console.log(e.target.value); }function App() {return (<div><input type"text" placeholder请输入用户名onChange{usernameChange}/><i…...
spring框架之AOP注解方式(java代码实例)
目录 半注解形式: 业务层接口实现类: 编写切面类: 在配置文件里面唯一需要加的: 测试类: 全注解形式: 不要配置文件,改为配置类: 同样的业务层接口实现类: 同样的…...
windows下gcc编译C、C++程序 MinGW编译器
文章目录 1、概要2、MinGW安装2.1 编译器下载2.2 编译器安装2.3 设置环境变量2.4 查看gcc版本信息 3、编译C、C程序3.1 编写Hello World.c3.2 编译C程序3.3 运行程序3.4 编译C程序 1、概要 GCC原名为GNU C语言编译器(GNU C Compiler),只能处…...
uniapp启动图延时效果,启动图的配置
今天阐述uniapp开发中给启动图做延迟效果,不然启动图太快了,一闪就过去了; 一:修改配置文件:manifest.json "app-plus" : {"splashscreen" : {"alwaysShowBeforeRender" : false,"…...
SQL,python,knime将数据混合的文字数字拆出来,合并计算(学习笔记)
将下面将数据混合的文字数字拆出来,合并计算 一、SQL解决: ---创建表插入数据 CREATE TABLE original_data (id INT AUTO_INCREMENT PRIMARY KEY,city VARCHAR(255),value DECIMAL(10, 2) );INSERT INTO original_data (city, value) VALUES (上海0.5…...
【算法】LRU缓存
难度:中等 题目: 请你设计并实现一个满足 LRU (最近最少使用) 缓存 约束的数据结构。 实现 LRUCache 类: LRUCache(int capacity) 以 正整数 作为容量 capacity 初始化 LRU 缓存int get(int key) 如果关键字 key 存在于缓存中,…...
解决elementUI列表的疑难杂症,排序显示错乱的问题
大家好,在使用elementUI表格时,有时会出现一些意料之外的问题,比如数据排序正常但表格显示、排序错乱等。在网上搜索后一般有2种解决方法:1.给表格每一项的el-table-column添加唯一的id用于区分。2.给表格每一项的el-table-column…...
重大消息:手机车机互联投屏专题发布-千里马带你学框架
背景: android投屏的使用场景以前在新能源车机还没火爆时候,大部分停留在手机小屏幕投屏到大屏幕的情况及整个多端设备的互动,整体需求和技术发展其实也就是比较有限,但是新能源车机火爆后,那么这种手机和车机互联互动…...
jail子系统里升级Ubuntu focal到jammy
Ubuntu focal是20.04 ,jammy版本是22.04,本次的目的就是将FreeBSD jail子系统里的Ubuntu 从20.04升级到22.04 。这个focal 子系统是通过cbsd克隆得到的。使用CBSD克隆复制Ubuntu jail子系统环境-CSDN博客 do-release-upgrade升级没成功,用de…...
2024年7月20日(星期六)骑行支里山
2024年7月20日 (星期六)骑行支里山,早8:00到8:30,大观公园门口集合,9:00准时出发【因迟到者,骑行速度快者,可自行追赶偶遇。】 偶遇地点:大观公园门口集合 ,家住东,南,北…...
Python:正则表达式相关整理
最近因为一些原因频繁使用正则表达式,因为以前系统整理过关于正则表达式的相关知识,所以这里仅记录使用期间遇到的问题。 本文内容基于re包 1. match和search方法的区别 在Python中,re.search和re.match都是用于匹配字符串的正则表达式函数&a…...
ChatGPT对话:有关花卉数据集
【编者按】编者准备研究基于深度学习的花卉识别,首先需要花卉数据集。 后续,编者不断会记录研究花卉识别过程中的技术知识,敬请围观 1问:推荐一下用于深度学习的花卉数据集 ChatGPT 以下是一些用于深度学习的优秀花卉数据集&am…...
特征向量及算法
数据挖掘流程 加载数据 把需要的模型数据先计算出来 特征工程 提取数据特征,对特征数据进行清洗转化 数据的筛选和清洗数据转化 类型转为 性别 男,女 ----> 1,0特征交叉 性别/职业/收入 —> 新特这 优质男性程序员 将多个特征值组合在一起特征筛选…...
cpp 强制转换
一、static_cast static_cast 是 C 中的一个类型转换操作符,用于在类的层次结构中进行安全的向上转换(从派生类到基类)或进行不需要运行时类型检查的转换。它主要用于基本数据类型之间的转换、对象指针或引用的向上转换(即从派生…...
MySQL字符串魔法:拼接、截取、替换与定位的艺术
在数据的世界里,MySQL作为一把强大的数据处理利剑,其字符串处理功能犹如魔术师手中的魔法棒,让数据变换自如。今天,我们就来一场关于MySQL字符串拼接、截取、替换以及查找位置的奇幻之旅,揭开这些操作的神秘面纱。 介绍…...
在 Windows 上开发.NET MAUI 应用_1.安装开发环境
开发跨平台的本机 .NET Multi-platform App UI (.NET MAUI) 应用需要 Visual Studio 2022 17.8 或更高版本,或者具有 .NET MAUI 扩展的最新 Visual Studio Code。要开始在 Windows 上开发本机跨平台 .NET MAUI 应用,请按照安装步骤安装 Visual Studio 20…...
深度学习驱动智能超材料设计与应用
在深度学习与超材料融合的背景下,不仅提高了设计的效率和质量,还为实现定制化和精准化的治疗提供了可能,展现了在材料科学领域的巨大潜力。深度学习可以帮助实现超材料结构参数的优化、电磁响应的预测、拓扑结构的自动设计、相位的预测及结构…...
Netty UDP
Netty在UDP(用户数据报协议,User Datagram Protocol)通信中的应用非常广泛,特别是在对实时性要求较高、对数据准确性要求相对较低的场景中,如视频传输、语音通信等。以下是对Netty在UDP通信中的详细解析: …...
Spring Framework各种jar包官网下载2024年最新下载官方渠道。
Spring其实就是一个大家族,它包含了Spring Framework,Spring Boot等一系列技术,它其实就是由许许多多的jar包构成,我们要使用Spring的框架,就要去下载支持这个框架的jar包即可。 1.官网下载Spring Framework的jar包 官…...
DeepSeek-Coder-V2:如何用开源代码智能模型解决企业级开发痛点?
DeepSeek-Coder-V2:如何用开源代码智能模型解决企业级开发痛点? 【免费下载链接】DeepSeek-Coder-V2 DeepSeek-Coder-V2: Breaking the Barrier of Closed-Source Models in Code Intelligence 项目地址: https://gitcode.com/GitHub_Trending/de/Deep…...
保姆级教程:在K8s集群上部署Triton Inference Server服务(含TensorRT加速配置)
生产级K8s集群部署Triton Inference Server全流程指南 在AI模型工业化落地的浪潮中,如何将训练好的模型高效、稳定地部署到生产环境,成为众多技术团队面临的共同挑战。本文将聚焦Kubernetes集群环境,详细拆解NVIDIA Triton Inference Server…...
chatgpt-mirai-qq-bot内存持久化:文件和Redis存储方案对比
chatgpt-mirai-qq-bot内存持久化:文件和Redis存储方案对比 你是否在为聊天机器人的记忆管理而烦恼?在多轮对话中,如何确保机器人能够记住上下文,同时保证数据的安全性和性能?chatgpt-mirai-qq-bot提供了两种内存持久化…...
ODT怎么转PDF?2026年实测5种转换方法与在线工具对比
ODT(OpenDocument Text)是开源办公软件默认的文档格式,但在实际工作和分享中,PDF的通用性和防篡改特性让它成为更优选择。很多人拿到ODT文件后都会面临同一个问题:怎样才能快速转成PDF?本文将从多个角度展示…...
Steam Economy Enhancer:终极Steam市场与库存自动化管理指南
Steam Economy Enhancer:终极Steam市场与库存自动化管理指南 【免费下载链接】Steam-Economy-Enhancer 中文版:Enhances the Steam Inventory and Steam Market. 项目地址: https://gitcode.com/gh_mirrors/ste/Steam-Economy-Enhancer Steam Eco…...
扁平化AI绘图黄金公式:sref 1280+--stylize 600+--v 6.2,为什么92%用户漏掉关键权重锚点?
更多请点击: https://codechina.net 第一章:扁平化AI绘图黄金公式的认知革命 传统AI绘图依赖复杂提示工程与多层参数调优,而“扁平化AI绘图黄金公式”颠覆了这一范式——它将生成逻辑压缩为三个可解释、可复用、可验证的核心要素:…...
暗黑3终极自动化助手:D3KeyHelper图形化宏工具完全指南
暗黑3终极自动化助手:D3KeyHelper图形化宏工具完全指南 【免费下载链接】D3keyHelper D3KeyHelper是一个有图形界面,可自定义配置的暗黑3鼠标宏工具。 项目地址: https://gitcode.com/gh_mirrors/d3/D3keyHelper 还在为暗黑破坏神3中频繁按键导致…...
Downkyi完全指南:三步掌握B站视频下载的10个高效技巧
Downkyi完全指南:三步掌握B站视频下载的10个高效技巧 【免费下载链接】downkyi 哔哩下载姬downkyi,哔哩哔哩网站视频下载工具,支持批量下载,支持8K、HDR、杜比视界,提供工具箱(音视频提取、去水印等&#x…...
Tenstorrent:基于RISC-V的异构计算架构如何挑战AI芯片市场
1. 项目概述:Tenstorrent的野心与Jim Keller的蓝图在芯片设计的江湖里,Jim Keller这个名字本身就代表着一种传奇。从AMD的K7、K8架构,到苹果A系列、M1芯片的奠基,再到特斯拉的自动驾驶芯片,他参与的每一个项目都深刻影…...
InterSystems IntelliCare 成为首个获得欧盟医疗器械法规认证的 AI 原生EHR系统
监管里程碑重申了 InterSystems 作为企业级 AI 应用领先提供商的地位 中国 北京 为全球超过 10 亿份健康记录提供支持的创新数据技术提供商 InterSystems今日宣布,其电子健康记录(EHR)解决方案已根据 《欧盟法规 (EU) 2017/745》ÿ…...
