当前位置: 首页 > article >正文

为人工智能驱动的交通研究增强路面传感器数据采集

论文标题

英文标题:Enhancing Pavement Sensor Data Harvesting for AI-Driven Transportation Studies
中文标题:为人工智能驱动的交通研究增强路面传感器数据采集

作者信息

  • Manish Kumar Krishne Gowda
    Purdue University,
    465 Northwestern Avenue, West Lafayette, IN 47907
    Email: mkrishne@purdue.edu

  • Andrew Balmos
    Purdue University,
    465 Northwestern Avenue, West Lafayette, IN 47907
    Email: abalmos@purdue.edu

  • Shin Boonam
    Indiana Department of Transportation,
    1205 Montgomery Street, West Lafayette, IN 47906
    Email: BShin@indot.IN.gov

  • James V. Krogmeier
    Purdue University,
    465 Northwestern Avenue, West Lafayette, IN 47907
    Email: jvk@purdue.edu

论文出处

  • 提交日期:2024年8月1日

  • 总字数:6879字(包括摘要、正文和参考文献)


摘要

本文提出了综合的交通传感器数据管理指南,涵盖静态存档数据和实时数据流。通过部署开源的“Avena”软件平台和NATS消息系统作为安全通信代理,确保了可靠的数据交换。同时,利用TimescaleDB等强大的数据库进行有组织的存储,并通过Grafana等可视化平台提供实时监控能力。对于静态数据,提出了结合云存储和关系数据库的标准,以高效处理非结构化和海量数据集。通过FME等云数据传输工具,实现了从本地存储到云端的高效迁移。此外,将强大的可视化工具集成到框架中,有助于从复杂数据集中提取模式和趋势。这些提案通过INDOT的实际案例研究进行了验证,展示了其在研究项目中的有效性。


引言

交通研究旨在探索网络设计、评估路面材料在不同负载和天气条件下的行为、优化交通工程的关键要素等。这些研究的目标是提高交通系统的整体质量,确保公共安全。为此,研究人员在交通网络中部署了大量传感器,这些传感器持续提供交通动态和路面状况的信息,生成了大量需要有效管理的数据。然而,管理如此庞大且多样化的数据集是一个重大挑战,因为数据量大、需要密集的清理和预处理以减少错误和不一致性。因此,需要有效的工具和技术来处理和分析数据,最好是在实时和集中信息数据库中进行。这样的策略可以帮助更好地组织数据,推导出潜在的模式和关系,应用数据抽象技术,并据此做出基于证据的决策,从而促进可持续交通基础设施的长期发展。


动机与范围

全球每年进行的交通研究项目众多,许多项目涉及研究人员和工程师前往现场进行实验、长时间物理监控传感器,并手动将收集的数据传输回中央位置进行分析。这种方法存在多个缺点,包括劳动密集型的实验监控和数据后处理、数据丢失或错误、延迟处理和实验反馈延迟等。这些问题可以通过自动化的实时监控和中央数据存储位置的早期检测来避免。实时数据可视化工具可以提供即时的路面健康洞察和更深入的情境感知,减少后处理工作量。因此,需要一个全面的实时数据监控和交付系统。


方法论

本文首先提出了静态数据库管理的操作标准和实时数据管理的系统架构,并通过INDOT的两个项目展示了这些指南的实际应用。

静态数据管理指南

静态数据管理指南包括以下几个关键组成部分:

  1. 数据源:静态数据源是已知大小和固定容量的,通常保存在本地存储介质中,如硬盘和存储盘,或原始在线存储库中。本地存储不仅限制了数据的可访问性和协作能力,还增加了因硬件故障导致数据丢失的风险。将这些静态数据源纳入强大的在线框架可以受益于多种基于网络的数据分析工具,并减少与内部数据管理相关的安全风险。

  2. 云数据传输工具:高效可靠的数据传输工具对于传感器数据迁移到在线领域至关重要。这些工具必须兼容不同大小和格式的数据文件,并支持自动化调度,以减少手动干预。错误检测和日志功能可以防止数据传输过程中的网络问题导致的数据损坏或退化。虽然Python等脚本语言可以通过广泛的API兼容性实现定制化的高效数据传输,但需要掌握语言特定的语法和语义,这可能会限制研究社区对框架的适应性。

  3. 数据库:将大量传感器数据托管在云存储上可以显著增强数据处理和资源管理能力。为了协助对广泛数据集进行全面分析,研究人员需要对数据的范围和范围有一个基本的了解。这种对传感器数据集的执行摘要可以帮助研究人员更好地规划和策略化对研究数据的全面深入分析。此外,对遥测数据的简洁概述可以帮助研究人员进行数据质量评估、初步错误检测、识别差距和不规则性以及假设形成,从而促进资源优化。

  4. 可视化工具:静态传感器数据建模的可视化工具的一般特征与实时数据可视化工具相似。然而,传感器数据的性质可能决定了在静态数据库上下文中进行视觉分析的工具选择。例如,具有高粒度的数据可能需要支持平滑函数或插值方法的工具来减少噪声,而对于极大数据集,可视化工具必须使用下采样或交互式过滤等技术有效地处理规模。

静态数据案例研究

本文将静态数据管理指南应用于两个由Purdue-INDOT联合研究团队维护的数据库。第一个数据库包含I-69高速公路部分路段的路面传感器数据,第二个数据库包含INDOT研究部门的加速路面测试(APT)的历史记录。

  • I-69数据库:包含压力传感器和应变计数据,存储在MATLAB兼容文件中。研究人员开发了一个MATLAB应用程序来检查和可视化数据,但该程序在处理大数据集时响应缓慢,且难以进行跨实验比较分析。为了解决这些问题,研究人员将压力传感器和应变计的峰值和谷值坐标捕获到一个表格格式中,并将关键数据(如文件名、测试段ID、传感器ID等)以结构化表格格式存储。这种格式整合了相关信息,使研究人员能够跨不同文件进行传感器数据的交叉分析。

  • APT数据库:包含来自不同类别传感器的读数,用于研究路面性能。数据格式化包括对沥青激光轮廓数据、沥青预交通激光轮廓数据、沥青传感器数据、沥青静态载荷数据、混凝土激光轮廓数据、混凝土预交通激光轮廓数据和FWD相关传感器数据的处理。这些数据通过Python语言进行格式化,并使用Safe的FME软件作为数据传输工具上传到Oracle数据库。

实时数据管理架构

实时数据管理架构包括以下几个关键组成部分:

  1. 数据源:指生成传感器数据的系统,使分析和研究成为可能。多种传感器被部署用于交通研究,包括土压力传感器、应变计、摄像头、湿度传感器、空气质量传感器和激光轮廓传感器。数据采集系统(DAQ)主动监控这些传感器,采样并收集传感器数据。

  2. 数据接口:指在DAQ上托管的软件应用程序,促进传感器数据在DAQ和NATS消息系统之间的传输。NATS是一个安全、轻量级的消息服务,设计用于创建多节点分布式平台、云原生应用程序和物联网解决方案。NATS作为发布-订阅模型中的消息代理,避免了系统中的冗余数据交换。

  3. 数据库:在端到端系统中集成强大的数据库,提供有组织和高效的存储解决方案,并允许研究人员在安全、易于访问的存储库中方便地访问数据。理想的数据库候选者应能够管理高速时间关键型传感器数据,适应更多传感器、更大数据集、处理大规模查询,并支持通知和警报功能。

  4. 可视化平台:与所选数据库无缝集成的数据表示和可视化工具对于实时监控传感器测量值至关重要。这些工具使研究人员能够对传感器数据进行初步评估,并评估模式和趋势是否符合预期行为。

实时数据案例研究

实时数据管理架构在I-65高速公路的两个实验现场进行了集成,展示了概念设计的功能方面。实验中使用了土壤压缩传感器、土压力传感器和土壤湿度温度传感器,用于评估交通负载分布、监测建筑材料的结构稳定性、评估路面组件对天气变化的响应等。Campbell Scientific DAQ系统用于采样和监控嵌入式传感器,并通过MQTT协议将数据传输到中央服务器。NATS作为消息代理,将DAQ输出的传感器数据流与数据库连接起来。RedPanda Connect软件在中央位置持续运行,接收数据负载并通过TimescaleDB数据库进行存储。Grafana用于从TimescaleDB数据库中查询数据,以实现实时监控和可视化。


结果

实时系统架构无缝集成,为I-65现场试验提供了一个强大的实时数据处理系统。基于Avena框架的案例研究系统实现了低延迟的传感器数据交换,TimescaleDB支持实时数据存储,Grafana实现了有效的数据可视化和实时传感器监控。静态数据管理解决方案为项目数据管理提供了灵活性,如案例研究中包含的项目性质多样化。Oracle等关系数据库在管理大型数据库的关键摘要时保证了ACID属性,而Blob存储解决方案则以低成本或无成本的方式经济地存档了大量未处理的传感器数据。ArcGIS等专业数据可视化工具满足了研究人员的项目特定数据可视化需求。


结论

本文深入分析了从I-65和I-69 Greenfield地区仪器路段的现场测试中收集的传感器数据的最佳管理实践。研究提出了针对大规模历史数据集的管理建议,包括将摘要和指标数据存储在关系数据库中,未处理数据存储在Blob存储中。研究人员更倾向于传感器指标而非原始传感器数据本身,他们通过应用分析方法将数据存储在Oracle等关系数据库中,并在现有的INDOT数据系统中使用。最后,提出了一个完整的端到端系统架构,用于通过远程数据采集系统实时收集嵌入式传感器数据。案例研究系统使用了太阳能供电的Campbell设备,主要用于自动但本地的数据采集。数据管理解决方案利用Avena框架,现代化了实时远程数据采集的设计,并在数据流上启用了边缘计算。因此,传感器可以24/7监控,实时生成有用的指标并推送到集中存储,大大减少了测量与INDOT数据驱动决策之间的延迟。然而,Campbell DAQ硬件的限制促使进一步探索在路边DAQ中引入Avena的可能性,以实现更开放的数据流。系统提案为交通研究中的静态和实时数据管理提供了全面的端到端解决方案。案例研究验证了提案的功能性和有效性,并增强了其操作的信心。该工作将鼓励研究人员在交通研究领域内和跨领域的各种实际项目中采用和整合提案。

相关文章:

为人工智能驱动的交通研究增强路面传感器数据采集

论文标题 英文标题:Enhancing Pavement Sensor Data Harvesting for AI-Driven Transportation Studies 中文标题:为人工智能驱动的交通研究增强路面传感器数据采集 作者信息 Manish Kumar Krishne Gowda Purdue University, 465 Northwestern Avenue,…...

unordered_set和unordered_map的使用

Hello,今天我来为大家介绍一下前几年才刚刚新出的两个容器——unordered_map和unordered_set,这两个容器属于是map系列和set系列中的一种,和map/set不同的是它们的底层,map/set的底层是红黑树,而unordered_map/unorder…...

【实体类】分层设计

【实体类】分层设计 【一】实体类的PO、VO、DO、DAO、BO、DTO、POJO有什么区别【1】PO(Persistent Object)【2】VO(View Object)【3】DO(Domain Object)【4】DAO(Data Access Object&#xff09…...

【无人集群系列---无人机集群编队算法】

【无人集群系列---无人机集群编队算法】 一、核心目标二、主流编队控制方法1. 领航-跟随法(Leader-Follower)2. 虚拟结构法(Virtual Structure)3. 行为法(Behavior-Based)4. 人工势场法(Artific…...

C语言基本知识------指针(4)

1. 回调函数是什么? 回调函数就是⼀个通过函数指针调用的函数。 如果你把函数的指针(地址)作为参数传递给另⼀个函数,当这个指针被⽤来调⽤其所指向的函数 时,被调⽤的函数就是回调函数。 void qsort(void base,//指针…...

深度学习pytorch之19种优化算法(optimizer)解析

提示:有谬误请指正 摘要 本博客详细介绍了多种常见的深度学习优化算法,包括经典的LBFGS 、Rprop 、Adagrad、RMSprop 、Adadelta 、ASGD 、Adamax、Adam、AdamW、NAdam、RAdam以及SparseAdam等,通过对这些算法的公式和参数说明进行详细解析…...

使用 BFS 解决 最短路问题

找往期文章包括但不限于本期文章中不懂的知识点: 个人主页:我要学编程(ಥ_ಥ)-CSDN博客 所属专栏: 优选算法专题 目录 1926.迷宫中离入口最近的出口 433.最小基因变化 127.单词接龙 675.为高尔夫比赛砍树 1926.迷宫中离入口最近的出口 题…...

【嵌入式Linux应用开发基础】网络编程(1):TCP/IP协议栈

目录 一、TCP/IP协议栈分层与核心协议 2.1. 应用层 2.2. 传输层 2.3. 网络层 2.4. 链路层 二、嵌入式Socket编程关键步骤 2.1. TCP服务端流程 2.2. TCP客户端流程 三、TCP/IP协议栈的配置与调试 四、嵌入式场景优化策略 4.1. 资源管理 4.2. 性能调优 4.3. 健壮性保…...

OpenCalib(七)二维码检测

1. 前言 前面无论是对棋盘格标靶还是圆形标靶检测时,一般都需要将所有标靶全部检出,这样才能根据标靶的分布确定每个标靶的相对位置。举个例子,对于5x5分布的棋盘格,如果我们只检出4x4排列的棋盘格,那么它在整个棋盘格中可能存在4种分布,此时我们无法确认检测结果中各个棋…...

DeepSeek在初创企业、教育和数字营销领域应用思考

如今,像 DeepSeek 这样的人工智能工具正在改变企业的运营方式,优化流程并显著提高生产力。通过重复任务的自动化、大量数据的分析以及内容创建效率的提高,组织正在寻找新的竞争和卓越方式。本文介绍了 DeepSeek 如何用于提高三个关键领域的生…...

BUUCTF--[极客大挑战 2019]RCE ME

目录 URL编码取反绕过 异或绕过 异或的代码 flag 借助蚁剑中的插件进行绕过 利用动态链接库 编写恶意c语言代码 进行编译 然后再写一个php文件 将这两个文件上传到/var/tmp下 运行payload 直接看代码 <?php error_reporting(0); if(isset($_GET[code])){$code$_G…...

【K8s】专题十六(2):Kubernetes 包管理工具之 Helm 使用

本文内容均来自个人笔记并重新梳理&#xff0c;如有错误欢迎指正&#xff01; 如果对您有帮助&#xff0c;烦请点赞、关注、转发、订阅专栏&#xff01; 专栏订阅入口 | 精选文章 | Kubernetes | Docker | Linux | 羊毛资源 | 工具推荐 | 往期精彩文章 【Docker】&#xff08;全…...

使用anaconda装虚拟环境

1. 下载好anaconda, 可以参考 笔记 2. 创建虚拟环境 # 创建新环境 # &#xff08;Conda 允许创建任意 Python 版本的环境&#xff0c;与基础环境无关。&#xff09; # 需要指定python版本&#xff0c;不指定就没有 conda create -n xxx_env python3.8 3. 查看有哪些anacond…...

玩转Docker | 使用Docker搭建Vikunja任务管理应用

玩转Docker | 使用Docker搭建Vikunja任务管理应用 前言一、 Vikunja介绍Vikunja 简介主要特点二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署Vikunja服务下载镜像创建容器检查容器状态检查服务端口安全设置四、访问Vikunja应用注册账号访问Vikunja主页五…...

VMware NSX 4.X Professional V2(2V0-41.24)题库2

What are two supported host switch modes? (Choose two.) A. Overlay Datapath B. Secure Datapath C. Standard Datapath D. Enhanced Datapath E. DPDK Datapath 答案&#xff1a;CD 完整题库见文章底部&#xff01; Which is an advantage of an L2 VPN in an NSX 4.x …...

算法-数据结构-图的构建(邻接矩阵表示)

数据定义 //邻接矩阵表示图 //1.无向图是对称的 //2.有权的把a,到b 对应的位置换成权的值/*** 无向图* A B* A 0 1* B 1 0*/ /*** 有向图* A B* A 0 1* B 0 0*/import java.util.ArrayList; import java.util.List;/*** 带权图* A B* A 0 1* B 0 0*/ p…...

ARCGIS国土超级工具集1.4更新说明

ARCGIS国土超级工具集V1.4版本&#xff0c;功能已增加至54 个。本次更新在V1.3版本的基础上&#xff0c;新增了“拓扑问题修复工具”并同时调整了数据处理工具栏的布局、工具操作界面的选择图层下拉框新增可选择位于图层组内的要素图层功能、数据保存路径新增了可选择数据库内的…...

Ollama+Cherrystudio+beg-m3+Deepseek R1 32b部署本地私人知识库(2025年2月win11版)

之前综合网络各方面信息得到的配置表&#xff1a; 在信息爆炸的时代&#xff0c;数据安全和个性化需求愈发凸显。搭建本地私人知识库&#xff0c;不仅能确保数据的安全性&#xff0c;还能根据个人需求进行个性化定制&#xff0c;实现知识的高效管理和利用。随着技术的不断发展…...

Websocket、WebRTC在大模型中的应用

文章目录 WebSocket简介Websocket流程图使用场景代码示例 WebRTC简介WebRTC&#xff08;Web Real-Time Communication&#xff09;流程图使用场景代码示例 大模型应用&#xff0c;使得 WebSocket&#xff0c; WebRTC 的使用频率越来越高&#xff0c;WebSocket提供了文本输入与大…...

C++ 顺序容器--vector容器详解

元素保存在连续的内存空间中。插入元素或者删除元素通常需要线性时间&#xff0c;当这些操作在尾部执行时&#xff0c;实际运行时间为摊还常量时间。随机访问某个元素的复杂度为常量时间。 1 vector 概述 vector 在<vector>头文件中被定义为一个带有2个类型参数的类模板…...

用Golang与WebAssembly构建高性能Web应用:详解`syscall/js`包

用Golang与WebAssembly构建高性能Web应用&#xff1a;详解syscall/js包 引言为什么选择syscall/js包&#xff1f;适用场景 syscall/js包概述syscall/js包的核心概念1. js.Global2. js.Value3. js.Func4. js.Null 和 js.Undefined syscall/js包在WebAssembly中的位置 环境配置与…...

LeetCode刷题 -- 23. 合并 K 个升序链表

小根堆排序与合并 K 个有序链表的实现 1. 介绍 本技术文档详细介绍了如何使用 小根堆&#xff08;Min Heap&#xff09; 实现 K 个有序链表的合并。 核心思想是&#xff1a; 使用 小根堆 维护当前最小的节点。每次取出堆顶元素&#xff08;最小值&#xff09;加入合并链表&…...

【每日八股】计算机网络篇(一):概述

OSI 的 7 层网络模型&#xff1f; OSI&#xff08;Open Systems Interconnection&#xff0c;开放互联系统&#xff09;是由国际标准化组织&#xff08;ISO&#xff09;提出的一种网络通信模型。 自上而下&#xff0c;OSI 可以被分为七层&#xff0c;分别是&#xff1a;应用层…...

业务应用和大数据平台的数据流向

概述 业务应用与大数据平台之间的交互是实现数据驱动决策和实时业务处理的关键环节。其交互方式多样&#xff0c;协议选择取决于数据流向、实时性要求及技术架构。一句话总结&#xff0c;数据流向可以是从业务应用写入大数据平台&#xff0c;也可以是大数据平台回写至业务应用…...

C语言中的文件和文件操作

文件操作 一、文件的打开和关闭二、文件的顺序读写fgetc和fputcfgets和fputsfscanf和fprintfsscanf和sprintffread和fwrite 三、文件的随机读写1.fseek2.ftell3.rewind 四、补充1.文件读取结束的判定2.文件缓冲区 一、文件的打开和关闭 流和标准流 流&#xff1a;想象为流淌着…...

插入排序:一种简单而直观的排序算法

大家好&#xff01;今天我们来聊聊一个简单却非常经典的排序算法——插入排序&#xff08;Insertion Sort&#xff09;。在所有的排序算法中&#xff0c;插入排序是最直观的一个。 一、插入排序的基本思想 插入排序的核心思想是&#xff1a;将一个待排序的元素&#xff0c;插…...

2.24力扣每日一题--设计有序流

1656. 设计有序流 - 力扣&#xff08;LeetCode&#xff09; &#xff08;设计一个可以存储n个字符串的数据结构&#xff0c;其中满足存在一个”指针“&#xff0c;用以展示当下是否还存在空间存储&#xff0c;每个字符串有自己ID需要存储&#xff09; 数据结构&#xff1a; 字…...

本地Oracle数据库复制数据到Apache Hive的Linux服务器集群的分步流程

我们已经有安装Apache Hive的Linux服务器集群&#xff0c;它可以连接到一个Oracle RDS数据库&#xff0c;需要在该Linux服务器上安装配置sqoop&#xff0c;然后将Oracle RDS数据库中所有的表数据复制到Hive。 为了将本地Oracle数据库中的所有表数据复制到Apache Hive Linux服务…...

【R语言】ggplot2绘图常用操作

目录 坐标轴以及标签的相关主题 图例调整 字体类型设置 颜色相关 ggplot2如何添加带箭头的坐标轴&#xff1f; 标题相关主题调整 修改点图中点的大小 如何使得点的大小根据变量取值的大小来改变&#xff1f; 柱状图和条形图 坐标轴以及标签的相关主题 theme( # 增大X…...

正态分布的奇妙性质:为什么奇数阶中心矩(odd central moments)为零?

正态分布的奇妙性质&#xff1a;为什么奇数阶矩为零&#xff1f; 正态分布&#xff08;Normal Distribution&#xff09;是统计学中最常见的分布之一&#xff0c;它的钟形曲线几乎无处不在&#xff0c;从身高体重到测量误差&#xff0c;都能看到它的影子。除了均值和方差这两个…...