当前位置: 首页 > news >正文

智能座舱相关术语全解及多模态交互在智能座舱中的应用

文章目录

  • 座舱相关术语全解
    • 1. 智能座舱
    • 2. UFS
    • 3. 多模态交互
    • 4. 3D虚拟引擎
    • 5. AR/VR
    • 6. GNSS
    • 7. TTS
    • 8. DPU
    • 9. 摄像头
    • 10. 屏幕/显示器
    • 11. 音频
    • 12. 无线连接
    • 13. 其他组件
  • 多模态交互在智能座舱中有以下一些应用

座舱相关术语全解

1. 智能座舱

智能座舱(intelligent cabin)旨在集成多种IT和人工智能技术,打造全新的车内一体化数字平台,为驾驶员提供智能体验,促进行车安全。目前国内外已经有很多研究工作,例如在车辆的AB柱及后视镜安装摄像头,提供情绪识别、年龄检测、遗留物检测、安全带检测等。

2. UFS

  1. 定义
    • UFS闪存是由多个闪存芯片、主控、缓存组成的阵列式存储模块。

在这里插入图片描述

  1. 特点
    • 弥补了eMMC仅支持半双工运行(读写必须分开执行)的缺陷,可实现全双工运行,性能得以翻番。
  2. 分类及标准
    • 目前被细分为UFS 2.0和UFS 2.1,读写速度的强制标准都为HS - G2(High speed GEAR2),可选HS - G3标准。
    • 两套标准都能运行在1Lane(单通道)或2Lane(双通道)模式上,手机读写速度取决于UFS闪存标准、通道数以及处理器对UFS闪存的总线接口支持情况。
  3. 应用及目标
    • 是一种设计用于数码相机、智能电话等消费电子产品使用的闪存存储规范。
    • 设计目标是发展一套统一的快闪存储卡格式,在提供高数据传输速度和稳定性的同时,减少消费者对于市面上各种存储卡格式的混淆和不同存储卡转接器的使用。

3. 多模态交互

  1. 定义
    • 英文是modality,通俗说就是“感官”,多模态即将多种感官融合。Turing OS机器人操作系统将机器人与人的交互模式定义为“多模态交互”,即通过文字、语音、视觉、动作、环境等多种方式进行人机交互,充分模拟人与人之间的交互方式。
  2. 意义
    • 打破了传统PC式的键盘输入和智能手机的点触式交互模式。

4. 3D虚拟引擎

  1. 定义
    • 是将现实中的物质抽象为多边形或者各种曲线等表现形式,在计算机中进行相关计算并输出最终图像的算法实现的集合,就像在计算机内建立一个“真实的世界”。

5. AR/VR

  1. VR
    • 虚拟现实Virtual Reality的英语缩写。VR显示的全是假的,是一种可以创建和体验虚拟世界的计算机仿真系统,利用计算机生成一种模拟环境,是一种多源信息融合的交互式的三维动态视景和实体行为的系统仿真,使用户沉浸到该环境中。
  2. AR
    • 增强现实Augmented Reality的英文缩写。AR显示的画面有一半是真的,一半是假的,是一种实时地计算摄影机影像的位置及角度并加上相应图像的技术,目标是在屏幕上把虚拟世界套在现实世界并进行互动,最早于1990年提出,随着随身电子产品运算能力的提升,用途越来越广。

6. GNSS

  1. 定义
    • 全球导航卫星系统(英文:Global Navigation Satellite System,GNSS),又称全球卫星导航系统。

7. TTS

  1. 定义
    • TTS是Text To Speech的缩写,即“从文本到语音”。它将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语(或者其他官方语言语音)输出的技术,隶属于语音合成(SpeechSynthesis)。

8. DPU

  1. 定义
    • DPU一般指数据处理器。数据处理器(英文名【Data Processing Unit】,简称DPU)是面向以数据为中心的计算的新一代处理器,集完整的数据中心功能于单芯片,和CPU及GPU一起构成新型计算的三大支柱。

9. 摄像头

  1. 分类
    • ADAS Camera:高级驾驶员辅助系统Camera,一般为车前双目摄像头等。
    • AVM Camera:Around View Monitor,全景环视系统。
    • DMS:Driver Monitoring System,监测对象为Driver(驾驶员)。
    • OMS:Occupancy Monitoring System,监测对象为乘客。
    • CMS:Camera - monitor system,电子后视镜。
  2. 相关组件
    • DES(DESerializer,解串器)、SER(SERializer,串行器)、CSI(CMOS Serial Interface)、ISP (Image Signal Processor,即图像处理)、NPU(Neural - network Processing Unit神经网络处理器)

10. 屏幕/显示器

  1. 分类
    • Cluster:汽车仪表群。
    • IVI Display:In - Vehicle Infotainment,车载信息娱乐系统。
    • RSE:Rear seat entertainment,后排座椅娱乐系统。
    • CMS:Camera - monitor system,电子后视镜。
  2. 相关组件
    • DP(display port,显示接口)、DSI(Display Serial Interface,显示串行接口,MIPI接口)

11. 音频

  1. 组成
    • Speaker:喇叭、外放。
  2. 相关组件
    • TDM(Time Division Multiplexing,时分复用)是PCM的一种方式,TDM相比I2S可以传输多channel音频数据。AMP(Amplifier,放大器)、A2B(Automotive Audio Bus)是汽车音频总线的简称,ADI设计研发的标准。

12. 无线连接

  1. 分类
    • BT/WIFI:PCIe接口的模块。
    • GNSS:全球导航卫星系统模块。
    • FM/AM: Tuner(调谐器)

13. 其他组件

  1. 分类
    • ETH:LIDARs(雷达);
    • Vehicle Network:车载网络;
    • PCIe:SSD(固态硬盘,PCIe接口、NVMe协议);
    • IMU:(Inertial Measurement Unit,即惯性测量单元);
    • Codec: 编译码器。指的是数字通信中具有编码、译码功能的器件。

多模态交互在智能座舱中有以下一些应用

  1. 语音 + 视觉:语音交互本身不可见,将其与视觉模态融合,例如通过中控屏幕上的语音虚拟形象或实体机器人的空间方位和状态变化,能让驾驶员更清楚地了解指令所处的状态,增强安全感。如蔚来汽车的 NOMI,在语音交互时能通过屏幕表情给出聆听、开心、点赞等反馈,增加了陪伴感和信任感。
  2. 视觉 + 触觉:例如小鹏 P7 在打开车道辅助时,为减少驾驶员低头看仪表盘的情况,方向盘会通过抖动提示车辆压线;还可通过方向盘物理按键唤醒语音,语音虚拟形象的状态变化显示在中控屏上。
  3. 手势识别:用于多媒体切换、音量控制、接电话、灯光控制等方面。比如岚图追光的手势控制,支持左右、上下和前后 3 种动态手势及 5 种静态手势,包括确认、自拍、接听 / 拒接电话和播放 / 暂停等常用功能,结合四音区语音系统实现语音 + 手势交互。一些车型还能通过 3D TOF 摄像头进行三维手势检测。
  4. 驾驶员监测系统(DMS):利用座舱内摄像头、近红外线等传感器,基于面部特征分析、头部姿态追踪、视线追踪、面部表情和情绪识别、身体姿势追踪和物体侦测等关键技术,实现对驾驶员的身份识别,以及疲劳驾驶、分心驾驶等危险行为的检测功能。例如,主流 DMS 方案采用近红外摄像头拍摄驾驶员眼球运动、面部表情,进行计算和 AI 识别,分析出驾驶员疲劳、分心、危险驾驶等动作信号,以此来提醒驾驶员。3D-TOF 传感器的 DMS 方案则可定位驾驶员眼神,协助 AR-HUD 实现动态校正。此外,DMS 能时刻监控驾驶员状态,满足 L3 决策安全性要求,法规也有标配 DMS 的趋势。
  5. 乘客监测系统(OMS):OMS 是 DMS 系统的延伸,可监测座舱内乘客的状态,比如监测儿童或宠物是否遗留在车内,还能检测人员是否使用安全带。在交互或娱乐方面,也可利用 OMS 摄像头完成手势识别、情绪识别、视频聊天等功能。
  6. 增强现实抬头显示器(AR-HUD):AR-HUD 可将车速、驾驶辅助和导航等信息直接显示在真实道路上,实现这一特性需要通过前视摄像头对前方的路况进行解析建模,得到对象的位置、距离、大小等,再把 HUD 需要显示的信息精准地投影到对应的位置。同时,融合 DMS 的眼神追踪摄像头,可保障画面跟着眼睛实时动态调节,保持动态中的相对静止,减少产生眩晕感,提升 AR-HUD 体验感。
  7. AID 全息投影:借助光学原理投射在空气中,不需要任何介质,用户能从各个角度感受到悬浮在屏幕上的真实效果。它可同仪表、中控屏、视觉感知系统和语音交互系统等多维深度协同,与 DMS 的视线追踪和表情识别、自动驾驶的环境感知等融合,感知驾驶员的心情以及车外环境,通过数字虚拟人进行主动关怀(如音乐电影播放、氛围灯开启)、疲劳提醒、危险预警、天气提醒、节日变装等,建立更深层次的情感交流,带来更多陪伴和乐趣。
  8. 情感化体验与主动服务:基于多模态感知,根据用户行为、历史使用习惯、用车场景和时间等情况主动推送应用服务。例如,对于 “路怒族”,AI 助手会通过心率、体温、表情等方面的大数据预判司机情绪是否处于 “路怒症” 发作范围,若判定则会通过对话、播放音乐、调节车内灯光等方式对司机进行安抚,并对车辆采取制动措施。还可感知司机的疲劳状态,准确识别人脸更多细节信息,如表情、微表情、精神状态(如是否疲劳、是否专注)等,从而判断出人的情绪、疲劳状态和开车时的专注度,通过情感互动进行疲劳驾驶预警,提高驾驶员专注度。

相关文章:

智能座舱相关术语全解及多模态交互在智能座舱中的应用

文章目录 座舱相关术语全解1. 智能座舱2. UFS3. 多模态交互4. 3D虚拟引擎5. AR/VR6. GNSS7. TTS8. DPU9. 摄像头10. 屏幕/显示器11. 音频12. 无线连接13. 其他组件 多模态交互在智能座舱中有以下一些应用 座舱相关术语全解 1. 智能座舱 智能座舱(intelligent cabi…...

【Fastjson反序列化漏洞:深入了解与防范】

一、Fastjson反序列化漏洞概述 Fastjson是一款高性能的Java语言JSON处理库,广泛应用于Web开发、数据交换等领域。然而,由于fastjson在解析JSON数据时存在安全漏洞,攻击者可以利用该漏洞执行任意代码,导致严重的安全威胁。 二、F…...

【OJ题解】C++实现反转字符串中的每个单词

💵个人主页: 起名字真南 💵个人专栏:【数据结构初阶】 【C语言】 【C】 【OJ题解】 题目要求:给定一个字符串 s ,你需要反转字符串中每个单词的字符顺序,同时仍保留空格和单词的初始顺序。 题目链接: 反转字符串中的所…...

万字长文详解Hive聚合函数 grouping sets、cube、rollup原理、语法、案例和优化

目录 原理与语法 使用场景 多维度报表生成 复杂的数据分析 实际案例 原理与语法 与GROUPINGSETS的区别 实际案例 原理与语法 与CUBE的对比 实际案例 执行效率比较 优化建议 Hive提供了三个强大的高级聚合函数: GROUPING SETS 、 CUBE 和 ROLLUP ,用于处理复杂的…...

数列分块入门

本期是数列分块入门。其中的大部分题目来自hzwer在LOJ上提供的数列分块入门系列。 Blog:here (其实是对之前分块的 blog 的整理补充) sto hzwer orz %%% [转载] ---------------------------------------------------------------------------------…...

SPRD Android 14 Launcher 3 中添加长按桌面图标启动自由窗口模式功能

本文将介绍如何在SPRD Android 14 Launcher 3 中实现一个功能,使用户可以通过长按应用图标来启动自由窗口模式。这一功能的实现将提升多任务处理能力和应用使用体验。 修改的文件列表 以下是主要涉及的文件及其修改内容: QuickstepLauncher.java:添加自由窗口快捷方式的支…...

WebSocket详解:从前端到后端的全栈理解

文章目录 前言一、WebSocket简介1.1 WebSocket的特点 二、WebSocket的工作原理2.1 握手过程2.2 数据传输 三、WebSocket在前端的应用四、WebSocket在后端的应用五、WebSocket的局限与解决方案结语 前言 随着互联网技术的发展,传统的HTTP协议在某些场景下的局限性逐…...

SOLIDWORKS 2025加快装配体设计 确保可制造性

在快速变化的制造业环境中,SOLIDWORKS作为一款CAD软件,始终致力于提供有效、智能且可靠的解决方案,以满足设计师和工程师对装配体设计的多样化需求。随着SOLIDWORKS 2025版本的发布,其在加快装配体设计、确保可制造性方面取得了显…...

简单题:计算从位置 x 到 y 的最少步数| 豆包MarsCode AI刷题

题目解析:计算从位置 x 到 y 的最少步数 题目描述 题目要求从整数位置 x 移动到整数位置 y,每一步可以将当前位置增加或减少,且每步的增加或减少的值必须是连续的整数。首末两步的步长必须是 1。要求求出从 x 到 y 的最少步数。 思路分析 …...

HTML 基础标签——表单标签<form>

文章目录 1. `<form>` 标签:定义表单容器2. `<input>` 标签:多用途输入控件3. `<textarea>` 标签:多行文本输入框4. `<select>` 标签:下拉选择框5. `<option>` 标签:下拉菜单选项6. `<button>` 标签:按钮元素7. `<label>` 标签…...

LeetCode 每日一题 2024/10/28-2024/11/3

记录了初步解题思路 以及本地实现代码&#xff1b;并不一定为最优 也希望大家能一起探讨 一起进步 目录 10/28 685. 冗余连接 II10/29 3211. 生成不含相邻零的二进制字符串10/30 3216. 交换后字典序最小的字符串10/31 3165. 不包含相邻元素的子序列的最大和11/1 3259. 超级饮料…...

基于Spring Boot和Vue的电子商城系统功能设计

基于Spring Boot和Vue的电子商城系统功能设计 该系统是一个基于Spring Boot和Vue框架的电子商城平台&#xff0c;包含前台商城和后台管理系统。系统功能设计包括用户购物体验和管理员管理功能&#xff0c;支持商品的分类展示、收藏、购物车和订单管理等模块。以下是系统功能的简…...

成都睿明智科技有限公司正规吗靠谱吗?

在这个短视频风起云涌的时代&#xff0c;抖音电商以其独特的魅力&#xff0c;成为了无数商家竞相追逐的新蓝海。而在这片浩瀚的商海中&#xff0c;成都睿明智科技有限公司犹如一艘装备精良的航船&#xff0c;引领着众多企业破浪前行&#xff0c;探索抖音电商的无限可能。今天&a…...

【天线&化学】航拍图屋顶异常检测系统源码&数据集全套:改进yolo11-ContextGuided

改进yolo11-ContextGuided等200全套创新点大全&#xff1a;航拍图屋顶异常检测系统源码&#xff06;数据集全套 1.图片效果展示 项目来源 人工智能促进会 2024.11.01 注意&#xff1a;由于项目一直在更新迭代&#xff0c;上面“1.图片效果展示”和“2.视频效果展示”展示的系…...

【回忆】JavaScript 中的 Map 有哪些方法

在 JavaScript 中&#xff0c;Map 对象是一种键值对的集合&#xff0c;类似于对象&#xff0c;但“键”可以是任何数据类型&#xff08;对象或原始值&#xff09;。Map 提供了多种方法来操作这些键值对。以下是 Map 对象的一些常用方法&#xff1a; 创建和初始化 new Map(): …...

Chrome与夸克的安全性对比

在当今数字化时代&#xff0c;浏览器的安全性对于用户来说至关重要。Chrome和夸克作为两款流行的浏览器&#xff0c;各有其特点和优势。本文将对这两款浏览器的安全性进行详细对比&#xff0c;帮助用户更好地了解它们之间的差异。&#xff08;本文由https://www.chromegw.com/的…...

使用Python可视化支持向量机(SVM)

支持向量机&#xff08;SVM&#xff09;是用于分类和回归任务的强大监督学习模型。它们受欢迎背后的一个关键因素是它们有效处理线性和非线性数据的能力。在本文中&#xff0c;我们将探索使用Python和流行的库&#xff08;如scikit-learn和Matplotlib&#xff09;可视化SVM。 …...

C++泛型编程

一、什么是泛型编程 泛型编程 是一种编程范式&#xff0c;它通过编写可以处理多种数据类型的代码来实现代码的灵活复用。泛型编程主要通过模板来实现。 比如我们日常使用的容器类型vector就应用了模板来实现其通用性&#xff0c;我们在使用时可以通过传入型别创建对应的动态数…...

【论文分享】利用大量街景图片研究街道空间质量与建筑环境属性之间的关联

本研究通过有序逻辑回归模型&#xff0c;结合街景图片和街道数据&#xff0c;分析了街道空间质量与建筑环境属性的关系。通过Kappa分析和相关性分析&#xff0c;确定了影响街道空间质量的因素&#xff0c;并绘制了质量分布图。这些因素与街道质量的不同维度相关联&#xff0c;对…...

【Linux第七课--基础IO】内存级文件、重定向、缓冲区、文件系统、动态库静态库

目录 引入内存级文件重新使用C文件接口 -- 对比重定向写文件读文件文件流 认识文件操作的系统接口open参数 -- flagflag的内容宏的传参方式 open关闭文件写文件读文件结论 引入文件描述符fd、对文件的理解理解一切皆文件方法集文件fd的分配规则 重定向代码的重定向输入重定向输…...

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…...

在软件开发中正确使用MySQL日期时间类型的深度解析

在日常软件开发场景中&#xff0c;时间信息的存储是底层且核心的需求。从金融交易的精确记账时间、用户操作的行为日志&#xff0c;到供应链系统的物流节点时间戳&#xff0c;时间数据的准确性直接决定业务逻辑的可靠性。MySQL作为主流关系型数据库&#xff0c;其日期时间类型的…...

XCTF-web-easyupload

试了试php&#xff0c;php7&#xff0c;pht&#xff0c;phtml等&#xff0c;都没有用 尝试.user.ini 抓包修改将.user.ini修改为jpg图片 在上传一个123.jpg 用蚁剑连接&#xff0c;得到flag...

Cursor实现用excel数据填充word模版的方法

cursor主页&#xff1a;https://www.cursor.com/ 任务目标&#xff1a;把excel格式的数据里的单元格&#xff0c;按照某一个固定模版填充到word中 文章目录 注意事项逐步生成程序1. 确定格式2. 调试程序 注意事项 直接给一个excel文件和最终呈现的word文件的示例&#xff0c;…...

C++:std::is_convertible

C++标志库中提供is_convertible,可以测试一种类型是否可以转换为另一只类型: template <class From, class To> struct is_convertible; 使用举例: #include <iostream> #include <string>using namespace std;struct A { }; struct B : A { };int main…...

MySQL 隔离级别:脏读、幻读及不可重复读的原理与示例

一、MySQL 隔离级别 MySQL 提供了四种隔离级别,用于控制事务之间的并发访问以及数据的可见性,不同隔离级别对脏读、幻读、不可重复读这几种并发数据问题有着不同的处理方式,具体如下: 隔离级别脏读不可重复读幻读性能特点及锁机制读未提交(READ UNCOMMITTED)允许出现允许…...

YSYX学习记录(八)

C语言&#xff0c;练习0&#xff1a; 先创建一个文件夹&#xff0c;我用的是物理机&#xff1a; 安装build-essential 练习1&#xff1a; 我注释掉了 #include <stdio.h> 出现下面错误 在你的文本编辑器中打开ex1文件&#xff0c;随机修改或删除一部分&#xff0c;之后…...

关于iview组件中使用 table , 绑定序号分页后序号从1开始的解决方案

问题描述&#xff1a;iview使用table 中type: "index",分页之后 &#xff0c;索引还是从1开始&#xff0c;试过绑定后台返回数据的id, 这种方法可行&#xff0c;就是后台返回数据的每个页面id都不完全是按照从1开始的升序&#xff0c;因此百度了下&#xff0c;找到了…...

Python实现prophet 理论及参数优化

文章目录 Prophet理论及模型参数介绍Python代码完整实现prophet 添加外部数据进行模型优化 之前初步学习prophet的时候&#xff0c;写过一篇简单实现&#xff0c;后期随着对该模型的深入研究&#xff0c;本次记录涉及到prophet 的公式以及参数调优&#xff0c;从公式可以更直观…...

【SQL学习笔记1】增删改查+多表连接全解析(内附SQL免费在线练习工具)

可以使用Sqliteviz这个网站免费编写sql语句&#xff0c;它能够让用户直接在浏览器内练习SQL的语法&#xff0c;不需要安装任何软件。 链接如下&#xff1a; sqliteviz 注意&#xff1a; 在转写SQL语法时&#xff0c;关键字之间有一个特定的顺序&#xff0c;这个顺序会影响到…...