当前位置：首页 > news >正文

智能座舱相关术语全解及多模态交互在智能座舱中的应用

news 2026/2/9 15:03:18

文章目录

座舱相关术语全解
- 1. 智能座舱
- 2. UFS
- 3. 多模态交互
- 4. 3D虚拟引擎
- 5. AR/VR
- 6. GNSS
- 7. TTS
- 8. DPU
- 9. 摄像头
- 10. 屏幕/显示器
- 11. 音频
- 12. 无线连接
- 13. 其他组件
多模态交互在智能座舱中有以下一些应用

座舱相关术语全解

1. 智能座舱

智能座舱（intelligent cabin）旨在集成多种IT和人工智能技术，打造全新的车内一体化数字平台，为驾驶员提供智能体验，促进行车安全。目前国内外已经有很多研究工作，例如在车辆的AB柱及后视镜安装摄像头，提供情绪识别、年龄检测、遗留物检测、安全带检测等。

2. UFS

定义
- UFS闪存是由多个闪存芯片、主控、缓存组成的阵列式存储模块。

在这里插入图片描述

特点
- 弥补了eMMC仅支持半双工运行（读写必须分开执行）的缺陷，可实现全双工运行，性能得以翻番。
分类及标准
- 目前被细分为UFS 2.0和UFS 2.1，读写速度的强制标准都为HS - G2（High speed GEAR2），可选HS - G3标准。
- 两套标准都能运行在1Lane（单通道）或2Lane（双通道）模式上，手机读写速度取决于UFS闪存标准、通道数以及处理器对UFS闪存的总线接口支持情况。
应用及目标
- 是一种设计用于数码相机、智能电话等消费电子产品使用的闪存存储规范。
- 设计目标是发展一套统一的快闪存储卡格式，在提供高数据传输速度和稳定性的同时，减少消费者对于市面上各种存储卡格式的混淆和不同存储卡转接器的使用。

3. 多模态交互

定义
- 英文是modality，通俗说就是“感官”，多模态即将多种感官融合。Turing OS机器人操作系统将机器人与人的交互模式定义为“多模态交互”，即通过文字、语音、视觉、动作、环境等多种方式进行人机交互，充分模拟人与人之间的交互方式。
意义
- 打破了传统PC式的键盘输入和智能手机的点触式交互模式。

4. 3D虚拟引擎

定义
- 是将现实中的物质抽象为多边形或者各种曲线等表现形式，在计算机中进行相关计算并输出最终图像的算法实现的集合，就像在计算机内建立一个“真实的世界”。

5. AR/VR

VR
- 虚拟现实Virtual Reality的英语缩写。VR显示的全是假的，是一种可以创建和体验虚拟世界的计算机仿真系统，利用计算机生成一种模拟环境，是一种多源信息融合的交互式的三维动态视景和实体行为的系统仿真，使用户沉浸到该环境中。
AR
- 增强现实Augmented Reality的英文缩写。AR显示的画面有一半是真的，一半是假的，是一种实时地计算摄影机影像的位置及角度并加上相应图像的技术，目标是在屏幕上把虚拟世界套在现实世界并进行互动，最早于1990年提出，随着随身电子产品运算能力的提升，用途越来越广。

6. GNSS

定义
- 全球导航卫星系统（英文：Global Navigation Satellite System，GNSS），又称全球卫星导航系统。

7. TTS

定义
- TTS是Text To Speech的缩写，即“从文本到语音”。它将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语（或者其他官方语言语音）输出的技术，隶属于语音合成（SpeechSynthesis）。

8. DPU

定义
- DPU一般指数据处理器。数据处理器(英文名【Data Processing Unit】，简称DPU)是面向以数据为中心的计算的新一代处理器，集完整的数据中心功能于单芯片，和CPU及GPU一起构成新型计算的三大支柱。

9. 摄像头

分类
- ADAS Camera：高级驾驶员辅助系统Camera，一般为车前双目摄像头等。
- AVM Camera：Around View Monitor，全景环视系统。
- DMS：Driver Monitoring System，监测对象为Driver(驾驶员）。
- OMS：Occupancy Monitoring System，监测对象为乘客。
- CMS：Camera - monitor system，电子后视镜。
相关组件
- DES（DESerializer，解串器）、SER（SERializer，串行器）、CSI（CMOS Serial Interface）、ISP (Image Signal Processor，即图像处理)、NPU（Neural - network Processing Unit神经网络处理器）

10. 屏幕/显示器

分类
- Cluster：汽车仪表群。
- IVI Display：In - Vehicle Infotainment，车载信息娱乐系统。
- RSE：Rear seat entertainment，后排座椅娱乐系统。
- CMS：Camera - monitor system，电子后视镜。
相关组件
- DP(display port，显示接口)、DSI（Display Serial Interface，显示串行接口，MIPI接口）

11. 音频

组成
- Speaker：喇叭、外放。
相关组件
- TDM（Time Division Multiplexing，时分复用）是PCM的一种方式，TDM相比I2S可以传输多channel音频数据。AMP（Amplifier，放大器）、A2B（Automotive Audio Bus）是汽车音频总线的简称，ADI设计研发的标准。

12. 无线连接

分类
- BT/WIFI：PCIe接口的模块。
- GNSS：全球导航卫星系统模块。
- FM/AM: Tuner（调谐器）

13. 其他组件

分类
- ETH：LIDARs（雷达）;
- Vehicle Network:车载网络;
- PCIe：SSD（固态硬盘，PCIe接口、NVMe协议）;
- IMU：（Inertial Measurement Unit，即惯性测量单元）;
- Codec: 编译码器。指的是数字通信中具有编码、译码功能的器件。

多模态交互在智能座舱中有以下一些应用

语音 + 视觉：语音交互本身不可见，将其与视觉模态融合，例如通过中控屏幕上的语音虚拟形象或实体机器人的空间方位和状态变化，能让驾驶员更清楚地了解指令所处的状态，增强安全感。如蔚来汽车的 NOMI，在语音交互时能通过屏幕表情给出聆听、开心、点赞等反馈，增加了陪伴感和信任感。
视觉 + 触觉：例如小鹏 P7 在打开车道辅助时，为减少驾驶员低头看仪表盘的情况，方向盘会通过抖动提示车辆压线；还可通过方向盘物理按键唤醒语音，语音虚拟形象的状态变化显示在中控屏上。
手势识别：用于多媒体切换、音量控制、接电话、灯光控制等方面。比如岚图追光的手势控制，支持左右、上下和前后 3 种动态手势及 5 种静态手势，包括确认、自拍、接听 / 拒接电话和播放 / 暂停等常用功能，结合四音区语音系统实现语音 + 手势交互。一些车型还能通过 3D TOF 摄像头进行三维手势检测。
驾驶员监测系统（DMS）：利用座舱内摄像头、近红外线等传感器，基于面部特征分析、头部姿态追踪、视线追踪、面部表情和情绪识别、身体姿势追踪和物体侦测等关键技术，实现对驾驶员的身份识别，以及疲劳驾驶、分心驾驶等危险行为的检测功能。例如，主流 DMS 方案采用近红外摄像头拍摄驾驶员眼球运动、面部表情，进行计算和 AI 识别，分析出驾驶员疲劳、分心、危险驾驶等动作信号，以此来提醒驾驶员。3D-TOF 传感器的 DMS 方案则可定位驾驶员眼神，协助 AR-HUD 实现动态校正。此外，DMS 能时刻监控驾驶员状态，满足 L3 决策安全性要求，法规也有标配 DMS 的趋势。
乘客监测系统（OMS）：OMS 是 DMS 系统的延伸，可监测座舱内乘客的状态，比如监测儿童或宠物是否遗留在车内，还能检测人员是否使用安全带。在交互或娱乐方面，也可利用 OMS 摄像头完成手势识别、情绪识别、视频聊天等功能。
增强现实抬头显示器（AR-HUD）：AR-HUD 可将车速、驾驶辅助和导航等信息直接显示在真实道路上，实现这一特性需要通过前视摄像头对前方的路况进行解析建模，得到对象的位置、距离、大小等，再把 HUD 需要显示的信息精准地投影到对应的位置。同时，融合 DMS 的眼神追踪摄像头，可保障画面跟着眼睛实时动态调节，保持动态中的相对静止，减少产生眩晕感，提升 AR-HUD 体验感。
AID 全息投影：借助光学原理投射在空气中，不需要任何介质，用户能从各个角度感受到悬浮在屏幕上的真实效果。它可同仪表、中控屏、视觉感知系统和语音交互系统等多维深度协同，与 DMS 的视线追踪和表情识别、自动驾驶的环境感知等融合，感知驾驶员的心情以及车外环境，通过数字虚拟人进行主动关怀（如音乐电影播放、氛围灯开启）、疲劳提醒、危险预警、天气提醒、节日变装等，建立更深层次的情感交流，带来更多陪伴和乐趣。
情感化体验与主动服务：基于多模态感知，根据用户行为、历史使用习惯、用车场景和时间等情况主动推送应用服务。例如，对于 “路怒族”，AI 助手会通过心率、体温、表情等方面的大数据预判司机情绪是否处于 “路怒症” 发作范围，若判定则会通过对话、播放音乐、调节车内灯光等方式对司机进行安抚，并对车辆采取制动措施。还可感知司机的疲劳状态，准确识别人脸更多细节信息，如表情、微表情、精神状态（如是否疲劳、是否专注）等，从而判断出人的情绪、疲劳状态和开车时的专注度，通过情感互动进行疲劳驾驶预警，提高驾驶员专注度。

智能座舱相关术语全解及多模态交互在智能座舱中的应用

文章目录座舱相关术语全解1. 智能座舱2. UFS3. 多模态交互4. 3D虚拟引擎5. AR/VR6. GNSS7. TTS8. DPU9. 摄像头10. 屏幕/显示器11. 音频12. 无线连接13. 其他组件多模态交互在智能座舱中有以下一些应用座舱相关术语全解 1. 智能座舱智能座舱（intelligent cabi…...

编程日记 2024/11/3 7:30:10

【Fastjson反序列化漏洞：深入了解与防范】

一、Fastjson反序列化漏洞概述 Fastjson是一款高性能的Java语言JSON处理库，广泛应用于Web开发、数据交换等领域。然而，由于fastjson在解析JSON数据时存在安全漏洞，攻击者可以利用该漏洞执行任意代码，导致严重的安全威胁。二、F…...

编程日记 2024/11/3 7:28:08

【OJ题解】C++实现反转字符串中的每个单词

💵个人主页: 起名字真南 💵个人专栏:【数据结构初阶】【C语言】【C】【OJ题解】题目要求：给定一个字符串 s ，你需要反转字符串中每个单词的字符顺序，同时仍保留空格和单词的初始顺序。题目链接: 反转字符串中的所…...

编程日记 2024/11/3 7:26:06

万字长文详解Hive聚合函数 grouping sets、cube、rollup原理、语法、案例和优化

目录原理与语法使用场景多维度报表生成复杂的数据分析实际案例原理与语法与GROUPINGSETS的区别实际案例原理与语法与CUBE的对比实际案例执行效率比较优化建议 Hive提供了三个强大的高级聚合函数： GROUPING SETS 、 CUBE 和 ROLLUP ，用于处理复杂的…...

编程日记 2024/11/3 7:24:03

数列分块入门

本期是数列分块入门。其中的大部分题目来自hzwer在LOJ上提供的数列分块入门系列。 Blog:here (其实是对之前分块的 blog 的整理补充) sto hzwer orz %%% [转载] ---------------------------------------------------------------------------------…...

编程日记 2024/11/3 7:22:00

SPRD Android 14 Launcher 3 中添加长按桌面图标启动自由窗口模式功能

本文将介绍如何在SPRD Android 14 Launcher 3 中实现一个功能，使用户可以通过长按应用图标来启动自由窗口模式。这一功能的实现将提升多任务处理能力和应用使用体验。修改的文件列表以下是主要涉及的文件及其修改内容： QuickstepLauncher.java：添加自由窗口快捷方式的支…...

编程日记 2024/11/3 7:18:57

WebSocket详解：从前端到后端的全栈理解

文章目录前言一、WebSocket简介1.1 WebSocket的特点二、WebSocket的工作原理2.1 握手过程2.2 数据传输三、WebSocket在前端的应用四、WebSocket在后端的应用五、WebSocket的局限与解决方案结语前言随着互联网技术的发展，传统的HTTP协议在某些场景下的局限性逐…...

编程日记 2024/11/3 7:16:55

SOLIDWORKS 2025加快装配体设计确保可制造性

在快速变化的制造业环境中，SOLIDWORKS作为一款CAD软件，始终致力于提供有效、智能且可靠的解决方案，以满足设计师和工程师对装配体设计的多样化需求。随着SOLIDWORKS 2025版本的发布，其在加快装配体设计、确保可制造性方面取得了显…...

编程日记 2024/11/3 7:11:49

简单题:计算从位置 x 到 y 的最少步数| 豆包MarsCode AI刷题

题目解析：计算从位置 x 到 y 的最少步数题目描述题目要求从整数位置 x 移动到整数位置 y，每一步可以将当前位置增加或减少，且每步的增加或减少的值必须是连续的整数。首末两步的步长必须是 1。要求求出从 x 到 y 的最少步数。思路分析 …...

编程日记 2024/11/3 7:09:46

HTML 基础标签——表单标签＜form＞

文章目录 1. `<form>` 标签：定义表单容器2. `<input>` 标签：多用途输入控件3. `<textarea>` 标签：多行文本输入框4. `<select>` 标签：下拉选择框5. `<option>` 标签：下拉菜单选项6. `<button>` 标签：按钮元素7. `<label>` 标签…...

编程日记 2024/11/3 7:08:45

LeetCode 每日一题 2024/10/28-2024/11/3

记录了初步解题思路以及本地实现代码；并不一定为最优也希望大家能一起探讨一起进步目录 10/28 685. 冗余连接 II10/29 3211. 生成不含相邻零的二进制字符串10/30 3216. 交换后字典序最小的字符串10/31 3165. 不包含相邻元素的子序列的最大和11/1 3259. 超级饮料…...

编程日记 2024/11/3 7:07:44

基于Spring Boot和Vue的电子商城系统功能设计

基于Spring Boot和Vue的电子商城系统功能设计该系统是一个基于Spring Boot和Vue框架的电子商城平台，包含前台商城和后台管理系统。系统功能设计包括用户购物体验和管理员管理功能，支持商品的分类展示、收藏、购物车和订单管理等模块。以下是系统功能的简…...

编程日记 2024/11/3 7:06:42

成都睿明智科技有限公司正规吗靠谱吗？

在这个短视频风起云涌的时代，抖音电商以其独特的魅力，成为了无数商家竞相追逐的新蓝海。而在这片浩瀚的商海中，成都睿明智科技有限公司犹如一艘装备精良的航船，引领着众多企业破浪前行，探索抖音电商的无限可能。今天&a…...

编程日记 2024/11/3 7:04:40

【天线＆化学】航拍图屋顶异常检测系统源码＆数据集全套：改进yolo11-ContextGuided

改进yolo11-ContextGuided等200全套创新点大全：航拍图屋顶异常检测系统源码＆数据集全套 1.图片效果展示项目来源人工智能促进会 2024.11.01 注意：由于项目一直在更新迭代，上面“1.图片效果展示”和“2.视频效果展示”展示的系…...

编程日记 2024/11/3 7:03:39

【回忆】JavaScript 中的 Map 有哪些方法

在 JavaScript 中，Map 对象是一种键值对的集合，类似于对象，但“键”可以是任何数据类型（对象或原始值）。Map 提供了多种方法来操作这些键值对。以下是 Map 对象的一些常用方法： 创建和初始化 new Map(): …...

编程日记 2024/11/3 7:01:36

Chrome与夸克的安全性对比

在当今数字化时代，浏览器的安全性对于用户来说至关重要。Chrome和夸克作为两款流行的浏览器，各有其特点和优势。本文将对这两款浏览器的安全性进行详细对比，帮助用户更好地了解它们之间的差异。（本文由https://www.chromegw.com/的…...

编程日记 2024/11/3 7:00:35

使用Python可视化支持向量机（SVM）

支持向量机（SVM）是用于分类和回归任务的强大监督学习模型。它们受欢迎背后的一个关键因素是它们有效处理线性和非线性数据的能力。在本文中，我们将探索使用Python和流行的库（如scikit-learn和Matplotlib）可视化SVM。 …...

编程日记 2024/11/3 6:57:32

C++泛型编程

一、什么是泛型编程泛型编程是一种编程范式，它通过编写可以处理多种数据类型的代码来实现代码的灵活复用。泛型编程主要通过模板来实现。比如我们日常使用的容器类型vector就应用了模板来实现其通用性，我们在使用时可以通过传入型别创建对应的动态数…...

编程日记 2024/11/3 6:55:30

【论文分享】利用大量街景图片研究街道空间质量与建筑环境属性之间的关联

本研究通过有序逻辑回归模型，结合街景图片和街道数据，分析了街道空间质量与建筑环境属性的关系。通过Kappa分析和相关性分析，确定了影响街道空间质量的因素，并绘制了质量分布图。这些因素与街道质量的不同维度相关联，对…...

编程日记 2024/11/3 6:45:22

【Linux第七课--基础IO】内存级文件、重定向、缓冲区、文件系统、动态库静态库

目录引入内存级文件重新使用C文件接口 -- 对比重定向写文件读文件文件流认识文件操作的系统接口open参数 -- flagflag的内容宏的传参方式 open关闭文件写文件读文件结论引入文件描述符fd、对文件的理解理解一切皆文件方法集文件fd的分配规则重定向代码的重定向输入重定向输…...

编程日记 2024/11/3 6:44:21

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向深度学习与微纳光子学的结合主要集中在以下几个方向： 逆向设计通过神经网络快速预测微纳结构的光学响应，替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。特征提取与优化从复杂的光学数据中自…...

编程新知 2026/2/8 15:03:04

CVPR 2025 MIMO: 支持视觉指代和像素grounding 的医学视觉语言模型

CVPR 2025 | MIMO：支持视觉指代和像素对齐的医学视觉语言模型论文信息标题：MIMO: A medical vision language model with visual referring multimodal input and pixel grounding multimodal output作者：Yanyuan Chen, Dexuan Xu, Yu Hu…...

编程新知 2025/10/6 14:17:21

相机Camera日志实例分析之二：相机Camx【专业模式开启直方图拍照】单帧流程日志详解

【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了： 这一篇我们开始讲： 目录一、场景操作步骤二、日志基础关键字分级如下三、场景日志如下： 一、场景操作步骤操作步…...

编程新知 2026/1/30 10:10:55

线程同步：确保多线程程序的安全与高效！

全文目录： 开篇语前序前言第一部分：线程同步的概念与问题1.1 线程同步的概念1.2 线程同步的问题1.3 线程同步的解决方案第二部分：synchronized关键字的使用2.1 使用 synchronized修饰方法2.2 使用 synchronized修饰代码块第三部分&#xff…...

编程新知 2025/9/24 16:02:40

vscode（仍待补充）

写于2025 6.9 主包将加入vscode这个更权威的圈子 vscode的基本使用侧边栏 vscode还能连接ssh？ debug时使用的launch文件 1.task.json {"tasks": [{"type": "cppbuild","label": "C/C: gcc.exe 生成活动文件"…...

编程新知 2026/1/24 13:04:10