当前位置: 首页 > news >正文

智能座舱相关术语全解及多模态交互在智能座舱中的应用

文章目录

  • 座舱相关术语全解
    • 1. 智能座舱
    • 2. UFS
    • 3. 多模态交互
    • 4. 3D虚拟引擎
    • 5. AR/VR
    • 6. GNSS
    • 7. TTS
    • 8. DPU
    • 9. 摄像头
    • 10. 屏幕/显示器
    • 11. 音频
    • 12. 无线连接
    • 13. 其他组件
  • 多模态交互在智能座舱中有以下一些应用

座舱相关术语全解

1. 智能座舱

智能座舱(intelligent cabin)旨在集成多种IT和人工智能技术,打造全新的车内一体化数字平台,为驾驶员提供智能体验,促进行车安全。目前国内外已经有很多研究工作,例如在车辆的AB柱及后视镜安装摄像头,提供情绪识别、年龄检测、遗留物检测、安全带检测等。

2. UFS

  1. 定义
    • UFS闪存是由多个闪存芯片、主控、缓存组成的阵列式存储模块。

在这里插入图片描述

  1. 特点
    • 弥补了eMMC仅支持半双工运行(读写必须分开执行)的缺陷,可实现全双工运行,性能得以翻番。
  2. 分类及标准
    • 目前被细分为UFS 2.0和UFS 2.1,读写速度的强制标准都为HS - G2(High speed GEAR2),可选HS - G3标准。
    • 两套标准都能运行在1Lane(单通道)或2Lane(双通道)模式上,手机读写速度取决于UFS闪存标准、通道数以及处理器对UFS闪存的总线接口支持情况。
  3. 应用及目标
    • 是一种设计用于数码相机、智能电话等消费电子产品使用的闪存存储规范。
    • 设计目标是发展一套统一的快闪存储卡格式,在提供高数据传输速度和稳定性的同时,减少消费者对于市面上各种存储卡格式的混淆和不同存储卡转接器的使用。

3. 多模态交互

  1. 定义
    • 英文是modality,通俗说就是“感官”,多模态即将多种感官融合。Turing OS机器人操作系统将机器人与人的交互模式定义为“多模态交互”,即通过文字、语音、视觉、动作、环境等多种方式进行人机交互,充分模拟人与人之间的交互方式。
  2. 意义
    • 打破了传统PC式的键盘输入和智能手机的点触式交互模式。

4. 3D虚拟引擎

  1. 定义
    • 是将现实中的物质抽象为多边形或者各种曲线等表现形式,在计算机中进行相关计算并输出最终图像的算法实现的集合,就像在计算机内建立一个“真实的世界”。

5. AR/VR

  1. VR
    • 虚拟现实Virtual Reality的英语缩写。VR显示的全是假的,是一种可以创建和体验虚拟世界的计算机仿真系统,利用计算机生成一种模拟环境,是一种多源信息融合的交互式的三维动态视景和实体行为的系统仿真,使用户沉浸到该环境中。
  2. AR
    • 增强现实Augmented Reality的英文缩写。AR显示的画面有一半是真的,一半是假的,是一种实时地计算摄影机影像的位置及角度并加上相应图像的技术,目标是在屏幕上把虚拟世界套在现实世界并进行互动,最早于1990年提出,随着随身电子产品运算能力的提升,用途越来越广。

6. GNSS

  1. 定义
    • 全球导航卫星系统(英文:Global Navigation Satellite System,GNSS),又称全球卫星导航系统。

7. TTS

  1. 定义
    • TTS是Text To Speech的缩写,即“从文本到语音”。它将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语(或者其他官方语言语音)输出的技术,隶属于语音合成(SpeechSynthesis)。

8. DPU

  1. 定义
    • DPU一般指数据处理器。数据处理器(英文名【Data Processing Unit】,简称DPU)是面向以数据为中心的计算的新一代处理器,集完整的数据中心功能于单芯片,和CPU及GPU一起构成新型计算的三大支柱。

9. 摄像头

  1. 分类
    • ADAS Camera:高级驾驶员辅助系统Camera,一般为车前双目摄像头等。
    • AVM Camera:Around View Monitor,全景环视系统。
    • DMS:Driver Monitoring System,监测对象为Driver(驾驶员)。
    • OMS:Occupancy Monitoring System,监测对象为乘客。
    • CMS:Camera - monitor system,电子后视镜。
  2. 相关组件
    • DES(DESerializer,解串器)、SER(SERializer,串行器)、CSI(CMOS Serial Interface)、ISP (Image Signal Processor,即图像处理)、NPU(Neural - network Processing Unit神经网络处理器)

10. 屏幕/显示器

  1. 分类
    • Cluster:汽车仪表群。
    • IVI Display:In - Vehicle Infotainment,车载信息娱乐系统。
    • RSE:Rear seat entertainment,后排座椅娱乐系统。
    • CMS:Camera - monitor system,电子后视镜。
  2. 相关组件
    • DP(display port,显示接口)、DSI(Display Serial Interface,显示串行接口,MIPI接口)

11. 音频

  1. 组成
    • Speaker:喇叭、外放。
  2. 相关组件
    • TDM(Time Division Multiplexing,时分复用)是PCM的一种方式,TDM相比I2S可以传输多channel音频数据。AMP(Amplifier,放大器)、A2B(Automotive Audio Bus)是汽车音频总线的简称,ADI设计研发的标准。

12. 无线连接

  1. 分类
    • BT/WIFI:PCIe接口的模块。
    • GNSS:全球导航卫星系统模块。
    • FM/AM: Tuner(调谐器)

13. 其他组件

  1. 分类
    • ETH:LIDARs(雷达);
    • Vehicle Network:车载网络;
    • PCIe:SSD(固态硬盘,PCIe接口、NVMe协议);
    • IMU:(Inertial Measurement Unit,即惯性测量单元);
    • Codec: 编译码器。指的是数字通信中具有编码、译码功能的器件。

多模态交互在智能座舱中有以下一些应用

  1. 语音 + 视觉:语音交互本身不可见,将其与视觉模态融合,例如通过中控屏幕上的语音虚拟形象或实体机器人的空间方位和状态变化,能让驾驶员更清楚地了解指令所处的状态,增强安全感。如蔚来汽车的 NOMI,在语音交互时能通过屏幕表情给出聆听、开心、点赞等反馈,增加了陪伴感和信任感。
  2. 视觉 + 触觉:例如小鹏 P7 在打开车道辅助时,为减少驾驶员低头看仪表盘的情况,方向盘会通过抖动提示车辆压线;还可通过方向盘物理按键唤醒语音,语音虚拟形象的状态变化显示在中控屏上。
  3. 手势识别:用于多媒体切换、音量控制、接电话、灯光控制等方面。比如岚图追光的手势控制,支持左右、上下和前后 3 种动态手势及 5 种静态手势,包括确认、自拍、接听 / 拒接电话和播放 / 暂停等常用功能,结合四音区语音系统实现语音 + 手势交互。一些车型还能通过 3D TOF 摄像头进行三维手势检测。
  4. 驾驶员监测系统(DMS):利用座舱内摄像头、近红外线等传感器,基于面部特征分析、头部姿态追踪、视线追踪、面部表情和情绪识别、身体姿势追踪和物体侦测等关键技术,实现对驾驶员的身份识别,以及疲劳驾驶、分心驾驶等危险行为的检测功能。例如,主流 DMS 方案采用近红外摄像头拍摄驾驶员眼球运动、面部表情,进行计算和 AI 识别,分析出驾驶员疲劳、分心、危险驾驶等动作信号,以此来提醒驾驶员。3D-TOF 传感器的 DMS 方案则可定位驾驶员眼神,协助 AR-HUD 实现动态校正。此外,DMS 能时刻监控驾驶员状态,满足 L3 决策安全性要求,法规也有标配 DMS 的趋势。
  5. 乘客监测系统(OMS):OMS 是 DMS 系统的延伸,可监测座舱内乘客的状态,比如监测儿童或宠物是否遗留在车内,还能检测人员是否使用安全带。在交互或娱乐方面,也可利用 OMS 摄像头完成手势识别、情绪识别、视频聊天等功能。
  6. 增强现实抬头显示器(AR-HUD):AR-HUD 可将车速、驾驶辅助和导航等信息直接显示在真实道路上,实现这一特性需要通过前视摄像头对前方的路况进行解析建模,得到对象的位置、距离、大小等,再把 HUD 需要显示的信息精准地投影到对应的位置。同时,融合 DMS 的眼神追踪摄像头,可保障画面跟着眼睛实时动态调节,保持动态中的相对静止,减少产生眩晕感,提升 AR-HUD 体验感。
  7. AID 全息投影:借助光学原理投射在空气中,不需要任何介质,用户能从各个角度感受到悬浮在屏幕上的真实效果。它可同仪表、中控屏、视觉感知系统和语音交互系统等多维深度协同,与 DMS 的视线追踪和表情识别、自动驾驶的环境感知等融合,感知驾驶员的心情以及车外环境,通过数字虚拟人进行主动关怀(如音乐电影播放、氛围灯开启)、疲劳提醒、危险预警、天气提醒、节日变装等,建立更深层次的情感交流,带来更多陪伴和乐趣。
  8. 情感化体验与主动服务:基于多模态感知,根据用户行为、历史使用习惯、用车场景和时间等情况主动推送应用服务。例如,对于 “路怒族”,AI 助手会通过心率、体温、表情等方面的大数据预判司机情绪是否处于 “路怒症” 发作范围,若判定则会通过对话、播放音乐、调节车内灯光等方式对司机进行安抚,并对车辆采取制动措施。还可感知司机的疲劳状态,准确识别人脸更多细节信息,如表情、微表情、精神状态(如是否疲劳、是否专注)等,从而判断出人的情绪、疲劳状态和开车时的专注度,通过情感互动进行疲劳驾驶预警,提高驾驶员专注度。

相关文章:

智能座舱相关术语全解及多模态交互在智能座舱中的应用

文章目录 座舱相关术语全解1. 智能座舱2. UFS3. 多模态交互4. 3D虚拟引擎5. AR/VR6. GNSS7. TTS8. DPU9. 摄像头10. 屏幕/显示器11. 音频12. 无线连接13. 其他组件 多模态交互在智能座舱中有以下一些应用 座舱相关术语全解 1. 智能座舱 智能座舱(intelligent cabi…...

【Fastjson反序列化漏洞:深入了解与防范】

一、Fastjson反序列化漏洞概述 Fastjson是一款高性能的Java语言JSON处理库,广泛应用于Web开发、数据交换等领域。然而,由于fastjson在解析JSON数据时存在安全漏洞,攻击者可以利用该漏洞执行任意代码,导致严重的安全威胁。 二、F…...

【OJ题解】C++实现反转字符串中的每个单词

💵个人主页: 起名字真南 💵个人专栏:【数据结构初阶】 【C语言】 【C】 【OJ题解】 题目要求:给定一个字符串 s ,你需要反转字符串中每个单词的字符顺序,同时仍保留空格和单词的初始顺序。 题目链接: 反转字符串中的所…...

万字长文详解Hive聚合函数 grouping sets、cube、rollup原理、语法、案例和优化

目录 原理与语法 使用场景 多维度报表生成 复杂的数据分析 实际案例 原理与语法 与GROUPINGSETS的区别 实际案例 原理与语法 与CUBE的对比 实际案例 执行效率比较 优化建议 Hive提供了三个强大的高级聚合函数: GROUPING SETS 、 CUBE 和 ROLLUP ,用于处理复杂的…...

数列分块入门

本期是数列分块入门。其中的大部分题目来自hzwer在LOJ上提供的数列分块入门系列。 Blog:here (其实是对之前分块的 blog 的整理补充) sto hzwer orz %%% [转载] ---------------------------------------------------------------------------------…...

SPRD Android 14 Launcher 3 中添加长按桌面图标启动自由窗口模式功能

本文将介绍如何在SPRD Android 14 Launcher 3 中实现一个功能,使用户可以通过长按应用图标来启动自由窗口模式。这一功能的实现将提升多任务处理能力和应用使用体验。 修改的文件列表 以下是主要涉及的文件及其修改内容: QuickstepLauncher.java:添加自由窗口快捷方式的支…...

WebSocket详解:从前端到后端的全栈理解

文章目录 前言一、WebSocket简介1.1 WebSocket的特点 二、WebSocket的工作原理2.1 握手过程2.2 数据传输 三、WebSocket在前端的应用四、WebSocket在后端的应用五、WebSocket的局限与解决方案结语 前言 随着互联网技术的发展,传统的HTTP协议在某些场景下的局限性逐…...

SOLIDWORKS 2025加快装配体设计 确保可制造性

在快速变化的制造业环境中,SOLIDWORKS作为一款CAD软件,始终致力于提供有效、智能且可靠的解决方案,以满足设计师和工程师对装配体设计的多样化需求。随着SOLIDWORKS 2025版本的发布,其在加快装配体设计、确保可制造性方面取得了显…...

简单题:计算从位置 x 到 y 的最少步数| 豆包MarsCode AI刷题

题目解析:计算从位置 x 到 y 的最少步数 题目描述 题目要求从整数位置 x 移动到整数位置 y,每一步可以将当前位置增加或减少,且每步的增加或减少的值必须是连续的整数。首末两步的步长必须是 1。要求求出从 x 到 y 的最少步数。 思路分析 …...

HTML 基础标签——表单标签<form>

文章目录 1. `<form>` 标签:定义表单容器2. `<input>` 标签:多用途输入控件3. `<textarea>` 标签:多行文本输入框4. `<select>` 标签:下拉选择框5. `<option>` 标签:下拉菜单选项6. `<button>` 标签:按钮元素7. `<label>` 标签…...

LeetCode 每日一题 2024/10/28-2024/11/3

记录了初步解题思路 以及本地实现代码&#xff1b;并不一定为最优 也希望大家能一起探讨 一起进步 目录 10/28 685. 冗余连接 II10/29 3211. 生成不含相邻零的二进制字符串10/30 3216. 交换后字典序最小的字符串10/31 3165. 不包含相邻元素的子序列的最大和11/1 3259. 超级饮料…...

基于Spring Boot和Vue的电子商城系统功能设计

基于Spring Boot和Vue的电子商城系统功能设计 该系统是一个基于Spring Boot和Vue框架的电子商城平台&#xff0c;包含前台商城和后台管理系统。系统功能设计包括用户购物体验和管理员管理功能&#xff0c;支持商品的分类展示、收藏、购物车和订单管理等模块。以下是系统功能的简…...

成都睿明智科技有限公司正规吗靠谱吗?

在这个短视频风起云涌的时代&#xff0c;抖音电商以其独特的魅力&#xff0c;成为了无数商家竞相追逐的新蓝海。而在这片浩瀚的商海中&#xff0c;成都睿明智科技有限公司犹如一艘装备精良的航船&#xff0c;引领着众多企业破浪前行&#xff0c;探索抖音电商的无限可能。今天&a…...

【天线&化学】航拍图屋顶异常检测系统源码&数据集全套:改进yolo11-ContextGuided

改进yolo11-ContextGuided等200全套创新点大全&#xff1a;航拍图屋顶异常检测系统源码&#xff06;数据集全套 1.图片效果展示 项目来源 人工智能促进会 2024.11.01 注意&#xff1a;由于项目一直在更新迭代&#xff0c;上面“1.图片效果展示”和“2.视频效果展示”展示的系…...

【回忆】JavaScript 中的 Map 有哪些方法

在 JavaScript 中&#xff0c;Map 对象是一种键值对的集合&#xff0c;类似于对象&#xff0c;但“键”可以是任何数据类型&#xff08;对象或原始值&#xff09;。Map 提供了多种方法来操作这些键值对。以下是 Map 对象的一些常用方法&#xff1a; 创建和初始化 new Map(): …...

Chrome与夸克的安全性对比

在当今数字化时代&#xff0c;浏览器的安全性对于用户来说至关重要。Chrome和夸克作为两款流行的浏览器&#xff0c;各有其特点和优势。本文将对这两款浏览器的安全性进行详细对比&#xff0c;帮助用户更好地了解它们之间的差异。&#xff08;本文由https://www.chromegw.com/的…...

使用Python可视化支持向量机(SVM)

支持向量机&#xff08;SVM&#xff09;是用于分类和回归任务的强大监督学习模型。它们受欢迎背后的一个关键因素是它们有效处理线性和非线性数据的能力。在本文中&#xff0c;我们将探索使用Python和流行的库&#xff08;如scikit-learn和Matplotlib&#xff09;可视化SVM。 …...

C++泛型编程

一、什么是泛型编程 泛型编程 是一种编程范式&#xff0c;它通过编写可以处理多种数据类型的代码来实现代码的灵活复用。泛型编程主要通过模板来实现。 比如我们日常使用的容器类型vector就应用了模板来实现其通用性&#xff0c;我们在使用时可以通过传入型别创建对应的动态数…...

【论文分享】利用大量街景图片研究街道空间质量与建筑环境属性之间的关联

本研究通过有序逻辑回归模型&#xff0c;结合街景图片和街道数据&#xff0c;分析了街道空间质量与建筑环境属性的关系。通过Kappa分析和相关性分析&#xff0c;确定了影响街道空间质量的因素&#xff0c;并绘制了质量分布图。这些因素与街道质量的不同维度相关联&#xff0c;对…...

【Linux第七课--基础IO】内存级文件、重定向、缓冲区、文件系统、动态库静态库

目录 引入内存级文件重新使用C文件接口 -- 对比重定向写文件读文件文件流 认识文件操作的系统接口open参数 -- flagflag的内容宏的传参方式 open关闭文件写文件读文件结论 引入文件描述符fd、对文件的理解理解一切皆文件方法集文件fd的分配规则 重定向代码的重定向输入重定向输…...

MPNet:旋转机械轻量化故障诊断模型详解python代码复现

目录 一、问题背景与挑战 二、MPNet核心架构 2.1 多分支特征融合模块(MBFM) 2.2 残差注意力金字塔模块(RAPM) 2.2.1 空间金字塔注意力(SPA) 2.2.2 金字塔残差块(PRBlock) 2.3 分类器设计 三、关键技术突破 3.1 多尺度特征融合 3.2 轻量化设计策略 3.3 抗噪声…...

vscode(仍待补充)

写于2025 6.9 主包将加入vscode这个更权威的圈子 vscode的基本使用 侧边栏 vscode还能连接ssh&#xff1f; debug时使用的launch文件 1.task.json {"tasks": [{"type": "cppbuild","label": "C/C: gcc.exe 生成活动文件"…...

生成 Git SSH 证书

&#x1f511; 1. ​​生成 SSH 密钥对​​ 在终端&#xff08;Windows 使用 Git Bash&#xff0c;Mac/Linux 使用 Terminal&#xff09;执行命令&#xff1a; ssh-keygen -t rsa -b 4096 -C "your_emailexample.com" ​​参数说明​​&#xff1a; -t rsa&#x…...

【Zephyr 系列 10】实战项目:打造一个蓝牙传感器终端 + 网关系统(完整架构与全栈实现)

🧠关键词:Zephyr、BLE、终端、网关、广播、连接、传感器、数据采集、低功耗、系统集成 📌目标读者:希望基于 Zephyr 构建 BLE 系统架构、实现终端与网关协作、具备产品交付能力的开发者 📊篇幅字数:约 5200 字 ✨ 项目总览 在物联网实际项目中,**“终端 + 网关”**是…...

MySQL 8.0 OCP 英文题库解析(十三)

Oracle 为庆祝 MySQL 30 周年&#xff0c;截止到 2025.07.31 之前。所有人均可以免费考取原价245美元的MySQL OCP 认证。 从今天开始&#xff0c;将英文题库免费公布出来&#xff0c;并进行解析&#xff0c;帮助大家在一个月之内轻松通过OCP认证。 本期公布试题111~120 试题1…...

Python 包管理器 uv 介绍

Python 包管理器 uv 全面介绍 uv 是由 Astral&#xff08;热门工具 Ruff 的开发者&#xff09;推出的下一代高性能 Python 包管理器和构建工具&#xff0c;用 Rust 编写。它旨在解决传统工具&#xff08;如 pip、virtualenv、pip-tools&#xff09;的性能瓶颈&#xff0c;同时…...

A2A JS SDK 完整教程:快速入门指南

目录 什么是 A2A JS SDK?A2A JS 安装与设置A2A JS 核心概念创建你的第一个 A2A JS 代理A2A JS 服务端开发A2A JS 客户端使用A2A JS 高级特性A2A JS 最佳实践A2A JS 故障排除 什么是 A2A JS SDK? A2A JS SDK 是一个专为 JavaScript/TypeScript 开发者设计的强大库&#xff…...

人机融合智能 | “人智交互”跨学科新领域

本文系统地提出基于“以人为中心AI(HCAI)”理念的人-人工智能交互(人智交互)这一跨学科新领域及框架,定义人智交互领域的理念、基本理论和关键问题、方法、开发流程和参与团队等,阐述提出人智交互新领域的意义。然后,提出人智交互研究的三种新范式取向以及它们的意义。最后,总结…...

Java求职者面试指南:Spring、Spring Boot、Spring MVC与MyBatis技术解析

Java求职者面试指南&#xff1a;Spring、Spring Boot、Spring MVC与MyBatis技术解析 一、第一轮基础概念问题 1. Spring框架的核心容器是什么&#xff1f;它的作用是什么&#xff1f; Spring框架的核心容器是IoC&#xff08;控制反转&#xff09;容器。它的主要作用是管理对…...

sshd代码修改banner

sshd服务连接之后会收到字符串&#xff1a; SSH-2.0-OpenSSH_9.5 容易被hacker识别此服务为sshd服务。 是否可以通过修改此banner达到让人无法识别此服务的目的呢&#xff1f; 不能。因为这是写的SSH的协议中的。 也就是协议规定了banner必须这么写。 SSH- 开头&#xff0c…...