v4l2(video4linux2) yuyv(yuv422)、MJPEG、H.264
V4L2(Video4Linux2)是Linux内核中的视频设备接口框架,专门用于捕获和输出视频数据。V4L2广泛应用于各种视频设备的驱动程序开发,如网络摄像头、电视调谐器、视频采集卡、以及其他视频输入/输出设备。
### V4L2的主要功能
1. **视频采集**:
- 通过摄像头、视频采集卡等设备捕获视频数据。
- 支持多种视频格式,如YUYV、MJPEG、H.264等。
2. **视频输出**:
- 通过显示设备输出视频流,如电视、显示器等。
3. **视频处理**:
- 支持视频格式转换、缩放、旋转等操作。
- 支持内核空间与用户空间之间的视频数据传输。
4. **音频支持**:
- V4L2也支持与视频流同步的音频数据传输和处理。
### V4L2的工作模式
V4L2支持两种主要的工作模式来管理视频数据的缓冲区:`mmap`模式和`USER_PTR`模式。
1. **mmap 模式**:
- `mmap`模式下,内核分配缓冲区并将其映射到用户空间,应用程序通过这些映射的内存区域来访问视频数据。
2. **USER_PTR 模式**:
- `USER_PTR`模式下,应用程序自行管理缓冲区,并将缓冲区的指针传递给内核。内核直接在这些用户空间的缓冲区中存储和处理数据。
### V4L2的API和结构体
V4L2提供了一系列的IOCTL(Input/Output Control)系统调用和数据结构,开发者可以通过这些接口与视频设备进行交互。
1. **常见的V4L2 IOCTL操作**:
- `VIDIOC_QUERYCAP`:查询设备的功能和能力。
- `VIDIOC_ENUM_FMT`:枚举设备支持的视频格式。
- `VIDIOC_S_FMT` 和 `VIDIOC_G_FMT`:设置和获取视频格式。
- `VIDIOC_REQBUFS`:请求分配视频缓冲区。
- `VIDIOC_QUERYBUF`:查询缓冲区的信息。
- `VIDIOC_QBUF` 和 `VIDIOC_DQBUF`:将缓冲区放入队列和从队列中取出。
- `VIDIOC_STREAMON` 和 `VIDIOC_STREAMOFF`:启动和停止视频流。
2. **主要的V4L2结构体**:
- `v4l2_capability`:表示设备的能力。
- `v4l2_format`:表示视频数据的格式。
- `v4l2_buffer`:表示视频缓冲区。
- `v4l2_requestbuffers`:用于请求缓冲区。
### V4L2的使用流程
一个典型的V4L2应用程序与视频设备交互的流程如下:
1. **打开设备**:
- 使用 `open()` 函数打开 `/dev/videoX` 设备文件。
2. **查询设备能力**:
- 使用 `VIDIOC_QUERYCAP` IOCTL 查询设备的能力。
3. **设置视频格式**:
- 使用 `VIDIOC_S_FMT` 设置所需的视频格式,如分辨率、像素格式等。
4. **请求和分配缓冲区**:
- 使用 `VIDIOC_REQBUFS` 请求内核分配视频缓冲区。
5. **映射缓冲区**(在 `mmap` 模式下):
- 使用 `mmap()` 将缓冲区映射到用户空间。
6. **启动视频流**:
- 使用 `VIDIOC_STREAMON` 启动视频流。
7. **处理视频帧**:
- 使用 `VIDIOC_QBUF` 将缓冲区放入队列,使用 `VIDIOC_DQBUF` 从队列中取出缓冲区,并处理视频数据。
8. **停止视频流**:
- 使用 `VIDIOC_STREAMOFF` 停止视频流。
9. **释放资源**:
- 解除映射,释放缓冲区,关闭设备。
### 应用场景
V4L2广泛应用于开发需要视频采集和处理的应用程序,如网络摄像头应用、视频会议系统、直播系统、安防监控系统、以及多媒体设备的驱动开发。
由于V4L2的灵活性和广泛支持,它成为了Linux平台上处理视频输入和输出的标准接口,尤其是在嵌入式系统和消费类电子产品中。
YUYV、MJPEG、H.264 是视频编码和像素格式的三种常见类型,每种格式在不同的场景下都有其特定的用途和优缺点。
### 1. **YUYV (YUV 4:2:2)**
**YUYV** 是一种像素格式,用于表示视频帧中每个像素的颜色信息。它属于 YUV 色彩空间的一种子采样格式。
- **YUV 色彩空间**:
- Y 代表亮度(Luminance),即灰度信息。
- U 和 V 代表色度(Chrominance),分别存储蓝色和红色分量的差异。
- **4:2:2 子采样**:
- 在 YUYV 格式中,Y 分量的分辨率与图像原始分辨率相同,但色度分量 U 和 V 的分辨率仅为原始分辨率的一半。这种子采样方式有效地减少了数据量,因为人眼对亮度变化比对色度变化更敏感。
- **数据排列**:
- 像素数据以交错方式存储,每两个像素共享一组 U 和 V 值。例如,存储格式为 `Y0 U0 Y1 V0`,其中 Y0 和 Y1 分别为两个像素的亮度,U0 和 V0 是这两个像素共享的色度信息。
- **优点**:
- 比 RGB 格式更节省带宽和存储空间,同时仍能提供良好的图像质量。
- **缺点**:
- 色彩分辨率较低,可能在某些高要求的应用中造成色彩细节丢失。
- **应用场景**:
- 常用于实时视频捕获和传输,如网络摄像头或视频会议系统。
### 2. **MJPEG (Motion JPEG)**
**MJPEG** 是一种视频编码格式,将一系列 JPEG 压缩的静态图像序列组成视频流。
- **编码方式**:
- 每一帧都是独立的 JPEG 图像,通过标准的 JPEG 压缩算法编码。这意味着 MJPEG 没有帧间压缩,帧与帧之间没有依赖性。
- **优点**:
- 编解码简单,资源开销小。
- 因为每一帧都是独立的图像,所以编辑和处理单帧图像非常方便。
- 对丢包不敏感,适合不可靠的网络传输环境。
- **缺点**:
- 由于没有帧间压缩,MJPEG 视频的文件大小通常较大。
- 相比 H.264 等高级视频压缩格式,压缩效率较低。
- **应用场景**:
- 常用于数字相机、网络摄像头、视频监控等应用中,特别是在实时性要求较高的场景中。
### 3. **H.264 (MPEG-4 AVC)**
**H.264**,也称为 **MPEG-4 AVC (Advanced Video Coding)**,是一种广泛使用的高效视频压缩标准。
- **编码方式**:
- H.264 使用帧内和帧间压缩技术,通过分析视频帧的冗余性(如运动估计和补偿)来极大地减少数据量。它将视频分成宏块,并对每个宏块进行变换、量化和熵编码。
- **优点**:
- 高压缩效率,能在较低的比特率下提供较高的视频质量。
- 支持多种分辨率和比特率,灵活性高。
- 由于广泛的硬件加速支持,H.264 可以在多种设备上实现高效的编码和解码。
- **缺点**:
- 编码和解码的复杂性较高,要求更多的计算资源。
- 由于其复杂的专利许可结构,在某些情况下可能涉及版权和授权费用。
- **应用场景**:
- H.264 是当前最广泛使用的视频编码格式之一,广泛应用于视频流媒体、视频会议、蓝光光盘、数字电视广播以及各种视频压缩应用中。
### 总结
- **YUYV**:用于未压缩的视频流,适合对延迟和色彩准确性有高要求的实时视频应用。
- **MJPEG**:适合简单的视频捕获和存储应用,特别是在不可靠的传输环境下。
- **H.264**:用于需要高压缩效率和良好视频质量的应用,特别是视频流媒体和高清电视广播。
相关文章:
v4l2(video4linux2) yuyv(yuv422)、MJPEG、H.264
V4L2(Video4Linux2)是Linux内核中的视频设备接口框架,专门用于捕获和输出视频数据。V4L2广泛应用于各种视频设备的驱动程序开发,如网络摄像头、电视调谐器、视频采集卡、以及其他视频输入/输出设备。 ### V4L2的主要功能 1. **视…...
.Net插件开发开源框架
在.NET开发中,有许多开源框架可以用于插件开发,以下是一些最常见的框架: MEF(Managed Extensibility Framework) MEF是一个用于创建可插拔软件应用程序的库,它可以在不修改原始应用程序的情况下扩展应用程…...
基于Spark实现大数据量的Node2Vec
基于Spark实现大数据量的Node2Vec Node2Vec 是一种基于图的学习算法,用于生成图中节点的低维度、高质量的向量表示。这种算法基于 word2vec 模型,将自然语言处理中的词嵌入技术应用于图结构的节点,以捕捉节点之间的复杂关系。Node2Vec 特别强…...
[VMware]VMware-Esxi 6.7 厚置备转为精简置备
背景:创建了一个win10 60G的厚置备磁盘,现在想改为精简置备。 先关闭win10系统,并删除快照 1、开启shell 2、登录到虚拟存放的目录 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 [rootxxx:~] cd /vmfs/volumes/5fea055e-458157d3-c8f8-8cec4ba51c4…...
vue面试题十八
一、Vue 3中的样式绑定有哪些新特性? Vue 3中的样式绑定保持了与Vue 2相似的灵活性和强大功能,同时引入了一些新的特性和改进,主要集中在响应式系统和Composition API上。以下是Vue 3中样式绑定的主要新特性及其说明: 1. 响应式…...
windows C++-windows C++/CX简介(三)
^类型 (^) 是 C/CX 最突出的功能之一——当人们第一次看到 C/CX 代码时,很难不注意到它。那么,^ 类型到底是什么?这是类型是一种智能指针类型,它自动管理 Windows 运行时对象的生命周期,也 提供自动类型转换功能以简化…...
《黑神话.悟空》:一场跨越神话与现实的深度探索
《黑神话.悟空》:一场跨越神话与现实的深度探索 在国产游戏日益崛起的今天,《黑神话.悟空》以其独特的剧情、丰富的人物设定和深刻的主题,成为了无数玩家翘首以盼的国产3A大作。这款游戏不仅是一次对传统故事的创新演绎,更是一场对…...
【Kotlin设计模式】建造者模式在Android中的应用
前言 建造者模式(Builder Pattern)是一种创建型设计模式,一步一步地构建一个复杂对象的不同部分,而不是直接创建该对象的实例。建造者模式的核心思想是将对象的构建过程与其表示分离,使得同样的构建过程可以创建不同的…...
Kafka 性能为什么比 RocketMQ 好
Kafka 性能更好的原因 因为 kafka 零拷贝技术跟 RocketMQ 的不一样。 kafka 零拷贝技术使用的是 sendfileDMA scatter/gather 。只需要经过 2 次拷贝,2 次上下文切换RocketMQ 零拷贝使用的 mmap 内存映射,需要经过 3 次拷贝,4 次上下文切换…...
el-image的配套使用(表格,表单)
1. 配合table在一起使用,支持预览 此处使用场景是表格中只显示一张图片 preview-src-list只支持数组,故需要将单个字符串转换为转换为字符串数组 <el-table-column align"center" label"二维码"><template slot-scope&q…...
MKS MWH-5匹配器Automatc matching impedance Network手侧
MKS MWH-5匹配器Automatc matching impedance Network手侧...
打卡50天------图论
正式开启图论了,作为一个前端工程师,这个代码随想录真的刷新了我对于算法的认知,每天都在学习新东西。 别着急、放轻松、慢慢来。 一、图论理论基础 二、深搜理论基础 了解一下深搜的原理和过程,其实对于深搜和广搜我自己也写过…...
实现 FastCGI
CGI的由来: 最早的 Web 服务器只能简单地响应浏览器发来的 HTTP 请求,并将存储在服务器上的 HTML 文件返回给浏 览器,也就是静态 html 文件,但是后期随着网站功能增多网站开发也越来越复杂,以至于出现动态技 术&…...
0x01 GlassFish 任意文件读取漏洞复现
参考文章: 应用服务器glassfish任意文件读取漏洞 - SecPulse.COM | 安全脉搏 fofa 搜索使用该服务器的网站 网络空间测绘,网络空间安全搜索引擎,网络空间搜索引擎,安全态势感知 - FOFA网络空间测绘系统 "glassfish"&…...
RLOC_ORIGIN
RLOC_ORIGIN属性为相对放置的对象提供绝对位置或LOC RTL设计中的宏(RPM)。有关定义RPM和使用 RLOC_ORIGIN属性,请参阅《Vivado Design Suite用户指南:使用约束》 (UG903)[参考文献19]。 RPM是通过使用H_set…...
【Python】成功解决 NameError: name ‘reload‘ is not defined
【Python】成功解决 NameError: name ‘reload’ is not defined 下滑即可查看博客内容 🌈 欢迎莅临我的个人主页 👈这里是我静心耕耘深度学习领域、真诚分享知识与智慧的小天地!🎇 🎓 博主简介:985高校…...
Android.bp和Android.mk文件有的区别
文章目录 1. 构建系统2. 语法和格式3. 可维护性和扩展性4. 编译效率5. 未来趋势 在Android的构建系统中, Android.mk和 android.bp是用于定义如何编译项目文件的两种文件类型,它们有一些显著的区别。 1. 构建系统 Android.mk:使用于基于GN…...
思科设备静态路由实验
拓扑及需求 网络拓扑及 IP 编址如图所示;PC1 及 PC2 使用路由器模拟;在 R1、R2、R3 上配置静态路由,保证全网可达;在 R1、R3 上删掉上一步配置的静态路由,改用默认路由,仍然要求全网可达。 各设备具体配置…...
学习笔记第二十九天
IPC 进程间通信方式:共享内存 原理 共享内存是最高效的进程间通信方式之一,因为它允许两个或多个进程直接访问同一块物理内存区域。这种机制避免了数据在用户空间和内核空间之间的频繁拷贝,从而显著提高了数据传输的效率。 在Linux系统中&…...
Apache Paimon走在正确的道路上|一些使用体验和未来判断
Apache Paimon这个框架大家应该都不陌生了。 在实际工作中大家应该多多少少都用到,这个文章是一个简单的使用体会。不涉及湖框架的拉踩,我们的着眼点是解决实际问题。 我来结合自身体会跟大家说说Paimon这个框架和对未来的一些判断。大家可以参考&#x…...
日语AI面试高效通关秘籍:专业解读与青柚面试智能助攻
在如今就业市场竞争日益激烈的背景下,越来越多的求职者将目光投向了日本及中日双语岗位。但是,一场日语面试往往让许多人感到步履维艰。你是否也曾因为面试官抛出的“刁钻问题”而心生畏惧?面对生疏的日语交流环境,即便提前恶补了…...
应用升级/灾备测试时使用guarantee 闪回点迅速回退
1.场景 应用要升级,当升级失败时,数据库回退到升级前. 要测试系统,测试完成后,数据库要回退到测试前。 相对于RMAN恢复需要很长时间, 数据库闪回只需要几分钟。 2.技术实现 数据库设置 2个db_recovery参数 创建guarantee闪回点,不需要开启数据库闪回。…...
利用ngx_stream_return_module构建简易 TCP/UDP 响应网关
一、模块概述 ngx_stream_return_module 提供了一个极简的指令: return <value>;在收到客户端连接后,立即将 <value> 写回并关闭连接。<value> 支持内嵌文本和内置变量(如 $time_iso8601、$remote_addr 等)&a…...
Java 语言特性(面试系列1)
一、面向对象编程 1. 封装(Encapsulation) 定义:将数据(属性)和操作数据的方法绑定在一起,通过访问控制符(private、protected、public)隐藏内部实现细节。示例: public …...
以下是对华为 HarmonyOS NETX 5属性动画(ArkTS)文档的结构化整理,通过层级标题、表格和代码块提升可读性:
一、属性动画概述NETX 作用:实现组件通用属性的渐变过渡效果,提升用户体验。支持属性:width、height、backgroundColor、opacity、scale、rotate、translate等。注意事项: 布局类属性(如宽高)变化时&#…...
ffmpeg(四):滤镜命令
FFmpeg 的滤镜命令是用于音视频处理中的强大工具,可以完成剪裁、缩放、加水印、调色、合成、旋转、模糊、叠加字幕等复杂的操作。其核心语法格式一般如下: ffmpeg -i input.mp4 -vf "滤镜参数" output.mp4或者带音频滤镜: ffmpeg…...
解决本地部署 SmolVLM2 大语言模型运行 flash-attn 报错
出现的问题 安装 flash-attn 会一直卡在 build 那一步或者运行报错 解决办法 是因为你安装的 flash-attn 版本没有对应上,所以报错,到 https://github.com/Dao-AILab/flash-attention/releases 下载对应版本,cu、torch、cp 的版本一定要对…...
UR 协作机器人「三剑客」:精密轻量担当(UR7e)、全能协作主力(UR12e)、重型任务专家(UR15)
UR协作机器人正以其卓越性能在现代制造业自动化中扮演重要角色。UR7e、UR12e和UR15通过创新技术和精准设计满足了不同行业的多样化需求。其中,UR15以其速度、精度及人工智能准备能力成为自动化领域的重要突破。UR7e和UR12e则在负载规格和市场定位上不断优化…...
SpringCloudGateway 自定义局部过滤器
场景: 将所有请求转化为同一路径请求(方便穿网配置)在请求头内标识原来路径,然后在将请求分发给不同服务 AllToOneGatewayFilterFactory import lombok.Getter; import lombok.Setter; import lombok.extern.slf4j.Slf4j; impor…...
视觉slam十四讲实践部分记录——ch2、ch3
ch2 一、使用g++编译.cpp为可执行文件并运行(P30) g++ helloSLAM.cpp ./a.out运行 二、使用cmake编译 mkdir build cd build cmake .. makeCMakeCache.txt 文件仍然指向旧的目录。这表明在源代码目录中可能还存在旧的 CMakeCache.txt 文件,或者在构建过程中仍然引用了旧的路…...
