当前位置: 首页 > news >正文

系统化学习 H264视频编码(06)哥伦布编码

说明:我们参考黄金圈学习法(什么是黄金圈法则?->模型 黄金圈法则,本文使用:why-what)来学习音H264视频编码。本系列文章侧重于理解视频编码的知识体系和实践方法,理论方面会更多地讲清楚 音视频中概念的起源以及各个概念的联系。知其然,知其所以然。同时更强调知识系统的建立。

针对本文,我们主要研究上一篇文章(系统化学习 H264视频编码(05)码流数据及相关概念解读)中提到的 H.264码流中的数据编码,也就是哥伦布编码。解读为什么要使用哥伦布编码以及哥伦布编码到底是怎么计算的。

1 为什么H264编码中使用哥伦布编码来编码来压缩数据?

我们将其拆分成2个问题:为什么H264编码中使用熵编码来压缩数据,以及为什么使用熵编码中的哥伦布编码来编码。

1.1 为什么H264编码中使用熵编码来压缩数据?

在视频编码中,熵编码方法被广泛使用,主要是因为它能够有效地减少数据的冗余,从而提高压缩效率。以下是使用熵编码方法的几个关键原因:

  1. 信息熵的概念: 信息熵是度量信息的不确定性的量。熵编码方法的核心思想是为更可能发生的事件分配更短的编码,从而最小化总体编码长度,接近信息熵的理论极限。

  2. 利用数据的统计特性: 视频数据具有明显的统计规律性,例如在自然场景中相邻像素之间存在很强的相关性。熵编码利用这些统计特性,通过为高频事件分配短码字,为低频事件分配长码字,实现数据的有效压缩。

  3. 无损压缩: 熵编码是一种无损压缩方法,这意味着原始视频数据可以从压缩后的数据完全恢复,不损失任何信息。

  4. 适应性: 熵编码可以适应各种不同的数据源和不同的编码场景。它可以动态地根据数据的实际分布调整编码策略。

  5. 减少存储和传输成本: 通过减少视频数据的大小,熵编码可以显著降低存储成本和网络带宽需求,这对于视频的存储和传输尤为重要。

  6. 提高编码效率: 熵编码通常作为视频编码流程的最后一步,对已经通过变换和量化处理过的数据进行进一步压缩,从而提高整体编码效率。

  7. 兼容性和标准化: 熵编码方法如哈夫曼编码、算术编码等已经被广泛地集成到视频编码标准中,如H.264、H.265、VP9等,这些标准确保了不同编码器和解码器之间的兼容性。

  8. 优化编码性能: 熵编码可以与其他视频编码技术(如帧内预测、帧间预测、变换和量化)相结合,共同优化编码性能。

  9. 灵活性和扩展性: 熵编码方法可以根据新的压缩需求和技术进步进行调整和扩展,以实现更高的压缩效率。

  10. 减少计算复杂度: 相比其他一些压缩技术,熵编码方法通常具有较低的计算复杂度,这使得它适合于实时视频编码和解码应用。

综上所述,熵编码方法在视频编码中的应用可以显著提高压缩效率,降低存储和传输成本,同时保持数据的无损性,这些优势使其成为视频编码中不可或缺的一部分。

1.2 那么多熵编码算法,为什么选择哥伦布编码?

哥伦布编码(Golomb coding)是一种熵编码方法,它与一些其他类型的编码方法有相似之处,尤其是在它们都是变长编码(Variable-Length Coding, VLC)这一点上。但是同类型的编码算法那么多,为什么视频编码中选择使用哥伦布编码而不是其他编码算法呢?

主要是因为哥伦布编码具有以下几个关键优势:

  • 与信源无关:哥伦布编码的编码规则与信源的概率分布无关,这意味着它适用于各种类型的数据流,而不需要针对特定信源调整编码规则。
  • 无需额外信息:使用哥伦布编码时,不需要携带额外的码表信息,这简化了编码过程并减少了必要的数据传输量。
  • 压缩效率:尽管哥伦布编码的压缩率可能不如霍夫曼编码等算法,但在实际的视频编码应用中,它提供了足够的压缩效率,同时保持了较低的计算复杂度。
  • 编码复杂度低:与霍夫曼编码相比,哥伦布编码的运算复杂度较低,这使得它更适合于需要处理大量数据的视频编码场景。
  • 适应性:哥伦布编码能够适应视频数据中的不同统计特性,尤其是在编码变换系数时,可以有效地处理视频数据中的稀疏性。
  • 容错性:哥伦布编码的结构有助于在不完美或有噪声的传输环境中保持较好的容错性,这对于视频流的稳定性至关重要。
  • 广泛应用于视频编码标准:哥伦布编码被广泛应用于多个视频编码标准中,如H.264,这表明它在实际应用中已被证明是有效的。
  • 易于实现:哥伦布编码的实现相对简单,易于在硬件和软件中部署,这对于降低编解码器的开发和维护成本非常重要。

综上所述,哥伦布编码因其简单性、适应性、以及在视频编码中的高效性,成为视频编码领域中一个受欢迎的选择。

2 什么是哥伦布编码?

视频编码中的哥伦布编码是一种用于压缩数据的熵编码技术,它特别适合于编码那些具有几何分布特性的数值,比如在视频编码中常见的变换系数。哥伦布编码能够有效地表示这种类型的数据,因为它可以为频繁出现的较小数值分配较短的编码,而不常见的较大数值则分配较长的编码。

哥伦布编码的基本思想是将每个待编码的非负整数转换为一个较短的二进制表示形式。这种转换基于一个简单的观察:在许多自然信号中,较小的数值出现的频率远高于较大的数值。

2.1 形象解读哥伦布编码

想象一下,你管理着一个巨大的图书馆,这个图书馆的书籍数量非常庞大,而且种类繁多。每本书都有一个唯一的编码,用于标识和检索。在这个图书馆中,有些书籍非常受欢迎,借阅的频率很高(相当于小数值),而有些书籍则很少被人问津(相当于大数值)。为了简化编码系统并节省空间,你决定使用一种特殊的编码规则,这就是类似于哥伦布编码的系统:

  1. 编号调整:首先,你决定对每本书的编号进行加1处理,因为图书馆中没有编号为0的书。
  2. 二进制转换:接着,你将每本书的编号转换为二进制形式。
  3. 寻找最长的0前缀:在二进制编号中,你从最高位开始寻找第一个1的位置,1前面的所有0构成了一个序列。
  4. 编码生成:在找到的1前面,你添加相同数量的0,然后紧跟着是1后面所有的二进制位,这样就形成了这本书的哥伦布编码。
  5. 编码优势:这种编码方式的好处在于,那些编号较小(即受欢迎的)书籍的编码会很短,因为它们的二进制表示中1出现得很快,不需要太多0前缀。而不那么受欢迎的书籍,虽然编号较大,但它们的编码也不会太长,因为它们本来就不常被借阅。
  6. 解码过程:当需要找到一本书时,你从编码的第一个位开始向左数,直到遇到第一个1,然后根据1前面的0的数量确定书籍的编号,从而快速检索到书籍。

通过这个比喻,我们可以看到哥伦布编码如何为不同频率出现的数值提供一种高效的编码方式,这与图书馆中根据书籍的受欢迎程度来优化编码和检索系统非常相似。

2.2 0阶无符号指数哥伦布编码

正常来说,哥伦布编码可以拓展位k阶,但是在H264中使用的是0阶指数哥伦布编码,在H.264中使用ue(v)表示0阶无符号指数哥伦布编码的解码过程,用se(v)表示0阶有符号指数哥伦布编码过程。0阶无符号指数哥伦布编码最后生成的比特串格式为"前缀1后缀",前缀和后缀的长度是相同的。假如待编码数字codeNum = 5,0阶无符号指数哥伦布编码的步骤如下:

  1. 将数字5以二进制写出,5的二进制为101,因为0阶指数哥伦布编码,所以不用去掉低位。
  2. 将上面的二进制+1,101加1为110,留下的比特数为3,3-1=2,所有需要增加前导0的个数为2
  3. 因为第一步没有去掉,所有这一步不进行任何操作,最终生成的比特串为00110

通过这种方式,哥伦布编码能够为视频编码中的变换系数提供一种高效的编码方式,从而减少视频数据的总体大小,实现高效视频压缩。下面是对其他不同codeNum进行编码的结果,如下所示:

最后,总结下哥伦布编码的具体步骤:

  1. 加1操作:首先,将待编码的数值加1。这是因为哥伦布编码需要处理非负整数,而0作为一个特殊值,通过加1操作可以避免在编码中单独处理。

  2. 二进制表示:将加1后的数值转换为二进制形式。

  3. 寻找最长的0前缀:在二进制表示中,从最高位(最左边)开始数,找到第一个1的位置,1前面所有的0就构成了最长的0前缀。

  4. 编码生成:在1的前面添加与0前缀长度相等的0,然后在1后面放置原始二进制表示中1后面的所有位,这样就形成了哥伦布编码。

  5. 解码过程:解码时,从编码的第一位开始向左数,直到遇到第一个1,1前面的0的数量就是编码的长度。然后根据这个长度,从1后面读取相应数量的位,还原为原始数值。

2.3 扩展知识:k阶无符号指数哥伦布编码

k阶无符号指数哥伦布编码步骤如下所示:

(1)将codeNum加上2^k,k-0时是1;k=1时是2;k=2时是4;

(2)将codeNum加上2^k的数字用二进制表示;

(3)计算二进制长度len,然后在其前面加上前缀 len-1-k个0;

比特串的格式位"前缀1后缀"。前缀 = 后缀 - k,下面是对其他不同codeNum进行k阶无符号指数哥伦布编码的结果,如下所示:

相关文章:

系统化学习 H264视频编码(06)哥伦布编码

说明:我们参考黄金圈学习法(什么是黄金圈法则?->模型 黄金圈法则,本文使用:why-what)来学习音H264视频编码。本系列文章侧重于理解视频编码的知识体系和实践方法,理论方面会更多地讲清楚 音视频中概念的…...

手机在网状态接口如何对接?(一)

一、什么是手机在网状态? 传入手机号码,查询该手机号的在网状态,返回内容有正常使用、停机、在网但不可用、不在网(销号/未启用/异常)、预销户等多种状态。 二、手机在网状态使用场景? 1.信贷审核&#…...

数据结构链表2(常考习题1)(C语言)

移除链表元素: . - 力扣(LeetCode) 题目: 给你一个链表的头节点 head 和一个整数 val ,请你删除链表中所有满足 Node.val val 的节点,并返回 新的头节点 。 解题思路: 情况1: 情…...

Rust的运行时多态

Rust的运行时多态 Rust的静态多态即编译时多态,通过**泛型特征约束(Generic Type Trait Constrait)**来实现; 那么动态多态(运行时多态)呢?答案是特征对象(Trait Object&#xff…...

sqllabs通关

sqllabs5:(报错注入) ?id1 回显You are in........... ?id2-1 回显You are in........... ?id1 回显 1 LIMIT 0,1 判断是字符型,闭合。?id1order by 3-- //页面显示正常我们试了4行得出是报错注入 我们先爆库名 http://127.0.0.1/sqli-labs-master/L…...

RTSP系列四:RTSP Server/Client实战项目

RTSP系列: RTSP系列一:RTSP协议介绍-CSDN博客 RTSP系列二:RTSP协议鉴权-CSDN博客 RTSP系列三:RTP协议介绍-CSDN博客 RTSP系列四:RTSP Server/Client实战项目-CSDN博客 目录 一、RTSP Server实战项目 1、准备 2、…...

sqli-labs-php7-master第11-16关

猜注入点 先来猜数字型 单引号字符型: 发现注入点找到了 猜测数据库有多少个字段: 1’ order by 4 # 密码随便输的。 这里没有使用--注释,因为没作用,可能是过滤掉了 继续猜。刚才没猜对 1 order by 2 # 没报错,猜…...

c++初阶 string的底层实现

string 基础函数成员成员变量构造函数析构函数&#xff1a;拷贝构造赋值构造 遍历下标访问迭代器 增删插开辟空间push_backappendinserterase 功能函数swapfindc_strsubstrclear 其他函数比较函数流提取<<流插入>>getline 完整版 声明&#xff1a;非纯手搓&#xf…...

微信小程序实现上传照片功能

案例&#xff1a; html: <view class"zhengjianCont fontSize30" style"margin-bottom: 40rpx;"><view class"kuai"><image binderror"imageOnloadError" bind:tap"upladPhoto" data-params"business…...

lombok安装成功但是找不到方法

2024.1.1版本的IDE的插件安装了默认的lombok&#xff08;如图1&#xff09;&#xff0c;pom文件中也引入了lombok的依赖&#xff0c;在实体类写了Data的注解&#xff0c;当调用实体类的get和set方法运行时&#xff0c;报错找不到相应的方法&#xff0c;但是在调用get、set方法的…...

单细胞Seurat的umi矩阵-与feature、counts(用于质控)

目录 关于umi矩阵学习 用umi计算feature、counts值 ①meta数据查看 ②Count和Feature计算(生成Seurat时自动计算) 1)提取UMI矩阵 2)计算 其他指标 评估质量指标(重点) 1)UMI计数 2)基因计数 3)UMIs vs. genes detected 4)线粒体计数比率 5)综合过滤 过…...

安防视频监控EasyCVR视频汇聚平台设备发送了GPS位置,但是订阅轨迹为空是什么原因?

安防视频监控EasyCVR视频汇聚平台兼容性强、支持灵活拓展&#xff0c;平台可提供视频远程监控、录像、存储与回放、视频转码、视频快照、告警、云台控制、语音对讲、GIS地图、轨迹跟踪、平台级联等视频能力。 用户描述&#xff0c;设备在电子地图中可以查看到定位信息&#xff…...

在 VueJS 中使用事件委托处理点击事件(事件委托,vue事件委托,什么是事件委托,什么是vue的事件委托)

前言 在开发 Vue 项目时&#xff0c;我们经常需要处理大量的点击事件。为每个可点击的元素单独添加事件监听器不仅会增加代码的复杂度&#xff0c;还会降低性能。事件委托是一种有效的优化方式&#xff0c;它可以显著减少事件监听器的数量&#xff0c;提高代码的可维护性和执行…...

密码学简史:时间密语

​ 注&#xff1a;机翻&#xff0c;未校。 A brief history of cryptography: Sending secret messages throughout time Stemming from the Greek words for “hidden writing,” cryptography is the practice of encrypting transmitted information so that it can only b…...

【Java数据结构】---初始数据结构

乐观学习&#xff0c;乐观生活&#xff0c;才能不断前进啊&#xff01;&#xff01;&#xff01; 我的主页&#xff1a;optimistic_chen 我的专栏&#xff1a;c语言 &#xff0c;Java 欢迎大家访问~ 创作不易&#xff0c;大佬们点赞鼓励下吧~ 前言 从今天开始我们就要学习Java…...

MySQL--主从复制

前言&#xff1a;本博客仅作记录学习使用&#xff0c;部分图片出自网络&#xff0c;如有侵犯您的权益&#xff0c;请联系删除 一、什么是主从复制 1、定义 主从复制&#xff0c;是用来建立一个和主数据库完全一样的数据库环境&#xff0c;称为从数据库&#xff1b;主数据库一…...

Linux RT调度器之负载均衡

RT调度类的调度策略是&#xff1a;保证TopN&#xff08;N为系统cpu个数&#xff09;优先级的任务可以优先获得cpu资源。除了在任务选核时通过基于cpu优先级的选核策略保证这一点外&#xff0c;还有其它流程&#xff0c;我们姑且将这部分流程称作RT调度器的负载均衡&#xff08;…...

pwn学习笔记(8)--初识Pwn沙箱

初识Pwn沙箱 ​ 沙箱机制&#xff0c;英文sandbox&#xff0c;是计算机领域的虚拟技术&#xff0c;常见于安全方向。一般说来&#xff0c;我们会将不受信任的软件放在沙箱中运行&#xff0c;一旦该软件有恶意行为&#xff0c;则禁止该程序的进一步运行&#xff0c;不会对真实系…...

Day18_2--Vue.js Ajax(使用 Axios)基础入门学习

Vue.js 中的 Ajax 请求&#xff08;使用 Axios&#xff09; 什么是 Axios&#xff1f; Axios 是一个基于 Promise 的 HTTP 客户端&#xff0c;可以用于浏览器和 Node.js 环境中。它是现代化的 Ajax 库&#xff0c;用来替代传统的 XMLHttpRequest。 为什么选择 Axios&#xf…...

windows11远程桌面如何打开

随着远程办公的普及&#xff0c;选择合适的远程桌面工具变得尤为重要。在Windows 11上&#xff0c;用户可以利用系统自带的远程桌面功能&#xff0c;或选择更专业的第三方解决方案&#xff0c;如Splashtop。本文将详细介绍如何在Windows 11上启用远程桌面&#xff0c;并对比Win…...

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…...

安宝特方案丨XRSOP人员作业标准化管理平台:AR智慧点检验收套件

在选煤厂、化工厂、钢铁厂等过程生产型企业&#xff0c;其生产设备的运行效率和非计划停机对工业制造效益有较大影响。 随着企业自动化和智能化建设的推进&#xff0c;需提前预防假检、错检、漏检&#xff0c;推动智慧生产运维系统数据的流动和现场赋能应用。同时&#xff0c;…...

《Playwright:微软的自动化测试工具详解》

Playwright 简介:声明内容来自网络&#xff0c;将内容拼接整理出来的文档 Playwright 是微软开发的自动化测试工具&#xff0c;支持 Chrome、Firefox、Safari 等主流浏览器&#xff0c;提供多语言 API&#xff08;Python、JavaScript、Java、.NET&#xff09;。它的特点包括&a…...

Robots.txt 文件

什么是robots.txt&#xff1f; robots.txt 是一个位于网站根目录下的文本文件&#xff08;如&#xff1a;https://example.com/robots.txt&#xff09;&#xff0c;它用于指导网络爬虫&#xff08;如搜索引擎的蜘蛛程序&#xff09;如何抓取该网站的内容。这个文件遵循 Robots…...

PL0语法,分析器实现!

简介 PL/0 是一种简单的编程语言,通常用于教学编译原理。它的语法结构清晰,功能包括常量定义、变量声明、过程(子程序)定义以及基本的控制结构(如条件语句和循环语句)。 PL/0 语法规范 PL/0 是一种教学用的小型编程语言,由 Niklaus Wirth 设计,用于展示编译原理的核…...

Axios请求超时重发机制

Axios 超时重新请求实现方案 在 Axios 中实现超时重新请求可以通过以下几种方式&#xff1a; 1. 使用拦截器实现自动重试 import axios from axios;// 创建axios实例 const instance axios.create();// 设置超时时间 instance.defaults.timeout 5000;// 最大重试次数 cons…...

UR 协作机器人「三剑客」:精密轻量担当(UR7e)、全能协作主力(UR12e)、重型任务专家(UR15)

UR协作机器人正以其卓越性能在现代制造业自动化中扮演重要角色。UR7e、UR12e和UR15通过创新技术和精准设计满足了不同行业的多样化需求。其中&#xff0c;UR15以其速度、精度及人工智能准备能力成为自动化领域的重要突破。UR7e和UR12e则在负载规格和市场定位上不断优化&#xf…...

CMake控制VS2022项目文件分组

我们可以通过 CMake 控制源文件的组织结构,使它们在 VS 解决方案资源管理器中以“组”(Filter)的形式进行分类展示。 🎯 目标 通过 CMake 脚本将 .cpp、.h 等源文件分组显示在 Visual Studio 2022 的解决方案资源管理器中。 ✅ 支持的方法汇总(共4种) 方法描述是否推荐…...

C++使用 new 来创建动态数组

问题&#xff1a; 不能使用变量定义数组大小 原因&#xff1a; 这是因为数组在内存中是连续存储的&#xff0c;编译器需要在编译阶段就确定数组的大小&#xff0c;以便正确地分配内存空间。如果允许使用变量来定义数组的大小&#xff0c;那么编译器就无法在编译时确定数组的大…...

NPOI操作EXCEL文件 ——CAD C# 二次开发

缺点:dll.版本容易加载错误。CAD加载插件时&#xff0c;没有加载所有类库。插件运行过程中用到某个类库&#xff0c;会从CAD的安装目录找&#xff0c;找不到就报错了。 【方案2】让CAD在加载过程中把类库加载到内存 【方案3】是发现缺少了哪个库&#xff0c;就用插件程序加载进…...