数字图像处理笔记(一)---- 图像数字化与显示
系列文章目录
数字图像处理学习笔记(一)---- 图像数字化与显示
数字图像处理笔记(二)---- 像素加图像统计特征
数字图像处理笔记(三) ---- 傅里叶变换的基本原理
文章目录
- 系列文章目录
- 前言
- 一、数字图像处理
- 二、图像数字化与显示(数字图像的基本获取过程)
- 2.1 采样
- 2.2 量化
- 2.2.1 量化方法--标量量化
- 2.2.2 矢量量化
- 总结
前言
慕课视频地址:https://www.icourse163.org/course/HHU-1471232170 from=searchPage&outVendor=zw_mooc_pcssjg_
注重讲解图像变换以及分解过程中物理含义
理解数学模型如何描述和解决实际应用问题
培养对复杂工程问题的分析解决的能力
一、数字图像处理
包括图像增强,图像压缩,图像重建,图像融合,图像分类,目标识别。
图像增强技术
图像增强技术的应用范围很广,最常见的就是手机美颜功能,可以平滑掉面部的瑕疵和纹理,也可以实现眼睛鼻子嘴唇等部位的特征增强。图像增强技术在医学影像领域也很重要,例如x光片,和CT影像,对图像全图或感兴趣区域进行局部对比度拉伸,方便医生做出诊断。
图像压缩技术
图像压缩技术是研究如何对数字图像进行压缩和编码,降低图像传输和存储所占用的带宽和存储资源的技术。我们平时的照片通常是jpg格式文件,视频通常是mp4格式文件。这些文件格式中都包含有图像压缩技术。
图像重建技术
图像重建技术是基于对场景有限的观测数据重建出清晰、完整的图像。例如在核磁共振成像领域,通常需要牺牲一部分观测数据换取扫描时间。成像时间长一直是核磁共振成像的一大弊力,对于CT影像快速成像可以降低患者的辐射量,它的意见就更加明显。
稀疏采样和压缩感知技术可以实现快速成像
快速成像为图像重建提出了新的挑战。
老照片复原技术,换脸技术都可以理解为图像重建技术。老照片复原技术中,由于当时传感器设备性能的局限性,很多保存的老照片存在分辨率低,噪声干扰强,图片失真等情况。可以通过图像重建技术进行修复和补充。
图像的分类识别
属于高级别的图像处理技术。在自动驾驶技术,医学AI诊断,遥感自动解译等领域都具有重要的研究价值。比如现有的CT影像已经可以实现机器的自动阅片,这就是通过图像分割,分类,识别技术实现的。
二、图像数字化与显示(数字图像的基本获取过程)
图像数字化的基本过程包括采样、量化和编码三个步骤。
采样:这一步骤涉及将二维空间上连续的图像在水平和垂直方向上等间距地分割成矩形网状结构,形成的微小方格称为像素点。例如,一幅640x480分辨率的图像由307200个像素点组成。采样频率,即一秒钟内采样的次数,反映了采样点之间的间隔大小。采样频率越高,得到的图像样本越逼真,图像质量越高,但要求的存储量也越大。采样点间隔大小的选取非常重要,它决定了采样后的图像能真实反映原图像的程度。
量化:量化是指使用多大范围的数值来表示图像采样之后的每一个点。量化的结果是图像能够容纳的颜色总数,反映了采样的质量。例如,如果使用4位存储一个点,图像只能有16种颜色;若采用16位存储一个点,则有2^16=65536种颜色。量化位数越大,图像可以拥有的颜色越多,产生的图像效果越细致,但也会占用更大的存储空间。
编码:在采样和量化之后,将像素灰度转换成离散的整数值,然后进行编码的过程。这一步骤将数字图像转换为计算机可以存储和处理的格式。
2.1 采样

数字信号是通过采样和量化两个过程,将模拟信号转化为数字信号,图像也是如此。
对于空间位置连续,辐射强度连续的场景,可以通过采样和量化两个步骤实现模拟信号的数字化

对于一个感兴趣的场景信号,我们采用一个光感受器阵列来记录该场景信息,这个过程就是采样,采样后场景中任意一个点都对应一个像素。采样可以将信号在空域维度上进行离散化。
对于同一个场景,既可以采用1024 * 1024 像素来记录也可以采用 256 * 256来记录,这就是由拍摄图像的设备来决定。当光感受器阵列上的采样孔径越小,采样间隔越小,采样得到的图像空间分辨率越高,场景中的细节越清晰。更高的像素即更小的采样间隔,这样我们获取的图像分辨率越高。
2.2 量化
量化是对采样的信号在幅度上进行离散化。
均匀量化可以将信号的变换区间,按照一定的间隔,映射为一个个离散的整数。通常为了满足计算机存储和计算的需要,量化后的数值取值会按照2的幂次方来选择。
可以用0-255这256个灰度级作为量化信号的强度,像素的灰度值就可以用8Bit二进制位来记录。
采样定理–奈奎斯特采样定理

对于一个信号FT,傅里叶变换后可以得到信号的频谱,频谱的宽度是最高频率的两倍;
使用一个采样脉冲序列对它进行采样,采样间隔和w_s称反比例关系。w_s是采样后信号频谱在频域上搬移的距离。

通常为了降低采样点的个数,减少存储的数据量和传输的带宽,我们需要加大采样间隔,这样采样得到信号的频谱搬移的距离w_s就会变小,当搬移的距离小于信号带宽时,我们采样得到的频谱就会发生镜像折叠,就无法重建信号。

如果对一个带宽时20HZ的信号进行采样,采样频率采样12HZ.
按照这个采样频率我们能测量的最高频率只有6HZ,而原始信号最高频率为10HZ.
10HZ的部分就会以6HZ为镜像,产生镜像折叠,就是2HZ.
采集到的信号频谱发生了折叠,最多采集到12HZ带宽的信号。
等间隔均匀采样时,需要满足奈奎斯特采样定理才能无失真的复原信号。
如果不采用等间隔采样,在压缩感知理论下,通过非均匀稀疏采样,就可以打破奈奎斯特采样定理,实现更低采样频率的采样。
如果我们的信号是在频域进行采样,那么采样频率是否要满足Niquest采样定理?
2.2.1 量化方法–标量量化
对每个采样点的信号强度进行量化
均匀量化和非均匀量化

均匀量化:将整个取值范围等间隔划分然后设置量化值代替落入区间的信号幅度
非均匀量化:根据信号幅度出现的频率来优化量化区间和量化值
不同量化间隔下均匀量化得到的成像效果

随着量化间隔的减少,图像中一些灰度差异较小的信息,就会被量化间隔淹没。量化级的减少导致图像中灰度变化平缓区域丢失。量化级越多,图像灰度变化刻画的越准确。
以上两种量化方法都是针对单个像素点的量化,称为标量量化。
如果要将多个像素点的灰度值组合起来一起量化,就是矢量量化。
2.2.2 矢量量化
矢量量化需要提前设计匹配的码字,码字是由同等数量的像素组成的向量;
每个码字分配一个编号。
量化过程就是寻找与输入向量距离最近的码字,用该码字的编号作为量化值进行传输和存储。
在解码时,根据包含所有码字的码书,通过编号索引进行解码。

下面这四个码字分别用两位二进制数进行编码,计算输入向量与各个码字的距离,发现输入向量与第三个码字最接近,因此量化后的编码是10.

相对于标量量化,矢量量化后数据量更小,且具有很强的抗干扰能力。
总结
等间隔均匀采样时,需要满足奈奎斯特采样定理才能无失真的复原信号。如果不采用等间隔采样,在压缩感知理论下,通过非均匀稀疏采样,就可以打破奈奎斯特采样定理,实现更低采样频率的采样。
相对于标量量化,矢量量化后数据量更小,且具有很强的抗干扰能力。
相关文章:
数字图像处理笔记(一)---- 图像数字化与显示
系列文章目录 数字图像处理学习笔记(一)---- 图像数字化与显示 数字图像处理笔记(二)---- 像素加图像统计特征 数字图像处理笔记(三) ---- 傅里叶变换的基本原理 文章目录 系列文章目录前言一、数字图像处理二、图像数…...
Unity UGUI 之 事件接口
本文仅作学习笔记与交流,不作任何商业用途 本文包括但不限于unity官方手册,唐老狮,麦扣教程知识,引用会标记,如有不足还请斧正 本文在发布时间选用unity 2022.3.8稳定版本,请注意分别 1.什么是事件接口&…...
Hadoop、HDFS、MapReduce 大数据解决方案
本心、输入输出、结果 文章目录 Hadoop、HDFS、MapReduce 大数据解决方案前言HadoopHadoop 主要组件的Web UI端口和一些基本信息MapReduceMapReduce的核心思想MapReduce的工作流程MapReduce的优缺点Hadoop、HDFS、MapReduce 大数据解决方案 编辑 | 简简单单 Online zuozuo 地址…...
Dubbo SPI 之负载均衡
1. 背景介绍 在分布式系统中,负载均衡是一项核心技术,旨在将请求合理地分配到多个服务实例上,以提高系统的性能和可靠性。Dubbo 作为一个高性能的 Java RPC 框架,提供了多种负载均衡策略来满足不同的业务需求。本文将深入探讨 Du…...
规范:前后端接口规范
1、前言 随着互联网的高速发展,前端页面的展示、交互体验越来越灵活、炫丽,响应体验也要求越来越高,后端服务的高并发、高可用、高性能、高扩展等特性的要求也愈加苛刻,从而导致前后端研发各自专注于自己擅长的领域深耕细作。 然…...
Python --NumPy库基础方法(2)
NumPy Numpy(Numerical Python) 是科学计算基础库,提供大量科学计算相关功能,比如数据统计,随机数生成等。其提供最核心类型为多维数组类型(ndarray),支持大量的维度数组与矩阵运算,Numpy支持向…...
音视频入门基础:H.264专题(15)——FFmpeg源码中通过SPS属性获取视频帧率的实现
音视频入门基础:H.264专题系列文章: 音视频入门基础:H.264专题(1)——H.264官方文档下载 音视频入门基础:H.264专题(2)——使用FFmpeg命令生成H.264裸流文件 音视频入门基础&…...
【C++高阶】哈希之美:探索位图与布隆过滤器的应用之旅
📝个人主页🌹:Eternity._ ⏩收录专栏⏪:C “ 登神长阶 ” 🤡往期回顾🤡:模拟实现unordered 的奥秘 🌹🌹期待您的关注 🌹🌹 ❀哈希应用 Ǵ…...
文件包涵条件竞争(ctfshow82)
Web82 利用 session.upload_progress 包含文件漏洞 <!DOCTYPE html> <html> <body> <form action"https://09558c1b-9569-4abd-bf78-86c4a6cb6608.challenge.ctf.show//" method"POST" enctype"multipart/form-data"> …...
通信原理-思科实验三:无线局域网实验
实验三 无线局域网实验 一:无线局域网基础服务集 实验步骤: 进入物理工作区,导航选择 城市家园; 选择设备 AP0,并分别选择Laptop0、Laptop1放在APO范围外区域 修改笔记本的网卡,从以太网卡切换到无线网卡WPC300N 切…...
*算法训练(leetcode)第三十一天 | 1049. 最后一块石头的重量 II、494. 目标和、474. 一和零
刷题记录 *1049. 最后一块石头的重量 II*494. 目标和474. 一和零 *1049. 最后一块石头的重量 II leetcode题目地址 本题与分割等和子集类似,要达到碰撞最后的石头重量最小,则尽可能把石头等分为两堆。 时间复杂度: O ( m ∗ n ) O(m * n)…...
mac中如何使用obs推流以及使用vlc播放
使用obs推流 1.打开obs,在“来源”框中->点加号->选择媒体源->选择本地ts文件 2.obs中->点击右下角设置->点直播->服务选自定义->服务器填写你的srt服务url,比如:srt://192.168.13.211:14000?modecaller 注意ÿ…...
shopee虾皮 java后端 一面面经 整体感觉不难
面试总结:总体不难,算法题脑抽了只过了一半,面试官点出了问题说时间到了,反问一点点,感觉五五开,许愿一个二面 1.Java中的锁机制,什么是可重入锁 Java中的机制主要包括 synchronized关键字 Loc…...
HydraRPC: RPC in the CXL Era——论文阅读
ATC 2024 Paper CXL论文阅读笔记整理 问题 远程过程调用(RPC)是分布式系统中的一项基本技术,它允许函数在远程服务器上通过本地调用执行来促进网络通信,隐藏底层通信过程的复杂性简化了客户端/服务器交互[15]。RPC已成为数据中心…...
pve笔记
配置显卡直通参考 https://blog.csdn.net/m0_59148723/article/details/130923893 https://foxi.buduanwang.vip/virtualization/pve/561.html/ https://www.cnblogs.com/MAENESA/p/18005241 https://www.wangsansan.com/archives/181/ pve配置显卡直通到虚拟机后,…...
typecho仿某度响应式主题Xaink
新闻类型博客主题,简洁好看,适合资讯类、快讯类、新闻类博客建站,响应式设计,支持明亮和黑暗模式 直接下载 zip 源码->解压后移动到 Typecho 主题目录->改名为xaink->启用。 演示图: 下载链接: t…...
springcloud RocketMQ 客户端是怎么走到消费业务逻辑的 - debug step by step
springcloud RocketMQ ,一个mq消息发送后,客户端是怎么一步步拿到消息去消费的?我们要从代码层面探究这个问题。 找的流程图,有待考究。 以下我们开始debug: 拉取数据的线程: PullMessageService.java 本…...
GPT-4o mini小型模型具备卓越的文本智能和多模态推理能力
GPT-4o mini 是首个应用OpenAI 指令层次结构方法的模型,这有助于增强模型抵抗越狱、提示注入和系统提示提取的能力。这使得模型的响应更加可靠,并有助于在大规模应用中更安全地使用。 GPT-4o mini 在学术基准测试中,无论是在文本智能还是多模…...
Milvus 向量数据库进阶系列丨部署形态选型
本系列文章介绍 在和社区小伙伴们交流的过程中,我们发现大家最关心的问题从来不是某个具体的功能如何使用,而是面对一个具体的实战场景时,如何选择合适的向量数据库解决方案或最优的功能组合。在 “Milvus 向量数据库进阶” 这个系列文章中&…...
【React】详解受控表单绑定
文章目录 一、受控组件的基本概念1. 什么是受控组件?2. 受控组件的优势3. 基本示例导入和初始化定义函数组件处理输入变化处理表单提交渲染表单导出组件 二、受控组件的进阶用法1. 多个输入框的处理使用多个状态变量使用一个对象管理状态 2. 处理选择框(…...
多模态2025:技术路线“神仙打架”,视频生成冲上云霄
文|魏琳华 编|王一粟 一场大会,聚集了中国多模态大模型的“半壁江山”。 智源大会2025为期两天的论坛中,汇集了学界、创业公司和大厂等三方的热门选手,关于多模态的集中讨论达到了前所未有的热度。其中,…...
CVPR 2025 MIMO: 支持视觉指代和像素grounding 的医学视觉语言模型
CVPR 2025 | MIMO:支持视觉指代和像素对齐的医学视觉语言模型 论文信息 标题:MIMO: A medical vision language model with visual referring multimodal input and pixel grounding multimodal output作者:Yanyuan Chen, Dexuan Xu, Yu Hu…...
Psychopy音频的使用
Psychopy音频的使用 本文主要解决以下问题: 指定音频引擎与设备;播放音频文件 本文所使用的环境: Python3.10 numpy2.2.6 psychopy2025.1.1 psychtoolbox3.0.19.14 一、音频配置 Psychopy文档链接为Sound - for audio playback — Psy…...
在WSL2的Ubuntu镜像中安装Docker
Docker官网链接: https://docs.docker.com/engine/install/ubuntu/ 1、运行以下命令卸载所有冲突的软件包: for pkg in docker.io docker-doc docker-compose docker-compose-v2 podman-docker containerd runc; do sudo apt-get remove $pkg; done2、设置Docker…...
html-<abbr> 缩写或首字母缩略词
定义与作用 <abbr> 标签用于表示缩写或首字母缩略词,它可以帮助用户更好地理解缩写的含义,尤其是对于那些不熟悉该缩写的用户。 title 属性的内容提供了缩写的详细说明。当用户将鼠标悬停在缩写上时,会显示一个提示框。 示例&#x…...
ABAP设计模式之---“简单设计原则(Simple Design)”
“Simple Design”(简单设计)是软件开发中的一个重要理念,倡导以最简单的方式实现软件功能,以确保代码清晰易懂、易维护,并在项目需求变化时能够快速适应。 其核心目标是避免复杂和过度设计,遵循“让事情保…...
FFmpeg:Windows系统小白安装及其使用
一、安装 1.访问官网 Download FFmpeg 2.点击版本目录 3.选择版本点击安装 注意这里选择的是【release buids】,注意左上角标题 例如我安装在目录 F:\FFmpeg 4.解压 5.添加环境变量 把你解压后的bin目录(即exe所在文件夹)加入系统变量…...
【学习笔记】erase 删除顺序迭代器后迭代器失效的解决方案
目录 使用 erase 返回值继续迭代使用索引进行遍历 我们知道类似 vector 的顺序迭代器被删除后,迭代器会失效,因为顺序迭代器在内存中是连续存储的,元素删除后,后续元素会前移。 但一些场景中,我们又需要在执行删除操作…...
MySQL 主从同步异常处理
阅读原文:https://www.xiaozaoshu.top/articles/mysql-m-s-update-pk MySQL 做双主,遇到的这个错误: Could not execute Update_rows event on table ... Error_code: 1032是 MySQL 主从复制时的经典错误之一,通常表示ÿ…...
Linux中《基础IO》详细介绍
目录 理解"文件"狭义理解广义理解文件操作的归类认知系统角度文件类别 回顾C文件接口打开文件写文件读文件稍作修改,实现简单cat命令 输出信息到显示器,你有哪些方法stdin & stdout & stderr打开文件的方式 系统⽂件I/O⼀种传递标志位…...
