当前位置: 首页 > news >正文

数字图像处理笔记(一)---- 图像数字化与显示

系列文章目录

数字图像处理学习笔记(一)---- 图像数字化与显示
数字图像处理笔记(二)---- 像素加图像统计特征
数字图像处理笔记(三) ---- 傅里叶变换的基本原理


文章目录

  • 系列文章目录
  • 前言
  • 一、数字图像处理
  • 二、图像数字化与显示(数字图像的基本获取过程)
    • 2.1 采样
    • 2.2 量化
      • 2.2.1 量化方法--标量量化
      • 2.2.2 矢量量化
  • 总结


前言

慕课视频地址:https://www.icourse163.org/course/HHU-1471232170 from=searchPage&outVendor=zw_mooc_pcssjg_
注重讲解图像变换以及分解过程中物理含义
理解数学模型如何描述和解决实际应用问题
培养对复杂工程问题的分析解决的能力


一、数字图像处理

包括图像增强,图像压缩,图像重建,图像融合,图像分类,目标识别。

图像增强技术
图像增强技术的应用范围很广,最常见的就是手机美颜功能,可以平滑掉面部的瑕疵和纹理,也可以实现眼睛鼻子嘴唇等部位的特征增强。图像增强技术在医学影像领域也很重要,例如x光片,和CT影像,对图像全图或感兴趣区域进行局部对比度拉伸,方便医生做出诊断。

图像压缩技术
图像压缩技术是研究如何对数字图像进行压缩和编码,降低图像传输和存储所占用的带宽和存储资源的技术。我们平时的照片通常是jpg格式文件,视频通常是mp4格式文件。这些文件格式中都包含有图像压缩技术。

图像重建技术
图像重建技术是基于对场景有限的观测数据重建出清晰、完整的图像。例如在核磁共振成像领域,通常需要牺牲一部分观测数据换取扫描时间。成像时间长一直是核磁共振成像的一大弊力,对于CT影像快速成像可以降低患者的辐射量,它的意见就更加明显。

稀疏采样和压缩感知技术可以实现快速成像

快速成像为图像重建提出了新的挑战。

老照片复原技术,换脸技术都可以理解为图像重建技术。老照片复原技术中,由于当时传感器设备性能的局限性,很多保存的老照片存在分辨率低,噪声干扰强,图片失真等情况。可以通过图像重建技术进行修复和补充。

图像的分类识别
属于高级别的图像处理技术。在自动驾驶技术,医学AI诊断,遥感自动解译等领域都具有重要的研究价值。比如现有的CT影像已经可以实现机器的自动阅片,这就是通过图像分割,分类,识别技术实现的。

二、图像数字化与显示(数字图像的基本获取过程)

图像数字化的基本过程包括采样、‌量化和编码三个步骤。‌

采样:‌这一步骤涉及将二维空间上连续的图像在水平和垂直方向上等间距地分割成矩形网状结构,‌形成的微小方格称为像素点。‌例如,‌一幅640x480分辨率的图像由307200个像素点组成。‌采样频率,‌即一秒钟内采样的次数,‌反映了采样点之间的间隔大小。‌采样频率越高,‌得到的图像样本越逼真,‌图像质量越高,‌但要求的存储量也越大。‌采样点间隔大小的选取非常重要,‌它决定了采样后的图像能真实反映原图像的程度。‌

量化:‌量化是指使用多大范围的数值来表示图像采样之后的每一个点。‌量化的结果是图像能够容纳的颜色总数,‌反映了采样的质量。‌例如,‌如果使用4位存储一个点,‌图像只能有16种颜色;‌若采用16位存储一个点,‌则有2^16=65536种颜色。‌量化位数越大,‌图像可以拥有的颜色越多,‌产生的图像效果越细致,‌但也会占用更大的存储空间。‌

编码:‌在采样和量化之后,‌将像素灰度转换成离散的整数值,‌然后进行编码的过程。‌这一步骤将数字图像转换为计算机可以存储和处理的格式。‌

2.1 采样

在这里插入图片描述
数字信号是通过采样和量化两个过程,将模拟信号转化为数字信号,图像也是如此。
对于空间位置连续,辐射强度连续的场景,可以通过采样和量化两个步骤实现模拟信号的数字化
在这里插入图片描述

对于一个感兴趣的场景信号,我们采用一个光感受器阵列来记录该场景信息,这个过程就是采样,采样后场景中任意一个点都对应一个像素。采样可以将信号在空域维度上进行离散化。
对于同一个场景,既可以采用1024 * 1024 像素来记录也可以采用 256 * 256来记录,这就是由拍摄图像的设备来决定。当光感受器阵列上的采样孔径越小,采样间隔越小,采样得到的图像空间分辨率越高,场景中的细节越清晰。更高的像素即更小的采样间隔,这样我们获取的图像分辨率越高。

2.2 量化

量化是对采样的信号在幅度上进行离散化。

均匀量化可以将信号的变换区间,按照一定的间隔,映射为一个个离散的整数。通常为了满足计算机存储和计算的需要,量化后的数值取值会按照2的幂次方来选择。

可以用0-255这256个灰度级作为量化信号的强度,像素的灰度值就可以用8Bit二进制位来记录。

采样定理–奈奎斯特采样定理
在这里插入图片描述

对于一个信号FT,傅里叶变换后可以得到信号的频谱,频谱的宽度是最高频率的两倍;
使用一个采样脉冲序列对它进行采样,采样间隔和w_s称反比例关系。w_s是采样后信号频谱在频域上搬移的距离。

在这里插入图片描述

通常为了降低采样点的个数,减少存储的数据量和传输的带宽,我们需要加大采样间隔,这样采样得到信号的频谱搬移的距离w_s就会变小,当搬移的距离小于信号带宽时,我们采样得到的频谱就会发生镜像折叠,就无法重建信号。
在这里插入图片描述

如果对一个带宽时20HZ的信号进行采样,采样频率采样12HZ.
按照这个采样频率我们能测量的最高频率只有6HZ,而原始信号最高频率为10HZ.
10HZ的部分就会以6HZ为镜像,产生镜像折叠,就是2HZ.
采集到的信号频谱发生了折叠,最多采集到12HZ带宽的信号。

等间隔均匀采样时,需要满足奈奎斯特采样定理才能无失真的复原信号。
如果不采用等间隔采样,在压缩感知理论下,通过非均匀稀疏采样,就可以打破奈奎斯特采样定理,实现更低采样频率的采样。

如果我们的信号是在频域进行采样,那么采样频率是否要满足Niquest采样定理?

2.2.1 量化方法–标量量化

对每个采样点的信号强度进行量化

均匀量化和非均匀量化

在这里插入图片描述

均匀量化:将整个取值范围等间隔划分然后设置量化值代替落入区间的信号幅度

非均匀量化:根据信号幅度出现的频率来优化量化区间和量化值

不同量化间隔下均匀量化得到的成像效果

在这里插入图片描述

随着量化间隔的减少,图像中一些灰度差异较小的信息,就会被量化间隔淹没。量化级的减少导致图像中灰度变化平缓区域丢失。量化级越多,图像灰度变化刻画的越准确。
以上两种量化方法都是针对单个像素点的量化,称为标量量化。
如果要将多个像素点的灰度值组合起来一起量化,就是矢量量化。

2.2.2 矢量量化

矢量量化需要提前设计匹配的码字,码字是由同等数量的像素组成的向量;
每个码字分配一个编号。
量化过程就是寻找与输入向量距离最近的码字,用该码字的编号作为量化值进行传输和存储。
在解码时,根据包含所有码字的码书,通过编号索引进行解码。
在这里插入图片描述
下面这四个码字分别用两位二进制数进行编码,计算输入向量与各个码字的距离,发现输入向量与第三个码字最接近,因此量化后的编码是10.

在这里插入图片描述

相对于标量量化,矢量量化后数据量更小,且具有很强的抗干扰能力。


总结

等间隔均匀采样时,需要满足奈奎斯特采样定理才能无失真的复原信号。如果不采用等间隔采样,在压缩感知理论下,通过非均匀稀疏采样,就可以打破奈奎斯特采样定理,实现更低采样频率的采样。

相对于标量量化,矢量量化后数据量更小,且具有很强的抗干扰能力。

相关文章:

数字图像处理笔记(一)---- 图像数字化与显示

系列文章目录 数字图像处理学习笔记(一)---- 图像数字化与显示 数字图像处理笔记(二)---- 像素加图像统计特征 数字图像处理笔记(三) ---- 傅里叶变换的基本原理 文章目录 系列文章目录前言一、数字图像处理二、图像数…...

Unity UGUI 之 事件接口

本文仅作学习笔记与交流,不作任何商业用途 本文包括但不限于unity官方手册,唐老狮,麦扣教程知识,引用会标记,如有不足还请斧正 本文在发布时间选用unity 2022.3.8稳定版本,请注意分别 1.什么是事件接口&…...

Hadoop、HDFS、MapReduce 大数据解决方案

本心、输入输出、结果 文章目录 Hadoop、HDFS、MapReduce 大数据解决方案前言HadoopHadoop 主要组件的Web UI端口和一些基本信息MapReduceMapReduce的核心思想MapReduce的工作流程MapReduce的优缺点Hadoop、HDFS、MapReduce 大数据解决方案 编辑 | 简简单单 Online zuozuo 地址…...

Dubbo SPI 之负载均衡

1. 背景介绍 在分布式系统中,负载均衡是一项核心技术,旨在将请求合理地分配到多个服务实例上,以提高系统的性能和可靠性。Dubbo 作为一个高性能的 Java RPC 框架,提供了多种负载均衡策略来满足不同的业务需求。本文将深入探讨 Du…...

规范:前后端接口规范

1、前言 随着互联网的高速发展,前端页面的展示、交互体验越来越灵活、炫丽,响应体验也要求越来越高,后端服务的高并发、高可用、高性能、高扩展等特性的要求也愈加苛刻,从而导致前后端研发各自专注于自己擅长的领域深耕细作。 然…...

Python --NumPy库基础方法(2)

NumPy Numpy(Numerical Python) 是科学计算基础库,提供大量科学计算相关功能,比如数据统计,随机数生成等。其提供最核心类型为多维数组类型(ndarray),支持大量的维度数组与矩阵运算,Numpy支持向…...

音视频入门基础:H.264专题(15)——FFmpeg源码中通过SPS属性获取视频帧率的实现

音视频入门基础:H.264专题系列文章: 音视频入门基础:H.264专题(1)——H.264官方文档下载 音视频入门基础:H.264专题(2)——使用FFmpeg命令生成H.264裸流文件 音视频入门基础&…...

【C++高阶】哈希之美:探索位图与布隆过滤器的应用之旅

📝个人主页🌹:Eternity._ ⏩收录专栏⏪:C “ 登神长阶 ” 🤡往期回顾🤡:模拟实现unordered 的奥秘 🌹🌹期待您的关注 🌹🌹 ❀哈希应用 &#x1f4…...

文件包涵条件竞争(ctfshow82)

Web82 利用 session.upload_progress 包含文件漏洞 <!DOCTYPE html> <html> <body> <form action"https://09558c1b-9569-4abd-bf78-86c4a6cb6608.challenge.ctf.show//" method"POST" enctype"multipart/form-data"> …...

通信原理-思科实验三:无线局域网实验

实验三 无线局域网实验 一&#xff1a;无线局域网基础服务集 实验步骤&#xff1a; 进入物理工作区&#xff0c;导航选择 城市家园; 选择设备 AP0&#xff0c;并分别选择Laptop0、Laptop1放在APO范围外区域 修改笔记本的网卡&#xff0c;从以太网卡切换到无线网卡WPC300N 切…...

*算法训练(leetcode)第三十一天 | 1049. 最后一块石头的重量 II、494. 目标和、474. 一和零

刷题记录 *1049. 最后一块石头的重量 II*494. 目标和474. 一和零 *1049. 最后一块石头的重量 II leetcode题目地址 本题与分割等和子集类似&#xff0c;要达到碰撞最后的石头重量最小&#xff0c;则尽可能把石头等分为两堆。 时间复杂度&#xff1a; O ( m ∗ n ) O(m * n)…...

mac中如何使用obs推流以及使用vlc播放

使用obs推流 1.打开obs&#xff0c;在“来源”框中->点加号->选择媒体源->选择本地ts文件 2.obs中->点击右下角设置->点直播->服务选自定义->服务器填写你的srt服务url&#xff0c;比如&#xff1a;srt://192.168.13.211:14000?modecaller 注意&#xff…...

shopee虾皮 java后端 一面面经 整体感觉不难

面试总结&#xff1a;总体不难&#xff0c;算法题脑抽了只过了一半&#xff0c;面试官点出了问题说时间到了&#xff0c;反问一点点&#xff0c;感觉五五开&#xff0c;许愿一个二面 1.Java中的锁机制&#xff0c;什么是可重入锁 Java中的机制主要包括 synchronized关键字 Loc…...

HydraRPC: RPC in the CXL Era——论文阅读

ATC 2024 Paper CXL论文阅读笔记整理 问题 远程过程调用&#xff08;RPC&#xff09;是分布式系统中的一项基本技术&#xff0c;它允许函数在远程服务器上通过本地调用执行来促进网络通信&#xff0c;隐藏底层通信过程的复杂性简化了客户端/服务器交互[15]。RPC已成为数据中心…...

pve笔记

配置显卡直通参考 https://blog.csdn.net/m0_59148723/article/details/130923893 https://foxi.buduanwang.vip/virtualization/pve/561.html/ https://www.cnblogs.com/MAENESA/p/18005241 https://www.wangsansan.com/archives/181/ pve配置显卡直通到虚拟机后&#xff0c;…...

typecho仿某度响应式主题Xaink

新闻类型博客主题&#xff0c;简洁好看&#xff0c;适合资讯类、快讯类、新闻类博客建站&#xff0c;响应式设计&#xff0c;支持明亮和黑暗模式 直接下载 zip 源码->解压后移动到 Typecho 主题目录->改名为xaink->启用。 演示图&#xff1a; 下载链接&#xff1a; t…...

springcloud RocketMQ 客户端是怎么走到消费业务逻辑的 - debug step by step

springcloud RocketMQ &#xff0c;一个mq消息发送后&#xff0c;客户端是怎么一步步拿到消息去消费的&#xff1f;我们要从代码层面探究这个问题。 找的流程图&#xff0c;有待考究。 以下我们开始debug&#xff1a; 拉取数据的线程&#xff1a; PullMessageService.java 本…...

GPT-4o mini小型模型具备卓越的文本智能和多模态推理能力

GPT-4o mini 是首个应用OpenAI 指令层次结构方法的模型&#xff0c;这有助于增强模型抵抗越狱、提示注入和系统提示提取的能力。这使得模型的响应更加可靠&#xff0c;并有助于在大规模应用中更安全地使用。 GPT-4o mini 在学术基准测试中&#xff0c;无论是在文本智能还是多模…...

Milvus 向量数据库进阶系列丨部署形态选型

本系列文章介绍 在和社区小伙伴们交流的过程中&#xff0c;我们发现大家最关心的问题从来不是某个具体的功能如何使用&#xff0c;而是面对一个具体的实战场景时&#xff0c;如何选择合适的向量数据库解决方案或最优的功能组合。在 “Milvus 向量数据库进阶” 这个系列文章中&…...

【React】详解受控表单绑定

文章目录 一、受控组件的基本概念1. 什么是受控组件&#xff1f;2. 受控组件的优势3. 基本示例导入和初始化定义函数组件处理输入变化处理表单提交渲染表单导出组件 二、受控组件的进阶用法1. 多个输入框的处理使用多个状态变量使用一个对象管理状态 2. 处理选择框&#xff08;…...

JavaSec-RCE

简介 RCE(Remote Code Execution)&#xff0c;可以分为:命令注入(Command Injection)、代码注入(Code Injection) 代码注入 1.漏洞场景&#xff1a;Groovy代码注入 Groovy是一种基于JVM的动态语言&#xff0c;语法简洁&#xff0c;支持闭包、动态类型和Java互操作性&#xff0c…...

Unity3D中Gfx.WaitForPresent优化方案

前言 在Unity中&#xff0c;Gfx.WaitForPresent占用CPU过高通常表示主线程在等待GPU完成渲染&#xff08;即CPU被阻塞&#xff09;&#xff0c;这表明存在GPU瓶颈或垂直同步/帧率设置问题。以下是系统的优化方案&#xff1a; 对惹&#xff0c;这里有一个游戏开发交流小组&…...

python/java环境配置

环境变量放一起 python&#xff1a; 1.首先下载Python Python下载地址&#xff1a;Download Python | Python.org downloads ---windows -- 64 2.安装Python 下面两个&#xff0c;然后自定义&#xff0c;全选 可以把前4个选上 3.环境配置 1&#xff09;搜高级系统设置 2…...

无法与IP建立连接,未能下载VSCode服务器

如题&#xff0c;在远程连接服务器的时候突然遇到了这个提示。 查阅了一圈&#xff0c;发现是VSCode版本自动更新惹的祸&#xff01;&#xff01;&#xff01; 在VSCode的帮助->关于这里发现前几天VSCode自动更新了&#xff0c;我的版本号变成了1.100.3 才导致了远程连接出…...

el-switch文字内置

el-switch文字内置 效果 vue <div style"color:#ffffff;font-size:14px;float:left;margin-bottom:5px;margin-right:5px;">自动加载</div> <el-switch v-model"value" active-color"#3E99FB" inactive-color"#DCDFE6"…...

数据链路层的主要功能是什么

数据链路层&#xff08;OSI模型第2层&#xff09;的核心功能是在相邻网络节点&#xff08;如交换机、主机&#xff09;间提供可靠的数据帧传输服务&#xff0c;主要职责包括&#xff1a; &#x1f511; 核心功能详解&#xff1a; 帧封装与解封装 封装&#xff1a; 将网络层下发…...

css3笔记 (1) 自用

outline: none 用于移除元素获得焦点时默认的轮廓线 broder:0 用于移除边框 font-size&#xff1a;0 用于设置字体不显示 list-style: none 消除<li> 标签默认样式 margin: xx auto 版心居中 width:100% 通栏 vertical-align 作用于行内元素 / 表格单元格&#xff…...

NXP S32K146 T-Box 携手 SD NAND(贴片式TF卡):驱动汽车智能革新的黄金组合

在汽车智能化的汹涌浪潮中&#xff0c;车辆不再仅仅是传统的交通工具&#xff0c;而是逐步演变为高度智能的移动终端。这一转变的核心支撑&#xff0c;来自于车内关键技术的深度融合与协同创新。车载远程信息处理盒&#xff08;T-Box&#xff09;方案&#xff1a;NXP S32K146 与…...

【网络安全】开源系统getshell漏洞挖掘

审计过程&#xff1a; 在入口文件admin/index.php中&#xff1a; 用户可以通过m,c,a等参数控制加载的文件和方法&#xff0c;在app/system/entrance.php中存在重点代码&#xff1a; 当M_TYPE system并且M_MODULE include时&#xff0c;会设置常量PATH_OWN_FILE为PATH_APP.M_T…...

多模态图像修复系统:基于深度学习的图片修复实现

多模态图像修复系统:基于深度学习的图片修复实现 1. 系统概述 本系统使用多模态大模型(Stable Diffusion Inpainting)实现图像修复功能,结合文本描述和图片输入,对指定区域进行内容修复。系统包含完整的数据处理、模型训练、推理部署流程。 import torch import numpy …...