当前位置: 首页 > news >正文

基于超像素的多视觉特征图像分割算法研究

0.引言

背景:

经典聚类算法:Kmeans、FCM
现有问题:
1)现有算法大都是基于单一的视觉特征而设计的,eg:基于颜色特征的分割。
2)没有考虑像素周围的空间信息;分割结果:多噪声,缺乏区域性
3)像素点的数量比较大,算法时间复杂度大;
4)传统的聚类优化算法一般都是使用梯度信息来求解,该优化算法对初始值比较敏感,容易陷入局部最优

梯度信息:在指定方向每单位距离的数值变化

解决思路

1)融合颜色特征和纹理特征——基于多特征的图像分割算法
(导致对多种特征赋予相同的权重)
2)分割空间信息:1.改进目标函数,将空间信息加入到聚类目标函数中。2.首先使用预分割算法获得过分割图像,而后使用聚类算法对过分割图像块进行合并(仅是基于颜色特征,效果不好)
3)进化算法——全局优化算法:多目标空间模糊聚类算法(MSFCA)——法在适应度函数中加入了从图像中提取的非局部空间信息(仅基于颜色特征,利用像素点进行计算,时间复杂度高)

多目标进化颜色和纹理分割算法(MECTS)

优化目标:颜色+纹理
缺点:基于像素点——无法有效去除噪声+时间复杂度高
改进:基于超像素的多视觉特征图像分割算法(SRMFS)

基于超像素的多视觉特征图像分割算法(SRMFS)

1.流程:

1.首先使用 Meanshift 算法将图像划分为多个超像素区域。
2.而后提取每个超像素区域的颜色和纹理特征。分别在颜色空间和纹理空
间中设计两个聚类目标准则,并使用多目标优化算法对其进行并行优化。
3.最终在获得的 Pareto 解集中挑选出最佳分割结果。
该算法分为五部分:
(1)对原始图像进行预分割,获得一组超像素区域;
(2)分别提取超像素区域的颜色特征和纹理特征
(3)使用多目标进化算法对超像素区域进行类,获得一组 Pareto 解集,每一个解代表一种分割结果;
(4)解码每个 Pareto 解,获得整个图像的分割结果;
(5)挑选出最佳分割结果。

在这里插入图片描述

2.算法核心

2.1超像素区域

首先对原始图像进行预分割,获得一组超像素区域。
Q1:为什么选择Meanshift算法?(其他算法:分预分割
流程既可以保证图片在局域内的连通性,又能通过减
少像素规模而降低算法的时间复杂度水岭算法、SLIC)
预分割作用:1)保证图片在局域内的连通性,2)通过减少像素规模而降低算法的时间复杂度
注意:Meanshift分割区域太多——结果图像噪声点较多,时间复杂度增大;太少——导致本文分割算法过多地依赖于Meanshift算法的预分割

2.2特征提取

Q2:为什么选取颜色和纹理作为特征提取

A2: 颜色特征和纹理特征已成为图像处理中两个比较重要的特征,并且这两个特征在描述图像信息时具有极大的不相关性,颜色特征可以直观的描述图像的视觉特征,纹理特征可以描述图像局域内的空间特征

2.2.1颜色提取

从 RGB 颜色空间中提取每个像素的颜色特征

2.2.2纹理特征提取

常见提取方法:可分统计方法、几何法、模型法、信号处理法和结构方法
本文选用: Gabor 小波方法
此方法通过对滤波后的图像进行非线性操作和能量计算来得到特征图像,并用建立的特征矢量做分类。可以对每个像素提取 5 维纹理特征

2.3 多目标进化算法(RM-MEDA)

2.3.1 染色体编码

首先需要将解编码成染色体形式;
目标:将预分割获得的超像素区域聚类成具有特定意义区域的形式。
编码形式:基于 实数-标签

2.3.2 目标函数

Jmse 指标
首先对染色体解码,并计算每个类的类中心;接下来再分别计算颜色空间中的隶属度矩阵和和纹理空间的隶属度矩阵。

2.3.3 进化算子

本文算法使用的是 RM-MEDA 算法作为进化多目标优化器。该算法使用建模和采样来产生新的种群。
通过建模和采样,可获得子代种群,然后使用非支配排序和拥挤距离选择popsize(种群规模)个染色体作为第g+1代种群pop(g+1);

2.4 输出最佳分割图像

从 Pareto 集中挑选出最优解,根据所得标签值进行聚类,对于所有标签为 j 的区域合并成若干个完整的区域,输出最终分割后的图像,由于最终获得的分割图像数量比较少,手工挑选出最好的分割图像。

3.实验结果

实验对象:

1)颜色相近但纹理特征不同;
2)纹理特征相近,但颜色不同 ;
3)目标物体内部与边缘颜色不同,但具有相同的纹理。

对比算法:

1)基于颜色的FCM
2)基于纹理的FCM
3)结合颜色和纹理的FCM
4)增加空间信息的AFCM_S1
5)Meanshift算法
6)基于像素点的多目标颜色纹理融合算法MECTS

例子

量化分析

1)分割精度 Segmentation Accuracy
2)兰德指数 Rand Index
ps:取值范围[0,1] 正相关

优点

1)有效地对颜色和纹理特征进行结合
2)分割对象是区域而不是像素点,可以极大地降低算法的时间复杂度

展望

1)如何融合三种以上特征
2)如何自动的选择最佳分割结果

相关文章:

基于超像素的多视觉特征图像分割算法研究

0.引言 背景: 经典聚类算法:Kmeans、FCM 现有问题: 1)现有算法大都是基于单一的视觉特征而设计的,eg:基于颜色特征的分割。 2)没有考虑像素周围的空间信息;分割结果:多噪…...

mysql的三大日志

摘自https://blog.csdn.net/chuige2013/article/details/123027580 一. 初步认识 binlog二进制日志 redolog undolog 二. binlog binlog记录写入行操作 作用 1)、主从复制:在Master端开启binlog,然后将binlog发送到各个Slave端,S…...

API接口及社区电子商务化的解释

API是应用程序的开发接口,在开发程序的时候,我们有些功能可能不需要从到到位去研发,我们可以拿现有的开发出来的功能模块来使用,而这个功能模块,就叫做库(libary)。比如说:要实现数据传输的安全&#xff0c…...

[蓝帽杯 2021]One Pointer PHP

知识点&#xff1a;php 数组整型溢出&#xff0c;open_basedir 绕过分析 利用数组整型溢出绕过&#xff0c;因为PHP 会对溢出的数字处理为 float 类型。 <?php include "user.php"; if($userunserialize($_COOKIE["data"])){$count[$user->count]…...

【JAVA】xxl-job服务搭建

xxl-job服务搭建 1.下载xxl-job项目 https://github.com/xuxueli/xxl-job 2.数据库表创建 3.修改配置 注意&#xff1a;这是两个项目&#xff0c;一个是xxl-job前台&#xff0c;一个是xxl-job执行器&#xff0c;找到这两个项目得配置文件&#xff0c;修改配置。 配置文件地址…...

毕业设计 基于STM32单片机生理监控心率脉搏TFT彩屏波形曲线设计

基于STM32单片机生理监控心率脉搏TFT彩屏波形曲线设计1、项目简介1.1 系统构成1.2 系统功能2、部分电路设计2.1 STM32F103C8T6核心系统电路设计2.2心率检测电路设计2.3 TFT2.4寸彩屏电路设计3、部分代码展示3.1 ADC初始化3.2 获取ADC采样值3.3 LCD引脚初始化3.3 在LCD指定位置显…...

【10k~30k的区别】=== 功能测试、自动化测试、性能测试的区别

按测试执行的类型来分&#xff1a;功能测试、自动化测试、性能测试 1&#xff0e;功能测试 功能测试俗称点点点测试。初级测试人员的主要测试任务就是执行测试工程师所写的测试用 例&#xff0c;记录用例的执行状态及bug情况。与开发人员进行交互直到bug被修复。 功能测试理论…...

《MySQL学习》 索引失效的三种特殊情况

一.条件字段使用函数 explain select * from bpm_proc_instance bpi where CREATED_AT > 2022-06-01 CREATED_AT 字段建立了索引&#xff0c;此时explain分析的结果表明能使用到索引 但如果我们对 CREATED_AT 字段使用函数 explain select * from bpm_proc_instance bpi w…...

wafw00f 防火墙探测

kali机器自带防火墙探测工具wafw00&#xff0c;它可以通过发送正常以及不正常甚至包含恶意代码的HTTP请求&#xff0c;来探测网站是否存在防火墙&#xff0c;并识别防火墙的厂商及类型。安装&#xff1a;git clone https://github.com/EnableSecurity/wafw00f.git python setup…...

MySQL学习(1)[参考书籍:mysql是怎么运行的]

目录 一、mysql设计模式和技术 二、mysql服务器和客户端 启动mysql服务 启动mysql客户端程序 三、mysql存储引擎 四、mysql配置 五、mysql系统变量 六、mysql字符集 编码和解码&#xff1a; 常见字符集&#xff08;五种&#xff09;&#xff1a; 相关概念&#xff1…...

用Python制作邮件检测器

github地址&#xff1a; https://github.com/CaLlMeErIC/MailDetective 因为需求需要写一个简单的邮件检测系统的框架&#xff0c;这里记录下思路 首先第一反应,这个检测系统不应该是各个邮件收件系统都有自带的吗&#xff0c;于是搜索了下是否有相关的邮件检测开源软件&#…...

K8S---pod基础概念

目录 一、资源限制 二、Pod 的两种使用方式 三、Pod 资源共享 四、底层容器Pause 1、Pause共享资源 1.1 网络 1.2 存储 1.3 小结 2、Pause主要功能 3、Pod 与 Pause 结构的设计初衷 五、Pod容器的分类 1、基础容器&#xff08;infrastructure container&#xff09;…...

激活函数入门学习

本篇文章从外行工科的角度尽量详细剖析激活函数&#xff0c;希望不吝指教&#xff01; 学习过程如下&#xff0c;先知道这个东西是什么&#xff0c;有什么用处&#xff0c;以及怎么使用它&#xff1a; 1. 为什么使用激活函数 2. 激活函数总类及优缺点 3. 如何选择激活函数 …...

小文智能结合ChatGPT的产业未来

最近几个月&#xff0c;由人工智能实验室OpenAI发布的对话式大型语言模型ChatGPT在国内外各大平台掀起了一阵AI狂潮。短短几天时间&#xff0c;其用户量就突破了百万大关&#xff0c;注册用户之多一度导致服务器爆满。 继AI画图之后&#xff0c;ChatGPT成为了新的顶流&#xf…...

Linux-编写一个自己的命令

前言&#xff08;1&#xff09;在Linux中&#xff0c;我们对文件路径进行操作都需要输入命令。那么&#xff0c;有人可能就会有疑惑了&#xff0c;命令是什么东西&#xff1f;我们是否也可以创造出自己的命令呢&#xff1f;答案是可以的。命令本身其实就是可执行文件。但是与普…...

Nacos架构篇 - Distro协议

Distro 它是 Nacos 社区自研的一种 AP 分布式协议&#xff08;也是最终一致性协议&#xff09;。它面向临时实例&#xff0c;保证了在某些 Nacos 节点宕机后&#xff0c;整个临时实例处理系统依旧可以正常工作。作为一种有状态的中间件应用的内嵌协议&#xff0c;Distro 保证了…...

和月薪3W的聊过后,才知道自己一直在打杂...

前几天和一个朋友聊面试&#xff0c;他说上个月同时拿到了腾讯和阿里的offer&#xff0c;最后选择了阿里。 我了解了下他的面试过程&#xff0c;就一点&#xff0c;不管是阿里还是腾讯的面试&#xff0c;这个级别的程序员&#xff0c;都会考察项目管理能力&#xff0c;并且权重…...

关于Ubuntu18.04 root账户登录的问题

关于Ubuntu18.04 root账户登录的问题一、 Ubuntu 18.04添加root用户登录1. 设置root用户2. 修改/root/.profile3. 修改/etc/pam.d目录下的gdm-autologin和gdm-password4. 修改50-ubuntu.conf5. 登录root账户二、Ubuntu18.04不能远程使用root账户登录的问题1. 修改sshd_config2.…...

基于jeecgboot的flowable的H5版本在演示系统发布

目前在NBCIO 亿事达企业管理平台上发布了H5的在线演示系统&#xff0c;欢迎大家批评指正。 在nbcio-vue nbcio-vue: NBCIO 亿事达企业管理平台前端代码&#xff0c;基于ant-design-vue-jeecg的前端版本&#xff1a; 3.0.0代码和和flowable6.7.2&#xff0c;初步完成了集流程设…...

【代码训练营】day44 | 完全背包理论 518. 零钱兑换 II 377. 组合总和 Ⅳ

所用代码 java 完全背包 01背包物品只能使用一次 – 倒序遍历 for(i 0; i < weight.length; i){ 物品for (j bagWeight; j > weight[i]; j--){ 背包dp[j] max(dp[j], dp[j-weight[i]] value[i])} }完全背包物品可以使用无限次 – 正序遍历 for(i 0; i < weigh…...

99%人开发Agent的致命误区!6大避坑指南助你从“调参怪”变“落地王”

本文揭示了开发Agent最常见的认知陷阱——将模型能力等同于系统能力&#xff0c;并提供了6大避坑指南&#xff1a;1. 掌握四层架构&#xff08;Persona、CoT、Skill、MCP&#xff09;&#xff1b;2. 选择合适的执行模型&#xff08;ReAct、Plan-and-Execute、Reflection&#x…...

Sora 2训练Pipeline为何突然兼容Gaussian Splatting?:逆向解析OpenAI最新隐式-显式混合表征专利(US20240177892A1)

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;Sora 2 Gaussian Splatting 技术融合背景 Sora 2 作为 OpenAI 推出的下一代视频生成模型&#xff0c;已深度集成高斯点绘&#xff08;Gaussian Splatting&#xff09;技术以提升动态场景的几何保真度…...

如何实现一个延迟队列?

1. 基于 Sorted Set (ZSet) 的实现 这是最轻量级、最原生的 Redis 延迟队列实现方式。 核心思想&#xff1a;利用 ZSet 可以根据 score 进行排序的特性。我们将任务的预期执行时间戳作为 score&#xff0c;任务的具体内容&#xff08;或任务 ID&#xff09;作为 member。 生产…...

QMCDecode:打破音乐枷锁,让QQ音乐文件在你的设备上自由呼吸

QMCDecode&#xff1a;打破音乐枷锁&#xff0c;让QQ音乐文件在你的设备上自由呼吸 【免费下载链接】QMCDecode QQ音乐QMC格式转换为普通格式(qmcflac转flac&#xff0c;qmc0,qmc3转mp3, mflac,mflac0等转flac)&#xff0c;仅支持macOS&#xff0c;可自动识别到QQ音乐下载目录&…...

必知必会:大模型位置编码RoPE与ALiBi位置编码详解

AI-Compass 致力于构建最全面、最实用、最前沿的AI技术学习和实践生态,通过六大核心模块的系统化组织,为不同层次的学习者和开发者提供从完整学习路径。 github地址:AI-Compass👈:https://github.com/tingaicompass/AI-Compass gitee地址:AI-Compass👈:https://gitee…...

3大核心技术解密:LeagueAkari本地自动化工具架构设计与实战指南

3大核心技术解密&#xff1a;LeagueAkari本地自动化工具架构设计与实战指南 【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power &#x1f680;. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit LeagueAkari是一款…...

XUnity.AutoTranslator:5步实现Unity游戏实时翻译的完整解决方案

XUnity.AutoTranslator&#xff1a;5步实现Unity游戏实时翻译的完整解决方案 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator 你是否曾经因为语言障碍而错过心仪的外语游戏&#xff1f;XUnity.AutoTransla…...

2026届学术党必备的降重复率平台横评

Ai论文网站排名&#xff08;开题报告、文献综述、降aigc率、降重综合对比&#xff09; TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 1. 在学术写作这个特定领域里&#xff0c;合理运用AI工具能切实有效提升文献检索、大纲构建…...

OpenVSP参数化飞机设计:3个技巧让你从零开始打造专业飞行器

OpenVSP参数化飞机设计&#xff1a;3个技巧让你从零开始打造专业飞行器 【免费下载链接】OpenVSP A parametric aircraft geometry tool 项目地址: https://gitcode.com/gh_mirrors/ope/OpenVSP 你是否梦想设计自己的飞机&#xff0c;却被复杂的CAD软件吓退&#xff1f;…...

C++ 算法实战:从鸡兔同笼到多元方程求解的编程思维演进

1. 从鸡兔同笼开始理解算法思维 记得第一次接触鸡兔同笼问题时&#xff0c;我正啃着铅笔头对着数学作业发愁。题目说笼子里有35个头和94只脚&#xff0c;问鸡和兔各有多少只。这个看似简单的应用题&#xff0c;后来竟成了我算法思维的启蒙老师。 用C解决这个问题时&#xff0c;…...