当前位置：首页 > news >正文

OpenCV实战——基于分水岭算法的图像分割

news 2025/11/10 5:34:12

OpenCV实战——基于分水岭算法的图像分割

- 0. 前言
- 1. 分水岭算法
- 2. 分水岭算法直观理解
- 3. 完整代码
- 相关链接

0. 前言

分水岭变换是一种流行的图像处理算法，用于快速将图像分割成同质区域。分水岭变换主要基于以下思想：当图像被视为拓扑浮雕时，均质区域对应于相对平坦且由陡峭的边缘界定的盆地。算法的原始版本倾向于过度分割图像，从而产生多个小区域，因此 OpenCV 中实现了该算法的改进版本，通过使用一组预定义的标记来指导图像分割区域的定义。

1. 分水岭算法

分水岭分割可以通过使用 cv::watershed 函数实现，函数的输入是一个 32 位有符号整数标记图像，其中每个非零像素表示一个标签。
通过标记图像中已知属于给定区域的一些像素，利用初始标记，分水岭算法可以确定其他像素所属的区域。

(1) 首先，将标记图像读取为灰度图像，然后将其转换为整数类型：

class WatershedSegmentater {private:cv::Mat markers;public:void setMarkers(const cv::Mat& markerImage) {// 转换数据类型markerImage.convertTo(markers, CV_32S);}cv::Mat process(const cv::Mat& image) {// 应用分水岭算法cv::watershed(image, markers);return markers;}

有多种获取标记的方式，例如，使用预处理步骤识别出属于感兴趣对象的某些像素，然后利用分水岭算法根据初始标记分割完整的对象。在本节中，我们将使用二值图像来识别相应原始图像中的动物。因此，从二值图像中，我们需要识别属于前景(动物)的像素和属于背景(主要是雪地)的像素，我们用标签 255 标记前景像素，用标签 128 标记背景像素，其他像素则标记为 0。

(2) 初始二值图像包含过多属于图像各个部分的白色像素，为了只保留属于重要对象的像素，我们首先需要腐蚀该图像：

// 消除噪音
cv::Mat fg;
cv::erode(binary, fg, cv::Mat(), cv::Point(-1, -1), 4);

结果如下图所示：

腐蚀图像
(3) 图中仍然存在一些属于背景(雪地)的像素，我们通过对原始二值图像进行膨胀来选择几个属于背景的像素：

// 标记图像像素
cv::Mat bg;
cv::dilate(binary, bg, cv::Mat(), cv::Point(-1, -1), 4);
cv::threshold(bg, bg, 1, 128, cv::THRESH_BINARY_INV);

结果如下图所示，黑色像素对应于背景像素：

图像膨胀
(4) 将这些图像组合起来形成标记图像：

cv::Mat markers(binary.size(), CV_8U, cv::Scalar(0));
markers = fg+bg;

我们使用重载的 + 运算符来组合图像，得到用作分水岭算法的输入：

标记图像
(5) 在这个输入图像中，白色区域属于前景对象，灰色区域是背景的一部分，黑色区域则属于未知标签，得到分割结果如下：

// 创建分水岭分割对象
WatershedSegmentater segmenter;
segmenter.setMarkers(markers);
segmenter.process(image);

更新标记图像，以便为黑色区域中的像素重新分配标签，而属于边界的像素的值为 -1。结果标签图像如下：

结果标签图像
图像中对象边缘的可视化结果如下图所示：

图像边缘

2. 分水岭算法直观理解

我们使用拓扑图进行类比，为了创建分水岭分割，我们从级别 0 开始注水，随着水位逐渐增加，就形成了集水盆地。这些盆地的大小也会逐渐增加，两个不同盆地的水最终会汇合，发生这种情况时，会创建一个分水岭，以将两个盆地分开。一旦水位达到最高水位，这些水域和分水岭就形成了分水岭分割。
在注水过程中最初会产生许多小盆地，当这些盆地进行合并时，会创建许多分水岭线，从而导致图像被过度分割。为了克服这个问题，已经提出了多种改进算法，在 OpenCV 调用 cv::watershed 函数时，注水过程从一组预定义的标记像素开始，根据分配给初始标记的值对盆地进行标记，当具有相同标签的两个盆地合并时，不会创建分水岭，从而防止过度分割，更新输入标记图像以获得最终的分水岭分割。用户可以输入带有任意数量的标签和未知标签的标记图像，标记图像的像素类型为为 32 位有符号整数，以便能够定义超过 255 个标签。cv::watershed 函数还允许返回与分水岭关联的像素(使用特殊值 -1 进行标记)。
为了便于显示结果，我们引入两种特殊的方法。第一个方法 getSegmentation() 通过阈值返回标签图像，分水岭值为 0：

// 返回结果
cv::Mat getSegmentation() {cv::Mat tmp;markers.convertTo(tmp, CV_8U);return tmp;
}

第二种方法 getWatersheds() 返回的图像中，分水岭线使用值 0 进行标记，图像的其余部分像素值为 255，可以使用 cv::convertTo 方法实现：

// 返回分水岭
cv::Mat getWatersheds() {cv::Mat tmp;markers.convertTo(tmp,CV_8U,255,255);return tmp;
}

在转换之前应用线性变换，可以将像素值 -1 转换为 0 ( $−1×255+255=0-1\times 255+255=0$ )。由于将有符号整数转换为无符号字符时需应用饱和操作，大于 255 的像素值将转换为 255。
我们也可以通过许多不同的方式获得标记图像。例如，可以令用户以交互方式在图像中标记属于对象和背景的像素区域；或者，如果我们需要识别位于图像中心的物体，可以输入一个中心区域标有特定标签的图像，且图像背景标记带有另一个标签，可以按以下方式创建标记图像：

// 标记背景像素
cv::Mat imageMask(image.size(), CV_8U, cv::Scalar(0));
cv::rectangle(imageMask,cv::Point(5, 5),cv::Point(image.cols-5, image.rows-5),cv::Scalar(255),3);
// 标记前景像素
cv::rectangle(imageMask,cv::Point(image.cols/2-10, image.rows/2-10),cv::Point(image.cols/2+10, image.rows/2+10),cv::Scalar(1),10);

如果我们将此标记图像叠加在测试图像上，可以得到以下图像：

标记图像
生成的分水岭图像如下图所示：

分水岭图像

3. 完整代码

头文件 (watershedSegmentation.h) 完整代码如下：

#if !defined WATERSHS
#define WATERSHS#include <opencv2/core/core.hpp>
#include <opencv2/imgproc/imgproc.hpp>class WatershedSegmentater {private:cv::Mat markers;public:void setMarkers(const cv::Mat& markerImage) {// 转换数据类型markerImage.convertTo(markers, CV_32S);}cv::Mat process(const cv::Mat& image) {// 应用分水岭算法cv::watershed(image, markers);return markers;}// 返回结果cv::Mat getSegmentation() {cv::Mat tmp;markers.convertTo(tmp, CV_8U);return tmp;}// 返回分水岭cv::Mat getWatersheds() {cv::Mat tmp;markers.convertTo(tmp,CV_8U,255,255);return tmp;}
};#endif

主文件 (segment.cpp) 完整代码如下所示：

#include <iostream>
#include <opencv2/core/core.hpp>
#include <opencv2/highgui/highgui.hpp>
#include <opencv2/imgproc/imgproc.hpp>
#include "watershedSegmentation.h"int main() {// 读取输入图像cv::Mat image = cv::imread("1.png");if (!image.data) return 0;cv::namedWindow("Original Image");cv::imshow("Original Image",image);// 读取二值图像cv::Mat binary;binary = cv::imread("binary.png", 0);cv::namedWindow("Binary Image");cv::imshow("Binary Image", binary);// 消除噪音cv::Mat fg;cv::erode(binary, fg, cv::Mat(), cv::Point(-1, -1), 4);cv::namedWindow("Foreground Image");cv::imshow("Foreground Image", fg);// 标记图像像素cv::Mat bg;cv::dilate(binary, bg, cv::Mat(), cv::Point(-1, -1), 4);cv::threshold(bg, bg, 1, 128, cv::THRESH_BINARY_INV);cv::namedWindow("Background Image");cv::imshow("Background Image", bg);cv::Mat markers(binary.size(), CV_8U, cv::Scalar(0));markers = fg+bg;cv::namedWindow("Markers");cv::imshow("Markers", markers);// 创建分水岭分割对象WatershedSegmentater segmenter;segmenter.setMarkers(markers);segmenter.process(image);cv::namedWindow("Segmentation");cv::imshow("Segmentation", segmenter.getSegmentation());cv::namedWindow("Watersheds");cv::imshow("Watersheds", segmenter.getWatersheds());// 打开另一张图像image = cv::imread("3.png");// 标记背景像素cv::Mat imageMask(image.size(), CV_8U, cv::Scalar(0));cv::rectangle(imageMask,cv::Point(5, 5),cv::Point(image.cols-5, image.rows-5),cv::Scalar(255),3);// 标记前景像素cv::rectangle(imageMask,cv::Point(image.cols/2-10, image.rows/2-10),cv::Point(image.cols/2+10, image.rows/2+10),cv::Scalar(1),10);segmenter.setMarkers(imageMask);segmenter.process(image);cv::rectangle(image,cv::Point(5, 5),cv::Point(image.cols-5, image.rows-5),cv::Scalar(255, 255, 255),3);cv::rectangle(image,cv::Point(image.cols/2-10, image.rows/2-10),cv::Point(image.cols/2+10, image.rows/2+10),cv::Scalar(1, 1, 1),10);cv::namedWindow("Image with marker");cv::imshow("Image with marker", image);cv::namedWindow("Watershed");cv::imshow("Watershed", segmenter.getWatersheds());cv::waitKey();return 0;
}

OpenCV实战——基于分水岭算法的图像分割

OpenCV实战——基于分水岭算法的图像分割

0. 前言

1. 分水岭算法

2. 分水岭算法直观理解

3. 完整代码

相关链接

相关文章：

OpenCV实战——基于分水岭算法的图像分割

YOLOv8模型调试记录

算法刷题打卡第97天：删除字符串两端相同字符后的最短长度

WebGPU学习（3）---使用IndexBuffer（索引缓冲区）

Java代码加密混淆工具有哪些?

华为OD机试 - 高效的任务规划（Python） | 机试题+算法思路+考点+代码解析【2023】

ChatGPT写程序如何？

编译链接实战（9）elf符号表

React合成事件的原理是什么

Arduino-交通灯

【论文笔记】Manhattan-SDF == ZJU == CVPR‘2022 Oral

好消息！Ellab（易来博）官方微信公众号开通了！携虹科提供专业验证和监测解决方案

想要去字节跳动面试Android岗，给你这些面试知识点

Java的Lambda表达式的使用

Spring MVC 源码 - HandlerMapping 组件（三）之 AbstractHandlerMethodMapping

超店有数，为什么商家要使用tiktok达人进行营销推广呢？

【分享】订阅万里牛集简云连接器同步企业采购审批至万里牛系统

C++类和对象_02----对象模型和this指针

瑞芯微RK3568开发：烧录过程

【数据结构】——树和二叉树的概念

Python爬虫实战：研究MechanicalSoup库相关技术

synchronized 学习

TDengine 快速体验（Docker 镜像方式）

相机Camera日志实例分析之二：相机Camx【专业模式开启直方图拍照】单帧流程日志详解

【入坑系列】TiDB 强制索引在不同库下不生效问题

mongodb源码分析session执行handleRequest命令find过程

Objective-C常用命名规范总结

Java-41 深入浅出 Spring - 声明式事务的支持事务配置 XML模式 XML+注解模式

Neo4j 集群管理：原理、技术与最佳实践深度解析

CMake 从 GitHub 下载第三方库并使用