当前位置：首页 > news >正文

Segment anything（图片分割大模型）

news 2026/2/9 23:00:05

1.Segment anything

2.补充图像分割和目标检测的区别

1.Segment anything

定义：图像分割通用大模型

延深：可以预计视觉检测大模型，也快了。

进一步理解：传统图像分割对于下图处理时，识别房子的是识别房子的模型，识别草的是识别草的模型，识别人的是识别人的模型，而Segment anything可一次识别所有物体。可以这样说以前我们的模型是训练得到几个，几十个，几千个标签，而Segment anything可以得到所有标签，

再进一步理解：chagpt在实现文本任务时我们发现，他同样是聚焦所有点，只需要几个提示词去引导它，对应下图，比方说，找到图中病毒或者找到图中蓝色区域。在 Segment anything同样是这个道理，我们对图中想要识别的对象，点三个点（提示词），模型便知道你想识别这个对象。也可以用一个框（提示词）对这个对象作为指导。通用大模型不用一次把所有东西都训练好，在有大模型后，有提示词，可以持续学习。

2.补充图像分割和目标检测的区别

定义：在这两个任务中，我们都希望找到图像中某些感兴趣的项目的位置，比如说图中人的位置。从输出理解两者区别：

1. 目标检测：预测包围盒（对于下面的狗只用框框起来即可）
YOLO，Fast-RCNN，似乎还有个SSD
输入：一个矩阵(输入图像)，每个像素有 3 个值(红、绿、蓝)，如果是黑色和白色，则每个像素有 1 个值。
输出：由左上角和大小定义的边框列表。

2. 图像分割：预测掩模（对下面的狗比方说，红色的狗，周边标注时要对每一个像素点标注，过于麻烦）
Mask RCNN，Unet，Segnet
输入：是一个矩阵(输入图像)，每个像素有 3 个值(红、绿、蓝)，如果是黑色和白色，则每个像素有 1 个值
输出：是一个矩阵(掩模图像)，每个像素有一个包含指定类别的

结论：输出不同，从下图理解二者区别：简单理解目标检测在图中表现为框，图像分割是一种类别的颜色。

补充一下语义分割和实例分割：

语义分割：（图片分割）是对图像中的每一块像素都应该给出类别标签。

实例分割：（目标检测）只需要给出我们关注的物体的像素的类别标签。

结论：两者其实没有本质的区别。

参考文献

1.分割一切！刷爆CV圈子的视觉终极模型Segment Anything（SAM），唐宇迪博士两小时原理精讲、源码复现带你实操！_哔哩哔哩_bilibili

2.图像分割与目标检测与区别_图像分割和目标检测区别_必修居士的博客-CSDN博客

3.计算机视觉：图像检测和图像分割有什么区别？_图像识别与分割_喜欢打酱油的老鸟的博客-CSDN博客

Segment anything（图片分割大模型）

1.Segment anything

2.补充图像分割和目标检测的区别

相关文章：

Segment anything（图片分割大模型）

【雕爷学编程】MicroPython动手做（27）——物联网之掌控板小程序3

Java中集合容器详解：简单使用与案例分析

机器学习04-数据理解之数据可视化-(基于Pima数据集)

百度@全球开发者，见证中国科技超级“碗”！

分库分表之基于Shardingjdbc+docker+mysql主从架构实现读写分离（一）

Ajax跨域问题

Vue + FormData + axios实现图片上传功能

设计模式系列：经典的单例模式

macbook pro 散热解决办法

高并发与性能优化的神奇之旅

Django Rest_Framework（一）

VB+ACCESS智能公交考勤系统管理软件设计与实现

企业电子招标采购系统源码Spring Boot + Mybatis + Redis + Layui + 前后端分离构建企业电子招采平台之立项流程图 tbms

【ES】笔记-ECMAScript 相关介绍

FFmpeg下载安装及Windows开发环境设置

transformer面试常考题

aws的EC2云服务器

hive函数大全

k8s概念-StatefulSet

KubeSphere 容器平台高可用：环境搭建与可视化操作指南

在软件开发中正确使用MySQL日期时间类型的深度解析

＜6＞-MySQL表的增删查改

前端导出带有合并单元格的列表

反射获取方法和属性

ardupilot 开发环境eclipse 中import 缺少C++

k8s业务程序联调工具-KtConnect

Spring Cloud Gateway 中自定义验证码接口返回 404 的排查与解决

Mobile ALOHA全身模仿学习

高效线程安全的单例模式：Python 中的懒加载与自定义初始化参数