当前位置：首页 > news >正文

论文阅读——Semantic-SAM

news 2026/5/13 21:39:22

Semantic-SAM可以做什么：

整合了七个数据集：

一般的分割数据集，目标级别分割数据集：MSCOCO, Objects365, ADE20k

部分分割数据集：PASCAL Part, PACO, PartImagenet, and SA-1B

The datasets are SA-1B, COCO panoptic, ADE20k panoptic, PASCAL part, PACO, PartImageNet, and Objects365

COCO 和 ADE20k 有目标级别mask和类别标签的全景分割数据集；PASCAL part, PACO, and PartImageNet 部分分割的masks和类别标签. SA-1B 包括 6-level masks without labels； Objects365 有大量目标实例类别标签。

Semantic-SAM

支持point and box

把输入的点和坐标统一成形式：(x, y)-->(x, y, w, h)，w, h非常小。

b = (x, y, w, h)

一个点击或者box，编码为一个位置向量和K（K=6）个内容向量（查询向量）Q = (q1, · · · , qK)。

输入坐标、图片特征、内容查询向量，得到每个查询的输出查询特征。

训练：

目标级别分割和部分分割解耦：

不同数据集对应的损失项：

训练时和GT匹配问题;

SAM是多对一的，即三个SAM预测masks只对应一个GT mask。

对同一点击位置的不同GT masks聚类，然后使用Hungarian algorithm多对多匹配。

相似性矩阵和分数根据不同分割数据成分的可用性而变化。

结果：

论文阅读——Semantic-SAM

Semantic-SAM可以做什么： 整合了七个数据集： 一般的分割数据集，目标级别分割数据集：MSCOCO, Objects365, ADE20k 部分分割数据集：PASCAL Part, PACO, PartImagenet, and SA-1B The datasets are SA-1B, COCO panopt…...

编程日记 2023/12/16 16:32:52

gitlab下载，离线安装

目录 1.下载 2.安装 3.配置 4.启动 5.登录参考： 1.下载根据服务器操作系统版本，下载对应的RPM包。 gitlab官网： The DevSecOps Platform | GitLab rpm包官网下载地址: gitlab/gitlab-ce - Results in gitlab/gitlab-ce 国内镜像地…...

编程日记 2023/12/16 16:31:52

【SpringBoot篇】Interceptor拦截器 | 拦截器和过滤器的区别

文章目录 🌹概念⭐作用 🎄快速入门⭐入门案例代码实现 🛸拦截路径🍔拦截器interceptor和过滤器filter的区别🎆登录校验 🌹概念拦截器（Interceptor）是一种软件设计模式，…...

编程日记 2023/12/16 16:29:50

conan入门(三十六):在set_version方法中从pom.xml中读取版本号实现动态版本定义

一般情况下，我们通过self.version字段定义conan 包的版本号如下： class PkgConan(ConanFile):name "pkg"version "1.7.3"因为版本号是写死的，所以这种方式有局限性： 比如我的java项目中版本号是在pom.xml中…...

编程日记 2023/12/16 16:24:45

为什么 GAN 不好训练

为什么 GAN 不好训练？先看 GAN 的损失： 当生成器固定时，堆D(x)求导，推理得到（加号右边先对log求导，再对负项求导） 然后在面对最优Discriminator时，Generator的优化目标就变成了&…...

编程日记 2023/12/16 16:23:44

select、poll、epoll 区别有哪些

文章目录 select、poll、epoll 区别有哪些？select：poll：epoll： select、poll、epoll 区别有哪些？ select： 它仅仅知道了，有 I/O 事件发生了，却并不知道是哪那几个流（可…...

编程日记 2023/12/16 16:22:44

1 基于文档解析工具的方法 pdf解析工具导图一览： PyPDF2提取txt： import PyPDF2 def extract_text_from_pdf(pdf_path):with open(pdf_path, rb) as file:pdf_reader PyPDF2.PdfFileReader(file)num_pages pdf_reader.numPagestext ""f…...

编程日记 2023/12/16 16:21:43

【华为数据之道学习笔记】5-4 数据入湖方式

数据入湖遵循华为信息架构，以逻辑数据实体为粒度入湖，逻辑数据实体在首次入湖时应该考虑信息的完整性。原则上，一个逻辑数据实体的所有属性应该一次性进湖，避免一个逻辑实体多次入湖，增加入湖工作量。数据入湖的方式…...

编程日记 2023/12/16 16:20:42

Vue3-03-reactive() 响应式基本使用

reactive() 的简介 reactive() 是vue3 中进行响应式状态声明的另一种方式； 但是，它只能声明【对象类型】的响应式变量，【不支持声明基本数据类型】。reactive() 与 ref() 一样，都是深度响应式的，即对象嵌套属性发生了…...

编程日记 2023/12/16 16:18:39

OpenAI开源超级对齐方法：用GPT-2，监督、微调GPT-4

12月15日，OpenAI在官网公布了最新研究论文和开源项目——如何用小模型监督大模型，实现更好的新型对齐方法。目前，大模型的主流对齐方法是RLHF（人类反馈强化学习）。但随着大模型朝着多模态、AGI发展，神经元…...

编程日记 2023/12/16 16:16:38

TeeChart.NET 2023.11.17 Crack

.NET 的 TeeChart 图表控件提供了一个出色的通用组件套件，可满足无数的图表需求，也针对重要的垂直领域，例如金融、科学和统计领域。数据可视化数十种完全可定制的交互式图表类型、地图和仪表指示器，以及完整的功能集&#xff0c…...

编程日记 2023/12/16 16:15:37

计算机网络常见的缩写

计算机网络常见缩写通讯控制处理机（Communication Control Processor）CCP 前端处理机（Front End Processor）FEP 开放系统互连参考模型 OSI/RM 开放数据库连接（Open Database Connectivity）ODBC 网络操作系…...

编程日记 2023/12/16 16:14:36

vue cli 脚手架之配置代理

方法二...

编程日记 2023/12/16 16:11:34

STM32启动流程详解（超全，startup_stm32xx.s分析）

单片机上电后执行的第一段代码 1.初始化堆栈指针 SP_initial_sp 2.初始化 PC 指针Reset_Handler 3.初始化中断向量表 4.配置系统时钟 5.调用 C 库函数_main 初始化用户堆栈，然后进入 main 函数。在正式讲解之前，我们需要了解STM32的启动模式。 STM32的…...

编程日记 2023/12/16 16:10:33

小程序接口OK,桌面调试接口不行

手机小程序OK,桌面版出现问题； 环境：iis反向url的tomcat服务，提供接口。该接口post了一个很大的数组，处理时间比较久。 1）桌面调试出现错误,提示用apipost调用接口同样出错, 502 - Web 服务器在作为网关或代理服…...

编程日记 2023/12/16 16:09:32

【贪心】LeetCode-406. 根据身高重建队列

406. 根据身高重建队列。假设有打乱顺序的一群人站成一个队列，数组 people 表示队列中一些人的属性（不一定按顺序）。每个 people[i] [hi, ki] 表示第 i 个人的身高为 hi ，前面正好有 ki 个身高大于或等于 hi 的人。请你重新…...

编程日记 2023/12/16 16:06:29

【C++11特性篇】C++11中新增的initializer_list——初始化的小利器

前言大家好吖，欢迎来到 YY 滴C11系列 ，热烈欢迎！ 本章主要内容面向接触过C的老铁主要内容含： 欢迎订阅 YY滴C专栏！更多干货持续更新！以下是传送门！ 目录一.探究std::initializer_list是什么…...

编程日记 2023/12/16 16:05:28

springboot(ssm宠物美容机构CRM系统宠物服务商城系统Java系统

springboot(ssm宠物美容机构CRM系统客户关系管理系统Java系统开发语言：Java 框架：ssm/springboot vue JDK版本：JDK1.8（或11） 服务器：tomcat 数据库：mysql 5.7（或8.0&#xff…...

编程日记 2023/12/16 16:04:27

LSTM 双向 Bi-LSTM

目录一.Bi-LSTM介绍二.Bi-LSTM结构 Bi-LSTM 代码实例一.Bi-LSTM介绍由于LSTM只能从序列里由前往后预测，为了既能够从前往后预测，也能从后往前预测，Bi-LSTM便被发明了出来。简单来说，BiLSTM就是由前向LSTM与后向LSTM组合而成。二.Bi-LSTM结构转自：...

编程日记 2023/12/16 16:03:26

2024测试开发面试题完整版本（附答案）

目录 1. 什么是软件测试， 谈谈你对软件测试的了解 2. 我看你简历上有写了解常见的开发模型和测试模型, 那你跟我讲一下敏捷模型 3. 我看你简历上还写了挺多开发技能的, 那你给我讲讲哈希表的实现流程 4. 谈一谈什么是线程安全问题, 如何解决 5. 既然你选择走测…...

编程日记 2023/12/16 16:01:25

开源免费Web搜索工具openclaw-free-web-search：原理、部署与实战调优

1. 项目概述：一个开源、免费的Web搜索工具最近在折腾一些需要实时信息查询的小项目，比如新闻聚合、舆情监控或者简单的市场调研，发现直接调用商业搜索引擎的API要么有调用限制，要么费用不菲。就在这个当口，我注意到了G…...

编程新知 2026/5/13 21:24:51

从零移植Debian到红米2：解锁MSM8916上的主线Linux手机体验

1. 为什么选择红米2作为Linux移植平台红米2作为2015年发布的入门级智能手机，搭载高通骁龙410（MSM8916）平台，1GB内存8GB存储的配置在今天看来已经相当落伍。但正是这种"过时硬件"反而成为了极客们眼中的宝藏开发板。我选…...

编程新知 2026/5/13 21:18:37

3分钟掌握PC端聊天软件防撤回：RevokeMsgPatcher实战指南

3分钟掌握PC端聊天软件防撤回：RevokeMsgPatcher实战指南【免费下载链接】RevokeMsgPatcher :trollface: A hex editor for WeChat/QQ/TIM - PC版微信/QQ/TIM防撤回补丁（我已经看到了，撤回也没用了） 项目地址: https://gitcode.…...

编程新知 2026/5/13 20:40:59

Taotoken CLI工具一键配置团队开发环境实战指南

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度 Taotoken CLI工具一键配置团队开发环境实战指南 1. 场景与需求在团队协作开发中，统一管理大模型调用环境是一个常见且…...

编程新知 2026/5/13 20:01:06

Carla 启动卡在75%并报“Fatal error”：从崩溃日志到资源缺失的排查实录

1. 当Carla卡在75%：从崩溃现象到问题定位那天我正在Windows环境下调试Carla仿真平台，编译过程一切顺利，但执行make launch命令后，进度条就像被施了定身咒——永远停在了75%的位置。紧接着弹出的"Fatal error"对话框让我…...

编程新知 2026/5/13 17:36:30

在ubuntu上为nodejs后端服务接入taotoken多模型api的步骤

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度在 Ubuntu 上为 Node.js 后端服务接入 Taotoken 多模型 API 的步骤为后端服务集成大模型能力是现代应用开发的常见需求。如果你在…...

编程新知 2026/5/13 16:51:49

思源宋体完全指南：7种字体样式免费商用，打造专业中文排版

思源宋体完全指南：7种字体样式免费商用，打造专业中文排版【免费下载链接】source-han-serif-ttf Source Han Serif TTF 项目地址: https://gitcode.com/gh_mirrors/so/source-han-serif-ttf 还在为设计项目寻找既专业又免费的中文字体而烦恼吗&a…...

编程新知 2026/5/13 16:43:06

避开这3个坑，你的MAX30102心率数据才更准（Arduino实测经验分享）

避开这3个坑，你的MAX30102心率数据才更准（Arduino实测经验分享） 当你在健康监测或可穿戴设备项目中使用MAX30102传感器时，是否遇到过心率数据忽高忽低、稳定性差的问题？这很可能不是传感器本身的问题，而是你…...

编程新知 2026/5/13 15:50:34

3种高效方案：让Windows直接运行Android应用的全新体验手册

3种高效方案：让Windows直接运行Android应用的全新体验手册【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 想象一下这样的场景：您需要在电脑上快…...

编程新知 2026/5/13 15:20:30

Understat终极指南：免费获取足球数据的Python异步神器

Understat终极指南：免费获取足球数据的Python异步神器【免费下载链接】understat An asynchronous Python package for https://understat.com/. 项目地址: https://gitcode.com/gh_mirrors/un/understat 想要快速获取专业足球数据？厌倦了手动爬…...

编程新知 2026/5/13 15:15:57

论文阅读——Semantic-SAM

相关文章：

论文阅读——Semantic-SAM

gitlab下载，离线安装

【SpringBoot篇】Interceptor拦截器 | 拦截器和过滤器的区别

conan入门(三十六):在set_version方法中从pom.xml中读取版本号实现动态版本定义

为什么 GAN 不好训练

select、poll、epoll 区别有哪些

大模型下开源文档解析工具总结及技术思考

【华为数据之道学习笔记】5-4 数据入湖方式

Vue3-03-reactive() 响应式基本使用

OpenAI开源超级对齐方法：用GPT-2，监督、微调GPT-4

TeeChart.NET 2023.11.17 Crack

计算机网络常见的缩写

vue cli 脚手架之配置代理

STM32启动流程详解（超全，startup_stm32xx.s分析）

小程序接口OK,桌面调试接口不行

【贪心】LeetCode-406. 根据身高重建队列

【C++11特性篇】C++11中新增的initializer_list——初始化的小利器

springboot(ssm宠物美容机构CRM系统宠物服务商城系统Java系统

LSTM 双向 Bi-LSTM

2024测试开发面试题完整版本（附答案）

开源免费Web搜索工具openclaw-free-web-search：原理、部署与实战调优

从零移植Debian到红米2：解锁MSM8916上的主线Linux手机体验

3分钟掌握PC端聊天软件防撤回：RevokeMsgPatcher实战指南

Taotoken CLI工具一键配置团队开发环境实战指南

Carla 启动卡在75%并报“Fatal error”：从崩溃日志到资源缺失的排查实录

在ubuntu上为nodejs后端服务接入taotoken多模型api的步骤

思源宋体完全指南：7种字体样式免费商用，打造专业中文排版

避开这3个坑，你的MAX30102心率数据才更准（Arduino实测经验分享）

3种高效方案：让Windows直接运行Android应用的全新体验手册

Understat终极指南：免费获取足球数据的Python异步神器