当前位置: 首页 > news >正文

SAM(Segment Anything)大模型论文汇总

A Comprehensive Survey on Segment Anything Model for Vision and Beyond

论文:https://arxiv.org/abs/2305.08196

25页综述,198篇参考文献!52个开源项目!本文第一个全面回顾了分割一切模型(SAM)的研究和应用进展,介绍了基础背景,总结了SAM在各种图像处理应用中的优势和局限性。

 

 相关SAM项目索引

 

How to Efficiently Adapt Large Segmentation Model(SAM) to Medical Image Domains

论文:https://arxiv.org/pdf/2306.13731.pdf

代码:https://github.com/xhu248/AutoSAM

解读:医疗SAM也来啦 | AutoSAM告诉你如何在医疗领域更快更好开发大模型 - 知乎 (zhihu.com)

 

AutoSAM: Adapting SAM to Medical Images by Overloading the Prompt Encoder

论文:https://arxiv.org/abs/2306.06370

Faster Segment Anything: Towards Lightweight SAM for Mobile Applications

论文:https://arxiv.org/abs/2306.14289

代码:https://github.com/ChaoningZhang/MobileSAM

解读:【论文解读】比sam小60倍的轻量级模型mobilesam(Faster Segment Anything) - 知乎 (zhihu.com)

MobileSAM来啦 | 比SAM小60倍,比FastSAM快4倍,速度和效果双赢 - 知乎 (zhihu.com)

Segment Anything in High Quality

论文:https://arxiv.org/abs/2306.01567

代码:https://github.com/SysCV/SAM-HQ

解读:苏黎世理工 & 港科大震撼力作 HQ-SAM:SAM新秀-高质量分割一切模型 - 知乎 (zhihu.com)

TinyViT: Fast Pretraining Distillation for Small Vision Transformers

论文:https://arxiv.org/abs/2207.10666

代码:https://github.com/wkcn/tinyvit

解读:【论文解读】TinyVit:快速蒸馏vit,可替换sam的vit(mobilesam) - 知乎 (zhihu.com)

ECCV 22|大数据的红利我吃定了!微软开源TinyViT :搞定小模型的预训练能力 - 知乎 (zhihu.com)

Fast Segment Anything

论文:https://arxiv.org/abs/2306.12156

代码:https://github.com/CASIA-IVA-Lab/FastSAM

解读:中科院自动化所发布Fast SAM | 精度相当,速度提升50倍!!! - 知乎 (zhihu.com)

SAM-IQA: Can Segment Anything Boost Image Quality Assessment?

论文:https://arxiv.org/abs/2307.04455

代码:https://github.com/Hedlen/SAM-IQA

解读:旷视提出SAM-IQA:分割一切模型可以提高图像质量评估吗? - 知乎 (zhihu.com)

RSPrompter: Learning to Prompt for Remote Sensing Instance Segmentation based on Visual Foundation Model

论文:https://arxiv.org/abs/2306.16269

代码:https://github.com/KyanChen/RSPrompter

解读:RSPrompter:遥感图像实例分割利器,基于SAM实现自动分割 - 知乎

RSPrompter - 知乎 (zhihu.com)

SAMMed: A medical image annotation framework based on large vision model

论文:https://arxiv.org/abs/2307.05617

解读:SAM-Med | 英伟达基于SAM提出医学图像标注效率神器 - 知乎 (zhihu.com)

SAMAug: Point Prompt Augmentation for Segment Anything Model

论文:https://arxiv.org/abs/2307.01187

解读:SAM增强技术 | SAMAug提出Point Prompt增强,让SAM模型天天向上 - 知乎 (zhihu.com)

Semantic-SAM: Segment and Recognize Anything at Any Granularity

论文:https://arxiv.org/abs/2307.04767

代码:https://github.com/UX-Decoder/Semantic-SAM

解读:港科&微软 | Semantic-SAM:多粒度的语义通用分割模型 - 知乎 (zhihu.com)

Semantic SAM: 多粒度、多语义的统一分割模型 - 知乎 (zhihu.com)

大模型学习笔记

大模型学习笔记 - 知乎 (zhihu.com)

LLM 系列超详细解读 (一):GPT:无标注数据的预训练生成式语言模型 - 知乎

LLM 系列超详细解读 (二):GPT-2:GPT 在零样本多任务学习的探索 - 知乎

LLM 系列超详细解读 (三):GPT-3:大型语言模型是少样本学习器 - 知乎

多模态超详细解读 (四):VLMo:混合多模态专家的视觉语言预训练 - 知乎

多模态超详细解读 (六):BLIP:统一理解和生成的自举多模态模型 - 知乎

Segment Anything(sam)项目整理汇总[2023.7.21] - 知乎 (zhihu.com)

SAM开源库

[0] dk-liang/Awesome-Segment-Anything

[1] liliu-avril/Awesome-Segment-Anything

[2] VainF/Awesome-Anything

[3] Hedlen/awesome-segment-anything

[4] Vision-Intelligence-and-Robots-Group/Awesome-Segment-Anything

[5] JerryX1110/awesome-segment-anything-extensions

相关文章:

SAM(Segment Anything)大模型论文汇总

A Comprehensive Survey on Segment Anything Model for Vision and Beyond 论文:https://arxiv.org/abs/2305.08196 25页综述,198篇参考文献!52个开源项目!本文第一个全面回顾了分割一切模型(SAM)的研究和应用进展,…...

金融翻译难吗,如何做好金融翻译?

我们知道,金融翻译涉及企业经济这块的,是影响各公司发展很重要的一方面,翻译做得好,可以促进公司内外的交流,及时掌握各种信息,做好应对。那么,金融翻译难吗,如何做好金融翻译&#…...

Java面试题(Tomcat与Nginx)

Tomcat 什么是Tomcat&#xff1f; 简单来说是一个运行Java的网络服务器&#xff0c;也是jsp和serlvet的一个容器 Tomcat的缺省端口是多少&#xff0c;怎么修改? conf文件夹下修改server.xml文件 <Connector connectionTimeout"20000" port"8080" p…...

React-使用mobx

React 中使用 mobx 配置开发环境 安装mobx和中间件工具 mobx-react-lite 只能函数组件中使用 yarn add mobx mobx-react-lite初始化 mobx 定义数据状态 state在构造器中实现数据响应式处理 makeAutoObservble定义修改数据的函数 action实例化 store 并导出 import { compute…...

LeetCode ACM模式——哈希表篇(一)

刷题顺序及部分思路来源于代码随想录&#xff0c;网站地址&#xff1a;https://programmercarl.com 部分思路来源于力扣官方题解&#xff0c;作者主页&#xff1a;https://leetcode.cn/u/leetcode-solution/ 242. 有效的字母异位词 给定两个字符串 s 和 t &#xff0c;编写一个…...

WPF实战学习笔记31-登录界面全局通知

UI添加消息聚合器 <md:Snackbarx:Name"LoginSnakeBar"Grid.ColumnSpan"2"Panel.ZIndex"1"MessageQueue"{md:MessageQueue}" />注册提示消息 文件&#xff1a;Mytodo.Views.LoginView.cs构造函数添加内容 //注册提示消息 aggre…...

通用商城项目(中)

金山编译器出问题了。下面段落标号全出问题了&#xff0c;排版也出问题了。懒得改了。 使用对象存储OSS&#xff0c;保存品牌logo 新建Module&#xff0c;提供上传、显示服务 有些不明所以的&#xff0c;按照steinliving-commodity配置了一通pom.xml 新建application.yml&…...

谨慎使用JSON.stringify

谨慎使用JSON.stringify 为了避免因为对象是引用类型而造成的数据源污染&#xff0c;我们通常使用 JSON.stringify 将其转换为字符串&#xff0c;而后通过JSON.parse方法将字符串转化一个新对象来实现深拷贝。但是在这个过程中也会存在一些问题&#xff0c;本文就介绍一下使用…...

驱动开发day8

编写LED灯的驱动&#xff0c;使用GPIO子系统&#xff0c;里面添加按键的中断处理 1.应用程序发送指令控制LED亮灭 2.按键1 按下&#xff0c;led1电位反转 按键2按下&#xff0c;led2电位反转 按键3 按下&#xff0c;led3电位反转 驱动程序 #include <linux/init.h> #i…...

CAS 机制

问题分析与思考&#xff1a; CAS 是 Java 中 Unsafe 类里面的方法&#xff0c;它的全称是 CompareAndSwap&#xff0c;比较并交换 的意思。 它的主要功能是能够保证在多线程环境下&#xff0c;对于共享变量的修改的原子性。 举个例子&#xff0c;比如说有这样一个场景&#xff…...

#P1003. [NOIP2009普及组] 道路游戏

题目描述 小新正在玩一个简单的电脑游戏。 游戏中有一条环形马路&#xff0c;马路上有 nn 个机器人工厂&#xff0c;两个相邻机器人工厂之间由一小段马路连接。小新以某个机器人工厂为起点&#xff0c;按顺时针顺序依次将这 nn 个机器人工厂编号为 1\sim n1∼n&#xff0c;因…...

python-网络爬虫.regular

regular 正则表达式 (regular expression) 正则表达式(regular expression)描述了一种字符串匹配的模式 &#xff08;pattern&#xff09;&#xff0c; 可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串 中取出符合某个条件的子串等。 正则表达式是由普通…...

手动搭建gateway,项目集成gateway实现Token效果

目录 背景步骤1、首先创建springboot项目2、引入依赖3、配置文件&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff08;超级重要&#xff01;&#xff01;&#xff01;根据自己的需要进行配置&#xff09;4、相关类我们在服务中进行的白名单中接口的操作如…...

linux下SVN服务器搭建

在本教程中&#xff0c;我们将介绍如何在Linux系统下搭建Subversion&#xff08;SVN&#xff09;服务器。Subversion是一种流行的版本控制系统&#xff0c;它允许多个人在同一项目上进行协作&#xff0c;同时避免了他们各自的更改发生冲突。 安装SVN 在大多数Linux发行版中&am…...

技术等级 TRL 定义

“不同环境、不同目标下TRL表述不一样” 技术等级 TRL 定义 TRL1 基本原理提出和发现 TRL2 技术应用研究 TRL3 完成概念验证&#xff0c;如叶栅试验、燃烧室头部试验等 TRL4 完成模拟部件试验&#xff0e;如压气机性能试验&#xff0c;燃烧室扇形试验 TRL5 完…...

DHorse v1.3.0 发布,基于k8s的发布平台

综述 DHorse是一个简单易用、以应用为中心的云原生DevOps系统&#xff0c;具有持续集成、持续部署、微服务治理等功能&#xff0c;无需安装依赖Docker、Maven、Node等环境即可发布Java、Vue、React应用&#xff0c;主要特点&#xff1a;部署简单、操作简洁、功能快速。 新增特…...

Redis - 缓存的双写一致性

概念&#xff1a; 当修改了数据库的数据也要同时更新缓存的数据&#xff0c;缓存和数据库的数据要保持一致 那为什么会有不一致的情况呢&#xff1f; 如果不追求一致性&#xff0c;正常有两种做法 先修改数据库 后删除旧的缓存先删除旧的缓存 再修改数据库 我们以先删除旧的…...

opencv03-Mat矩阵API的使用

opencv03-Mat矩阵API的使用 构造方法(具体介绍看API文档) int main() {Mat m1 Mat(200, 100, CV_8UC1);imshow("o1", m1);Mat m2 Mat(Size(100, 200), CV_8UC1);imshow("o2", m2);Mat m3 Mat(200, 100, CV_8UC3, Scalar(255, 0, 0));imshow("o3&…...

2023届浙江大学MPA提面A资格经验总结分享

本人是去年报考的浙大MPA项目&#xff0c;并通过提面获得了A资格&#xff0c;新一年浙大MPA项目提前批面试已经开始了&#xff0c;受达立易考周老师邀请来分享下我的提面经验&#xff0c;希望我的经验能对还在迷茫中的小伙伴有所帮助。 点开提面通知&#xff0c;首先看到…...

BugKu CTF(杂项篇MISC)—想要种子吗

BugKu CTF(杂项篇MISC)—想要种子吗 提 示: 描 述:flag{} 题目下载后是一张图片&#xff0c;打开如下。 一、工具 十六进制编辑器010 editor kali系统文件分离工具binwalk或者foremost 维吉尼亚密码 STEGHIDE图片隐写工具 文章所需的软件下载地址 ARCHPR压缩包密码破解…...

长期使用Taotoken的Token Plan套餐带来的月度成本变化观察

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 长期使用Taotoken的Token Plan套餐带来的月度成本变化观察 对于需要持续调用大模型API的开发者或团队而言&#xff0c;成本的可预测…...

产品质量总是不稳?问题可能出在这五个地方

你厂里是不是也有这类难题&#xff1f;投入不少钱买设备、招人手&#xff0c;产品质量却始终上不去。不良品率高、批量出问题、客户投诉退货&#xff0c;甚至找不到问题根源。今天我就来聊聊质量上不去的几个原因&#xff0c;大家可对照自查。一、问题可能出现在生产之前看到质…...

书匠策AI官网www.shujiangce.com|论文写作“裸奔时代“结束了!

哈喽各位还在跟论文死磕的朋友们&#xff0c;我是你们的论文科普搭子。 今天咱们换个玩法——不讲理论&#xff0c;不说大道理&#xff0c;我就拿书匠策AI&#xff08; 官网直达&#xff1a;www.shujiangce.com&#xff09; 的期刊论文功能当一台"时光机"&#xff0…...

给嵌入式工程师的保姆级ISP图像调试指南:从AE曝光到3DNR降噪的完整流程

嵌入式工程师的ISP图像调试实战手册&#xff1a;从曝光控制到降噪优化的全链路解析 当你第一次拿到一款全新的IPC摄像头模组时&#xff0c;是否曾被复杂的ISP参数搞得手足无措&#xff1f;作为嵌入式工程师&#xff0c;我们往往需要在资源受限的环境中实现专业级的图像质量。本…...

【Oracle数据库指南】第43篇:Oracle ASM磁盘组使用与维护

上一篇【第42篇】Oracle ASM实例与磁盘组管理详解 下一篇【第44篇】Oracle性能监控——关键指标与工具 摘要 ASM&#xff08;Automatic Storage Management&#xff0c;自动存储管理&#xff09;是Oracle提供的专用文件系统和卷管理器&#xff0c;专为Oracle数据库设计。本文在…...

如何利用Google Cloud服务加速OR-Tools大规模优化求解:完整实践指南

如何利用Google Cloud服务加速OR-Tools大规模优化求解&#xff1a;完整实践指南 【免费下载链接】or-tools Googles Operations Research tools: 项目地址: https://gitcode.com/gh_mirrors/or/or-tools OR-Tools是Google开发的强大运筹学工具库&#xff0c;能够高效解决…...

2026年程序员AI工具链完整配置指南:从开发到部署全流程

你的开发环境还在用2023年的工具&#xff1f;醒醒&#xff0c;AI工具链已经迭代了三代了。## 前言作为一个从 Cursor 0.x 版本就开始跟的早期用户&#xff0c;我亲眼见证了AI编程工具从"玩具"变成"生产力核武器"的过程。2026年5月的今天&#xff0c;整个AI…...

Perseus:碧蓝航线皮肤解锁补丁的完整使用指南

Perseus&#xff1a;碧蓝航线皮肤解锁补丁的完整使用指南 【免费下载链接】Perseus Azur Lane scripts patcher. 项目地址: https://gitcode.com/gh_mirrors/pers/Perseus 你是否曾经在《碧蓝航线》中看到心仪的舰船皮肤&#xff0c;却因为需要付费而望而却步&#xff1…...

03-eMMC性能实战解析:速率模式、引脚配置与上电时序的协同设计

1. eMMC高速模式实战&#xff1a;HS400与HS200的带宽对决 在嵌入式系统设计中&#xff0c;eMMC存储的性能直接影响设备响应速度和用户体验。实测数据显示&#xff0c;三星KLMCG2KETM-B041芯片在HS400模式下能达到269.4MB/s的读取速度&#xff0c;而东芝THGBMDG5D1LBAIL同模式下…...

PostgreSQL游标:海量数据处理与高效分页的核心机制

1. 项目概述&#xff1a;为什么我们需要关注PostgreSQL游标&#xff1f;在数据库应用开发中&#xff0c;尤其是处理海量数据时&#xff0c;我们常常会遇到一个经典的两难困境&#xff1a;要么一次性将所有数据加载到应用内存中&#xff0c;导致内存溢出&#xff08;OOM&#xf…...