SAM(Segment Anything)大模型论文汇总
A Comprehensive Survey on Segment Anything Model for Vision and Beyond
论文:https://arxiv.org/abs/2305.08196
25页综述,198篇参考文献!52个开源项目!本文第一个全面回顾了分割一切模型(SAM)的研究和应用进展,介绍了基础背景,总结了SAM在各种图像处理应用中的优势和局限性。
相关SAM项目索引
How to Efficiently Adapt Large Segmentation Model(SAM) to Medical Image Domains
论文:https://arxiv.org/pdf/2306.13731.pdf
代码:https://github.com/xhu248/AutoSAM
解读:医疗SAM也来啦 | AutoSAM告诉你如何在医疗领域更快更好开发大模型 - 知乎 (zhihu.com)
AutoSAM: Adapting SAM to Medical Images by Overloading the Prompt Encoder
论文:https://arxiv.org/abs/2306.06370
Faster Segment Anything: Towards Lightweight SAM for Mobile Applications
论文:https://arxiv.org/abs/2306.14289
代码:https://github.com/ChaoningZhang/MobileSAM
解读:【论文解读】比sam小60倍的轻量级模型mobilesam(Faster Segment Anything) - 知乎 (zhihu.com)
MobileSAM来啦 | 比SAM小60倍,比FastSAM快4倍,速度和效果双赢 - 知乎 (zhihu.com)
Segment Anything in High Quality
论文:https://arxiv.org/abs/2306.01567
代码:https://github.com/SysCV/SAM-HQ
解读:苏黎世理工 & 港科大震撼力作 HQ-SAM:SAM新秀-高质量分割一切模型 - 知乎 (zhihu.com)
TinyViT: Fast Pretraining Distillation for Small Vision Transformers
论文:https://arxiv.org/abs/2207.10666
代码:https://github.com/wkcn/tinyvit
解读:【论文解读】TinyVit:快速蒸馏vit,可替换sam的vit(mobilesam) - 知乎 (zhihu.com)
ECCV 22|大数据的红利我吃定了!微软开源TinyViT :搞定小模型的预训练能力 - 知乎 (zhihu.com)
Fast Segment Anything
论文:https://arxiv.org/abs/2306.12156
代码:https://github.com/CASIA-IVA-Lab/FastSAM
解读:中科院自动化所发布Fast SAM | 精度相当,速度提升50倍!!! - 知乎 (zhihu.com)
SAM-IQA: Can Segment Anything Boost Image Quality Assessment?
论文:https://arxiv.org/abs/2307.04455
代码:https://github.com/Hedlen/SAM-IQA
解读:旷视提出SAM-IQA:分割一切模型可以提高图像质量评估吗? - 知乎 (zhihu.com)
RSPrompter: Learning to Prompt for Remote Sensing Instance Segmentation based on Visual Foundation Model
论文:https://arxiv.org/abs/2306.16269
代码:https://github.com/KyanChen/RSPrompter
解读:RSPrompter:遥感图像实例分割利器,基于SAM实现自动分割 - 知乎
RSPrompter - 知乎 (zhihu.com)
SAMMed: A medical image annotation framework based on large vision model
论文:https://arxiv.org/abs/2307.05617
解读:SAM-Med | 英伟达基于SAM提出医学图像标注效率神器 - 知乎 (zhihu.com)
SAMAug: Point Prompt Augmentation for Segment Anything Model
论文:https://arxiv.org/abs/2307.01187
解读:SAM增强技术 | SAMAug提出Point Prompt增强,让SAM模型天天向上 - 知乎 (zhihu.com)
Semantic-SAM: Segment and Recognize Anything at Any Granularity
论文:https://arxiv.org/abs/2307.04767
代码:https://github.com/UX-Decoder/Semantic-SAM
解读:港科&微软 | Semantic-SAM:多粒度的语义通用分割模型 - 知乎 (zhihu.com)
Semantic SAM: 多粒度、多语义的统一分割模型 - 知乎 (zhihu.com)
大模型学习笔记
大模型学习笔记 - 知乎 (zhihu.com)
LLM 系列超详细解读 (一):GPT:无标注数据的预训练生成式语言模型 - 知乎
LLM 系列超详细解读 (二):GPT-2:GPT 在零样本多任务学习的探索 - 知乎
LLM 系列超详细解读 (三):GPT-3:大型语言模型是少样本学习器 - 知乎
多模态超详细解读 (四):VLMo:混合多模态专家的视觉语言预训练 - 知乎
多模态超详细解读 (六):BLIP:统一理解和生成的自举多模态模型 - 知乎
Segment Anything(sam)项目整理汇总[2023.7.21] - 知乎 (zhihu.com)
SAM开源库
[0] dk-liang/Awesome-Segment-Anything
[1] liliu-avril/Awesome-Segment-Anything
[2] VainF/Awesome-Anything
[3] Hedlen/awesome-segment-anything
[4] Vision-Intelligence-and-Robots-Group/Awesome-Segment-Anything
[5] JerryX1110/awesome-segment-anything-extensions
相关文章:

SAM(Segment Anything)大模型论文汇总
A Comprehensive Survey on Segment Anything Model for Vision and Beyond 论文:https://arxiv.org/abs/2305.08196 25页综述,198篇参考文献!52个开源项目!本文第一个全面回顾了分割一切模型(SAM)的研究和应用进展,…...

金融翻译难吗,如何做好金融翻译?
我们知道,金融翻译涉及企业经济这块的,是影响各公司发展很重要的一方面,翻译做得好,可以促进公司内外的交流,及时掌握各种信息,做好应对。那么,金融翻译难吗,如何做好金融翻译&#…...
Java面试题(Tomcat与Nginx)
Tomcat 什么是Tomcat? 简单来说是一个运行Java的网络服务器,也是jsp和serlvet的一个容器 Tomcat的缺省端口是多少,怎么修改? conf文件夹下修改server.xml文件 <Connector connectionTimeout"20000" port"8080" p…...
React-使用mobx
React 中使用 mobx 配置开发环境 安装mobx和中间件工具 mobx-react-lite 只能函数组件中使用 yarn add mobx mobx-react-lite初始化 mobx 定义数据状态 state在构造器中实现数据响应式处理 makeAutoObservble定义修改数据的函数 action实例化 store 并导出 import { compute…...
LeetCode ACM模式——哈希表篇(一)
刷题顺序及部分思路来源于代码随想录,网站地址:https://programmercarl.com 部分思路来源于力扣官方题解,作者主页:https://leetcode.cn/u/leetcode-solution/ 242. 有效的字母异位词 给定两个字符串 s 和 t ,编写一个…...
WPF实战学习笔记31-登录界面全局通知
UI添加消息聚合器 <md:Snackbarx:Name"LoginSnakeBar"Grid.ColumnSpan"2"Panel.ZIndex"1"MessageQueue"{md:MessageQueue}" />注册提示消息 文件:Mytodo.Views.LoginView.cs构造函数添加内容 //注册提示消息 aggre…...

通用商城项目(中)
金山编译器出问题了。下面段落标号全出问题了,排版也出问题了。懒得改了。 使用对象存储OSS,保存品牌logo 新建Module,提供上传、显示服务 有些不明所以的,按照steinliving-commodity配置了一通pom.xml 新建application.yml&…...
谨慎使用JSON.stringify
谨慎使用JSON.stringify 为了避免因为对象是引用类型而造成的数据源污染,我们通常使用 JSON.stringify 将其转换为字符串,而后通过JSON.parse方法将字符串转化一个新对象来实现深拷贝。但是在这个过程中也会存在一些问题,本文就介绍一下使用…...
驱动开发day8
编写LED灯的驱动,使用GPIO子系统,里面添加按键的中断处理 1.应用程序发送指令控制LED亮灭 2.按键1 按下,led1电位反转 按键2按下,led2电位反转 按键3 按下,led3电位反转 驱动程序 #include <linux/init.h> #i…...

CAS 机制
问题分析与思考: CAS 是 Java 中 Unsafe 类里面的方法,它的全称是 CompareAndSwap,比较并交换 的意思。 它的主要功能是能够保证在多线程环境下,对于共享变量的修改的原子性。 举个例子,比如说有这样一个场景ÿ…...
#P1003. [NOIP2009普及组] 道路游戏
题目描述 小新正在玩一个简单的电脑游戏。 游戏中有一条环形马路,马路上有 nn 个机器人工厂,两个相邻机器人工厂之间由一小段马路连接。小新以某个机器人工厂为起点,按顺时针顺序依次将这 nn 个机器人工厂编号为 1\sim n1∼n,因…...

python-网络爬虫.regular
regular 正则表达式 (regular expression) 正则表达式(regular expression)描述了一种字符串匹配的模式 (pattern), 可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串 中取出符合某个条件的子串等。 正则表达式是由普通…...

手动搭建gateway,项目集成gateway实现Token效果
目录 背景步骤1、首先创建springboot项目2、引入依赖3、配置文件!!!!!(超级重要!!!根据自己的需要进行配置)4、相关类我们在服务中进行的白名单中接口的操作如…...
linux下SVN服务器搭建
在本教程中,我们将介绍如何在Linux系统下搭建Subversion(SVN)服务器。Subversion是一种流行的版本控制系统,它允许多个人在同一项目上进行协作,同时避免了他们各自的更改发生冲突。 安装SVN 在大多数Linux发行版中&am…...

技术等级 TRL 定义
“不同环境、不同目标下TRL表述不一样” 技术等级 TRL 定义 TRL1 基本原理提出和发现 TRL2 技术应用研究 TRL3 完成概念验证,如叶栅试验、燃烧室头部试验等 TRL4 完成模拟部件试验.如压气机性能试验,燃烧室扇形试验 TRL5 完…...

DHorse v1.3.0 发布,基于k8s的发布平台
综述 DHorse是一个简单易用、以应用为中心的云原生DevOps系统,具有持续集成、持续部署、微服务治理等功能,无需安装依赖Docker、Maven、Node等环境即可发布Java、Vue、React应用,主要特点:部署简单、操作简洁、功能快速。 新增特…...

Redis - 缓存的双写一致性
概念: 当修改了数据库的数据也要同时更新缓存的数据,缓存和数据库的数据要保持一致 那为什么会有不一致的情况呢? 如果不追求一致性,正常有两种做法 先修改数据库 后删除旧的缓存先删除旧的缓存 再修改数据库 我们以先删除旧的…...
opencv03-Mat矩阵API的使用
opencv03-Mat矩阵API的使用 构造方法(具体介绍看API文档) int main() {Mat m1 Mat(200, 100, CV_8UC1);imshow("o1", m1);Mat m2 Mat(Size(100, 200), CV_8UC1);imshow("o2", m2);Mat m3 Mat(200, 100, CV_8UC3, Scalar(255, 0, 0));imshow("o3&…...

2023届浙江大学MPA提面A资格经验总结分享
本人是去年报考的浙大MPA项目,并通过提面获得了A资格,新一年浙大MPA项目提前批面试已经开始了,受达立易考周老师邀请来分享下我的提面经验,希望我的经验能对还在迷茫中的小伙伴有所帮助。 点开提面通知,首先看到…...

BugKu CTF(杂项篇MISC)—想要种子吗
BugKu CTF(杂项篇MISC)—想要种子吗 提 示: 描 述:flag{} 题目下载后是一张图片,打开如下。 一、工具 十六进制编辑器010 editor kali系统文件分离工具binwalk或者foremost 维吉尼亚密码 STEGHIDE图片隐写工具 文章所需的软件下载地址 ARCHPR压缩包密码破解…...
椭圆曲线密码学(ECC)
一、ECC算法概述 椭圆曲线密码学(Elliptic Curve Cryptography)是基于椭圆曲线数学理论的公钥密码系统,由Neal Koblitz和Victor Miller在1985年独立提出。相比RSA,ECC在相同安全强度下密钥更短(256位ECC ≈ 3072位RSA…...
1688商品列表API与其他数据源的对接思路
将1688商品列表API与其他数据源对接时,需结合业务场景设计数据流转链路,重点关注数据格式兼容性、接口调用频率控制及数据一致性维护。以下是具体对接思路及关键技术点: 一、核心对接场景与目标 商品数据同步 场景:将1688商品信息…...

Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility
Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility 1. 实验室环境1.1 实验室环境1.2 小测试 2. The Endor System2.1 部署应用2.2 检查现有策略 3. Cilium 策略实体3.1 创建 allow-all 网络策略3.2 在 Hubble CLI 中验证网络策略源3.3 …...

【机器视觉】单目测距——运动结构恢复
ps:图是随便找的,为了凑个封面 前言 在前面对光流法进行进一步改进,希望将2D光流推广至3D场景流时,发现2D转3D过程中存在尺度歧义问题,需要补全摄像头拍摄图像中缺失的深度信息,否则解空间不收敛…...

Springcloud:Eureka 高可用集群搭建实战(服务注册与发现的底层原理与避坑指南)
引言:为什么 Eureka 依然是存量系统的核心? 尽管 Nacos 等新注册中心崛起,但金融、电力等保守行业仍有大量系统运行在 Eureka 上。理解其高可用设计与自我保护机制,是保障分布式系统稳定的必修课。本文将手把手带你搭建生产级 Eur…...
Robots.txt 文件
什么是robots.txt? robots.txt 是一个位于网站根目录下的文本文件(如:https://example.com/robots.txt),它用于指导网络爬虫(如搜索引擎的蜘蛛程序)如何抓取该网站的内容。这个文件遵循 Robots…...

Spring数据访问模块设计
前面我们已经完成了IoC和web模块的设计,聪明的码友立马就知道了,该到数据访问模块了,要不就这俩玩个6啊,查库势在必行,至此,它来了。 一、核心设计理念 1、痛点在哪 应用离不开数据(数据库、No…...
Device Mapper 机制
Device Mapper 机制详解 Device Mapper(简称 DM)是 Linux 内核中的一套通用块设备映射框架,为 LVM、加密磁盘、RAID 等提供底层支持。本文将详细介绍 Device Mapper 的原理、实现、内核配置、常用工具、操作测试流程,并配以详细的…...

Python 实现 Web 静态服务器(HTTP 协议)
目录 一、在本地启动 HTTP 服务器1. Windows 下安装 node.js1)下载安装包2)配置环境变量3)安装镜像4)node.js 的常用命令 2. 安装 http-server 服务3. 使用 http-server 开启服务1)使用 http-server2)详解 …...
libfmt: 现代C++的格式化工具库介绍与酷炫功能
libfmt: 现代C的格式化工具库介绍与酷炫功能 libfmt 是一个开源的C格式化库,提供了高效、安全的文本格式化功能,是C20中引入的std::format的基础实现。它比传统的printf和iostream更安全、更灵活、性能更好。 基本介绍 主要特点 类型安全:…...