当前位置: 首页 > news >正文

在 Ubuntu 22.04/20.04 安装 CVAT 和 SAM 指南

1. 安装 Docker 和 Docker Compose

sudo apt-get update
sudo apt-get --no-install-recommends install -y \apt-transport-https \ca-certificates \curl \gnupg-agent \software-properties-common
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
sudo add-apt-repository \"deb [arch=amd64] https://download.docker.com/linux/ubuntu \$(lsb_release -cs) \stable"
sudo apt-get update
sudo apt-get --no-install-recommends install -y \docker-ce docker-ce-cli containerd.io docker-compose-plugin

2. 安装 CVAT

2.1 从 Github clone CVAT 工程

git clone https://github.com/cvat-ai/cvat
cd cvat

2.2 局域网使用

要想在局域网内使用 CVAT,需 export CVAT_HOST 环境变量,

export CVAT_HOST=FQDN_or_YOUR-IP-ADDRESS

2.3 运行容器

需要一些时间下载最新的 CVAT 和其它镜像文件,

docker compose up -d

2.4 创建管理员

你可以使用默认方式注册用户,但无法查看任务列表。因此,你需要创建超级用户,超级用户能使用管理员面板来分配任务给不同的用户,创建命令如下:

docker exec -it cvat_server bash -ic 'python3 ~/manage.py createsuperuser'

然后根据提示,依次输入用户名、邮箱和密码即可。

2.5 浏览器

默认为 Google Chrome,访问地址是localhost:8080

输入登录用户名和密码进入页面,然后就可以创建新的标注任务。
使用说明可以参考:Manual | CVAT

3. 可能遇到的问题

由于我们在中国境内,可能遇到一些安装依赖的问题。
其它安装问题可以参考:Installation Guide | CVAT

3.1 apt update

可能需要修改源地址:

  • pre-compiled packages
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-updates main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-backports main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-security main restricted universe multiverse
  • source packages
deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal main restricted universe multiverse
deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-updates main restricted universe multiverse
deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-backports main restricted universe multiverse
deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-security main restricted universe multiverse

3.2 Docker 镜像站
在 daemon.json 中添加注册镜像:

{"registry-mirrors": ["http://f1361db2.m.daocloud.io","https://docker.mirrors.ustc.edu.cn","https://hub-mirror.c.163.com","https://mirror.ccs.tencentyun.com"]
}

3.3 pip

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

4. 安装 SAM 半自动标注工具

详细可以参考官网说明:Semi-automatic and Automatic Annotation | CVAT

4.1 运行 Docker 容器服务

为了创建带自动标注工具的 CVAT,在 CVAT 工程的根目录下,运行:

docker compose -f docker-compose.yml -f components/serverless/docker-compose.serverless.yml up -d

备注:如果对 Docker Compose 文件做了修改,需要在上述命令后加上 --build。

CPU 版本

如果只配置 CPU 版本的 SAM 服务,在 serverless/pytorch/facebookresearch/sam/nuclio/function.yaml 中,需做如下修改,配置 port,该端口是 nuclio function 的端口,需要和 SAM 算法服务 docker 容器的端口一致,

...
triggers:myHttpTrigger:maxWorkers: 2kind: 'http'workerAvailabilityTimeoutMilliseconds: 10000attributes:maxRequestBodySize: 33554432 # 32MBport: 32728 # 指定端口,与其它端口不冲突即可

GPU 版本

如果配置 GPU 版本的 SAM 服务,在 serverless/pytorch/facebookresearch/sam/nuclio/function-gpu.yaml 中,需做上述修改,配置 port,该端口是 nuclio function 的端口,需要和 SAM 算法服务 docker 容器的端口一致。

4.2 停止 Docker 容器服务

docker compose -f docker-compose.yml -f components/serverless/docker-compose.serverless.yml down

4.3 安装 nuctl

你必须安装 nuctl 命令行工具来构建和部署 serverless functions。

下载

下载地址:Release 1.11.24 · nuclio/nuclio · GitHub
版本需要和 docker-compose.serverless.yaml 里的版本一致。

wget https://github.com/nuclio/nuclio/releases/download/<version>/nuctl-<version>-linux-amd64

安装

下载完成后,设置权限和软链接,

sudo chmod +x nuctl-<version>-linux-amd64
sudo ln -sf $(pwd)/nuctl-<version>-linux-amd64 /usr/local/bin/nuctl

4.4 部署 serverless functions

通过 nuctl 部署 serverless functions,它会自动创建一个包含这些 functions 的 cvat Nuclio 项目。在 CVAT 使用 docker compose 安装完成后运行下述命令,因为 nuclio dashboard 会管理所有的 serverless functions,

CPU 服务

./serverless/deploy_cpu.sh serverless/pytorch/facebookresearch/sam/nuclio

或 GPU 服务,maxWorkers 是 SAM 服务开启的进程数,应和 GPU 资源匹配

nuctl deploy --project-name cvat --path serverless/pytorch/facebookresearch/sam/nuclio --platform local --base-image ubuntu:22.04 --desc "gpu based implementation of sam on python3, pytorch" --image cvat.pth.facebookresearch.sam.vit_h:latest --triggers '{"myHttpTrigger": {"maxWorkers": 4}}' --resource-limit nvidia.com/gpu=1

4.5 拷贝 SAM 权重到容器内

离线下载 SAM 权重文件,然后注释掉 function.yaml 和 function-gpu.yaml 里下载权重的命令,

...
download sam weights#  - kind: RUN#    value: curl -O https://dl.fbaipublicfiles.com/segment_anything/sam_vit_h_4b8939.pth
...

手动将提前下载好的 SAM 权重文件拷贝到容器内,

docker cp ./sam_vit_h_4b8939.pth 5b915cbc903e:/opt/nuclio/sam/

4.6 Troubleshooting

Docker 镜像下载及网络问题

Docker images

在服务器上,提前下载好部署本项目所需的全部镜像,无需再 docker pull。

其它网络问题

建议科学上网。

SAM 容器的其它问题

通过下述命令行发现问题,然后进入 docker 容器内修改,

docker logs nuclio-nuclio-pth-facebookresearch-sam-vit-h

进入容器

docker exec -it nuclio-nuclio-pth-facebookresearch-sam-vit-h /bin/bash

完成修改后,重启容器,注意查看端口是否和 nuctl function node 端口一致

docker restart nuclio-nuclio-pth-facebookresearch-sam-vit-h

端口问题

可以通过命令来查看 nuctl 服务节点的端口:

nuctl get function

打印信息如下,

NAMESPACE | NAME                           | PROJECT | STATE | REPLICAS | NODE PORT nuclio    | pth-facebookresearch-sam-vit-h | cvat    | ready | 1/1      | 32728  

这里的 32728 应和 docker 容器的端口一致,不然会报错。

删除 serverless functions
如果 nuctl 创建 function 时遇到任何问题,需要删除该 function,管理页面地址为:

http://$IP_ADDR:8070/projects/cvat/functions

IP_ADDR 是部署该服务的 IP 地址,如果部署在本地就是 localhost

删除后,就可以重新部署 serverless functions

相关文章:

在 Ubuntu 22.04/20.04 安装 CVAT 和 SAM 指南

1. 安装 Docker 和 Docker Compose sudo apt-get update sudo apt-get --no-install-recommends install -y \apt-transport-https \ca-certificates \curl \gnupg-agent \software-properties-common curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-ke…...

【SpringCloud】 微服务分布式环境下的事务问题,seata大合集

目录 微服务分布式环境下的事务问题 分布式事务 本地事务 BASE理论与强弱一致性 BASE理论 强弱一致性 常见分布式事务解决方案 - 2PC 常见分布式事务解决方案 - TCC 常见分布式事务解决方案 - 最大努力通知 常见分布式事务解决方案 - 最终一致性 Seata介绍与术语 Seata…...

vite5+vue3开发阅读APP实战笔记20240725

目前界面长成这样&#xff1a; 配置别名 修改vite.config.js import {defineConfig} from vite import vue from vitejs/plugin-vue import path from "path"// https://vitejs.dev/config/ export default defineConfig({server: {open: true,port: 8088,},plug…...

Intel任命Micron技术开发主管领导Intel Foundry制造运营

- **新闻要点**&#xff1a;Intel聘请了Micron的技术开发主管Dr. Naga Chandrasekaran担任首席全球运营官、执行副总裁以及Intel Foundry制造和供应链组织的总经理。他将负责Intel的所有制造运营事务。 #### 任命背景 - **领导团队**&#xff1a;Chandrasekaran将成为Intel执行…...

苹果发布iOS 18 Beta 4,新增CarPlay 壁纸等多项功能改进

本文首发于公众号“AntDream”&#xff0c;欢迎微信搜索“AntDream”或扫描文章底部二维码关注&#xff0c;和我一起每天进步一点点 iOS 18 Beta 4&#xff1a;新功能与改进的探索 苹果公司在2024年7月9日向开发者推送了iOS 18的第四个开发者预览版Beta 4更新&#xff0c;内部…...

谷粒商城实战笔记-50-51-商品分类的删除

文章目录 一&#xff0c;50-商品服务-API-三级分类-删除-逻辑删除1&#xff0c;逻辑删除的配置1.1 配置全局的逻辑删除规则&#xff08;可省略&#xff09;1.2 配置逻辑删除Bean&#xff08;可省略&#xff09;1.3 Bean相应字段上加上注解TableLogic 2&#xff0c;后台接口开发…...

vue3+g2plot实现词云图

词云图 效果预览: 核心代码: import {WordCloud } from @antv/g2plot;fetch(https://gw.alipayobjects.com/os/antfincdn/jPKbal7r9r/mock.json).then((res) => res.json()).then((data) => {const wordCloud = new WordCloud(container, {data,wordField: x,weigh…...

Golang | Leetcode Golang题解之第273题整数转换英文表示

题目&#xff1a; 题解&#xff1a; var (singles []string{"", "One", "Two", "Three", "Four", "Five", "Six", "Seven", "Eight", "Nine"}teens []string{&…...

使用C#手搓Word插件

WordTools主要功能介绍 编码语言&#xff1a;C#【VSTO】 1、选择 1.1、表格 作用&#xff1a;全选文档中的表格&#xff1b; 1.2、表头 作用&#xff1a;全选文档所有表格的表头【第一行】&#xff1b; 1.3、表正文 全选文档中所有表格的除表头部分【除第一行部分】 1.…...

WordPress主题追格企业官网主题免费开源版V1.1.6

追格企业官网主题免费开源版由追格开发的一款开源wordpress主题&#xff0c;专为企业建站和追格企业官网小程序&#xff08;开源版&#xff09;PC配套而设计&#xff0c;功能集新闻动态、留言反馈、产品与服务、公司简介、联系我们等模块。...

uniapp引入自定义图标

目录 一、选择图标&#xff0c;加入购物车 二、下载到本地 三、导入项目 四、修改字体引用路径 五、开始使用 这里以扩展iconfont图标为例 官网&#xff1a;iconfont-阿里巴巴矢量图标库 一、选择图标&#xff0c;加入购物车 二、下载到本地 直接点击下载素材&#xff0…...

pytorch-scheduler(调度器)

scheduler简介 scheduler(调度器)是一种用于调整优化算法中学习率的机制。学习率是控制模型参数更新幅度的关键超参数,而调度器根据预定的策略在训练过程中动态地调整学习率。 优化器负责根据损失函数的梯度更新模型的参数,而调度器则负责调整优化过程中使用的特定参数,通…...

防火墙与入侵检测系统(IDS/IPS)在现代网络安全中的关键角色

在数字化日益加速的今天&#xff0c;网络安全变得尤为重要。随着网络攻击的复杂性和频率不断增加&#xff0c;保护关键信息资产已成为各大小组织的首要任务。防火墙&#xff08;Firewall&#xff09;和入侵检测系统&#xff08;Intrusion Detection System&#xff0c;IDS&…...

Python 之 os、open、json、pickle 模块的“疯狂”探险记

1.open函数的使用 Python 中的 open() 函数是处理文件的标准方法。它允许你打开一个文件&#xff0c;并对其进行读取、写入或追加操作 open(file,mode,encoding)函数的格式&#xff1a;file&#xff1a;文件路径 mode&#xff1a;打开方式&#xff08;读&#xff1a; r写&…...

CTF-Web习题:2019强网杯 UPLOAD

题目链接&#xff1a;2019强网杯 UPLOAD 解题思路 打开靶场如下图所示&#xff0c;是一个注册和登录界面 那就注册登录一下&#xff0c;发现是一个提交头像的页面&#xff1a; 试了一下只有能正确显示的png图片才能提交成功&#xff0c;同时F12拿到cookie&#xff0c;base6…...

Unity环境渲染与反射探针的深入探索

目录 环境渲染基础 光源设置 材质与光照贴图 反射探针&#xff08;Reflection Probes&#xff09;详解 反射探针的创建与配置 材质中的反射探针设置 实践案例 实践案例&#xff1a;室内场景中的反射效果 场景设置 反射探针配置 Unity代码示例&#xff08;非直接配置…...

vue3 父组件 props 异步传值,子组件接收不到或接收错误

1. 使用场景 我们在子组件中通常需要调用父组件的数据&#xff0c;此时需要使用 vue3 的 props 进行父子组件通信传值。 2. 问题描述 那么此时问题来了&#xff0c;在使用 props 进行父子组件通信时&#xff0c;因为数据传递是异步的&#xff0c;导致子组件无法成功获取数据…...

[C++]TinyWebServer

TinyWebServer 文章目录 TinyWebServer1 主体框架2 Buffer2.1 向Buffer写入数据2.2 从Buffer读取数据2.3 动态扩容2.4 从socket中读取数据2.5 具体实现 3 日志系统3.1 生产者-消费者模型3.2 数据一致3.3 代码 4 定时器4.1 调整堆中元素操作4.2 堆的操作4.2.1 增4.2.2 删4.2.3 改…...

Uniswap价格批量查询与ws订阅行情

Uniswap价格批量查询与ws订阅行情 由于 Uniswap V1 版本必须包含 ETH 所以两个 token 之间交换必须先换成 ETH 去中转效率很低已经弃用了 由于 V3 版本 CLMM 和 V4 版本的 DLMM 数学模型过于复杂&#xff0c;还是先从 AMM 模型的 V2 进行入门和学习 Uniswap 三种合约 Unisw…...

vue 实战 区域内小组件元素拖拽 示例

<template><div><el-button type"primary" click"showDialog true">快捷布局</el-button><el-dialog title"快捷布局配置" :visible.sync"showDialog"><el-row :gutter"20"><el-co…...

Phi-3-Mini-128K惊艳效果:处理含JSON Schema的OpenAPI规范并生成Mock数据

Phi-3-Mini-128K惊艳效果&#xff1a;处理含JSON Schema的OpenAPI规范并生成Mock数据 1. 模型能力概览 Phi-3-Mini-128K是基于微软Phi-3-mini-128k-instruct模型开发的轻量化对话工具&#xff0c;专为处理复杂技术文档和结构化数据而优化。这个128K超长上下文的模型在解析技术…...

C++ constexpr 在工程中的应用场景

C constexpr 在工程中的应用场景 在现代C开发中&#xff0c;constexpr关键字因其强大的编译时计算能力&#xff0c;逐渐成为提升性能与代码可维护性的利器。它允许开发者在编译期完成复杂的计算和初始化&#xff0c;从而减少运行时开销&#xff0c;同时增强代码的静态安全性。…...

MediaPipe人体骨骼检测:零配置Web应用,上传图片秒出骨架图

MediaPipe人体骨骼检测&#xff1a;零配置Web应用&#xff0c;上传图片秒出骨架图 1. 引言&#xff1a;一键式骨骼检测的便捷体验 想象一下这样的场景&#xff1a;健身教练需要快速分析学员的动作姿势&#xff0c;医生希望直观展示患者的骨骼姿态&#xff0c;或者动画师需要参…...

SAM3镜像部署:一键启动,开箱即用的文本引导分割工具

SAM3镜像部署&#xff1a;一键启动&#xff0c;开箱即用的文本引导分割工具 1. 快速入门指南 1.1 镜像概述 本镜像基于Meta最新发布的SAM3&#xff08;Segment Anything Model 3&#xff09;算法构建&#xff0c;通过二次开发集成了直观的Gradio Web交互界面。无需任何编程基…...

Mac Mouse Fix终极指南:重新定义macOS鼠标交互体验的开源解决方案

Mac Mouse Fix终极指南&#xff1a;重新定义macOS鼠标交互体验的开源解决方案 【免费下载链接】mac-mouse-fix Mac Mouse Fix - A simple way to make your mouse better. 项目地址: https://gitcode.com/GitHub_Trending/ma/mac-mouse-fix 在macOS生态系统中&#xff0…...

GLM-OCR Python API详解:predict接口返回结构、置信度阈值设置与后处理

GLM-OCR Python API详解&#xff1a;predict接口返回结构、置信度阈值设置与后处理 1. 项目概述与环境准备 GLM-OCR 是一个基于先进多模态架构的高性能OCR识别模型&#xff0c;专门针对复杂文档理解场景设计。它不仅能识别常规文本&#xff0c;还支持表格识别、公式识别等高级…...

别再手动写DSP了!Vivado里用Multiply Adder IP核实现MAC运算的保姆级教程

高效实现MAC运算&#xff1a;Vivado中Multiply Adder IP核的工程实践指南 在FPGA开发中&#xff0c;乘累加&#xff08;MAC&#xff09;运算作为数字信号处理的核心操作&#xff0c;其实现效率直接影响系统性能。传统手写RTL代码不仅耗时&#xff0c;还容易引入时序问题和资源浪…...

网易云音乐无损解析:从零打造个人音乐库的终极指南

网易云音乐无损解析&#xff1a;从零打造个人音乐库的终极指南 【免费下载链接】Netease_url 网易云无损解析 项目地址: https://gitcode.com/gh_mirrors/ne/Netease_url 还在为网易云音乐无法下载无损音质而烦恼吗&#xff1f;想要建立属于自己的高品质音乐收藏库吗&am…...

SillyTavern角色系统深度解析:从基础配置到高级应用

SillyTavern角色系统深度解析&#xff1a;从基础配置到高级应用 【免费下载链接】SillyTavern LLM Frontend for Power Users. 项目地址: https://gitcode.com/GitHub_Trending/si/SillyTavern 引言&#xff1a;为什么角色系统是SillyTavern的核心竞争力&#xff1f; 在…...

MCU内存管理实战:用__attribute__控制变量在Flash/RAM中的存放位置

MCU内存管理实战&#xff1a;用__attribute__控制变量在Flash/RAM中的存放位置 引言&#xff1a;嵌入式开发中的内存困局 在Cortex-M系列MCU开发中&#xff0c;我们常常面临这样的矛盾&#xff1a;一方面&#xff0c;片上Flash和RAM资源极其有限&#xff08;尤其是成本敏感型产…...