当前位置：首页 > news >正文

深度学习的数据集制作、标注、处理相关软件

news 2026/2/10 2:01:36

制作深度学习数据集通常涉及数据的采集、标注和预处理等步骤。以下是一些可用于制作和处理深度学习数据集的软件工具，以及它们的详细介绍：

数据采集和生成

Web爬虫工具 (如 Scrapy, Beautiful Soup)
- 描述：这些工具可以帮助你从网上自动抓取和下载数据，例如图片、文本或视频。
- 特点：自动化数据采集、灵活的数据提取、支持多种输出格式。
OpenAI Gym
- 描述：OpenAI Gym提供了一套针对强化学习算法的标准化环境，可用于生成训练数据。
- 特点：标准化的环境、适用于多种强化学习任务、简单的API。
Synthetic Data Generation Tools (如 Unity ML-Agents, NVIDIA Isaac Sim)
- 描述：通过创建模拟环境和场景生成合成数据，通常用于机器视觉和机器人学习。
- 特点：高度可控的环境、逼真的图像和物理模拟、安全收集敏感数据的代替品。

数据标注

LabelImg
- 描述：LabelImg是一个图形化的图像标注工具，可以为物体检测模型标注边界框。
- 特点：易于使用的GUI、支持Pascal VOC和YOLO格式、用Python编写。
Labelbox
- 描述：Labelbox是一个商业数据标注平台，提供多种数据标注服务包括图像、视频和文本。
- 特点：支持多种标注类型、团队协作、集成机器学习模型以加速标注过程。
VGG Image Annotator (VIA)
- 描述：VGG Image Annotator是一个简单且独立的手动标注工具，用于标注图像和视频中的对象。
- 特点：无需安装、支持自定义标注属性、导出为JSON格式。
Supervisely
- 描述：Supervisely是一个提供数据标注和管理解决方案的平台，支持多种任务类型，包括图像分割和关键点检测。
- 特点：支持图像和视频数据、丰富的标注工具、自动标注和AI辅助功能。
RectLabel
- 描述：RectLabel是一个用于Mac OS的图像标注工具，支持对象检测和分割任务的标注。
- 特点：支持创建边界框和多边形标签，可以导出标注为COCO和Pascal VOC格式。
labelme
- 描述：labelme是一个图形化的图像多功能标注工具，支持边界框、多边形、圆形和线条等多种类型的标注。
- 特点：基于Python和Qt的开源标注工具，支持JSON格式的标注导出，具有灵活的自定义能力。
CVAT (Computer Vision Annotation Tool)
- 描述：CVAT是一个开源的在线视频和图像标注工具，适用于团队合作和大规模项目。
- 特点：支持边界框、多边形、关键点和轨迹等标注，提供插件以自动化标注流程。
Anno-Mage
- 描述：Anno-Mage是一个基于深度学习模型的半自动图像标注工具，可以减少手工标注工作。
- 特点：使用预训练的深度学习模型来识别图片中的对象，用户可以修改和完善自动生成的标注。
VATIC (Video Annotation Tool from Irvine, California)
- 描述：VATIC是一个用于视频标注的在线工具，允许用户标注视频中的对象和它们的轨迹。
- 特点：适用于视频中的对象跟踪和行为分析，支持在Amazon Mechanical Turk上进行分布式工作。
brat (brat rapid annotation tool)
- 描述：brat是一个用于文本的标注和可视化的在线工具，特别适用于实体识别和关系标注。
- 特点：基于Web的用户界面，可视化标注文本数据，支持分布式协作。
doccano
- 描述：doccano是一个开源的文本标注工具，支持多种文本标注任务，如文本分类、序列标注和序列对标注。
- 特点：易用的Web界面，支持多用户协作和角色管理，支持导出为多种格式。
Audacity
- 描述：Audacity是一个开源的音频编辑和录音软件，也可以用来进行音频数据的标注。
- 特点：支持音频剪辑和效果处理，允许用户在音频轨道上添加标签，这些标签可用于音频事件的标注。
Praat
- 描述：Praat是一个用于语音分析的软件，也常用于语音和声音的标注。
- 特点：提供详细的声音分析工具，用户可以手动添加和编辑标注，适用于语音学研究。

数据预处理和增强

OpenCV
- 描述：OpenCV是一个用于计算机视觉任务的开源库，包含了大量的图像预处理和数据增强功能。
- 特点：广泛的图像处理功能、支持多种编程语言、强大的社区支持。
Albumentations
- 描述：Albumentations是一个用于图像增强的快速Python库，专为深度学习模型的输入优化。
- 特点：高性能增强、易于集成、支持广泛的增强技术。
Augmentor
- 描述：Augmentor是一个用于图像数据增强的Python库，可以通过大量随机变换来增加数据集的多样性。
- 特点：简单的API、丰富的增强操作、流水线处理功能。

数据管理和转换

Pandas
- 描述：Pandas是一个用于数据分析和操作的Python库，特别适合于表格数据的处理。
- 特点：数据结构丰富（如DataFrame）、数据清洗与转换能力强、可与其他数据分析工具集成。
HDF5 / h5py
- 描述：HDF5是一种用于存储和组织大量数据的文件格式，h5py是Python的HDF5数据科学库。
- 特点：支持大规模数据存储、高效的IO操作、良好的跨平台支持。
TFRecord / TensorFlow Data API
- 描述：TFRecord是TensorFlow提供的一种高效的数据格式，适用于大规模数据训练。而TensorFlow Data API可用于构建复杂的数据输入管道。
- 特点：优化的数据格式、收集多种数据类型、与TensorFlow紧密集成。

综合型平台

Amazon SageMaker Ground Truth
- 描述：Amazon SageMaker Ground Truth是一个完整的数据标注服务，为机器学习模型提供数据集创建和管理。
- 特点：集成工作流程、人工和机器学习标注相结合、易于缩放。
Google Cloud AutoML Vision
- 描述：Google Cloud AutoML Vision提供数据导入、标注和训练集成服务，特别适合没有深度学习专业知识的用户。
- 特点：用户友好的界面、自动化模型训练、与Google Cloud平台集成。

选择适合的软件工具时，需要考虑数据类型（图像、文本、音频、视频等）、任务类型（分类、检测、分割等）、以及预算和易用性。通常，你可能需要结合使用多个工具来完成深度学习数据集的制作。

深度学习的数据集制作、标注、处理相关软件

制作深度学习数据集通常涉及数据的采集、标注和预处理等步骤。以下是一些可用于制作和处理深度学习数据集的软件工具，以及它们的详细介绍： 数据采集和生成 Web爬虫工具 (如 Scrapy, Beautiful Soup) 描述：这些工具可以帮助你从网上自动抓取和…...

编程日记 2024/2/5 11:11:20

点击按钮打开自定义iframe弹窗

1、效果点击按钮打开弹窗： 打开弹窗后： 2、代码 <!DOCTYPE html> <html><head><title>iframe弹窗</title><style>/* 使用媒体查询来实现响应式设计 */media (min-width: 768px) {.popup {width: 80%; /* 设置…...

编程日记 2024/2/5 11:10:19

LeetCode977 有序数组的平方

暴力解法是平方之后排序复杂度是nnlogn 优化解法是双指针i，j，i放数组首元素位置，j放数组末尾，每次比较i和j位置的数组元素大小，然后挑一个大的放在新的数组元素的指定末尾位置上。当原始数组nums第一个元素大于零时&a…...

编程日记 2024/2/5 11:09:18

Windows自动化实现：系统通知和任务栏图标自定义

文章目录 Windows自动化的三个小工具系统通知任务栏图标使用pystray实现使用infi.systray实现 Windows自动化的三个小工具系统通知 import win10toastwin10toast.ToastNotifier().show_toast("eee", "休息一下", icon_path"icon.ico", durati…...

编程日记 2024/2/5 11:08:16

Spring | Spring的“数据库开发“ (Srping JDBC)

目录： Spring JDBC1.Spring JDBC的核心类 ( JdbcTemplate类 )2.Srping JDBC 的配置3.JdbcTemplate类的“常用方法”execute( )：直接执行“sql语句”，没有返回值update( ) ：“增删改”，返回 “影响的行数”query( ) : “…...

编程日记 2024/2/5 11:06:13

面试八股文（2）

文章目录 1.ArrayList和LinkedList区别2.HashMap和HashTable区别3.线程的创建方式4.Java中异常处理5.Java序列化中某些字段不想进行序列化？6.Java序列化7.静态方法和实例方法8.List、Set、Map三者区别9.ArrayList和Vector区别10.HashMap和HashSet区别 1.ArrayList和…...

编程日记 2024/2/5 11:03:10

记elasticsearch CPU负载100%问题

记elasticsearch CPU负载100%问题环境：问题表现：初步排查：日志查询hot_thread 深入查询当前elasticsearch正在运行的Task查看Task详情解决问题对导致问题的原因的几个猜测问题复现：导致问题的原因。json导入规则问题json导入规则…...

编程日记 2024/2/5 11:02:09

回归预测 | Matlab实现OOA-CNN-LSTM-Attention鱼鹰算法优化卷积长短期记忆网络注意力多变量回归预测（SE注意力机制）

回归预测 | Matlab实现OOA-CNN-LSTM-Attention鱼鹰算法优化卷积长短期记忆网络注意力多变量回归预测（SE注意力机制） 目录回归预测 | Matlab实现OOA-CNN-LSTM-Attention鱼鹰算法优化卷积长短期记忆网络注意力多变量回归预测（SE注意力机制&…...

编程日记 2024/2/5 10:57:02

PyTorch、NCNN、CV::Mat三者张量的shape

目录一、PyTorch二、NCNN三、CV::Mat 一、PyTorch 在 PyTorch 中，张量（Tensor）的形状通常按照 (N, C, H, W) 的顺序排列，其中： N 是批量大小（batch size） C 是通道数（channel numb…...

编程日记 2024/2/5 10:55:59

社交平台内容创作未来会有哪些方向？

内容为王的时代下，企业如果想要通过社交平台占据用户心智，可以找到适合自己的内容营销策略，好的内容能够与消费者建立信任关系，今天媒介盒子就来和大家聊聊：社交平台内容创作的方向。一、内容逐渐细分相比于原来…...

编程日记 2024/2/5 10:52:56

MySQL温故篇（一）SQL语句基础

一、SQL语句基础 1、SQL语言分类 DDL：数据定义语言 DCL：数据控制语言 DML：数据操作语言 DQL：数据的查询语言 2、数据类型 3、字符类型 char(11) ： 定长的字符串类型,在存储字符串时，最大字符长度11个&a…...

编程日记 2024/2/5 10:45:49

C 检查小端存储还是大端

#include <stdio.h>int main() {unsigned int i 1;char *c (char*)&i;if (*c) printf("小端字节序\n");elseprintf("大端字节序\n");return 0; }该程序就是利用了强转舍弃我们首先定义了一个无符号整数i并将其初始化为1。然后，…...

编程日记 2024/2/5 10:44:48

【ETOJ P1021】树的遍历题解（有向图+深度优先搜索+广度优先搜索）

题目描述给定一棵大小为 n n n，根为 1 1 1 的树，求出其按照 dfs 和 bfs 进行遍历时的顺序。请将所有出点按照编号从小到大排序后进行遍历。 dfs 为深度优先搜索，bfs 为宽度优先搜索。输入格式一个整数 n n n，表示点的…...

编程日记 2024/2/5 10:43:47

红队渗透靶机:LEMONSQUEEZY: 1

目录信息收集 1、arp 2、nmap 3、nikto 4、whatweb 目录扫描 1、dirsearch 2、gobuster WEB phpmyadmin wordpress wpscan 登录wordpress 登录phpmyadmin 命令执行反弹shell 提权 get user.txt 信息收集本地提权信息收集 1、arp ┌──(root㉿ru)-[~…...

编程日记 2024/2/5 10:42:46

【Servlet】——Servlet API 详解

个人主页：兜里有颗棉花糖欢迎点赞👍 收藏✨ 留言✉ 加关注💓本文由兜里有颗棉花糖原创收录于专栏【Servlet】本专栏旨在分享学习Servlet的一点学习心得，欢迎大家在评论区交流讨论💌 目录一、HttpServlet二、Htt…...

编程日记 2024/2/5 10:39:43

oracle主库增加redo组数

redo log（重做日志）： 重做日志：简单来说就是，将oracle数据库的DML、DDL（数据库操作语言，数据库定义i语言）操作记录在日志中，方便恢复及备库使用，以组的方式管…...

编程日记 2024/2/5 10:36:41

lua只读表

参考《programming in lua》13.4.5中，详细介绍了只读表的用法。建立一个函数，传入一个table，传出一个代理table，其__index指向传入的table，__newIndex直接报error即可： --输入一个table，输出一…...

编程日记 2024/2/5 10:35:40

探索深度学习的边界：使用 TensorFlow 实现高效空洞卷积（Atrous Convolution）的全面指南

空洞卷积（Atrous Convolution），在 TensorFlow 中通过 tf.nn.atrous_conv2d 函数实现，是一种强大的工具，用于增强卷积神经网络的功能，特别是在处理图像和视觉识别任务时。这种方法的核心在于它允许网络以更高…...

编程日记 2024/2/5 10:33:38

HarmonyOS案例：摇杆游戏

本案例主要演示如何通过一系列的动画效果以及运算实现摇杆控制组件同步运动的功能，界面简陋无需在意。欢迎大家的阅读和评价，也欢迎大佬们批评、指正，我将继续努力，奉上更加专业的、高效的代码案例。 import curves from ohos.c…...

编程日记 2024/2/5 10:31:36

Elasticsearch：构建自定义分析器指南

在本博客中，我们将介绍不同的内置字符过滤器、分词器和分词过滤器，以及如何创建适合我们需求的自定义分析器。更多关于分析器的知识，请详细阅读文章： 开始使用 Elasticsearch （3） Elasticsearch: analyzer…...

编程日记 2024/2/5 10:30:34

python打卡day49

知识点回顾： 通道注意力模块复习空间注意力模块CBAM的定义作业：尝试对今天的模型检查参数数目，并用tensorboard查看训练过程 import torch import torch.nn as nn# 定义通道注意力 class ChannelAttention(nn.Module):def __init__(self,…...

编程新知 2026/2/7 5:37:17

聊聊 Pulsar：Producer 源码解析

一、前言 Apache Pulsar 是一个企业级的开源分布式消息传递平台，以其高性能、可扩展性和存储计算分离架构在消息队列和流处理领域独树一帜。在 Pulsar 的核心架构中，Producer（生产者） 是连接客户端应用与消息队列的第一步。生产者…...

编程新知 2026/2/5 21:34:41

Axios请求超时重发机制

Axios 超时重新请求实现方案在 Axios 中实现超时重新请求可以通过以下几种方式： 1. 使用拦截器实现自动重试 import axios from axios;// 创建axios实例 const instance axios.create();// 设置超时时间 instance.defaults.timeout 5000;// 最大重试次数 cons…...

编程新知 2025/10/13 2:26:14

UR 协作机器人「三剑客」：精密轻量担当（UR7e）、全能协作主力（UR12e）、重型任务专家（UR15）

UR协作机器人正以其卓越性能在现代制造业自动化中扮演重要角色。UR7e、UR12e和UR15通过创新技术和精准设计满足了不同行业的多样化需求。其中，UR15以其速度、精度及人工智能准备能力成为自动化领域的重要突破。UR7e和UR12e则在负载规格和市场定位上不断优化&#xf…...

编程新知 2026/2/2 2:47:37

Element Plus 表单(el-form)中关于正整数输入的校验规则

目录 1 单个正整数输入1.1 模板1.2 校验规则 2 两个正整数输入（联动）2.1 模板2.2 校验规则2.3 CSS 1 单个正整数输入 1.1 模板 <el-formref"formRef":model"formData":rules"formRules"label-width"150px"…...

编程新知 2025/11/10 19:08:45

laravel8+vue3.0+element-plus搭建方法

创建 laravel8 项目 composer create-project --prefer-dist laravel/laravel laravel8 8.* 安装 laravel/ui composer require laravel/ui 修改 package.json 文件 "devDependencies": {"vue/compiler-sfc": "^3.0.7","axios": …...

编程新知 2025/10/15 0:25:46

HarmonyOS运动开发：如何用mpchart绘制运动配速图表

##鸿蒙核心技术##运动开发##Sensor Service Kit（传感器服务）# 前言在运动类应用中，运动数据的可视化是提升用户体验的重要环节。通过直观的图表展示运动过程中的关键数据，如配速、距离、卡路里消耗等，用户可以更清晰…...

编程新知 2026/2/2 7:49:59

安宝特方案丨船舶智造的“AR+AI+作业标准化管理解决方案”（装配）

船舶制造装配管理现状：装配工作依赖人工经验，装配工人凭借长期实践积累的操作技巧完成零部件组装。企业通常制定了装配作业指导书，但在实际执行中，工人对指导书的理解和遵循程度参差不齐。船舶装配过程中的挑战与需求挑战 (1…...

编程新知 2026/2/6 2:16:18

《Docker》架构

文章目录架构模式单机架构应用数据分离架构应用服务器集群架构读写分离/主从分离架构冷热分离架构垂直分库架构微服务架构容器编排架构什么是容器，docker，镜像，k8s 架构模式单机架构单机架构其实就是应用服务器和单机服务器都部署在同一…...

编程新知 2026/2/4 16:31:26

LangChain 中的文档加载器（Loader）与文本切分器（Splitter）详解《二》

🧠 LangChain 中 TextSplitter 的使用详解：从基础到进阶（附代码） 一、前言在处理大规模文本数据时，特别是在构建知识库或进行大模型训练与推理时，文本切分（Text Splitting） 是一个…...

编程新知 2025/10/10 9:24:44

数据采集和生成

数据标注

数据预处理和增强

数据管理和转换

综合型平台

相关文章：