当前位置: 首页 > news >正文

【图像识别】十大数据集合集!

本文将为您介绍10个经典、热门的数据集,希望对您在选择适合的数据集时有所帮助。

1

DanishFungi2020

  • 发布方:

    Google

  • 发布时间:

    2021

  • 简介:

    补充材料:丹麦真菌 2020 - 不仅仅是另一个图像识别数据集为了支持细粒度植物分类的研究并允许我们的结果完全重现,我们共享训练日志和训练脚本。图片、检查点和元数据因尺寸限制不包括在内,将在审核后发布。

  • 下载地址:

    https://sites.google.com/view/danish-fungi-dataset

  • 论文地址:https://openaccess.thecvf.com/content/WACV2022/papers/Picek_Danish_Fungi_2020_-_Not_Just_Another_Image_Recognition_Dataset_WACV_2022_paper.pdf

2

SPEECH-COCO

  • 发布方:

    格勒诺布尔-阿尔卑斯大学·Voxygen

  • 发布时间:

    2017-06-01

  • 简介:

    我们的语料库是MS COCO图像识别和字幕数据集的扩展。COCO女士包含与五个字幕配对的图像。然而,它不包括任何言论。因此,我们使用Voxygen的文本到语音系统来合成可用的字幕。

    语音作为一种新的方式的添加使MSCOCO能够用于语言习得,无监督的术语发现,关键字发现或使用语音和视觉的语义嵌入领域的研究。

  • 下载地址:

    https://zenodo.org/record/4282267#.Y_XMuHZBw2x

  • 论文地址:

    https://www.isca-speech.org/archive/pdfs/glu_2017/havard17_glu.pdf

3

Kaggle Cats and Dogs Dataset

  • 发布方:

    Unknown

  • 发布时间:

    2022-05-09

  • 简介:

    Web服务通常受到挑战的保护,人们应该很容易解决,但计算机却很难解决。这样的挑战通常被称为验证码 (完全自动化的公共图灵测试,以区分计算机和人类) 或HIP (人类交互证明)。HIPs用于许多目的,例如减少电子邮件和博客垃圾邮件,并防止对网站密码的暴力攻击。Asirra (用于限制访问的动物物种图像识别) 是一种臀部,通过要求用户识别猫和狗的照片来工作。这项任务对计算机来说很难,但研究表明,人们可以快速准确地完成这项任务。Asirra之所以独特,是因为它与世界上最大的网站wit h Petfinder.com合作,致力于寻找无家可归的宠物的家园。他们为微软研究院提供了超过300万张猫和狗的图像,这些图像是由美国数千个动物收容所的人手动分类的。Kaggle很幸运地提供了这些数据的一部分,以供娱乐和研究。

  • 下载地址:

    https://www.microsoft.com/en-us/download/details.aspx?id=54765

4

SentiCap

  • 发布方:

    澳大利亚国立大学

  • 发布时间:

    2015

  • 简介:

    图像识别和语言建模的最新进展正在使图像内容的自动描述成为现实。但是,当前系统缺少书面描述的程式化、非事实方面。一种这样的风格是带有情感的描述,这在日常交流中很常见,并且会影响决策和人际关系。我们设计了一个系统来描述带有情感的图像,并展示了一个自动生成带有正面或负面情绪的字幕的模型。我们提出了一种具有词级正则化的新型切换循环神经网络,它能够仅使用 2000 多个包含情感的训练句子来生成情感图像说明。我们使用不同的自动和众包指标评估字幕。我们的模型在图像字幕的常见质量指标方面具有优势。在 84.6% 的案例中,生成的正面字幕被认为至少与事实字幕一样具有描述性。在这些积极的标题中,88% 被众包工作者确认为具有适当的情绪。

  • 下载地址:

    http://users.cecs.anu.edu.au/~u4534172/senticap.html

  • 论文地址:

    https://arxiv.org/pdf/1510.01431v2.pdf

5

9,497张10种表格OCR数据【数据堂】

  • 发布方:

    数据堂(北京)科技股份有限公司

  • 简介:

    9,497张10种表格OCR数据,通过使用矩形框进行标注,本套数据可用于表格检测与识别等任务

  • 下载地址:

    https://www.datatang.com/dataset/1056?source=openxlab

6

Herbarium 2021 Half–Earth

  • 发布方:

    苏黎世联邦理工学院·Google Research·Cornell Tech

  • 发布时间:

    2021

  • 简介:

    植物标本馆 2022:北美植物群是纽约植物园项目的一部分,该项目由美国国家科学基金会资助,旨在构建用于识别世界各地新植物物种的工具。该数据集使用从全球 60 个不同植物机构收集的图像,力求代表北美所有已知的维管植物分类群。 我们的数据集具有长尾分布。每个分类单元的图像数量少则 7 幅,多则 100 幅。尽管有更多图像可用,但我们限制了最大数量,以确保竞赛参与者有足够但可管理的训练数据大小。

  • 下载地址:

    https://github.com/visipedia/herbarium_comp

  • 论文地址:

    https://arxiv.org/pdf/2105.13808v1.pdf

7

CUB-GHA (CUB Gaze-based Human Attention)

  • 发布方:

    图宾根大学·中国科学院大学·马克斯普朗克智能系统研究所

  • 发布时间:

    2021

  • 简介:

    CUB-GHA 是一个带有人类注意力注释的细粒度分类数据集。该数据集为细粒度分类数据集 CUB 收集人类注视数据,并构建一个名为 CUB-GHA(基于注视的人类注意力)的数据集。

  • 下载地址:

    https://github.com/yaorong0921/CUB-GHA

  •  论文地址:

    https://arxiv.org/pdf/2111.01628v1.pdf

8

Goldfinch (GOogLe image-search Dataset)

  • 发布方:

    Google·斯坦福大学·Zoox

  • 发布时间:

    2017

  • 简介:

    Goldfinch 是一个用于细粒度识别挑战的数据集。它包含鸟类、蝴蝶、飞机和狗类别的列表以及相关的 Google 图片搜索和 Flickr 搜索 URL。此外,它还包括一组关于狗类别的主动学习注释。

  • 下载地址:

    https://github.com/google/goldfinch

  • 论文地址:

    https://arxiv.org/pdf/1511.06789v3.pdf

9

CUB-200-2011 (Caltech-UCSD Birds-200-2011)

  • 发布方:

    Allan Lab

  • 发布时间:2017

  • 简介:

    Caltech-UCSD Birds-200-2011 (CUB-200-2011) 数据集是用于细粒度视觉分类任务的最广泛使用的数据集。它包含属于鸟类的 200 个子类别的 11,788 张图像,其中 5,994 张用于训练,5,794 张用于测试。每个图像都有详细的注释:1 个子类别标签、15 个部分位置、312 个二进制属性和 1 个边界框。文本信息来自 Reed 等人。他们通过收集细粒度的自然语言描述来扩展 CUB-200-2011 数据集。为每个图像收集十个单句描述。自然语言描述是通过 Amazon Mechanical Turk (AMT) 平台收集的,要求至少 10 个单词,没有任何子类别和动作信息。

  • 下载地址:

    http://www.vision.caltech.edu/datasets/cub_200_2011/

  •  论文地址:

    https://arxiv.org/abs/1709.00340

 温馨  小贴士

如有您想了解的计算机方向数据集

请联系我们

免费为您提供数据集搜索服务

相关文章:

【图像识别】十大数据集合集!

本文将为您介绍10个经典、热门的数据集,希望对您在选择适合的数据集时有所帮助。 1 DanishFungi2020 发布方: Google 发布时间: 2021 简介: 补充材料:丹麦真菌 2020 - 不仅仅是另一个图像识别数据集为了支持细粒度植…...

C++ | Leetcode C++题解之第312题戳气球

题目&#xff1a; 题解&#xff1a; class Solution { public:int maxCoins(vector<int>& nums) {int n nums.size();vector<vector<int>> rec(n 2, vector<int>(n 2));vector<int> val(n 2);val[0] val[n 1] 1;for (int i 1; i &l…...

SSM学习11:springboot基础

教学视频 黑马程序员SpringBoot3Vue3全套视频教程&#xff0c;springbootvue企业级全栈开发从基础、实战到面试一套通关 springboot基础 搭建项目 修改配置文件 修改application.yml&#xff08;后缀名不对&#xff0c;可以改成这个&#xff09;&#xff0c;配置数据库 spr…...

【前端 18】安装Node.js

Node.js 安装指南 在今天的博客中&#xff0c;我们将一起探讨如何在您的计算机上安装Node.js。Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行环境&#xff0c;它允许你在服务器端运行 JavaScript 代码。无论您是前端开发者希望探索全栈开发&#xff0c;还是后端开发者寻…...

C#/Winform入门、进阶、强化、扩展、知识体系完善等知识点学习、性能优化、源码分析专栏分享

场景 作为一名C#的Winform开发者&#xff0c;势必经历过从入门到自学、从基础到进阶、从学习到强化的过程。 当经历过几年企业级开发的磨炼&#xff0c;再回头看之前的开发过程、成长阶段发现确实是走了好多的弯路。 作为一名终身学习的信奉者&#xff0c;秉承Java体系需持续…...

springboot的表现层/控制层controller开发

第一步&#xff1a;新建文件和注入业务层对象 需要使用的注解&#xff1a; 第一个声明是restful风格开发 第二个是需要设置网页访问路径 RestController RequestMapping("/fuels")//http://localhost/fuels注入服务层对象&#xff1a; Autowiredprivate FuelServ…...

前端使用html2canvas在页面截图并导出,以及截图中含有图片时的跨域问题解决

1.引入html2canvas npm 安装或cdn引入 npm install html2canvas <script src"https://cdnjs.cloudflare.com/ajax/libs/html2canvas/1.4.1/html2canvas.min.js"></script> 2.使用 html2canvas // 假设你有一个 id 为 "capture" 的元素 h…...

道可云元宇宙每日资讯|第十二届互联网安全大会在北京开幕

道可云元宇宙每日简报&#xff08;2024年8月2日&#xff09;讯&#xff0c;今日元宇宙新鲜事有&#xff1a; 第十二届互联网安全大会在北京开幕 7月31日&#xff0c;第十二届互联网安全大会&#xff08;ISC.AI 2024&#xff09;在北京国家会议中心盛大开幕。 本届大会以“打造…...

前端面试基础题(微信公众号:前端面试成长之路)

BFC、IFC、GFC、FFC CSS2.1中只有BFC和IFC, CSS3中才有GFC和FFC。 到底什么是BFC、IFC、GFC和FFC Whats FC&#xff1f; 一定不是KFC&#xff0c;FC的全称是&#xff1a;Formatting Contexts&#xff0c;是W3C CSS2.1规范中的一个概念。它是页面中的一块渲染区域&#xff0c;并…...

https执行过程,特点,作用

还是大剑师兰特&#xff1a;曾是美国某知名大学计算机专业研究生&#xff0c;现为航空航海领域高级前端工程师&#xff1b;CSDN知名博主&#xff0c;GIS领域优质创作者&#xff0c;深耕openlayers、leaflet、mapbox、cesium&#xff0c;canvas&#xff0c;webgl&#xff0c;ech…...

【优秀python案例】基于Python的豆瓣电影TOP250爬虫与可视化设计与实现

摘要&#xff1a;伴随着当代社会物质水平的不断提高&#xff0c;人们越来越注重精神享受&#xff0c;看电影成为人们日常生活中重要的组成成分。本文将针对豆瓣上热门电影评论进行爬取&#xff0c;应用可视化分析更为形象地了解该电影的动态。该系统可以使得人们实时了解到有关…...

如何设计一个测试用例

前言&#x1f440;~ 上一章我们介绍了什么是软件测试以及软件测试的一些基础概念&#xff0c;今天来聊聊如何设计一个测试用例&#xff0c;涉及到黑盒测试的测试方法 基于需求进行测试用例的设计 基于需求的具体设计方法 等价类 边界值 判定表法 正交表法 场景设计法 …...

黄金和原油市场波动背后的经济信号

黄金市场的波动与经济数据影响 周四&#xff0c;黄金市场经历了一天内的剧烈波动&#xff0c;从早盘的高点到纽约时段的急剧下跌。现货黄金价格最初上涨至2462.29美元/盎司&#xff0c;但随后迅速跌至最低的2434.72美元/盎司。最终&#xff0c;黄金收盘价报2445.84美元/盎司&am…...

【Python数值分析】革命:引领【数学建模】新时代的插值与拟合前沿技术

目录 ​编辑 第一部分&#xff1a;插值的基本原理及应用 1. 插值的基本原理 1.1 插值多项式 1.2 拉格朗日插值 1.3 牛顿插值 1.4 样条插值 2. 插值的Python实现 2.1 使用 NumPy 进行插值 2.2 使用 SciPy 进行插值 2.2.1 一维插值 ​编辑 2.2.2 二维插值 3. 插值…...

PCL-基于超体聚类的LCCP点云分割

目录 一、LCCP方法二、代码实现三、实验结果四、总结五、相关链接 一、LCCP方法 LCCP指的是Local Convexity-Constrained Patch&#xff0c;即局部凸约束补丁的意思。LCCP方法的基本思想是在图像中找到局部区域内的凸结构&#xff0c;并将这些结构用于分割图像或提取特征。这种…...

git 推送时出现错误 Locking support detected on remote “origin“

背景&#xff1a;代码托管是局域网搭建的gitlab 按照提示配置 lfs.locksverify true 还是没有用。 网上搜索了一番&#xff0c;其中有人提到可能时服务器磁盘满了&#xff0c;连到服务器上 df -h 查看&#xff0c; 发现根目录已经写满了&#xff1a; 使用命令行&#xff1a; d…...

劳动仲裁经验篇【赶紧收藏】

【劳动仲裁】纯经验干货分享&#xff0c;点个关注防止需要时找不到&#xff01; 当公司决定搞你心态&#xff0c;变相逼退你时&#xff0c;无非就那么些手段&#xff0c;只要你能正确应对&#xff0c;并做好收集证据的准备&#xff0c;就不住畏惧。合理利用法律的武器维护自身…...

QT多媒体编程(一)——音频编程知识详解及MP3音频播放器Demo

目录 引言 一、QtMultimedia模块简介 主要类和功能 二、QtMultimedia相关类及函数解析 QAudioInput QAudioOutput QAudioFormat QMediaPlayer QMediaPlaylist QCamera 三、音频项目实战Demo UI界面 核心代码 运行结果 四、结论 引言 在数字时代&#xff0c;音频…...

MySQL使用教程 最最最实用的零基础教程 直接从安装开始教!!!!

数据构成了我们日益数字化的社会基础。想象一下&#xff0c;从移动应用和银行系统到搜索引擎&#xff0c;再到如 ChatGPT 这样的先进人工智能聊天机器人&#xff0c;这些工具若没有数据支撑&#xff0c;将寸步难行。你有没有好奇过这些海量数据都存放在哪里呢&#xff1f;答案正…...

pycharm怎么使用Anaconda和配置

打开Anaconda Prompt 要删除 Conda 环境 yolov5sconda&#xff0c;你可以使用以下命令&#xff1a; conda remove --name yolov5sconda --all这个命令会删除名为 yolov5sconda 的整个环境&#xff0c;包括其中安装的所有包和依赖项。请在命令提示符或终端中运行此命令。执行此…...

告别格式烦恼:哈工大深圳LaTeX论文模板的6大核心优势

告别格式烦恼&#xff1a;哈工大深圳LaTeX论文模板的6大核心优势 【免费下载链接】hitszthesis A dissertation template for Harbin Institute of Technology, ShenZhen (HITSZ), including bachelor, master and doctor dissertations. 项目地址: https://gitcode.com/gh_m…...

10分钟上手!Java开发者也能轻松调用AI,Spring AI Alibaba手把手教你构建智能体!

介绍&#xff1a;还在羡慕Python开发者能轻松调用AI&#xff1f;Spring AI Alibaba让Java也能10分钟构建一个能“思考”和“行动”的智能体&#xff0c;这次手把手教&#xff01; 系统&#xff1a;Windows jdk版本&#xff1a;17 maven&#xff1a;3.8 模型API Key&#xff1a…...

【2026最新】DirectX Repair修复工具,轻松解决 DirectX 报错、DLL 缺失与游戏闪退问题

游戏打不开、软件报错&#xff1f;别急着重装系统&#xff0c;可能是DirectX和DLL在作怪 “缺少d3dx9_43.dll”、“无法找到X3DAudio1_7.dll”、“应用程序无法启动。。。。。需要的是一个DirectX修复工具。 玩游戏或运行 3D 图形软件时&#xff0c;DirectX 报错是一类常见但又…...

个人开发者如何高效率APP上架安卓应用市场?软著、备案、资质、审核详解大全,一篇文章讲透流程规则!

一、上架前的资质准备 1. 软件著作权登记证书&#xff08;软著&#xff09; 软著是证明APP拥有自主知识产权的重要文件&#xff0c;多数应用商店要求上架时提供。申请周期通常为1-2个月&#xff0c;建议提前规划。 2. APP备案 根据工信部要求&#xff0c;APP主办者需要在接…...

当NB-IoT遇上同步轨道卫星:GEO场景下的定时关系增强全指南(基于3GPP Release 17最新规范)

GEO卫星场景下NB-IoT定时关系增强技术解析 1. GEO卫星通信与NB-IoT的技术融合挑战 地球静止轨道&#xff08;GEO&#xff09;卫星通信与窄带物联网&#xff08;NB-IoT&#xff09;技术的结合&#xff0c;为全球物联网覆盖提供了革命性解决方案。GEO卫星位于地球赤道上空35,786公…...

SecGPT-14B案例分享:某能源企业OT网络异常通信行为识别过程

SecGPT-14B案例分享&#xff1a;某能源企业OT网络异常通信行为识别过程 1. 引言&#xff1a;当能源网络遭遇“隐形”威胁 想象一下&#xff0c;一家大型能源企业的工业控制系统&#xff08;OT网络&#xff09;正在平稳运行&#xff0c;控制着发电、输电的关键设备。突然&…...

Realistic Vision V5.1 虚拟摄影棚实战:利用GitHub管理自定义模型与脚本

Realistic Vision V5.1 虚拟摄影棚实战&#xff1a;利用GitHub管理自定义模型与脚本 你是不是也遇到过这样的烦恼&#xff1f;好不容易在本地电脑上&#xff0c;用Realistic Vision V5.1模型调出了一套完美的参数组合&#xff0c;生成的人像照片质感堪比专业影棚。结果换台电脑…...

# Kafka 消息队列实战指南

大数据开发核心技能&#xff1a;Kafka 架构原理、生产者消费者配置、Spark/Flink 集成、消息积压处理、数据一致性保障、生产环境案例&#xff0c;从 0 到 1 掌握企业级消息队列&#x1f4cc; 前言 真实生产问题 问题场景&#xff1a; 某电商公司数据平台遇到的问题&#xff1a…...

Web开发中前端与Node服务中的信息安全与解决办法

Web开发中前端与Node服务中的信息安全与解决办法 input限制特殊字符和长度 漏洞描述&#xff1a; 永远不要相信用户输入的信息&#xff0c;如常规的注入脚本通过input输入之后被页面执行 整改办法 方法1&#xff1a;对于vue项目中ElementUI的el-input 和 原生input <el-in…...

Linux Ubuntu 24.04 Server 超简单部署 Fast GPT(新手零踩坑)

前言&#xff1a; Fast GPT 是一款基于大语言模型的知识型平台&#xff0c;支持数据处理、RAG检索、可视化AI工作流编排&#xff0c;能快速搭建专属问答系统&#xff0c;无需复杂开发配置。本文针对 Ubuntu 24.04 Server 系统&#xff0c;用最简洁的步骤完成部署&#xff0c;全…...