当前位置: 首页 > news >正文

【人脸识别】数据集宝藏合集,速看!

本文将为您介绍10个经典、热门的数据集,希望对您在选择适合的数据集时有所帮助。

1

26,090张人脸肤质缺陷采集数据【数据堂】

  • 发布方:

    数据堂(北京)科技股份有限公司

  • 发布时间:

    2021

  • 简介:

    26,090张人脸肤质缺陷采集数据包含痘痘、痘印、色斑、皱纹、黑眼圈五种肤质缺陷的人脸。26,090张人脸肤质缺陷采集数据可用于肤质检测、人脸识别等任务

  • 下载地址:

    https://www.datatang.com/dataset/1052?source=openxlab

2

LFW (Labeled Faces in the Wild)

  • 发布方:

    马萨诸塞大学

  • 发布时间:

    2007

  • 简介:

    Labeled Faces in the Wild,是一个人脸照片数据库,旨在研究无约束的人脸识别问题。该数据集包含从网络收集的超过 13,000 张人脸图像。每张脸都标有图中人物的名字。照片中的 1680 人在数据集中有两张或更多张不同的照片。这些人脸的唯一限制是它们是由 Viola-Jones 人脸检测器检测到的。更多细节可以在下面的技术报告中找到。

  • 下载地址:

    http://vis-www.cs.umass.edu/lfw/

  • 论文地址:

    http://vis-www.cs.umass.edu/lfw/lfw.pdf

3

MALF (Multi-Attribute Labelled Faces)

  • 发布方:

    中国科学院·中国科学院自动研究所

  • 发布时间:

    2015

  • 简介:

    该数据集包含从 Internet 收集的 5,250 张图像和 11,931 个带注释的人脸。 每个面都包含以下注释: 方形边界框; yaw、pitch、roll的位姿变形等级(小、中、大); 'ignore' 标记小于 20x20 或极难识别的人脸(总共 838 个人脸,约占 7%); 其他面部属性:性别(女、男、未知)、isWearingGlasses、isOccluded 和 isExaggeratedExpression。

  • 下载地址:

    http://www.cbsr.ia.ac.cn/faceevaluation/

  • 论文地址:

    http://www.cbsr.ia.ac.cn/faceevaluation/faceevaluation15.pdf

4

VoxCeleb2

  • 发布方:

    牛津大学

  • 发布时间:

    2018

  • 简介:

    VoxCeleb2 是一个从开源媒体自动获得的大规模说话人识别数据集。 VoxCeleb2 包含来自 6k 多个扬声器的超过 100 万个话语。由于数据集是“在野外”收集的,语音片段被现实世界的噪音破坏,包括笑声、串音、频道效果、音乐和其他声音。该数据集也是多语言的,来自 145 个不同国籍的演讲者,涵盖了广泛的口音、年龄、种族和语言。该数据集是视听的,因此对于许多其他应用也很有用,例如 - 视觉语音合成、语音分离、从人脸到语音的跨模态转换(反之亦然)以及从视频中训练人脸识别以补充现有的人脸识别数据集。

  • 下载地址:

    https://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox2.html

  • 论文地址:

    https://arxiv.org/pdf/1806.05622v2.pdf

5

IMDb-Face

  • 发布方:

    南洋理工大学·商汤科技研究所·University of California, San Diego

  • 发布时间:

    2018

  • 简介:

    IMDb-Face 是用于人脸识别研究的大规模噪声控制数据集。该数据集包含大约 170 万张面孔、59k 个身份,这些都是从 200 万张原始图像中手动清除的。所有图片均来自 IMDb 网站。

  • 下载地址:

    https://github.com/fwang91/IMDb-Face

  • 论文地址:

    https://arxiv.org/pdf/1807.11649v1.pdf

6

YouTube Faces

  • 发布方:

    特拉维夫大学

  • 发布时间:

    2011

  • 简介:

    YouTube Faces Dataset 是一个人脸视频数据库,用于研究视频中不受约束的人脸识别问题。数据集包含来自 1,595 个主题的 3,425 个视频,全部来自 YouTube,每个主题大约有 2.15 个视频。最短的剪辑持续了 48 帧,最长的为 6070 帧,剪辑的平均长度为 181.3 帧。 YouTube Faces Dataset由特拉维夫大学于2011年发表,相关论文包括《Lior Wolf, Tal Hassner and Itay Maoz Face Recognition in Unconstrained Videos with Matched Background Similarity》。

  • 下载地址:

    http://www.cs.tau.ac.il/~wolf/ytfaces/

  • 论文地址:

    https://arxiv.org/pdf/1902.03804v1.pdf

7

CACD

  • 发布方:

    马里兰大学

  • 发布时间:

    2014

  • 简介:

    跨年龄名人数据集是用于跨年龄人脸识别和检索的数据集。它包含 2,000 位名人的 163,446 张图像。该数据集于 2014 年由马里兰大学计算机科学系发表,论文名为 cross-age Reference Coding for Age-invariant Face Recognition and Retrieval。

  • 下载地址:

    http://bcsiriuschen.github.io/CARC/

8

Expression in-the-Wild (ExpW)

  • 发布方:

    Chinese University of Hong Kong

  • 发布时间:

    2015

  • 简介:

    我们建立了一个名为 Expression in-the-Wild (ExpW) 数据集的新数据库,其中包含 91,793 个手动标记有表情的人脸。每个人脸图像都被手动注释为七种基本表情类别之一:愤怒、厌恶、恐惧、快乐、悲伤、惊讶或中性。与许多现有数据库相比,ExpW 中的图像数量更大,人脸变化更多样化。

  • 下载地址:

    http://mmlab.ie.cuhk.edu.hk/projects/socialrelation/index.html

  • 论文地址:

    https://arxiv.org/pdf/1609.06426v3.pdf

9

RenderMe-360

  • 发布方:

    上海人工智能实验室

  • 发布时间:

    2023-05-24

  • 简介:

    RenFace是一个大规模多视角人脸高清视频数据集,包含多样的人脸表情、丰富的细粒度发型发色,同时也包含音素均衡的说话视频。可应用于:2D/3D数字人脸生成、人脸重建捕捉等领域。

  • 下载地址:

    https://renderme-360.github.io/; https://openxdlab.org.cn/home

10

CPLFW(Cross-Pose LFW)

  • 发布方: 北京邮电大学

  • 发布时间:2018

  • 简介:

    Labeled Faces in the Wild (LFW) 的改造,这是用于无约束人脸验证的事实上的标准测试平台。 构建 CPLFW 基准的背后有以下三个动机: 1.建立一个相对难度更大的数据库来评估现实世界人脸验证的性能,以便充分证明几种人脸验证方法的有效性。 2.继续深入研究LFW,更加现实地考虑姿态类内变化,促进无约束情况下跨姿态人脸验证的研究。 CPLFW 的挑战强调位姿差异以进一步扩大类内方差。此外,故意选择负面对以避免不同的性别或种族。 CPLFW 同时考虑了大的类内方差和微小的类间方差。 3.保持数据量,人脸验证协议在LFW中提供“相同/不同”的基准和相同的身份,因此可以很容易地应用CPLFW来评估人脸验证的性能。

  • 下载地址:

    http://whdeng.cn/CPLFW/index.html

  •  论文地址:

    http://www.whdeng.cn/CPLFW/Cross-Pose-LFW.pdf

11

300-W

  • 发布方:伦敦帝国理工学院

  • 发布时间:2013

  • 简介:300-W 是一个人脸数据集,由 300 张室内和 300 张室外野外图像组成。它涵盖了身份、表情、照明条件、姿势、遮挡和面部大小的大量变化。这些图片是通过查询“派对”、“会议”、“抗议”、“足球”和“名人”等从 google.com 下载的。与其他野外数据集相比,300-W 数据库包含更大比例的部分遮挡图像,并且涵盖的表情比常见的“中性”或“微笑”(例如“惊喜”或“尖叫”)更多.使用半自动方法用 68 点标记对图像进行注释。数据库中的图像经过精心挑选,因此它们代表了在完全不受约束的条件下具有挑战性但自然的人脸实例的特征样本。因此,在 300-W 数据库上实现准确性能的方法可以在大多数实际情况下展示相同的准确度。数据库中的许多图像包含不止一张带注释的人脸(293 张带有 1 张人脸的图像,53 张带有 2 张人脸的图像和 53 张带有 [3, 7] 人脸的图像)。因此,该数据库包含 600 个带注释的人脸实例,但包含 399 个独特的图像。最后,有各种各样的脸型。具体来说,49.3% 的人脸大小在 [48.6k, 2.0M] 范围内,整体平均大小为 85k(约 292 × 292)像素。

  • 下载地址:

    https://ibug.doc.ic.ac.uk/resources/300-W/

  •  论文地址:

    https://ibug.doc.ic.ac.uk/media/uploads/documents/sagonas_iccv_2013_300_w.pdf

12

UTKFace

  • 发布方:

    田纳西大学

  • 发布时间:2017

  • 简介:UTKFace 数据集是一个大规模的人脸数据集,年龄跨度长(从 0 到 116 岁)。该数据集包含超过 20,000 张带有年龄、性别和种族注释的人脸图像。这些图像涵盖了姿势、面部表情、照明、遮挡、分辨率等方面的巨大变化。该数据集可用于各种任务,例如面部检测、年龄估计、年龄进展/回归、地标定位等。

  • 下载地址:

    https://susanqq.github.io/UTKFace/

  •  论文地址:

    https://arxiv.org/pdf/1702.08423v2.pdf

13

WFLW (Wider Facial Landmarks in the Wild)

  • 发布方:

    清华大学·商汤科技研究所·亚马逊

  • 发布时间:2018

  • 简介:

    Wider Facial Landmarks in-the-wild (WFLW) 包含 10000 个人脸(7500 个用于训练,2500 个用于测试)和 98 个完全手动注释的地标。除了地标标注外,新的数据集还包括丰富的属性标注,即遮挡、姿势、化妆、照明、模糊和表达,用于对现有算法的综合分析。与之前的数据集相比,所提出的数据集中的人脸在表情、姿势和遮挡方面引入了很大的变化。

  • 下载地址:

    https://wywu.github.io/projects/LAB/WFLW.html

  •  论文地址:

    https://arxiv.org/pdf/1805.10483v1.pdf

14

FG-NET

  • 发布方:

    伦敦大学·Chinese University of Hong Kong

  • 发布时间:2013

  • 简介:

    FGNet 是一个用于跨年龄的年龄估计和人脸识别的数据集。它由 82 人的 1,002 张图像组成,年龄范围从 0 到 69,年龄差距高达 45 岁

  • 下载地址:

    https://yanweifu.github.io/FG_NET_data/

  •  论文地址:

    http://www.eecs.qmul.ac.uk/~sgg/papers/ChenEtAl_CVPR2013.pdf

 温馨  小贴士

如有您想了解的计算机方向数据集

请联系我们

免费为您提供数据集搜索服务

相关文章:

【人脸识别】数据集宝藏合集,速看!

本文将为您介绍10个经典、热门的数据集,希望对您在选择适合的数据集时有所帮助。 1 26,090张人脸肤质缺陷采集数据【数据堂】 发布方: 数据堂(北京)科技股份有限公司 发布时间: 2021 简介: 26,090张人脸…...

mysql操作(进阶)

1.数据库约束 数据库自动对数据的合法性进行校验检查的一系列机制,目的是为了保证数据库中能够避免被插入或者修改一些非法数据。 (1)mysql中提供了以下的约束: a.NOT NULL:指定某列不能为null b.UNIQUE&#xff1…...

[000-01-025].第07节:WorkBench

我的后端学习大纲 我的Drools学习大纲 8. WorkBench 8.1 WorkBench简介: 1.WorkBench是KIE组件中的元素,也称为KIE-WB,是Drools-WB与JBPM-WB的结合体。它是一个可视化的规则编辑器。WorkBench其实就是一个war包,安装到tomcat中就可以运行。…...

JavaScript - 变量声明(let、const 和其他)

目录 一、引言 1. let 的作用 2. const 的作用 3. let 与 const 的选择 4. let 和 const 的性能 5. var, let, const 的对比 6. 常见误区 二、其他变量定义 1. var 关键字 2. 全局对象属性 3. 使用 IIFE(立即调用函数表达式) 4. ES6 模块 总结 …...

AC800PEC PC D231 3BHE025541R0101控制模块面价

AC800PEC PC D231 3BHE025541R0101控制模块面价 AC800PEC PC D231 3BHE025541R0101控制模块面价 AC800PEC PC D231 3BHE025541R0101控制模块面价 AC800PEC PC D231 3BHE025541R0101控制模块引脚线 AC800PEC PC D231 3BHE025541R0101控制模块说明书 AC800PEC PC D231 3BHE0…...

2024年3款免费录屏软件,你的电脑桌面上缺哪一个?

现在,不管是上网课、在家工作,还是拍视频,录屏软件都变得越来越重要了。想做个教学视频、录个操作指南,或者录个游戏的高光时刻,好的录屏软件都能帮你轻松搞定。这篇文章就是要聊聊免费录屏软件一般都有啥功能&#xf…...

Python爬虫新手指南及简单实战

网络爬虫是自动化获取网络信息的高效工具,Python因其强大的库支持和简洁的语法成为编写网络爬虫的首选语言。本教程将通过一个具体的案例(基于Microsoft Edge浏览器的简单爬取),指导你使用Python实现一个完整的网络爬虫&#xff0…...

如何有效开展产业链招商?

产业链招商是一种以产业大数据为依托、以产业链图谱为基础、以产业链分析为核心、以完善产业链结构为目标的招商引资方式。相比于传统招商模式,产业链招商比拼的并不是土地、政策优惠,而是以产业链分析为核心,诊断区域产业链结构及长短板&…...

爬虫中使用多进程、多线程的混合方式遇到的数据丢失问题

项目场景: 网络爬虫项目,主要实现多进程、多线程方式快速缓存网页资源到MongoDB,并解析网页数据,将信息写入到csv文件中。 问题描述 在单独使用多线程的过程中,是没有问题的,比如这个爬虫示例是爬取豆瓣电…...

多云应用安全平台RegData利用MongoDB简化数据控制和合规流程

在高度规范化市场中,为了保障数据安全,企业可能需要部署一系列繁琐且成本高昂的IT基础设施系统。随着各项数据安全保护措施的出台,企业需要遵守的法规数量越多,尤其是跨越多个地域的企业,其IT基础设施就会越复杂。如今…...

VUE实现TAB切换不同页面

VUE实现TAB切换不同页面 实现效果 资源准备 ReceiveOrderList, TodoListMulti, SignList 这三个页面就是需要切换的页面 首页代码 <template><div><el-tabs v-model"activeTab" type"card" tab-click"handleTabClick"><…...

C++ 80行 极简扫雷

一共5346个字符&#xff0c;MinGW编译通过&#xff08;强烈不建议写这种代码&#xff01;&#xff01;&#xff01;&#xff09; 压行规则&#xff1a;一行不超过80个字符 代码&#xff1a; #include<windows.h> #include<stdio.h> #include<time.h> #def…...

常见VPS服务器附加组件一览

网络主机行业竞争非常激烈&#xff0c;因此主机服务提供商竭尽全力为客户提供完整的解决方案&#xff0c;其中包含构建和管理在线项目所需的一切。但客户通常有特定需求&#xff0c;因此需要不同的附加组件。在管理自己的网络服务器时尤其如此。 今天&#xff0c;我们将介绍您…...

Electron 使用Electron-build 进行打包

看完下面两篇就可以完成&#xff01; 基于vue3vite的web项目改为Electron桌面应用&#xff08;一&#xff09;_vue3转electron-CSDN博客 将web项目打包成electron桌面端教程&#xff08;二&#xff09;vue3vitets_vue3 打包桌面端-CSDN博客 打包报错 1. 首先确定依赖包 npm …...

Springboot+Websocket+Security+Vue 实现弹幕推送功能

后端部分 (Spring Boot) 1. 创建一个 Spring Boot 项目 创建一个新的 Spring Boot 项目并添加以下依赖&#xff1a; <dependencies><!-- Spring Boot Starter Web --><dependency><groupId>org.springframework.boot</groupId><artifactId…...

LangChain之网络爬虫

网络爬虫 概述 网络爬虫是LangChain中的一项关键功能&#xff0c;允许用户自动从互联网上收集信息。这项功能对于研究和数据收集尤其有价值&#xff0c;因为它可以大幅减少手动搜索和信息整理的工作量。 从网络收集内容有几个主要组件&#xff1a; Search搜索&#xff1a;使用…...

VueRouter 相关信息

VueRouter 是Vue.js官方路由插件&#xff0c;与Vue.js深度集成&#xff0c;用于构建单页面应用。构建的单页面是基于路由和组件&#xff0c;路由设定访问路径&#xff0c;将路径与组件进行映射。VueRouter有两中模式 &#xff1a;hash 和 history &#xff0c;默认是hash模式。…...

[环境配置]Pycharm:Failed to start [PowerShell.exe]

解决方法&#xff0c;点Local旁边的 号&#xff0c;点击Command Prompt&#xff0c;即可在Pycharm中呼出控制台。 如果要修改Command Prompt的启动时访问的cmd.exe的路径&#xff0c;可以去Settings→Tools→Terminal中&#xff0c;修改Shell Path实现&#xff0c;改为cmd.exe…...

搜狗爬虫(www.sogou.com)IP及UA,真实采集数据

一、数据来源&#xff1a; 1、这批搜狗爬虫&#xff08;www.sogou.com&#xff09;IP来源于尚贤达猎头网站采集数据&#xff1b; ​ 2、数据采集时间段&#xff1a;2023年10月-2024年7月&#xff1b; 3、判断标准&#xff1a;主要根据用户代理是否包含“www.sogou.com”和IP核实…...

北京青蓝智慧科技ITSS服务经理:长安链ChainBridge“链桥”问世 加速国家级区块链网络互联互通

8月5日&#xff0c;据国家区块链技术创新中心消息&#xff0c;我国首个完全自主控制的区块链软硬件技术系统——长安链&#xff0c;正式推出了全场景技术平台ChainBridge“链桥”。 此平台能够支持所有异构和同构的区块链进行协作&#xff0c;满足跨领域、跨地域、跨行业及跨层…...

应用升级/灾备测试时使用guarantee 闪回点迅速回退

1.场景 应用要升级,当升级失败时,数据库回退到升级前. 要测试系统,测试完成后,数据库要回退到测试前。 相对于RMAN恢复需要很长时间&#xff0c; 数据库闪回只需要几分钟。 2.技术实现 数据库设置 2个db_recovery参数 创建guarantee闪回点&#xff0c;不需要开启数据库闪回。…...

《Qt C++ 与 OpenCV:解锁视频播放程序设计的奥秘》

引言:探索视频播放程序设计之旅 在当今数字化时代,多媒体应用已渗透到我们生活的方方面面,从日常的视频娱乐到专业的视频监控、视频会议系统,视频播放程序作为多媒体应用的核心组成部分,扮演着至关重要的角色。无论是在个人电脑、移动设备还是智能电视等平台上,用户都期望…...

【Java学习笔记】Arrays类

Arrays 类 1. 导入包&#xff1a;import java.util.Arrays 2. 常用方法一览表 方法描述Arrays.toString()返回数组的字符串形式Arrays.sort()排序&#xff08;自然排序和定制排序&#xff09;Arrays.binarySearch()通过二分搜索法进行查找&#xff08;前提&#xff1a;数组是…...

大型活动交通拥堵治理的视觉算法应用

大型活动下智慧交通的视觉分析应用 一、背景与挑战 大型活动&#xff08;如演唱会、马拉松赛事、高考中考等&#xff09;期间&#xff0c;城市交通面临瞬时人流车流激增、传统摄像头模糊、交通拥堵识别滞后等问题。以演唱会为例&#xff0c;暖城商圈曾因观众集中离场导致周边…...

ESP32读取DHT11温湿度数据

芯片&#xff1a;ESP32 环境&#xff1a;Arduino 一、安装DHT11传感器库 红框的库&#xff0c;别安装错了 二、代码 注意&#xff0c;DATA口要连接在D15上 #include "DHT.h" // 包含DHT库#define DHTPIN 15 // 定义DHT11数据引脚连接到ESP32的GPIO15 #define D…...

STM32F4基本定时器使用和原理详解

STM32F4基本定时器使用和原理详解 前言如何确定定时器挂载在哪条时钟线上配置及使用方法参数配置PrescalerCounter ModeCounter Periodauto-reload preloadTrigger Event Selection 中断配置生成的代码及使用方法初始化代码基本定时器触发DCA或者ADC的代码讲解中断代码定时启动…...

Auto-Coder使用GPT-4o完成:在用TabPFN这个模型构建一个预测未来3天涨跌的分类任务

通过akshare库&#xff0c;获取股票数据&#xff0c;并生成TabPFN这个模型 可以识别、处理的格式&#xff0c;写一个完整的预处理示例&#xff0c;并构建一个预测未来 3 天股价涨跌的分类任务 用TabPFN这个模型构建一个预测未来 3 天股价涨跌的分类任务&#xff0c;进行预测并输…...

2025盘古石杯决赛【手机取证】

前言 第三届盘古石杯国际电子数据取证大赛决赛 最后一题没有解出来&#xff0c;实在找不到&#xff0c;希望有大佬教一下我。 还有就会议时间&#xff0c;我感觉不是图片时间&#xff0c;因为在电脑看到是其他时间用老会议系统开的会。 手机取证 1、分析鸿蒙手机检材&#x…...

成都鼎讯硬核科技!雷达目标与干扰模拟器,以卓越性能制胜电磁频谱战

在现代战争中&#xff0c;电磁频谱已成为继陆、海、空、天之后的 “第五维战场”&#xff0c;雷达作为电磁频谱领域的关键装备&#xff0c;其干扰与抗干扰能力的较量&#xff0c;直接影响着战争的胜负走向。由成都鼎讯科技匠心打造的雷达目标与干扰模拟器&#xff0c;凭借数字射…...

Java多线程实现之Thread类深度解析

Java多线程实现之Thread类深度解析 一、多线程基础概念1.1 什么是线程1.2 多线程的优势1.3 Java多线程模型 二、Thread类的基本结构与构造函数2.1 Thread类的继承关系2.2 构造函数 三、创建和启动线程3.1 继承Thread类创建线程3.2 实现Runnable接口创建线程 四、Thread类的核心…...