当前位置: 首页 > news >正文

【人脸识别】数据集宝藏合集,速看!

本文将为您介绍10个经典、热门的数据集,希望对您在选择适合的数据集时有所帮助。

1

26,090张人脸肤质缺陷采集数据【数据堂】

  • 发布方:

    数据堂(北京)科技股份有限公司

  • 发布时间:

    2021

  • 简介:

    26,090张人脸肤质缺陷采集数据包含痘痘、痘印、色斑、皱纹、黑眼圈五种肤质缺陷的人脸。26,090张人脸肤质缺陷采集数据可用于肤质检测、人脸识别等任务

  • 下载地址:

    https://www.datatang.com/dataset/1052?source=openxlab

2

LFW (Labeled Faces in the Wild)

  • 发布方:

    马萨诸塞大学

  • 发布时间:

    2007

  • 简介:

    Labeled Faces in the Wild,是一个人脸照片数据库,旨在研究无约束的人脸识别问题。该数据集包含从网络收集的超过 13,000 张人脸图像。每张脸都标有图中人物的名字。照片中的 1680 人在数据集中有两张或更多张不同的照片。这些人脸的唯一限制是它们是由 Viola-Jones 人脸检测器检测到的。更多细节可以在下面的技术报告中找到。

  • 下载地址:

    http://vis-www.cs.umass.edu/lfw/

  • 论文地址:

    http://vis-www.cs.umass.edu/lfw/lfw.pdf

3

MALF (Multi-Attribute Labelled Faces)

  • 发布方:

    中国科学院·中国科学院自动研究所

  • 发布时间:

    2015

  • 简介:

    该数据集包含从 Internet 收集的 5,250 张图像和 11,931 个带注释的人脸。 每个面都包含以下注释: 方形边界框; yaw、pitch、roll的位姿变形等级(小、中、大); 'ignore' 标记小于 20x20 或极难识别的人脸(总共 838 个人脸,约占 7%); 其他面部属性:性别(女、男、未知)、isWearingGlasses、isOccluded 和 isExaggeratedExpression。

  • 下载地址:

    http://www.cbsr.ia.ac.cn/faceevaluation/

  • 论文地址:

    http://www.cbsr.ia.ac.cn/faceevaluation/faceevaluation15.pdf

4

VoxCeleb2

  • 发布方:

    牛津大学

  • 发布时间:

    2018

  • 简介:

    VoxCeleb2 是一个从开源媒体自动获得的大规模说话人识别数据集。 VoxCeleb2 包含来自 6k 多个扬声器的超过 100 万个话语。由于数据集是“在野外”收集的,语音片段被现实世界的噪音破坏,包括笑声、串音、频道效果、音乐和其他声音。该数据集也是多语言的,来自 145 个不同国籍的演讲者,涵盖了广泛的口音、年龄、种族和语言。该数据集是视听的,因此对于许多其他应用也很有用,例如 - 视觉语音合成、语音分离、从人脸到语音的跨模态转换(反之亦然)以及从视频中训练人脸识别以补充现有的人脸识别数据集。

  • 下载地址:

    https://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox2.html

  • 论文地址:

    https://arxiv.org/pdf/1806.05622v2.pdf

5

IMDb-Face

  • 发布方:

    南洋理工大学·商汤科技研究所·University of California, San Diego

  • 发布时间:

    2018

  • 简介:

    IMDb-Face 是用于人脸识别研究的大规模噪声控制数据集。该数据集包含大约 170 万张面孔、59k 个身份,这些都是从 200 万张原始图像中手动清除的。所有图片均来自 IMDb 网站。

  • 下载地址:

    https://github.com/fwang91/IMDb-Face

  • 论文地址:

    https://arxiv.org/pdf/1807.11649v1.pdf

6

YouTube Faces

  • 发布方:

    特拉维夫大学

  • 发布时间:

    2011

  • 简介:

    YouTube Faces Dataset 是一个人脸视频数据库,用于研究视频中不受约束的人脸识别问题。数据集包含来自 1,595 个主题的 3,425 个视频,全部来自 YouTube,每个主题大约有 2.15 个视频。最短的剪辑持续了 48 帧,最长的为 6070 帧,剪辑的平均长度为 181.3 帧。 YouTube Faces Dataset由特拉维夫大学于2011年发表,相关论文包括《Lior Wolf, Tal Hassner and Itay Maoz Face Recognition in Unconstrained Videos with Matched Background Similarity》。

  • 下载地址:

    http://www.cs.tau.ac.il/~wolf/ytfaces/

  • 论文地址:

    https://arxiv.org/pdf/1902.03804v1.pdf

7

CACD

  • 发布方:

    马里兰大学

  • 发布时间:

    2014

  • 简介:

    跨年龄名人数据集是用于跨年龄人脸识别和检索的数据集。它包含 2,000 位名人的 163,446 张图像。该数据集于 2014 年由马里兰大学计算机科学系发表,论文名为 cross-age Reference Coding for Age-invariant Face Recognition and Retrieval。

  • 下载地址:

    http://bcsiriuschen.github.io/CARC/

8

Expression in-the-Wild (ExpW)

  • 发布方:

    Chinese University of Hong Kong

  • 发布时间:

    2015

  • 简介:

    我们建立了一个名为 Expression in-the-Wild (ExpW) 数据集的新数据库,其中包含 91,793 个手动标记有表情的人脸。每个人脸图像都被手动注释为七种基本表情类别之一:愤怒、厌恶、恐惧、快乐、悲伤、惊讶或中性。与许多现有数据库相比,ExpW 中的图像数量更大,人脸变化更多样化。

  • 下载地址:

    http://mmlab.ie.cuhk.edu.hk/projects/socialrelation/index.html

  • 论文地址:

    https://arxiv.org/pdf/1609.06426v3.pdf

9

RenderMe-360

  • 发布方:

    上海人工智能实验室

  • 发布时间:

    2023-05-24

  • 简介:

    RenFace是一个大规模多视角人脸高清视频数据集,包含多样的人脸表情、丰富的细粒度发型发色,同时也包含音素均衡的说话视频。可应用于:2D/3D数字人脸生成、人脸重建捕捉等领域。

  • 下载地址:

    https://renderme-360.github.io/; https://openxdlab.org.cn/home

10

CPLFW(Cross-Pose LFW)

  • 发布方: 北京邮电大学

  • 发布时间:2018

  • 简介:

    Labeled Faces in the Wild (LFW) 的改造,这是用于无约束人脸验证的事实上的标准测试平台。 构建 CPLFW 基准的背后有以下三个动机: 1.建立一个相对难度更大的数据库来评估现实世界人脸验证的性能,以便充分证明几种人脸验证方法的有效性。 2.继续深入研究LFW,更加现实地考虑姿态类内变化,促进无约束情况下跨姿态人脸验证的研究。 CPLFW 的挑战强调位姿差异以进一步扩大类内方差。此外,故意选择负面对以避免不同的性别或种族。 CPLFW 同时考虑了大的类内方差和微小的类间方差。 3.保持数据量,人脸验证协议在LFW中提供“相同/不同”的基准和相同的身份,因此可以很容易地应用CPLFW来评估人脸验证的性能。

  • 下载地址:

    http://whdeng.cn/CPLFW/index.html

  •  论文地址:

    http://www.whdeng.cn/CPLFW/Cross-Pose-LFW.pdf

11

300-W

  • 发布方:伦敦帝国理工学院

  • 发布时间:2013

  • 简介:300-W 是一个人脸数据集,由 300 张室内和 300 张室外野外图像组成。它涵盖了身份、表情、照明条件、姿势、遮挡和面部大小的大量变化。这些图片是通过查询“派对”、“会议”、“抗议”、“足球”和“名人”等从 google.com 下载的。与其他野外数据集相比,300-W 数据库包含更大比例的部分遮挡图像,并且涵盖的表情比常见的“中性”或“微笑”(例如“惊喜”或“尖叫”)更多.使用半自动方法用 68 点标记对图像进行注释。数据库中的图像经过精心挑选,因此它们代表了在完全不受约束的条件下具有挑战性但自然的人脸实例的特征样本。因此,在 300-W 数据库上实现准确性能的方法可以在大多数实际情况下展示相同的准确度。数据库中的许多图像包含不止一张带注释的人脸(293 张带有 1 张人脸的图像,53 张带有 2 张人脸的图像和 53 张带有 [3, 7] 人脸的图像)。因此,该数据库包含 600 个带注释的人脸实例,但包含 399 个独特的图像。最后,有各种各样的脸型。具体来说,49.3% 的人脸大小在 [48.6k, 2.0M] 范围内,整体平均大小为 85k(约 292 × 292)像素。

  • 下载地址:

    https://ibug.doc.ic.ac.uk/resources/300-W/

  •  论文地址:

    https://ibug.doc.ic.ac.uk/media/uploads/documents/sagonas_iccv_2013_300_w.pdf

12

UTKFace

  • 发布方:

    田纳西大学

  • 发布时间:2017

  • 简介:UTKFace 数据集是一个大规模的人脸数据集,年龄跨度长(从 0 到 116 岁)。该数据集包含超过 20,000 张带有年龄、性别和种族注释的人脸图像。这些图像涵盖了姿势、面部表情、照明、遮挡、分辨率等方面的巨大变化。该数据集可用于各种任务,例如面部检测、年龄估计、年龄进展/回归、地标定位等。

  • 下载地址:

    https://susanqq.github.io/UTKFace/

  •  论文地址:

    https://arxiv.org/pdf/1702.08423v2.pdf

13

WFLW (Wider Facial Landmarks in the Wild)

  • 发布方:

    清华大学·商汤科技研究所·亚马逊

  • 发布时间:2018

  • 简介:

    Wider Facial Landmarks in-the-wild (WFLW) 包含 10000 个人脸(7500 个用于训练,2500 个用于测试)和 98 个完全手动注释的地标。除了地标标注外,新的数据集还包括丰富的属性标注,即遮挡、姿势、化妆、照明、模糊和表达,用于对现有算法的综合分析。与之前的数据集相比,所提出的数据集中的人脸在表情、姿势和遮挡方面引入了很大的变化。

  • 下载地址:

    https://wywu.github.io/projects/LAB/WFLW.html

  •  论文地址:

    https://arxiv.org/pdf/1805.10483v1.pdf

14

FG-NET

  • 发布方:

    伦敦大学·Chinese University of Hong Kong

  • 发布时间:2013

  • 简介:

    FGNet 是一个用于跨年龄的年龄估计和人脸识别的数据集。它由 82 人的 1,002 张图像组成,年龄范围从 0 到 69,年龄差距高达 45 岁

  • 下载地址:

    https://yanweifu.github.io/FG_NET_data/

  •  论文地址:

    http://www.eecs.qmul.ac.uk/~sgg/papers/ChenEtAl_CVPR2013.pdf

 温馨  小贴士

如有您想了解的计算机方向数据集

请联系我们

免费为您提供数据集搜索服务

相关文章:

【人脸识别】数据集宝藏合集,速看!

本文将为您介绍10个经典、热门的数据集,希望对您在选择适合的数据集时有所帮助。 1 26,090张人脸肤质缺陷采集数据【数据堂】 发布方: 数据堂(北京)科技股份有限公司 发布时间: 2021 简介: 26,090张人脸…...

mysql操作(进阶)

1.数据库约束 数据库自动对数据的合法性进行校验检查的一系列机制,目的是为了保证数据库中能够避免被插入或者修改一些非法数据。 (1)mysql中提供了以下的约束: a.NOT NULL:指定某列不能为null b.UNIQUE&#xff1…...

[000-01-025].第07节:WorkBench

我的后端学习大纲 我的Drools学习大纲 8. WorkBench 8.1 WorkBench简介: 1.WorkBench是KIE组件中的元素,也称为KIE-WB,是Drools-WB与JBPM-WB的结合体。它是一个可视化的规则编辑器。WorkBench其实就是一个war包,安装到tomcat中就可以运行。…...

JavaScript - 变量声明(let、const 和其他)

目录 一、引言 1. let 的作用 2. const 的作用 3. let 与 const 的选择 4. let 和 const 的性能 5. var, let, const 的对比 6. 常见误区 二、其他变量定义 1. var 关键字 2. 全局对象属性 3. 使用 IIFE(立即调用函数表达式) 4. ES6 模块 总结 …...

AC800PEC PC D231 3BHE025541R0101控制模块面价

AC800PEC PC D231 3BHE025541R0101控制模块面价 AC800PEC PC D231 3BHE025541R0101控制模块面价 AC800PEC PC D231 3BHE025541R0101控制模块面价 AC800PEC PC D231 3BHE025541R0101控制模块引脚线 AC800PEC PC D231 3BHE025541R0101控制模块说明书 AC800PEC PC D231 3BHE0…...

2024年3款免费录屏软件,你的电脑桌面上缺哪一个?

现在,不管是上网课、在家工作,还是拍视频,录屏软件都变得越来越重要了。想做个教学视频、录个操作指南,或者录个游戏的高光时刻,好的录屏软件都能帮你轻松搞定。这篇文章就是要聊聊免费录屏软件一般都有啥功能&#xf…...

Python爬虫新手指南及简单实战

网络爬虫是自动化获取网络信息的高效工具,Python因其强大的库支持和简洁的语法成为编写网络爬虫的首选语言。本教程将通过一个具体的案例(基于Microsoft Edge浏览器的简单爬取),指导你使用Python实现一个完整的网络爬虫&#xff0…...

如何有效开展产业链招商?

产业链招商是一种以产业大数据为依托、以产业链图谱为基础、以产业链分析为核心、以完善产业链结构为目标的招商引资方式。相比于传统招商模式,产业链招商比拼的并不是土地、政策优惠,而是以产业链分析为核心,诊断区域产业链结构及长短板&…...

爬虫中使用多进程、多线程的混合方式遇到的数据丢失问题

项目场景: 网络爬虫项目,主要实现多进程、多线程方式快速缓存网页资源到MongoDB,并解析网页数据,将信息写入到csv文件中。 问题描述 在单独使用多线程的过程中,是没有问题的,比如这个爬虫示例是爬取豆瓣电…...

多云应用安全平台RegData利用MongoDB简化数据控制和合规流程

在高度规范化市场中,为了保障数据安全,企业可能需要部署一系列繁琐且成本高昂的IT基础设施系统。随着各项数据安全保护措施的出台,企业需要遵守的法规数量越多,尤其是跨越多个地域的企业,其IT基础设施就会越复杂。如今…...

VUE实现TAB切换不同页面

VUE实现TAB切换不同页面 实现效果 资源准备 ReceiveOrderList, TodoListMulti, SignList 这三个页面就是需要切换的页面 首页代码 <template><div><el-tabs v-model"activeTab" type"card" tab-click"handleTabClick"><…...

C++ 80行 极简扫雷

一共5346个字符&#xff0c;MinGW编译通过&#xff08;强烈不建议写这种代码&#xff01;&#xff01;&#xff01;&#xff09; 压行规则&#xff1a;一行不超过80个字符 代码&#xff1a; #include<windows.h> #include<stdio.h> #include<time.h> #def…...

常见VPS服务器附加组件一览

网络主机行业竞争非常激烈&#xff0c;因此主机服务提供商竭尽全力为客户提供完整的解决方案&#xff0c;其中包含构建和管理在线项目所需的一切。但客户通常有特定需求&#xff0c;因此需要不同的附加组件。在管理自己的网络服务器时尤其如此。 今天&#xff0c;我们将介绍您…...

Electron 使用Electron-build 进行打包

看完下面两篇就可以完成&#xff01; 基于vue3vite的web项目改为Electron桌面应用&#xff08;一&#xff09;_vue3转electron-CSDN博客 将web项目打包成electron桌面端教程&#xff08;二&#xff09;vue3vitets_vue3 打包桌面端-CSDN博客 打包报错 1. 首先确定依赖包 npm …...

Springboot+Websocket+Security+Vue 实现弹幕推送功能

后端部分 (Spring Boot) 1. 创建一个 Spring Boot 项目 创建一个新的 Spring Boot 项目并添加以下依赖&#xff1a; <dependencies><!-- Spring Boot Starter Web --><dependency><groupId>org.springframework.boot</groupId><artifactId…...

LangChain之网络爬虫

网络爬虫 概述 网络爬虫是LangChain中的一项关键功能&#xff0c;允许用户自动从互联网上收集信息。这项功能对于研究和数据收集尤其有价值&#xff0c;因为它可以大幅减少手动搜索和信息整理的工作量。 从网络收集内容有几个主要组件&#xff1a; Search搜索&#xff1a;使用…...

VueRouter 相关信息

VueRouter 是Vue.js官方路由插件&#xff0c;与Vue.js深度集成&#xff0c;用于构建单页面应用。构建的单页面是基于路由和组件&#xff0c;路由设定访问路径&#xff0c;将路径与组件进行映射。VueRouter有两中模式 &#xff1a;hash 和 history &#xff0c;默认是hash模式。…...

[环境配置]Pycharm:Failed to start [PowerShell.exe]

解决方法&#xff0c;点Local旁边的 号&#xff0c;点击Command Prompt&#xff0c;即可在Pycharm中呼出控制台。 如果要修改Command Prompt的启动时访问的cmd.exe的路径&#xff0c;可以去Settings→Tools→Terminal中&#xff0c;修改Shell Path实现&#xff0c;改为cmd.exe…...

搜狗爬虫(www.sogou.com)IP及UA,真实采集数据

一、数据来源&#xff1a; 1、这批搜狗爬虫&#xff08;www.sogou.com&#xff09;IP来源于尚贤达猎头网站采集数据&#xff1b; ​ 2、数据采集时间段&#xff1a;2023年10月-2024年7月&#xff1b; 3、判断标准&#xff1a;主要根据用户代理是否包含“www.sogou.com”和IP核实…...

北京青蓝智慧科技ITSS服务经理:长安链ChainBridge“链桥”问世 加速国家级区块链网络互联互通

8月5日&#xff0c;据国家区块链技术创新中心消息&#xff0c;我国首个完全自主控制的区块链软硬件技术系统——长安链&#xff0c;正式推出了全场景技术平台ChainBridge“链桥”。 此平台能够支持所有异构和同构的区块链进行协作&#xff0c;满足跨领域、跨地域、跨行业及跨层…...

聊一聊接口测试的意义有哪些?

目录 一、隔离性 & 早期测试 二、保障系统集成质量 三、验证业务逻辑的核心层 四、提升测试效率与覆盖度 五、系统稳定性的守护者 六、驱动团队协作与契约管理 七、性能与扩展性的前置评估 八、持续交付的核心支撑 接口测试的意义可以从四个维度展开&#xff0c;首…...

让回归模型不再被异常值“带跑偏“,MSE和Cauchy损失函数在噪声数据环境下的实战对比

在机器学习的回归分析中&#xff0c;损失函数的选择对模型性能具有决定性影响。均方误差&#xff08;MSE&#xff09;作为经典的损失函数&#xff0c;在处理干净数据时表现优异&#xff0c;但在面对包含异常值的噪声数据时&#xff0c;其对大误差的二次惩罚机制往往导致模型参数…...

腾讯云V3签名

想要接入腾讯云的Api&#xff0c;必然先按其文档计算出所要求的签名。 之前也调用过腾讯云的接口&#xff0c;但总是卡在签名这一步&#xff0c;最后放弃选择SDK&#xff0c;这次终于自己代码实现。 可能腾讯云翻新了接口文档&#xff0c;现在阅读起来&#xff0c;清晰了很多&…...

安卓基础(Java 和 Gradle 版本)

1. 设置项目的 JDK 版本 方法1&#xff1a;通过 Project Structure File → Project Structure... (或按 CtrlAltShiftS) 左侧选择 SDK Location 在 Gradle Settings 部分&#xff0c;设置 Gradle JDK 方法2&#xff1a;通过 Settings File → Settings... (或 CtrlAltS)…...

nnUNet V2修改网络——暴力替换网络为UNet++

更换前,要用nnUNet V2跑通所用数据集,证明nnUNet V2、数据集、运行环境等没有问题 阅读nnU-Net V2 的 U-Net结构,初步了解要修改的网络,知己知彼,修改起来才能游刃有余。 U-Net存在两个局限,一是网络的最佳深度因应用场景而异,这取决于任务的难度和可用于训练的标注数…...

通过MicroSip配置自己的freeswitch服务器进行调试记录

之前用docker安装的freeswitch的&#xff0c;启动是正常的&#xff0c; 但用下面的Microsip连接不上 主要原因有可能一下几个 1、通过下面命令可以看 [rootlocalhost default]# docker exec -it freeswitch fs_cli -x "sofia status profile internal"Name …...

Vue 模板语句的数据来源

&#x1f9e9; Vue 模板语句的数据来源&#xff1a;全方位解析 Vue 模板&#xff08;<template> 部分&#xff09;中的表达式、指令绑定&#xff08;如 v-bind, v-on&#xff09;和插值&#xff08;{{ }}&#xff09;都在一个特定的作用域内求值。这个作用域由当前 组件…...

32单片机——基本定时器

STM32F103有众多的定时器&#xff0c;其中包括2个基本定时器&#xff08;TIM6和TIM7&#xff09;、4个通用定时器&#xff08;TIM2~TIM5&#xff09;、2个高级控制定时器&#xff08;TIM1和TIM8&#xff09;&#xff0c;这些定时器彼此完全独立&#xff0c;不共享任何资源 1、定…...

多元隐函数 偏导公式

我们来推导隐函数 z z ( x , y ) z z(x, y) zz(x,y) 的偏导公式&#xff0c;给定一个隐函数关系&#xff1a; F ( x , y , z ( x , y ) ) 0 F(x, y, z(x, y)) 0 F(x,y,z(x,y))0 &#x1f9e0; 目标&#xff1a; 求 ∂ z ∂ x \frac{\partial z}{\partial x} ∂x∂z​、 …...

Python环境安装与虚拟环境配置详解

本文档旨在为Python开发者提供一站式的环境安装与虚拟环境配置指南&#xff0c;适用于Windows、macOS和Linux系统。无论你是初学者还是有经验的开发者&#xff0c;都能在此找到适合自己的环境搭建方法和常见问题的解决方案。 快速开始 一分钟快速安装与虚拟环境配置 # macOS/…...