当前位置：首页 > news >正文

使用dlib进行人脸检测和对齐

news 2025/12/19 19:09:29

最近在配置人脸属性识别的服务，用过faceboxes_detector（faster rcnn的包），也用过face_recognition的，但是她们都没有做人脸对齐，而且检测人脸的范围也不太一样。

没有做人脸对齐的时候，使用属性识别模型，效果会较差。

后面查怎么进行人脸对齐，知道dlib可以做，而且这个包也能做人脸检测，那我就不需要再配置那么多用不到的包了，只用这个工具就行。

参考https://blog.csdn.net/superdont/article/details/126300274所写的

因为服务资源有限，不能上传太大的图像到model里，所以我对图像的尺寸做了限制。这就需要最后的结果要把真实坐标还原。

不过脸部的图像还是去原图里截取，可以更加清晰，不浪费高像素。

修改如下

步骤1：初始化

import dlib# 构造检测器detector = dlib.get_frontal_face_detector()# 载入模型predictor  = dlib.shape_predictor('shape_predictor_68_face_landmarks.dat')# 模型链接：https://pan.baidu.com/s/1Hp7IZnf2Wez_kYOYfToc_w 提取码：p8ps

步骤2：获取人脸框集合

def face_detect(image):"""进行人脸检测Args:img:array输入：原图，opencv读取的bgr图片输出：人脸检测框位置，resize倍数"""h,w = image.shape[:2]scale = max(h,w)/1000  # 上服务必须限制尺寸，太小的人脸可丢弃image = cv2.resize(image, (int(w/scale), int(h/scale)))detections = detector(image, 1)return detections, scale

步骤3：根据原始图像、人脸检测框位置，还原原图的人脸检测框坐标位置

步骤4：根据原始图像、人脸关键点获取人脸对齐结果

步骤5：查看对齐后的人脸图像

以上步骤全写在下面这个函数里

def get_face_attributes(image):result = []image_height, image_width, _ = image.shapedetections, scale = face_detect(image)#构建一个dlib.rectangles对象#因为需要把计算好的原图坐标，做成rectangles格式，输入dlib.get_face_chipsfaceBoxs = dlib.rectangles() face_dect_list = []#步骤3：根据原始图像、人脸检测框位置，还原原图的人脸检测框坐标位置for i in range(len(detections)):det_xmin = int(detections[i].left() * scale)det_ymin = int(detections[i].top() * scale)det_xmax = int(detections[i].right() * scale)det_ymax = int(detections[i].bottom() * scale)face_dect_list.append([det_xmin,det_ymin,det_xmax,det_ymax]) #原图坐标rectangle = dlib.rectangle(det_xmin, det_ymin, det_xmax, det_ymax)faceBoxs.append(rectangle) #新的rectangles格式坐标#构造容器faces = dlib.full_object_detections()#将所获取的人脸框集合，逐个放入容器faces中。for faceBox in faceBoxs:faces.append(predictor(image, faceBox)) # 调用函数get_face_chips完成对人脸图像的对齐（倾斜校正）faces = dlib.get_face_chips(img, faces, size=256)i = 0for face in faces:face_image = np.array(face).astype(np.uint8)#可保存查看cv2.imwrite("result"+str(i)+".jpg",face_image)attributes_dict = {}#我需要做的人脸属性检测，这里不展开attributes_dict = dete_attributes1(face_image,attributes_dict)attributes_dict = dete_attributes2(face_image,attributes_dict)attributes_dict = dete_attributes3(face_image,attributes_dict)person_dict = {"face_loc":face_dect_list[i],"face_attributes":attributes_dict}result.append(person_dict)i+=1return result

使用dlib进行人脸检测和对齐

最近在配置人脸属性识别的服务，用过faceboxes_detector（faster rcnn的包），也用过face_recognition的，但是她们都没有做人脸对齐，而且检测人脸的范围也不太一样。没有做人脸对齐的时候，使用属性识…...

编程日记 2023/2/18 7:20:55

将python代码封装成c版本的dll动态链接库

前言将python程序打包成DLL文件，然后用C调用生成的DLL文件，这是一种用C调用python的方法，这一块比较容易遇到坑。网上关于这一块的教程不是很多，而且大部分都不能完全解决问题。我在傻傻挣扎了几天之后，终于试出了一个…...

编程日记 2023/2/18 7:19:48

AI技术网关如何用于安全生产监测？有什么优势？

现代工业生产和运营的规模越来越庞大、系统和结构越来越复杂，现场的风险点多面广，给作业一线的安全监管带来极大的挑战。针对工地、煤矿、危化品、加油站、烟花爆竹、电力等行业的安全生产监管场景，可以借助AI智能与物联网技术，…...

编程日记 2023/2/18 7:18:42

2｜数据挖掘｜关联规则｜Association Rules｜Apriori算法｜Frequent-pattern tree和FP-growth算法｜11.11

...

编程日记 2023/2/18 7:17:35

刷题记录:牛客NC53370 Forsaken的三维数点

传送门:牛客题目描述: Forsaken现在在一个三维空间中，空间中每个点都可以用(x,y,z)表示。突然，三维空间的主人出现了，如果Forsaken想要继续在三维空间中呆下去，他就必须回答三维空间主人的问题.主人会在空间中坐标为(x,y,z)处…...

编程日记 2023/2/18 7:16:29

lombok的原理和使用

原理Lombok能以简单的注解形式来简化java代码，提高开发人员的开发效率。其实并没有改变字节码文件的任何内容，只是简化的程序员编写代码的方式。不使用lombok：使用lombok：lombok常用注解Setter ：注解在类或字段&#x…...

编程日记 2023/2/18 7:15:21

UDP网络编程

UDP和TCP 前几节我们提到了计算机网络编程中的TCP编程，TCP和UDP都是计算机机网络通信的传输层中的传输协议，今天我们来学习计算机网络编程中的基于UDP传输协议的网络编程首先我们要了解TCP和UDP的区别它们是同属于计算机网络传输层的传输协议 TCP&…...

编程日记 2023/2/18 7:14:14

“合并区间”问题解析及其思考

合并区间题目以数组 intervals 表示若干个区间的集合，其中单个区间为 intervals[i] [starti, endi] 。请你合并所有重叠的区间，并返回一个不重叠的区间数组，该数组需恰好覆盖输入中的所有区间。解析本题思路相对比较容易想先对各个区间按左…...

编程日记 2023/2/18 7:13:07

2023年理想新能源汽车核心部件解密

理想主要硬件清单（L9车型）汽车结构设置名称规格备注价格供应商感知层...

编程日记 2023/2/18 7:11:58

C++ 将一个vector内容赋值给另一个vector，及swap与assign的区别

在本文中，我们将主要介绍5种将一个vector内容赋值给另一个vector的方式，顺便讨论下swap与assign的区别。赋值方式一、申明时赋值 vector<int> v2; v2.push_back(0); v2.push_back(1);vector<int> v1(v2); //声明方式二、使用assign赋值…...

编程日记 2023/2/18 7:10:50

PMP的价值有哪些？

我个人认为，考证只有两个出发点是正确的。一是为了提升自己或者满足自己的兴趣，另一个是和自己的职业规划相关。比如，有同学想提升自己英语能力，可以考四六级，或者更厉害一点的考雅思、托福。比如，有的同…...

编程日记 2023/2/18 7:09:44

OnGUI label 控件||Unity 3D GUI教程||OnGUI Background Color 控件

Unity 3D Label 控件用于在设备的屏幕上创建文本标签和纹理标签，和Box 控件类似，可以显示文本内容或图片。Label 控件一般用于显示提示性的信息，如当前窗口的名称、游戏中游戏对象的名字、游戏对玩家的任务提示和功能介绍等。具体使用方法如下…...

编程日记 2023/2/18 7:08:35

从 JavaScript 中的数组中删除空对象

从数组中删除空对象： 使用 Array.filter() 方法遍历数组。将每个对象传递给 Object.keys() 方法并检查键的长度是否不等于 0。filter 方法将返回一个不包含空对象的新数组。 const arr [{}, {id: 1}, {}, {id: 2}, {}];const results arr.filter(element > {…...

编程日记 2023/2/18 7:07:28

【C++】AVL树和红黑树（插入和测试详解）

文章目录1、AVL树1.1 AVL树的插入1.2 总结与测试AVL树2、红黑树2.1 红黑树的插入2.2 红黑树的测试了解AVL树是为了了解红黑树，了解红黑树是为了更好的理解set和map。 1、AVL树 AVL树是在二叉搜索树的基础上进行了严格的平衡，能做到平衡的关键是通过平衡…...

编程日记 2023/2/18 7:06:20

Centos7 安装 Mysql 8.0.32，详细完整教程（好文章！！）

mysql5.7的安装方式参考之前的文章： centos7 安装 Mysql 5.7.27，详细完整教程（好文章！！）_HD243608836的博客-CSDN博客一、检查mysql版本冲突先检查是否已经存在mysql，若存在卸载&#xff0…...

编程日记 2023/2/18 7:05:13

Apache Beanutils为什么被禁止使用？

收录于热门专栏Java基础教程系列（进阶篇） 在实际的项目开发中，对象间赋值普遍存在，随着双十一、秒杀等电商过程愈加复杂，数据量也在不断攀升，效率问题，浮出水面。问：如果是你来写…...

编程日记 2023/2/18 7:04:06

sql server执行md5加密的时候，字符串前带N和不带N的结果是不一样的

最近因为项目的需要，报表中需要对数据进行MD5加密，结果报表系统得出来的sql语句，字符串前都自动带了N，执行时，发现得到的结果跟在数据库中执行的sql（字符串不带N）得的值不一样，最后自…...

编程日记 2023/2/18 7:03:00

01Python编译器和编辑器下载

Python下载通过python官网下载：https://www.python.org/因为python官网的服务器在国外，我们可以通过腾讯软件中心下载https://pc.qq.com/search.html#!keyword=python 腾讯软件中心下载请使用普通下载，其他什么下载会自动帮你下个电脑管家（没必要） python简单描述 python…...

编程日记 2023/2/18 7:01:54

CHAPTER 5 自动发现、自动注册、分布式监控、SNMP监控

自动发现与自动注册5.1 自动发现与自动注册5.1.1 简介5.1.2 两种模式5.2 自动发现--被动模式5.3 自动注册--主动模式5.4 分布式监控5.4.1 介绍5.4.2 配置zabbix proxy5.5 SNMP监控5.5.1 使用范围5.5.2 安装snmp程序5.5.3 配置snmp程序5.5.4 测试snmp5.5.5 在web界面进行配置5.1…...

编程日记 2023/2/18 7:00:48

P5311 [Ynoi2011] 成都七中

题目描述给你一棵 nnn 个节点的树，每个节点有一种颜色，有 mmm 次查询操作。查询操作给定参数 lrxl\ r\ xl r x，需输出： 将树中编号在 [l,r][l,r][l,r] 内的所有节点保留，xxx 所在连通块中颜色种类数。每次查询操…...

编程日记 2023/2/18 6:59:42

树莓派超全系列教程文档--(61)树莓派摄像头高级使用方法

树莓派摄像头高级使用方法配置通过调谐文件来调整相机行为使用多个摄像头安装 libcam 和 rpicam-apps依赖关系开发包文章来源： http://raspberry.dns8844.cn/documentation 原文网址配置大多数用例自动工作，无需更改相机配置。但是，一…...

编程新知 2025/12/13 8:43:37

DeepSeek 赋能智慧能源：微电网优化调度的智能革新路径

目录一、智慧能源微电网优化调度概述1.1 智慧能源微电网概念1.2 优化调度的重要性1.3 目前面临的挑战二、DeepSeek 技术探秘2.1 DeepSeek 技术原理2.2 DeepSeek 独特优势2.3 DeepSeek 在 AI 领域地位三、DeepSeek 在微电网优化调度中的应用剖析3.1 数据处理与分析3.2 预测与…...

编程新知 2025/11/20 2:48:44

定义集线器接口 IOnlineUserHub public interface IOnlineUserHub {/// 在线用户列表Task OnlineUserList(OnlineUserList context);/// 强制下线Task ForceOffline(object context);/// 发布站内消息Task PublicNotice(SysNotice context);/// 接收消息Task ReceiveMessage(…...

编程新知 2025/9/10 5:36:56

【网络安全产品大调研系列】2. 体验漏洞扫描

前言 2023 年漏洞扫描服务市场规模预计为 3.06（十亿美元）。漏洞扫描服务市场行业预计将从 2024 年的 3.48（十亿美元）增长到 2032 年的 9.54（十亿美元）。预测期内漏洞扫描服务市场 CAGR（增长率&…...

编程新知 2025/12/17 21:16:11

React Native在HarmonyOS 5.0阅读类应用开发中的实践

一、技术选型背景随着HarmonyOS 5.0对Web兼容层的增强，React Native作为跨平台框架可通过重新编译ArkTS组件实现85%以上的代码复用率。阅读类应用具有UI复杂度低、数据流清晰的特点。二、核心实现方案 1. 环境配置 （1）使用React Native…...

编程新知 2025/8/19 2:57:37

Android Bitmap治理全解析：从加载优化到泄漏防控的全生命周期管理

引言 Bitmap（位图）是Android应用内存占用的“头号杀手”。一张1080P（1920x1080）的图片以ARGB_8888格式加载时，内存占用高达8MB（192010804字节）。据统计，超过60%的应用OOM崩溃与Bitm…...

编程新知 2025/9/9 23:27:37

蓝桥杯3498 01串的熵

问题描述对于一个长度为 23333333的 01 串, 如果其信息熵为 11625907.5798， 且 0 出现次数比 1 少, 那么这个 01 串中 0 出现了多少次? #include<iostream> #include<cmath> using namespace std;int n 23333333;int main() {//枚举 0 出现的次数//因…...

编程新知 2025/12/9 7:15:22

USB Over IP专用硬件的5个特点

USB over IP技术通过将USB协议数据封装在标准TCP/IP网络数据包中，从根本上改变了USB连接。这允许客户端通过局域网或广域网远程访问和控制物理连接到服务器的USB设备（如专用硬件设备），从而消除了直接物理连接的需要。USB over IP的…...

编程新知 2025/12/12 20:29:11

安宝特案例丨Vuzix AR智能眼镜集成专业软件，助力卢森堡医院药房转型，赢得辉瑞创新奖

在Vuzix M400 AR智能眼镜的助力下，卢森堡罗伯特舒曼医院（the Robert Schuman Hospitals, HRS）凭借在无菌制剂生产流程中引入增强现实技术（AR）创新项目，荣获了2024年6月7日由卢森堡医院药剂师协会&#xff0…...

编程新知 2025/12/16 15:18:19

STM32HAL库USART源代码解析及应用

STM32HAL库USART源代码解析前言STM32CubeIDE配置串口USART和UART的选择使用模式参数设置GPIO配置DMA配置中断配置硬件流控制使能生成代码解析和使用方法串口初始化__UART_HandleTypeDef结构体浅析HAL库代码实际使用方法使用轮询方式发送使用轮询方式接收使用中断方式发送使用中…...

编程新知 2025/12/13 10:29:27

使用dlib进行人脸检测和对齐

相关文章：

使用dlib进行人脸检测和对齐

将python代码封装成c版本的dll动态链接库

AI技术网关如何用于安全生产监测？有什么优势？

2｜数据挖掘｜关联规则｜Association Rules｜Apriori算法｜Frequent-pattern tree和FP-growth算法｜11.11

刷题记录:牛客NC53370 Forsaken的三维数点

lombok的原理和使用

UDP网络编程

“合并区间”问题解析及其思考

2023年理想新能源汽车核心部件解密

C++ 将一个vector内容赋值给另一个vector，及swap与assign的区别

PMP的价值有哪些？

OnGUI label 控件||Unity 3D GUI教程||OnGUI Background Color 控件

从 JavaScript 中的数组中删除空对象

【C++】AVL树和红黑树（插入和测试详解）

Centos7 安装 Mysql 8.0.32，详细完整教程（好文章！！）

Apache Beanutils为什么被禁止使用？

sql server执行md5加密的时候，字符串前带N和不带N的结果是不一样的

01Python编译器和编辑器下载

CHAPTER 5 自动发现、自动注册、分布式监控、SNMP监控

P5311 [Ynoi2011] 成都七中

树莓派超全系列教程文档--(61)树莓派摄像头高级使用方法

DeepSeek 赋能智慧能源：微电网优化调度的智能革新路径

Admin.Net中的消息通信SignalR解释

【网络安全产品大调研系列】2. 体验漏洞扫描

React Native在HarmonyOS 5.0阅读类应用开发中的实践

Android Bitmap治理全解析：从加载优化到泄漏防控的全生命周期管理

蓝桥杯3498 01串的熵

USB Over IP专用硬件的5个特点

安宝特案例丨Vuzix AR智能眼镜集成专业软件，助力卢森堡医院药房转型，赢得辉瑞创新奖

STM32HAL库USART源代码解析及应用