当前位置: 首页 > article >正文

Linux49:rockx读取单张图片并检测图片内人脸的矩形

rockx人脸检画框测大体流程本次代码主要实现如何通过rockx的框架进行人脸的检测并把人脸画出来。具体的流程如下总共分成四步第一步是初始化rockx人脸检测框架、第二步是读取人脸图片、第三步是调用rockx的人脸检测API对其进行人脸检测、第四步循环人脸数量并使用Opencv进行画框、第五步保存图像.1.初始化rockx人脸检测框架上图是初始化步骤首先要使用rockx_create_config分配rockx_config_t结构体并使用rockx_add_config把对应的rockx路径配置进去在我们的板子里面在/userdata/rockx_data里面并使用rockx_create创建rockx_handle_t句柄。2.读取人脸图片读取对应的人脸图片在rockx里面用rockx_image_read来读取对应的人脸图片。并把人脸的特征数据传入到rockx_image_t结构体里面。3.调用rockx的人脸检测API对其进行人脸检测调用rockx_face_detect对图片进行人脸检测这里的输入的是input_image这个是由rockx_image_read读取的图片数据输出的数据是rockx_object_array_t后面的数据则都是通过rockx_object_array_t来处理。4.循环人脸数量并使用Opencv进行画框循环人脸数量人脸数量是face_array.count。然后获取人脸的坐标属性这里的坐标属性就是left、top、w、h并用OPENCV把input_image转换成Mat矩阵(Mat tmp_img Mat(input_image.height, input_image.width, CV_8UC3, input_image.data))转换完成之后再使用rectangle把坐标转换成矩形。5.保存人脸检测的图片最后用imwrite保存人脸检测后的图片并使用rockx_destroy销毁rockx_handle_t。最后的效果可以看到周董的脸上就已经出现矩形检测的框框。/**************************************************************************** * * Copyright (c) 2017 - 2019 by Rockchip Corp. All rights reserved. * * The material in this file is confidential and contains trade secrets * of Rockchip Corporation. This is proprietary information owned by * Rockchip Corporation. No part of this work may be disclosed, * reproduced, copied, transmitted, or used in any way for any purpose, * without the express written permission of Rockchip Corporation. * *****************************************************************************/ #include stdio.h #include memory.h #include sys/time.h #include rknn_rockx_include/rockx_type.h #include rknn_rockx_include/utils/rockx_config_util.h #include rknn_rockx_include/utils/rockx_image_util.h #include rockx.h #include opencv2/opencv.hpp #include opencv2/imgcodecs.hpp using namespace cv; int main(int argc, char **argv) { const char * img_path argv[1]; rockx_config_t * face_detect_config rockx_create_config(); rockx_add_config(face_detect_config, ROCKX_CONFIG_DATA_PATH, /userdata/rockx_data/); rockx_handle_t face_detect_handle; rockx_ret_t rockx_ret; rockx_module_t face_rockx_module ROCKX_MODULE_FACE_DETECTION_V2; rockx_ret rockx_create(face_detect_handle, face_rockx_module, face_detect_config, 0); if(rockx_ret ! ROCKX_RET_SUCCESS) { printf(rockx_create failed...\n); return -1; } rockx_image_t face_rockx_image; rockx_image_read(img_path, face_rockx_image, 1); rockx_object_array_t face_array; rockx_ret rockx_face_detect(face_detect_handle, face_rockx_image, face_array, nullptr); if(rockx_ret ! ROCKX_RET_SUCCESS) { printf(rockx_face_detect failed...\n); return -1; } Mat rockx_face_mat Mat(face_rockx_image.height, face_rockx_image.width, CV_8UC3, face_rockx_image.data); for (int i 0; i face_array.count; i) { int left face_array.object[i].box.left; int top face_array.object[i].box.top; int w face_array.object[i].box.right - face_array.object[i].box.left; int h face_array.object[i].box.bottom - face_array.object[i].box.top; Rect boudingRect(left, top, w, h); rectangle(rockx_face_mat, boudingRect, Scalar(255,255,0),1); } imwrite(output_face_det.jpg, rockx_face_mat); rockx_destroy(face_detect_handle); return 0; }代码详解1.rockx_create_config()rockx_config_t* rockx_create_config(void);参数无返回值指向新创建的rockx_config_t配置对象的指针。作用创建一个空的配置对象用于后续设置RockX模块的运行参数。代码示例rockx_config_t * face_detect_config rockx_create_config();这行代码创建了一个名为face_detect_config的配置对象用来保存人脸检测模块的配置。2.rockx_add_config()rockx_ret_t rockx_add_config(rockx_config_t *config, const char *key, const char *value);参数config指向已创建的配置对象的指针。key配置项的键名是一个字符串。常用键为ROCKX_CONFIG_DATA_PATH用于指定模型数据文件的存放路径。value与key对应的配置项的值。返回值rockx_ret_t枚举值ROCKX_RET_SUCCESS表示成功其他值表示失败。作用向配置对象中添加具体的配置键值对。代码示例rockx_add_config(face_detect_config, ROCKX_CONFIG_DATA_PATH, /userdata/rockx_data/);这行代码设置了模型文件的查找路径为/userdata/rockx_data/。3.rockx_create()rockx_ret_t rockx_create(rockx_handle_t *handle, rockx_module_t m, void *config, size_t config_size);参数handlerockx_handle_t类型的指针用于接收创建成功的模块句柄。mrockx_module_t枚举类型指定要创建的模块功能。例如ROCKX_MODULE_FACE_DETECTION_V2V2版本的人脸检测模块。ROCKX_MODULE_OBJECT_DETECTION目标检测模块。config指向配置对象rockx_config_t的指针。config_size配置对象的大小通常传入0即可。返回值rockx_ret_t枚举值ROCKX_RET_SUCCESS表示成功其他值表示失败。作用根据指定的模块类型和配置初始化RockX模块并创建操作句柄。这是使用任何RockX功能前必须先完成的初始化步骤。这行代码创建了一个V2版本的人脸检测模块并将操作句柄保存在face_detect_handle中后续所有检测操作都通过此句柄进行。4.rockx_image_read函数原型rockx_ret_t rockx_image_read(const char *img_path, rockx_image_t *image, int flag);参数img_path图像文件的路径字符串。image指向rockx_image_t结构体的指针用于存储读取到的图像数据。flag读取图像的标志Flag通常1表示以彩色模式读取。返回值rockx_ret_t枚举值ROCKX_RET_SUCCESS表示成功其他值表示失败。作用从文件路径读取图像并将其数据填充到rockx_image_t结构体中。代码示例rockx_image_read(img_path, face_rockx_image, 1);这行代码读取argv[1]路径下的图像并将数据存入face_rockx_image结构体。5.rockx_image_t结构体定义这不是一个函数而是一个用于存储图像信息的关键结构体。成员width图像的宽度像素。height图像的高度像素。datauint8_t*类型的指针指向存储实际图像像素数据的连续内存块。pixel_format图像的像素格式如RGB、BGR等。作用作为RockX SDK内部传递图像数据的标准容器。代码示例Mat rockx_face_mat Mat(face_rockx_image.height, face_rockx_image.width, CV_8UC3, face_rockx_image.data);这行代码巧妙地利用了rockx_image_t的成员将其中的数据指针data、width和height共享给OpenCV的Mat对象避免了数据拷贝实现了零开销的格式转换。6.rockx_face_detect函数原型rockx_ret_t rockx_face_detect(rockx_handle_t handle, rockx_image_t *in_image, rockx_object_array_t *out_objects, void *extra);参数handle由rockx_create创建的人脸检测模块句柄。in_image指向rockx_image_t的指针为输入图像。out_objects指向rockx_object_array_t结构体的指针用于接收检测到的人脸数组。每个对象object[i]都包含一个box矩形框left,top,right,bottom。extra扩展参数通常设置为nullptr。返回值rockx_ret_t枚举值ROCKX_RET_SUCCESS表示成功其他值表示失败。作用对输入图像执行人脸检测并将检测结果如人脸位置框返回到out_objects中。代码示例这行代码对之前读取的图像face_rockx_image进行人脸检测检测到的人脸信息如位置、大小会被保存至face_array中。7.rockx_destroy函数原型rockx_ret_t rockx_destroy(rockx_handle_t handle);参数handle要销毁的RockX模块句柄。返回值rockx_ret_t枚举值ROCKX_RET_SUCCESS表示成功。作用销毁由rockx_create创建的RockX模块句柄并释放其占用的所有资源。这是一个必须调用的清理函数以防止内存泄漏。代码示例rockx_destroy(face_detect_handle);这行代码释放了face_detect_handle所关联的人脸检测模块资源。

相关文章:

Linux49:rockx读取单张图片并检测图片内人脸的矩形

rockx人脸检画框测大体流程本次代码主要实现如何通过rockx的框架进行人脸的检测,并把人脸画出来。具体的流程如下:总共分成四步,第一步是初始化rockx人脸检测框架、第二步是读取人脸图片、第三步是调用rockx的人脸检测API对其进行人脸检测、第…...

Lowkey:基于Docker Compose的轻量级本地开发环境解决方案

1. 项目概述:一个为开发者打造的轻量级本地开发环境最近在和一些独立开发者朋友聊天时,发现一个挺普遍的现象:大家手头的项目越来越多,每个项目依赖的环境、数据库、中间件版本都不一样。在本地机器上装一堆Docker、配各种环境变量…...

AI 的“打字机效果”到底怎么实现?从我的聊天项目说起

从项目中学习 NDJSON 流式协议本文基于 X-Chat 项目中的 AI 流式回复链路整理。项目由 Vue3 前端、Spring Boot 主后端、FastAPI AI 服务组成。本文重点讲清楚一个问题:Python AI 服务如何一边生成答案,一边把内容传给 Java 后端,再实时显示到…...

AI智能体记忆架构设计:从分层模型到工程实践

1. 项目概述:从“记忆”视角重构智能体架构最近在折腾AI智能体项目时,我遇到了一个几乎所有开发者都会头疼的经典问题:智能体“记性”太差。一个会话稍微长点,或者任务稍微复杂点,它要么忘了上下文,要么把关…...

Qt 容器实战:用 QMap<QString, QList<T>> 实现一对多关系映射

在 Qt 开发中,经常遇到一个分类对应多个条目的场景,比如: 设置面板中"网络"分类下有多个配置项 商品系统中"电子产品"分类下有多个商品 权限系统中"管理员"角色有多个权限点 这类一对多关系,用 QMap<QString, QList<T>> 是极为优…...

Awesome-OpenAI-GPTs:GPTs生态的策展地图与提示词工程实战指南

1. 项目概述&#xff1a;为什么我们需要一个“Awesome-Openai-GPTs”&#xff1f;如果你最近也在捣鼓GPTs&#xff0c;那你肯定和我一样&#xff0c;经历过一个阶段&#xff1a;打开GPTs商店&#xff0c;面对琳琅满目的应用&#xff0c;却感觉无从下手。官方的推荐和分类有时候…...

Git Worktree Manager:多分支并行开发的高效解决方案

1. 项目概述与核心价值如果你和我一样&#xff0c;日常需要在同一个Git仓库的不同分支之间频繁切换&#xff0c;同时处理多个并行任务——比如一边修复线上紧急bug&#xff0c;一边开发新功能&#xff0c;一边还要评审同事的代码——那你一定体会过那种在分支间反复git stash、…...

构建高性能链上数据同步工具:以HyperLiquid为例的量化交易数据基础设施实践

1. 项目概述&#xff1a;当高频交易遇见链上数据如果你在加密货币量化交易领域摸爬滚打过一段时间&#xff0c;尤其是涉足过像HyperLiquid这样的高性能永续合约DEX&#xff0c;那你一定对“数据”这两个字有切肤之痛。行情数据、订单簿数据、账户状态、交易历史……这些信息是策…...

技术项目学习指南:从初学者到高级开发者的实战项目推荐

技术项目学习指南&#xff1a;从初学者到高级开发者的实战项目推荐 一、项目概述 本文精选了10个不同难度层次的技术项目&#xff0c;涵盖前端、后端、数据分析、移动开发等多个技术领域。每个项目都包含明确的学习目标、核心技术栈、适合阶段以及预期学习成果&#xff0c;帮助…...

AI智能体长时记忆解决方案:agent-recall架构设计与工程实践

1. 项目概述&#xff1a;一个为AI智能体打造的“记忆宫殿”最近在折腾AI智能体&#xff08;Agent&#xff09;的开发&#xff0c;一个绕不开的痛点就是“记忆”问题。你肯定也遇到过&#xff1a;让智能体帮你写个周报&#xff0c;它记得你上周干了啥&#xff0c;但完全忘了上个…...

没事,学习一下node.js,从安装mysql开始哈...

...

量子计算中的离散拉普拉斯算子与块编码技术

1. 量子计算中的离散拉普拉斯算子基础离散拉普拉斯算子是科学计算和量子算法中的核心数学工具。在经典计算领域&#xff0c;拉普拉斯算子广泛用于求解偏微分方程、图像处理和流体力学模拟等问题。当我们将这些经典问题迁移到量子计算框架时&#xff0c;如何高效地表示和处理离散…...

基于AI与Remotion的短视频自动化生成引擎实战指南

1. 项目概述&#xff1a;从零构建一个AI驱动的短视频生成引擎如果你和我一样&#xff0c;对TikTok、YouTube Shorts上那些由AI语音驱动、画面快速切换的“洗脑”短视频&#xff08;俗称“brainrot”内容&#xff09;感到既好奇又手痒&#xff0c;想自己动手做一个&#xff0c;那…...

OramaCore:一体化AI应用运行时引擎部署与开发实战指南

1. 项目概述&#xff1a;一站式AI应用运行时引擎如果你正在构建一个需要结合搜索、推理和智能对话的应用&#xff0c;比如一个智能客服、一个内部知识库问答系统&#xff0c;或者一个能理解复杂查询的文档分析工具&#xff0c;那么你很可能需要同时部署和维护好几个组件&#x…...

基于MCP协议构建AI数据预言机:安全获取链下实时数据

1. 项目概述&#xff1a;一个为AI应用提供实时数据源的“预言机”如果你正在开发一个需要实时获取外部数据的AI应用&#xff0c;比如一个能告诉你最新加密货币价格的聊天机器人&#xff0c;或者一个能分析社交媒体情绪的智能助手&#xff0c;你很快就会遇到一个核心难题&#x…...

mysql升级时如何使用Ansible进行自动化部署_mysql自动化管理

MySQL升级前须验证Ansible变量和目录权限&#xff1a;检查mysql_data_dir、mysql_conf_file路径及/var/lib/mysql属主&#xff1b;mysql_package_name需匹配系统包名&#xff1b;升级包需放files/并校验sha256&#xff1b;用shell模块执行mysql_upgrade并预置login-path&#x…...

VSCode原生指针优化:Electron应用CSS样式修改实战

1. 项目概述&#xff1a;为什么我们需要“原生”的鼠标指针&#xff1f;作为一名长期与代码编辑器打交道的开发者&#xff0c;我几乎每天有超过8小时的时间是在Visual Studio Code&#xff08;以下简称VSCode&#xff09;中度过的。久而久之&#xff0c;一个看似微小、却异常“…...

Codesight:为AI编码助手生成结构化项目地图,节省91倍Token成本

1. 项目概述&#xff1a;你的AI编码助手&#xff0c;别再浪费token了如果你用过Claude Code、Cursor或者GitHub Copilot&#xff0c;肯定遇到过这种情况&#xff1a;你刚打开一个新项目&#xff0c;想让它帮你改个功能&#xff0c;结果它上来就是一句“让我先看看你的代码结构”…...

基于RAG的智能问答助手:Next.js与LangChain构建企业知识库应用

1. 项目概述&#xff1a;一个为机构量身定制的智能问答助手如果你是一家创意机构、咨询公司或任何以项目交付为核心的服务商&#xff0c;你肯定遇到过这样的场景&#xff1a;潜在客户发来询问&#xff0c;想知道你们是否做过类似的项目&#xff0c;或者有没有相关的经验。传统的…...

ARMv8 AArch64 ID寄存器解析与系统编程实践

1. AArch64 ID寄存器体系解析在ARMv8架构中&#xff0c;AArch64通过一组特殊的系统寄存器来标识处理器实现的指令集特性和功能扩展&#xff0c;这些寄存器统称为ID寄存器。作为系统程序员&#xff0c;理解这些寄存器的编码机制和使用方法&#xff0c;对于编写高性能、可移植的系…...

从零调试一个逆变电源:我在单片机与FPGA通信、SPWM生成和ADS8688采样上踩过的坑

从零调试一个逆变电源&#xff1a;我在单片机与FPGA通信、SPWM生成和ADS8688采样上踩过的坑 去年夏天接手一个光伏逆变器项目时&#xff0c;我完全没料到会在混合信号系统调试中经历这么多"惊喜"。当示波器上第一次出现畸变的SPWM波形时&#xff0c;我才真正理解教科…...

嵌入式开发中的字节序问题与跨平台解决方案

1. 嵌入式开发中的字节序问题解析第一次在嵌入式项目中遇到字节序问题是在2015年&#xff0c;当时我们团队将一个原本运行在PowerPC架构&#xff08;大端序&#xff09;的工业控制程序移植到x86平台&#xff08;小端序&#xff09;。本以为只是简单的重新编译&#xff0c;结果设…...

PHP怎么用parse_url拆解URL各部分【方法】

...

三步解锁网盘直链下载:告别繁琐的智能助手方案

三步解锁网盘直链下载&#xff1a;告别繁琐的智能助手方案 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 &#xff0c;支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云盘 / …...

茉莉花插件完整指南:如何让Zotero中文文献管理效率大幅提升

茉莉花插件完整指南&#xff1a;如何让Zotero中文文献管理效率大幅提升 【免费下载链接】jasminum A Zotero add-on to retrive CNKI meta data. 一个简单的Zotero 插件&#xff0c;用于识别中文元数据 项目地址: https://gitcode.com/gh_mirrors/ja/jasminum 茉莉花(Ja…...

Python+OpenCV实现人脸追踪鼠标:从Haar级联到坐标映射的实战教程

1. 项目概述与核心思路那天下午&#xff0c;我盯着电脑屏幕&#xff0c;突然冒出一个想法&#xff1a;能不能用我的脸来控制鼠标光标&#xff1f;不是那种需要昂贵硬件或复杂传感器的方案&#xff0c;就用手边最普通的网络摄像头。这个念头一旦产生就挥之不去&#xff0c;于是就…...

使用 ESP8266 + Arduino IDE + ST7789 240*240 OLED 显示屏实现显示“Hello World!”

我会带你从零开始&#xff0c;从安装 Arduino、配置 ESP8266 环境、接线、安装库到最终显示 Hello World&#xff0c;全程一步到位&#xff0c;新手也能直接成功。 一、准备工具与材料 开发板&#xff1a;ESP8266MOD&#xff08;ESP-12F / ESP-07 等通用&#xff09;显示屏&a…...

风险投资中非正式社交的价值:从人际网络到融资策略

1. 风险投资圈的“非典型”社交场&#xff1a;从玫瑰木酒店谈起如果你在硅谷的科技圈待过一阵子&#xff0c;尤其是和创业、融资打过交道&#xff0c;那你一定对门洛帕克的沙丘路不陌生。这条看似普通的街道&#xff0c;是全球风险资本最密集的神经中枢&#xff0c;无数改变世界…...

基于MCP协议与Apify的英国企业合规智能查询引擎实战指南

1. 项目概述&#xff1a;一个为AI工作流赋能的英国企业合规智能引擎如果你在金融、法律、供应链或者风控领域工作&#xff0c;那么“查公司”这件事对你来说一定不陌生。无论是引入一个新的供应商&#xff0c;还是评估一个潜在的商业伙伴&#xff0c;你都需要打开一堆政府网站&…...

jieba-analysis(Java 版结巴分词)

jieba-analysis&#xff08;Java 版结巴分词&#xff09;虽然只有 9 个核心类&#xff0c;但它完整复现了 Python jieba 的三大分词模式&#xff0c;并高效实现了中文分词的核心流程。下面我用技术拆解 代码逻辑映射的方式&#xff0c;告诉你它到底做了哪些事&#xff1a;✅ 一…...