当前位置：首页 > news >正文

前景物体提取

news 2026/2/11 0:21:08

参考：精选课：C++完整的实现双目摄像头图像采集、双目摄像头畸变矫正、前景物体提取、生成视差图、深度图、PCL点云图

前景物体提取是计算机视觉中的一个重要技术，可以用于视频监控、虚拟现实和计算机视觉等领域。

1.前景物体提取的原理

前景物体提取是将摄像机拍摄到的图像中的前景物体（如移动的人、车辆等）从背景中分离出来的过程。其原理是利用帧间差分和背景建模两个步骤。帧间差分是通过相邻帧之间像素点灰度值的差异来检测出运动目标，背景建模是通过不断更新背景图像来适应场景的变化。

2.实现步骤

步骤1：读取摄像机视频并初始化，使用OpenCV库来读取摄像机视频：

cv::VideoCapture cap(0);
if (!cap.isOpened()) {std::cout << "Cannot open camera" << std::endl;return -1;
}cv::Mat frame;
cap.read(frame);

步骤2：背景建模，定义一个背景图像和一个学习率，初始值为0.01。在每一帧中，将当前帧与背景图像相减，得到一个差分图像。

cv::Mat background;
double learning_rate = 0.01;// 第一帧作为背景图像
background = frame.clone();// 对于后面的帧，逐像素地计算背景图像
while (true) {cap.read(frame);// 将当前帧与背景图像相减，得到一个差分图像cv::Mat diff;cv::absdiff(frame, background, diff);// 根据差分图像更新背景图像for (int i = 0; i < diff.rows; i++) {for (int j = 0; j < diff.cols; j++) {cv::Vec3b pixel = diff.at<cv::Vec3b>(i, j);if (pixel[0] > 50 || pixel[1] > 50 || pixel[2] > 50) {// 更新背景像素cv::Vec3b background_pixel = background.at<cv::Vec3b>(i, j);cv::Vec3b frame_pixel = frame.at<cv::Vec3b>(i, j);background_pixel[0] = (1 - learning_rate) * background_pixel[0] + learning_rate * frame_pixel[0];background_pixel[1] = (1 - learning_rate) * background_pixel[1] + learning_rate * frame_pixel[1];background_pixel[2] = (1 - learning_rate) * background_pixel[2] + learning_rate * frame_pixel[2];background.at<cv::Vec3b>(i, j) = background_pixel;}}}
}

步骤3：帧间差分，将当前帧与背景图像相减，得到差分图像。然后将差分图像进行二值化处理，得到前景物体掩模。

// 帧间差分
cv::Mat diff;
cv::absdiff(frame, background, diff);// 二值化处理，得到前景掩模
cv::Mat foreground_mask;
cv::threshold(diff, foreground_mask, 50, 255, cv::THRESH_BINARY);

步骤4：过滤掉小的前景物体，使用形态学操作对前景掩模进行处理，去除噪声和小物体。

// 使用开运算去除噪声和小物体
cv::Mat kernel = cv::getStructuringElement(cv::MORPH_ELLIPSE, cv::Size(5, 5));
cv::Mat foreground_mask_filtered;
cv::morphologyEx(foreground_mask, foreground_mask_filtered, cv::MORPH_OPEN, kernel);

步骤5：显示结果，将原始图像和前景掩模相乘，得到只有前景物体的图像。

// 显示结果
cv::Mat result = frame.clone();
cv::Mat foreground_image = cv::Mat::zeros(frame.size(), frame.type());
frame.copyTo(foreground_image, foreground_mask_filtered);cv::imshow("Original Image", frame);
cv::imshow("Foreground Mask", foreground_mask_filtered);
cv::imshow("Foreground Image", foreground_image);cv::waitKey(30);

3.完整代码

演示了对单个摄像头的前景物体提取，双目摄像机需要对两个摄像头的同一幅图片场景分别做前景物体提取，然后作为左右视图对其进行进一步畸变矫正。

#include <iostream>
#include <opencv2/opencv.hpp>int main() {// 打开摄像机cv::VideoCapture cap(0);if (!cap.isOpened()) {std::cout << "Cannot open camera" << std::endl;return -1;}// 初始化cv::Mat frame;cap.read(frame);// 背景建模cv::Mat background;double learning_rate = 0.01;background = frame.clone();while (true) {// 读取帧cap.read(frame);// 背景建模cv::Mat diff;cv::absdiff(frame, background, diff);for (int i = 0; i < diff.rows; i++) {for (int j = 0; j < diff.cols; j++) {cv::Vec3b pixel = diff.at<cv::Vec3b>(i, j);if (pixel[0] > 50 || pixel[1] > 50 || pixel[2] > 50) {cv::Vec3b background_pixel = background.at<cv::Vec3b>(i, j);cv::Vec3b frame_pixel = frame.at<cv::Vec3b>(i, j);background_pixel[0] = (1 - learning_rate) * background_pixel[0] + learning_rate * frame_pixel[0];background_pixel[1] = (1 - learning_rate) * background_pixel[1] + learning_rate * frame_pixel[1];background_pixel[2] = (1 - learning_rate) * background_pixel[2] + learning_rate * frame_pixel[2];background.at<cv::Vec3b>(i, j) = background_pixel;}}}// 帧间差分cv::Mat diff2;cv::absdiff(frame, background, diff2);cv::Mat foreground_mask;cv::threshold(diff2, foreground_mask, 50, 255, cv::THRESH_BINARY);// 去除噪声和小物体cv::Mat kernel = cv::getStructuringElement(cv::MORPH_ELLIPSE, cv::Size(5, 5));cv::Mat foreground_mask_filtered;cv::morphologyEx(foreground_mask, foreground_mask_filtered, cv::MORPH_OPEN, kernel);// 显示结果cv::Mat result = frame.clone();cv::Mat foreground_image = cv::Mat::zeros(frame.size(), frame.type());frame.copyTo(foreground_image, foreground_mask_filtered);cv::imshow("Original Image", frame);cv::imshow("Foreground Mask", foreground_mask_filtered);cv::imshow("Foreground Image", foreground_image);cv::waitKey(30);}// 释放资源cap.release();cv::destroyAllWindows();return 0;
}

前景物体提取

参考：精选课：C完整的实现双目摄像头图像采集、双目摄像头畸变矫正、前景物体提取、生成视差图、深度图、PCL点云图前景物体提取是计算机视觉中的一个重要技术，可以用于视频监控、虚拟现实和计算机视觉等领域。 1.前景物体提取的原理前景…...

编程日记 2024/12/18 12:09:52

Kotlin复习

一、Kotlin类型 1.整数 2.浮点显示转换： 所有数字类型都支持转换为其他类型，但是转换前会检测长度。 toByte(): Byte toShort(): Short toInt(): Int toLong(): Long toFloat(): Float toDouble(): Double 不同进制的数字表示方法（为了提高…...

编程日记 2024/12/18 12:08:51

【AI日记】24.12.17 kaggle 比赛 2-6 | 把做饭看成一种游戏 | 咖喱牛肉

【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】【AI日记】工作参加：kaggle 比赛 Regression with an Insurance Dataset时间：9 小时睡得好很重要读书书名：富兰克林自传时间：0.5 小时阅读原因：100 美元纸…...

编程日记 2024/12/18 12:04:45

操作系统（14）请求分页

前言操作系统中的请求分页，也称为页式虚拟存储管理，是建立在基本分页基础上，为了支持虚拟存储器功能而增加了请求调页功能和页面置换功能的一种内存管理技术。一、基本概念分页：将进程的逻辑地址空间分成若干个大小相等的页&am…...

编程日记 2024/12/18 12:01:35

uniapp navigateTo、redirectTo、reLaunch等页面路由跳转方法的区别

uni.switchTab 跳转到 tabBar 页面，并关闭其他所有非 tabBar 页面 // app.json {"tabBar": {"list": [{"pagePath": "index","text": "首页"},{"pagePath": "other","text&…...

编程日记 2024/12/18 11:57:24

模型 A/B测试（科学验证）

系列文章分享模型，了解更多👉 模型_思维模型目录。控制变量法。 1 A/B测试的应用 1.1 Electronic Arts（EA）《模拟城市》5游戏网站A/B测试定义目标： Electronic Arts（EA）在发布新版《模拟城…...

编程日记 2024/12/18 11:54:21

谷歌发布升级版AI视频生成器Veo 2与图像生成器Imagen 3

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领…...

编程日记 2024/12/18 11:53:18

快速掌握源码部署Filebeat

文章目录 1. 裸金属安装1.1 压缩包方式安装1.2 yum方式安装 2. docker安装3. K8s安装项目使用了Filebeat，现在需要运行在ARM架构的服务器上，但是Filebeat官方没有提供，需要自己编译一份 filebeat等组件的源码地址 https://github.com/elasti…...

编程日记 2024/12/18 11:49:14

C++ 哈希表封装unordered_map 和 unordered_set

1.源码框架 SGI-STL30版本源代码中没有unordered_map和unordered_set，SGI-STL30版本是C11之前的STL 版本，这两个容器是C11之后才更新的。但是SGI-STL30实现了哈希表，只容器的名字是hash_map 和hash_set，他是作为⾮标准的容器出现…...

编程日记 2024/12/18 11:46:12

pymysql 入门

发现宝藏前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。【宝藏入口】。 1. 什么是 PyMySQL？ PyMySQL 是一个纯 Python 编写的 MySQL 客户端库，可以通过它轻松地在 Python 中连…...

编程日记 2024/12/18 11:41:04

Leecode刷题C++之形成目标字符串需要的最少字符串数①

执行结果:通过执行用时和内存消耗如下： 代码如下： class Solution { public:int minValidStrings(vector<string>& words, string target) {auto prefix_function [](const string& word, const string& target) -> vector<…...

编程日记 2024/12/18 11:39:01

Linux应用开发————mysql数据库

数据库概述什么是数据库(database)? 数据库是一种数据管理的管理软件，它的作用是为了有效管理数据，形成一个尽可能无几余的数据集合，并能提供接口，方便用户使用。数据库能用来干什么? 顾名思义，仓库就是用来保存东…...

编程日记 2024/12/18 11:35:57

4_使用 HTML5 Canvas API (3) --[HTML5 API 学习之旅]

4_使用 HTML5 Canvas API (3) --[HTML5 API 学习之旅] 1.缩放 canvas 对象在 <canvas> 中缩放对象可以通过 scale 方法来实现。这个方法会根据提供的参数对之后绘制的所有内容进行缩放。下面是两个具体的示例，展示如何使用 scale 方法来缩放 canvas 上的对…...

编程日记 2024/12/18 11:33:55

docker build次数过多，导致磁盘内存不足：ERROR: no space left on device

在使用 docker build 构建镜像时，Docker 会创建一个临时的构建上下文，生成镜像的过程中会产生多个中间层。这些文件和层会占用磁盘空间。构建完成后，如果你没有清理这些不再使用的中间层和临时文件，可能会导致磁盘空间不足。常见…...

编程日记 2024/12/18 11:31:53

LDO和DC-DC的区别、DCDC和LDO主要指标

LDO和DC-DC的区别 LDO外围器件少，电路简单，成本低；DC-DC外围器件多，电路复杂，成本高； LDO负载响应快，输出纹波小；DC-DC负载响应比LDO慢，输出纹波大； LDO效…...

编程日记 2024/12/18 11:29:50

LeetCode hot100-81

https://leetcode.cn/problems/climbing-stairs/description/?envTypestudy-plan-v2&envIdtop-100-liked 70. 爬楼梯已解答简单相关标签相关企业提示假设你正在爬楼梯。需要 n 阶你才能到达楼顶。每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶呢&…...

编程日记 2024/12/18 11:27:46

RTMP、RTSP、RTP、HLS、MPEG-DASH协议的简介，以及应用场景

实时视频传输协议 1. RTMP（Real Time Messaging Protocol） 简介：RTMP是由Adobe公司开发的实时消息传输协议，主要用于流媒体数据的传输。它基于TCP传输，具有低延迟、高可靠性的特点。特点：RTMP支持多种视…...

编程日记 2024/12/18 11:26:45

力扣-图论-15【算法学习day.65】

前言 ###我做这类文章一个重要的目的还是给正在学习的大家提供方向和记录学习过程（例如想要掌握基础用法，该刷哪些题？）我的解析也不会做的非常详细，只会提供思路和一些关键点，力扣上的大佬们的题解质量是非…...

编程日记 2024/12/18 11:24:38

“AI智慧数字孪生系统：开启智能新纪元

嘿，大家好！今天我想和大家聊聊一个特别酷炫的话题——AI智慧数字孪生系统。这可是个新鲜玩意儿，可能有些朋友还不太了解，别急，我来慢慢道来。首先，啥叫数字孪生呢？简单来说，就是给现…...

编程日记 2024/12/18 11:21:35

54、库卡机器人轴的软限位设置

步骤1：将用户组改为“专家”。步骤2：点击“投入运行”----“售后服务”-----“软件限位开关” 步骤3：就可以针对每个轴修改对应的角度值，然后点击“保存”。...

编程日记 2024/12/18 11:19:32

Unity3D中Gfx.WaitForPresent优化方案

前言在Unity中，Gfx.WaitForPresent占用CPU过高通常表示主线程在等待GPU完成渲染（即CPU被阻塞），这表明存在GPU瓶颈或垂直同步/帧率设置问题。以下是系统的优化方案： 对惹，这里有一个游戏开发交流小组&…...

编程新知 2026/2/7 17:31:44

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个医院挂号小程序

一、开发准备环境搭建： 安装DevEco Studio 3.0或更高版本配置HarmonyOS SDK申请开发者账号项目创建： File > New > Create Project > Application (选择"Empty Ability") 二、核心功能实现 1. 医院科室展示 /…...

编程新知 2025/9/5 12:16:40

376. Wiggle Subsequence 代码 class Solution { public:int wiggleMaxLength(vector<int>& nums) {int n nums.size();int res 1;int prediff 0;int curdiff 0;for(int i 0;i < n-1;i){curdiff nums[i1] - nums[i];if( (prediff > 0 && curdif…...

编程新知 2026/2/8 10:51:38

CocosCreator 之 JavaScript/TypeScript和Java的相互交互

引擎版本： 3.8.1 语言： JavaScript/TypeScript、C、Java 环境：Window 参考：Java原生反射机制您好，我是鹤九日！ 回顾在上篇文章中：CocosCreator Android项目接入UnityAds 广告SDK。我们简单讲…...

编程新知 2026/1/30 12:10:19

VTK如何让部分单位不可见

最近遇到一个需求，需要让一个vtkDataSet中的部分单元不可见，查阅了一些资料大概有以下几种方式 1.通过颜色映射表来进行，是最正规的做法 vtkNew<vtkLookupTable> lut; //值为0不显示，主要是最后一个参数，透明度…...

编程新知 2025/12/12 4:55:21

Spring Boot+Neo4j知识图谱实战：3步搭建智能关系网络！

一、引言在数据驱动的背景下，知识图谱凭借其高效的信息组织能力，正逐步成为各行业应用的关键技术。本文聚焦 Spring Boot与Neo4j图数据库的技术结合，探讨知识图谱开发的实现细节，帮助读者掌握该技术栈在实际项目中的落地方法。 …...

编程新知 2025/9/17 21:39:04

SpringTask-03.入门案例

一.入门案例启动类： package com.sky;import lombok.extern.slf4j.Slf4j; import org.springframework.boot.SpringApplication; import org.springframework.boot.autoconfigure.SpringBootApplication; import org.springframework.cache.annotation.EnableCach…...

编程新知 2026/2/2 0:35:08