当前位置：首页 > article >正文

OpenCV光流估计：原理、实现与应用

article 2026/2/8 3:10:11

一、什么是光流？

光流(Optical Flow)是计算机视觉中描述图像序列中像素运动模式的重要概念。它表示图像中物体在连续帧之间的表观运动，是由物体或相机的运动引起的。

光流的基本假设

亮度恒常性：同一物体点在连续帧中的亮度保持不变
时间持续性：运动随时间缓慢变化
空间一致性：邻近点有相似的运动

二、OpenCV中的光流算法

OpenCV提供了多种光流算法的实现，主要包括：

1. Lucas-Kanade方法

import cv2
import numpy as np# 读取视频
cap = cv2.VideoCapture('test.mp4')# 参数设置
feature_params = dict(maxCorners=100, qualityLevel=0.3, minDistance=7, blockSize=7)
lk_params = dict(winSize=(15,15), maxLevel=2, criteria=(cv2.TERM_CRITERIA_EPS | cv2.TERM_CRITERIA_COUNT, 10, 0.03))# 读取第一帧
ret, old_frame = cap.read()
old_gray = cv2.cvtColor(old_frame, cv2.COLOR_BGR2GRAY)
p0 = cv2.goodFeaturesToTrack(old_gray, mask=None, **feature_params)# 创建随机颜色
color = np.random.randint(0,255,(100,3))while(1):ret, frame = cap.read()if not ret:breakframe_gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)# 计算光流p1, st, err = cv2.calcOpticalFlowPyrLK(old_gray, frame_gray, p0, None, **lk_params)# 选择好的点good_new = p1[st==1]good_old = p0[st==1]# 绘制轨迹for i,(new,old) in enumerate(zip(good_new,good_old)):a,b = new.ravel()c,d = old.ravel()frame = cv2.line(frame, (a,b),(c,d), color[i].tolist(), 2)frame = cv2.circle(frame,(a,b),5,color[i].tolist(),-1)cv2.imshow('frame',frame)k = cv2.waitKey(30) & 0xffif k == 27:break# 更新前一帧和特征点old_gray = frame_gray.copy()p0 = good_new.reshape(-1,1,2)cv2.destroyAllWindows()
cap.release()

2. Farneback稠密光流

import cv2
import numpy as npcap = cv2.VideoCapture('test.mp4')ret, frame1 = cap.read()
prvs = cv2.cvtColor(frame1, cv2.COLOR_BGR2GRAY)
hsv = np.zeros_like(frame1)
hsv[...,1] = 255while(1):ret, frame2 = cap.read()if not ret:breaknext = cv2.cvtColor(frame2, cv2.COLOR_BGR2GRAY)# 计算稠密光流flow = cv2.calcOpticalFlowFarneback(prvs, next, None, 0.5, 3, 15, 3, 5, 1.2, 0)# 转换为极坐标mag, ang = cv2.cartToPolar(flow[...,0], flow[...,1])hsv[...,0] = ang*180/np.pi/2hsv[...,2] = cv2.normalize(mag, None, 0, 255, cv2.NORM_MINMAX)bgr = cv2.cvtColor(hsv, cv2.COLOR_HSV2BGR)cv2.imshow('frame2', bgr)k = cv2.waitKey(30) & 0xffif k == 27:breakelif k == ord('s'):cv2.imwrite('opticalfb.png',frame2)cv2.imwrite('opticalhsv.png',bgr)prvs = nextcap.release()
cv2.destroyAllWindows()

3. DeepFlow和DIS光流

OpenCV还提供了基于深度学习的DIS(Dense Inverse Search)光流算法：

# 初始化DIS光流
dis = cv2.DISOpticalFlow_create(cv2.DISOPTICAL_FLOW_PRESET_FAST)# 计算光流
flow = dis.calc(prev_frame, next_frame, None)

三、光流估计的应用

运动检测与跟踪：通过光流可以检测视频中的运动物体
视频稳定：利用光流估计相机运动并进行补偿
动作识别：分析人体关节点的光流模式来识别动作
自动驾驶：估计车辆自身运动和周围物体的运动
视频插帧：基于光流生成中间帧

四、光流估计的挑战与改进

光照变化：亮度恒常性假设在实际中常被违反
遮挡问题：物体被遮挡时难以追踪
快速运动：大位移运动难以捕捉
计算效率：实时性要求高的场景需要优化

改进方法：

使用深度学习模型如FlowNet、PWC-Net
多尺度处理
结合其他特征如深度信息

五、总结

OpenCV提供了丰富的光流估计算法实现，从经典的Lucas-Kanade到基于深度学习的方法。理解光流的基本原理并掌握OpenCV中的实现方法，能够为计算机视觉应用的开发奠定坚实基础。在实际应用中，需要根据具体场景选择合适的光流算法，并考虑其精度和效率的平衡。

OpenCV光流估计：原理、实现与应用

一、什么是光流？ 光流(Optical Flow)是计算机视觉中描述图像序列中像素运动模式的重要概念。它表示图像中物体在连续帧之间的表观运动，是由物体或相机的运动引起的。光流的基本假设亮度恒常性：同一物体点在连续帧中的亮度保持不变时间持…...

编程日记 2026/1/26 8:43:58

C语言经典笔试题目分析（持续更新）

1. 描述下面代码中两个static 各自的含义 static void func (void) {static unsigned int i; }static void func(void) 中的 static 作用对象：函数 func。含义： 限制函数的作用域（链接属性），使其仅在当前源文件&…...

编程日记 2026/1/26 11:41:36

AI工具分享篇 | recraft.ai + figma 复刻技术路线图

recraft 介绍 recraft.ai 主要生成和编辑适合网站、印刷和营销的各种风格的矢量艺术、图标、3d图像和插图。其矢量化功能可将路线图转化为一个矢量图。 recraft 的注册流程非常的简单，邮箱注册即可，无需科学上网，3分钟就能搞定。看不懂英文…...

编程日记 2026/1/29 18:37:07

部署安装jenkins.war（2.508）

实验目的：部署jenkins，并与gitlab关联bulid 所需软件：jdk-17_linux-x64_bin.tar.gz jenkins.war apache-tomcat-10.1.40.tar.gz 实验主机：8.10具有java环境,内存最少为4G，cpu双核目录 jdk安装 …...

编程日记 2026/1/30 14:22:21

JS手写代码篇---手写 Object.create

JS手写代码篇在做手写题的时候，我们要思考两个问题这个代码的作用是什么能够实现的效果是什么样子 1. 手写 Object.create 思路：创造一个对象，类似于Object.create()方法>将obj作为原型 // 手写 Object.create function create (ob…...

编程日记 2026/1/29 16:40:53

前端最新面试题及答案 (2025)

前端最新面试题及答案 (2025) JavaScript 核心 1. ES6+ 新特性问题: 请解释 ES6 中 let/const 与 var 的区别，以及箭头函数的特点。答案: let/const vs var: 作用域: let/const 是块级作用域，var 是函数作用域变量提升: var会提升变量，let/const不会(有暂时性死区) 重…...

编程日记 2026/1/24 23:55:05

视频编解码学习十二之Android疑点

一、android.view.SurfaceControl.setDisplaySurface的作用 android.view.SurfaceControl.setDisplaySurface 是 Android 系统中一个 native 层级别的 API，主要用于设置某个物理显示屏（Display）的输出 Surface，属于 SurfaceFlin…...

编程日记 2026/1/26 23:39:57

绘制时间对应的数据曲线

头文件#pragma once #include "ChartControl.h" #include <vector> #include "DBOperate.h&...

编程日记 2026/1/28 5:02:59

HTTP 请求中 Content-Type 头部

HTTP 请求中 Content-Type 头部可以设置的各种不同的传输格式。multipart/form-data 只是其中一种，主要用于传输包含文件的数据。以下是一些常见的 HTTP 请求体的 Content-Type 及其用途：常见的数据传输格式 (Content-Type) 列表： application/json: 描述: 用于传输 JSO…...

编程日记 2026/1/27 12:23:20

spring boot Controller 和 RestController 的区别

spring boot Controller 和 RestController 的区别 5.3.1常用注解 Spring MVC控制器中常使用的注解有如下几种。 Controller Controller 标记在类上。使用Controller 标记的类表示是Spring MVC的Controller对象。分发处理器将会扫描使用了该注解的类，并检测其中的…...

编程日记 2026/1/29 21:33:31

LeRobot 项目部署运行逻辑（七）—— ACT 在 Mobile ALOHA 训练与部署

全部流程为：硬件配置 -> 环境安装 -> 遥操作数据采集 -> 数据集可视化 -> 策略训练 -> 策略评估在之前的笔记中已经完成了绝大部分，最后再记录一下最后的训练部署，算是最简单的部分了目录 1 ACT 训练 2 ALOHA 部署 3 更…...

编程日记 2026/1/29 21:19:50

高频交直流电流测量技术：射频PA与MEMS测试的简单解决方案

随着5G通信和智能传感器技术的快速发展，传统电流测量手段已难以满足现代电子设备的测试需求。最新一代交直流混合测量探头通过突破性的技术创新，正在重新定义射频功率器件和微机电系统的测试标准。射频功率放大器测试新范式： 在5G基站等高…...

编程日记 2026/2/4 3:20:13

原生微信小程序 textarea组件placeholder无法换行的问题解决办法

【问题描述】微信小程序原生代码，使用文本域，placeholder使用\n 没有效果，网上找了一堆方案说使用也没有效果最后在一个前端大佬博客，找到解决办法，CSS设置word-wrap: break-word; white-space: pre-line; 【解决办…...

编程日记 2026/1/29 19:32:57

网络协议分析实验二 IP分片与IPv6

文章目录索引及重要内容实验2 IP 高级实验实验2.1 IPv4协议分片实验实验2.2 IPV6协议实验2.3 ARP初级索引及重要内容实验2 IP 高级实验实验2.1 IPv4协议分片实验 icmp的不可达报文实验2.2 IPV6协议实验2.3 ARP初级 arp –a 查看ARP缓存表内容 arp –s IP地址(格式&…...

编程日记 2026/1/29 18:11:59

QT6 源（101）篇一：阅读与注释 QPlainTextEdit，其继承于QAbstractScrollArea，属性学习与测试

（1） （2） （3）属性学习与测试 ： （4） （5） 谢谢...

编程日记 2026/1/29 21:18:00

【ROS2】编译Qt实现的库，然后链接该库时，报错：/usr/bin/ld: XXX undefined reference to `vtable for

【ROS】郭老二博文之：ROS目录 1、问题描述在ROS2工程中，编译使用Qt实现的库，在其它ROS2包链接该库时，报错： /usr/bin/ld: XXX undefined reference to `vtable for2、原因分析查看链接失败的几个函数接口都是，信号函数（signals 标记的函数）。因为信号函数都只有定…...

编程日记 2026/1/28 16:14:59

工业大数据的定义

目录工业大数据的定义工业大数据发展历程工业大数据的特征工业大数据的处理流程工业大数据在处理上面临的挑战工业大数据的有效处理方案工业大数据处理相关案例数益工联 x TDengine 中天钢铁 x TDengine 广州某企业工业互联网项目 x TDengine 格创东智 x TD…...

编程日记 2026/1/29 20:33:47

126.在 Vue 3 中使用 OpenLayers 实现绘制正方形、正三角形、正五边形

🗺️ 项目效果（先看效果）支持点击按钮绘制图形，效果如下： ✅ 正三角形 ✅ 正方形 ✅ 正五边形 ✅ 支持停止绘制 📌 前言在 Web GIS 的实际项目中，我们经常需要绘制一些规则的图形，比如：正方形、正三角形、正五边形等，这在标注地块、规划图形、布设区域等场景中都…...

编程日记 2026/1/30 16:03:00

大数据 vs. 小数据：AI项目中数据规模与质量的权衡之道

大数据 vs. 小数据：AI项目中数据规模与质量的权衡之道引言：数据时代的辩证法则在AI领域，一个根本性悖论日益凸显：数据规模与质量往往呈现此消彼长的关系。Google Brain团队的研究揭示，当数据规模增长10倍时&#x…...

编程日记 2026/1/26 22:43:03

互联网大厂Java求职面试实战：Spring Boot到微服务全景解析

💪🏻 1. Python基础专栏，基础知识一网打尽，9.9元买不了吃亏，买不了上当。 Python从入门到精通 2. 我的免费工具站： 欢迎访问 https://tools-6wi.pages.dev/ 😁 3. 毕业设计专栏，毕业…...

编程日记 2026/1/26 8:12:01

SQL Server中delete table和truncate table删除全表数据哪个快？

目录 1.TRUNCATE 2.DELETE 总结在 SQL Server 中，DELETE 和 TRUNCATE 都可以用来删除表中的数据，但它们执行的方式和性能影响是不同的。这里简要说明两者的区别以及哪个更快： 1.TRUNCATE 速度： TRUNCATE 是一个DDL&#xff…...

编程日记 2026/1/27 22:27:03

3DVR制作的工具或平台

3DVR（三维虚拟现实）是利用三维图像技术和虚拟现实技术，将真实场景进行三维扫描并转换成计算机可识别的三维模型，使用户能够在虚拟空间中自由漫游，体验身临其境的感觉。3DVR技术结合了全景拍摄和虚拟现实，提…...

编程日记 2026/1/29 16:24:05

qt QMessageBox 的详细解析

以下是关于 QMessageBox 的详细解析，涵盖其核心功能、使用方法、高级特性及常见场景示例。 1. QMessageBox 的核心作用 QMessageBox 是 Qt 中用于快速创建标准化对话框的类，常用于以下场景：信息提示（如操作成功/失败）。警告或错误通知（如文件未保存）。用户决策（如确认…...

编程日记 2026/1/25 2:23:07

高吞吐与低延迟的博弈：Kafka与RabbitMQ数据管道实战指南

摘要本文全面对比Apache Kafka与RabbitMQ在数据管道中的设计哲学、核心差异及协同方案。结合性能指标、应用场景和企业级实战案例，揭示Kafka在高吞吐流式处理中的优势与RabbitMQ在复杂路由和低延迟传输方面的独特特点；介绍了使用Java生态成熟第三方库（如Apache Kafka Clie…...

编程日记 2026/1/29 18:51:34

在 Spring Boot 中实现分库分表的全面指南

分库分表（Database Sharding）是一种数据库架构优化技术，通过将数据分散到多个数据库或表中，以应对高并发、大数据量场景，提升系统性能和扩展性。在 Spring Boot 中，分库分表可以通过框架支持（如…...

编程日记 2026/1/25 8:32:09

关于大语言模型的困惑度（PPL）指标优势与劣势

1. 指标本身的局限性与人类感知脱节： PPL衡量的是模型对词序列的预测概率（基于交叉熵损失），但低困惑度未必对应高质量的生成结果。例如： 模型可能生成语法正确但内容空洞的文本（PPL低但质量差）…...

编程日记 2026/1/26 22:04:32

如何使用WordPress SEO检查器进行实时内容分析

在这篇文章中，我们将带你从头开始了解如何在WordPress中使用SEO检查工具进行实时内容分析。这篇文章面向初学者，帮助你理解SEO的重要性以及如何通过工具提高文章的搜索引擎优化（SEO）效果。一、什么是SEO内容分析？ 内…...

编程日记 2026/1/29 20:50:40

C语言：深入理解指针（5）

目录一、回调函数二、qsort 使用举例三、模拟qsort 一、回调函数回调函数就是一个通过函数指针调用的函数。举个例子： int Add(int x, int y) {return xy; }void test(int (*pf)(int, int)) {int r pf(10 ,20);printf("%d\n" ,r); }int main()…...

编程日记 2026/1/30 14:11:33

前端如何获取电脑唯一编码

在前端开发中，出于安全和隐私的考虑，浏览器不允许直接获取硬件的唯一标识（如 MAC 地址、CPU 序列号等）。但可以通过以下方法生成设备指纹（Device Fingerprint），近似实现设备唯一标识&#xff1a…...

编程日记 2026/1/24 21:55:14