当前位置：首页 > news >正文

OpenCV机器学习（10）训练数据的一个核心类cv::ml::TrainData

news 2026/4/27 12:08:20

操作系统：ubuntu22.04
OpenCV版本：OpenCV4.9
IDE:Visual Studio Code
编程语言：C++11

算法描述

cv::ml::TrainData 类是 OpenCV 机器学习模块中用于表示训练数据的一个核心类。它封装了样本数据、响应（标签）、样本权重等信息，并提供了多种方法来创建和操作这些数据，以适应不同的机器学习算法需求。

主要功能

数据准备：允许你从原始数据创建训练数据对象。
支持多种任务：无论是分类、回归还是其他类型的任务，都可以使用 TrainData 来组织你的数据。
灵活的数据输入：支持直接从矩阵输入数据，也支持加载来自文件的数据。
数据分割：可以将数据集分割为训练集和测试集。

常用成员函数

创建 TrainData 对象
static Ptr create(InputArray samples, int layout, InputArray responses, InputArray varIdx=noArray(), InputArray sampleIdx=noArray(), InputArray sampleWeights=noArray(), InputArray varType=noArray())：
从给定的样本、响应和其他可选参数创建一个 TrainData 对象。
- samples：样本数据矩阵，每一行代表一个样本。
- layout：样本布局，可以是 ROW_SAMPLE 或 COL_SAMPLE，表示每个样本是按行还是按列存储。
- responses：每个样本对应的响应向量或矩阵。
获取数据信息
- int getNTrainSamples() const：获取训练样本的数量。
- int getNVars() const：获取变量（特征）的数量。
- Mat getSamples() const：返回所有样本。
- Mat getResponses() const：返回所有响应。
- Mat getSampleWeights() const：返回样本权重。
- Mat getTrainSampleWeights() const：返回训练集的样本权重。
数据分割
- void setTrainTestSplit(int count, bool shuffle=true)：根据指定的训练样本数量将数据集划分为训练集和测试集。
- void setTrainTestSplitRatio(double ratio, bool shuffle=true)：根据比例将数据集划分为训练集和测试集。
- Mat getTrainSamples() const：返回训练集的样本。
- Mat getTrainResponses() const：返回训练集的响应。
- Mat getTestSamples() const：返回测试集的样本。
- Mat getTestResponses() const：返回测试集的响应。

代码示例

#include <iostream>
#include <opencv2/ml.hpp>
#include <opencv2/opencv.hpp>using namespace cv;
using namespace cv::ml;
using namespace std;int main()
{// 准备训练数据Mat samples = ( Mat_< float >( 4, 2 ) << 0.5, 1.0, 1.0, 1.5, 2.0, 0.5, 1.5, 0.0 );Mat responses = ( Mat_< int >( 4, 1 ) << 0, 0, 1, 1 );// 使用TrainData创建训练数据对象Ptr< TrainData > trainData = TrainData::create( samples, ROW_SAMPLE, responses );// 打印样本数量和变量数量cout << "Number of training samples: " << trainData->getNTrainSamples() << endl;cout << "Number of variables: " << trainData->getNVars() << endl;// 分割数据集为训练集和测试集trainData->setTrainTestSplitRatio( 0.75, true );  // 按75%比例分割，shuffle=true表示随机打乱// 获取训练样本和响应Mat trainSamples   = trainData->getTrainSamples();Mat trainResponses = trainData->getTrainResponses();// 获取测试样本和响应Mat testSamples   = trainData->getTestSamples();Mat testResponses = trainData->getTestResponses();// 训练一个简单的SVM模型作为示例Ptr< SVM > svm_model = SVM::create();svm_model->setType( SVM::C_SVC );svm_model->setKernel( SVM::RBF );svm_model->setC( 1 );svm_model->setGamma( 0.5 );bool ok = svm_model->train( trainData );if ( ok ){// 对测试集中的样本进行预测float response = svm_model->predict( testSamples );cout << "The predicted response for the test sample is: " << response << endl;}else{cerr << "Training failed!" << endl;}return 0;
}

运行结果

Number of training samples: 4
Number of variables: 2
The predicted response for the test sample is: 1

OpenCV机器学习（10）训练数据的一个核心类cv::ml::TrainData

操作系统：ubuntu22.04 OpenCV版本：OpenCV4.9 IDE:Visual Studio Code 编程语言：C11 算法描述 cv::ml::TrainData 类是 OpenCV 机器学习模块中用于表示训练数据的一个核心类。它封装了样本数据、响应（标签）、样本权重…...

编程日记 2025/2/21 6:21:31

3.1 actor基本框架（c#的Akka.Actor模式）

1.最简单的一个框架代码如下（代码容易理解）： using System; using Akka.Actor; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading.Tasks; using System.Security.Cryptography.X509Certi…...

编程日记 2025/2/21 6:20:30

Git使用[同一电脑多个账户ssh-key的管理]

同一电脑多个账户ssh-key的管理现在遇到一个问题,我同一台电脑既要通过VPN访问内网的git也要访问对外释放的gitee,刚开始我直接把原来的SSH-key添加到内网的gitlab发现可以访问,但是后来再方位外网的gitee就出问题了,看来要换一种手段才行本文引用：https://cloud…...

编程日记 2025/2/21 6:19:28

使用Python结合`stable-baselines3`库（包含PPO和TD3算法）以及`gym`库来实现分层强化学习的示例代码

以下是一个使用Python结合stable-baselines3库（包含PPO和TD3算法）以及gym库来实现分层强化学习的示例代码。该代码将环境中的动作元组分别提供给高层处理器PPO和低层处理器TD3进行训练，并实现单独训练和共同训练的功能。代码实现 import g…...

编程日记 2025/2/21 6:18:27

【论文笔记】MambaGlue: Fast and Robust Local Feature Matching With Mamba

【引用格式】：Ryoo K, Lim H, Myung H. MambaGlue: Fast and Robust Local Feature Matching With Mamba[J]. arXiv preprint arXiv:2502.00462, 2025. 【网址】：https://arxiv.org/pdf/2502.00462 【开源代码】：https://github.com/uri-Ka…...

编程日记 2025/2/21 6:15:22

基于 Stanford CoreNLP 的中文自然语言处理

一、概述 Stanford CoreNLP 是斯坦福大学开发的一款强大的自然语言处理（NLP）工具，支持多种语言的文本处理，包括中文。本文将详细介绍如何使用 Stanford CoreNLP 实现中文文本的分词、词性标注、命名实体识别、句法分析等功能&…...

编程日记 2025/2/21 6:14:20

python 量化交易入门到提升详细教程，python量化交易教程

文章目录前言入门阶段1. 环境准备安装 Python选择开发环境安装必要的库 2. 金融数据获取3. 简单策略构建 - 移动平均线交叉策略进阶阶段1. 策略回测2. 风险管理3. 多因子策略4. 机器学习在量化交易中的应用5. 高频交易策略前言 Python 作为一门功能强大、易于学习且应用广泛…...

编程日记 2025/2/21 6:13:18

如何设置爬虫的访问频率？

设置爬虫的访问频率（即请求间隔）是确保爬虫稳定运行并避免对目标服务器造成过大压力的关键步骤。合理的访问频率不仅可以减少被目标网站封禁IP的风险，还能提高爬虫的效率。以下是一些设置爬虫访问频率的方法和最佳实践： 1. 使用s…...

编程日记 2025/2/21 6:11:15

前端循环全解析：JS/ES/TS 循环写法与实战示例

循环是编程中控制流程的核心工具。本文将详细介绍 JavaScript、ES6 及 TypeScript 中各种循环的写法、特性，并通过实际示例帮助你掌握它们的正确使用姿势。目录传统三剑客 for 循环 while 循环 do...while 循环 ES6 新特性 forEach for...of for...in 数组…...

编程日记 2025/2/21 6:10:14

大气体育直播模板赛事扁平自适应模板源码

源码名称：大气体育直播模板赛事网站源码开发环境：帝国cms 7.5 安装环境：phpmysql 模板特点： 程序伪静态版本，实时采集更新，无人值守，省心省力。带火车头采集，可以挂着自动采集发布…...

编程日记 2025/2/21 6:09:13

vue3学习1

vite是新的官方构建工具，构建速度比webpack更快 vue项目的入口文件是index.html，一般在这里引入src/main.js，并且设置好容器#app App.vue放的是根组件，components里放分支组件 vue组件中写三种标签，template & s…...

编程日记 2025/2/21 6:08:11

java机器学习计算指标动态阈值

java机器学习计算指标动态阈值最近听到有的人说要做机器学习就一定要学Python，我想他们掌握的知道还不够系统全面。本文作者以动态阈值需求场景给大家介绍几种常用Java实现的机器学习库，包括使用开源库如Weka或Deeplearning4j（DL4J&#xf…...

编程日记 2025/2/21 6:07:09

mac os设置jdk版本

打开环境变量配置文件 sudo vim ~/.bash_profile 设置不同的jdk版本路径 # 设置JAVA_HOME为jdk17路径 export JAVA_HOME$(/usr/libexec/java_home -v 17)# 设置JAVA_HOME为jdk8路径 export JAVA_HOME$(/usr/libexec/java_home -v 1.8) 设置环境变量 # 将jdk加入到环境变量…...

编程日记 2025/2/21 6:06:08

Python正则表达式学习

Python正则表达式全攻略一、正则表达式基础 1. 什么是正则表达式？ 用于描述字符串匹配规则的表达式广泛应用于文本处理、表单验证、数据清洗等领域 2. Python中的re模块 import re3. 基础语法字符说明示例.匹配任意字符(除换行)a.c → abc\d数字 [0-9]\d\d …...

编程日记 2025/2/21 6:05:06

ShenNiusModularity项目源码学习（10：ShenNius.FileManagement项目分析）

ShenNiusModularity项目支持七牛云和本地图片存储，其文件上传接口及实现就位于ShenNius.FileManagement项目内，该项目内文件不多，主要就是围绕上传本地及七牛云的实现及相关类定义。扩展类FileManagemenServiceExtensions的AddFileUploa…...

编程日记 2025/2/21 6:04:05

mysql查看binlog日志

mysql 配置、查看binlog日志： 示例为MySQL8.0 1、检查binlog开启状态 SHOW VARIABLES LIKE ‘log_bin’; 如果未开启，修改配置my.ini 开启日志安装目录配置my.ini(mysql8在data目录) log-binmysql-bin（开启日志并指定日志前缀&#xff…...

编程日记 2025/2/21 6:01:01

Node.js高频面试题精选及参考答案

目录什么是 Node.js？它的主要特点有哪些？ Node.js 的事件驱动和非阻塞 I/O 模型是如何工作的？为什么 Node.js 适合处理高并发场景？ Node.js 与传统后端语言（如 Java、Python）相比，有哪些优势和劣势？简述 Node.js 的运行原理，包括 V8 引擎的作用。什么是 Nod…...

编程日记 2025/2/21 5:59:59

TaskBuilder创建客户信息列表页面

3.4.1选择页面类型点击上面创建的customer文件夹右侧的加号，打开“前端资源创建向导”对话框，选中“数据查询TFP”，资源名称会自动设置为index，这里我们不用改。点“下一步”按钮，会弹出下图所示的“创建数据查询T…...

编程日记 2025/2/21 5:58:58

Linux Iptables示例一则

个人博客地址：Linux Iptables示例一则 | 一张假钞的真实世界关于Iptables的介绍个人强烈推荐：iptables-朱双印博客-第2页。这位兄弟介绍的很详细。我个人的需求是在同一个网络内从网络上把测试主机与正式环境主机间的网络进行隔离。我的思路是采用OU…...

编程日记 2025/2/21 5:56:55

新手小白如何挖掘cnvd通用漏洞之存储xss漏洞（利用xss钓鱼）

视频教程和更多福利在我主页简介或专栏里 （不懂都可以来问我专栏找我哦） 如果对你有帮助你可以来专栏找我，我可以无偿分享给你对你更有帮助的一些经验和资料哦目录： 一、XSS的三种类型： 二、XSS攻击的危害&#x…...

编程日记 2025/2/21 5:54:53

你的运放电路为啥会自己‘唱歌’？聊聊负反馈自激振荡那些事儿

运放电路为何会自激振荡？从啸叫现象到稳定设计的实战指南现象篇：当电路开始"唱歌" 调试台上传来刺耳的高频啸叫声——这是许多硬件工程师都经历过的"惊悚时刻"。上周五深夜，当我正在测试一款多级运放构成的麦克风前置放…...

编程新知 2026/4/27 10:55:53

《好写作AI：带你轻松解锁期刊论文的“学术翻译”密码，审稿人一眼就懂！》

“我的实验数据明明很漂亮，创新点也够，怎么每次都被审稿人说‘表达不清晰、逻辑欠连贯’？” 这是我在后台收到频率最高的私信之一，几乎每周都要回答好几次。问题到底出在哪？我想说的是——很多时候，问题不…...

编程新知 2026/4/27 10:45:37

飞书网页应用开发避坑指南：从500错误到成功部署，我踩过的那些坑（Flask环境配置篇）

飞书网页应用开发避坑指南：Flask环境配置的深度排错手册第一次在飞书开放平台尝试Python网页应用开发时，我盯着命令行里不断刷新的500错误日志，感觉就像在解一道没有提示的谜题。作为从传统Web开发转向企业级应用集成的开发者，飞…...

编程新知 2026/4/27 9:45:51

免费开源AMD Ryzen处理器深度调试工具：终极指南

免费开源AMD Ryzen处理器深度调试工具：终极指南【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://gitcode.…...

编程新知 2026/4/27 9:22:41

Alternative Frontends完整清单：从YouTube到Reddit的30+个无追踪前端

Alternative Frontends完整清单：从YouTube到Reddit的30个无追踪前端【免费下载链接】alternative-frontends 🔐🌐 Privacy-respecting web frontends for popular services 项目地址: https://gitcode.com/gh_mirrors/al/alternative-fro…...

编程新知 2026/4/27 6:20:13