当前位置：首页 > article >正文

Matlab中的均值函数mean

article 2026/3/23 22:16:59

今天调了一个代码里的bug，根源居然是mean函数的使用细节没留意到~

具体来说，写一个类似k均值聚类那样的程序，交替迭代，其中有一部是使用mean求一堆向量的均值，这些向量存在一个矩阵里，每行对应一个向量。若本次迭代的均值和上一次迭代的均值之差很小，则程序结束，跳出循环。

但调试时发现，这个程序会一直交替迭代，你设置迭代上线是多少次，它就迭代多少次。但很奇怪的是，聚类的结果迭代少量几次后就不再发生变化了。

后来查了一下，是跑出循环的条件一直不满足，因为均值向量出现了nan，因此前后两次迭代的均值向量相减，再求范数，结果也是nan，所以就无法跑出循环。

为什么会出现nan呢？

查了一下，原来是有些簇在迭代过程中没有样本属于它了，所以在更新簇中心时筛选出来的样本为空，直接对一个空矩阵求mean，就得到nan了。

那又有一个事情很奇怪了，为什么那些簇会没有样本属于它呢？在初始化那些簇中心时，我明明是直接使用了样本集中的某个样本，因此在更新时这个样本应该一直属于它才对呀？因为它和它自己的距离肯定是最小的，所以应该是在更新簇中心时出现了问题。

后来就查了一下，果然如此。对于Matlab中的mean函数来说，对于一个矩阵求mean时，默认是按行求均值，就是把各行向量加起来取均值。但是，若对于一个向量求mean时，不管是行向量还是列向量，都是将所有向量中的所有元素加起来求均值。我在更新簇中心时，有些簇只有一个样本，也就是一个行向量，这样用mean对它求均值，得到的不是它本身（程序本身所期望的结果），而是将这个行向量所有元素取平均，然后将这个标量值赋值给簇中心向量时，Matlab自动会将簇中心向量所有元素都赋值为这个平均值。因此，下一次更新时，这个簇的唯一样本与簇中心的距离将不再是零，就有可能被划分到其它簇里去了。

解决的办法也很简单，就是在更新簇中心时，判断一下属于当前簇的样本个数，如果大于1，每行一个样本，存成一个矩阵，直接对这个矩阵使用mean就行，反之若等于1，则直接将这个向量赋值给簇中心，不要使用mean。

更改后就不再有上述问题了。但进一步检查程序运行过程发现，确实会有初始化的簇在迭代过程中逐渐消失的现象，也就是有些簇慢慢地一个样本都不包含了。这也需要写代码时考虑一下。

一点小状况，记录一下，权当纪念。

Matlab中的均值函数mean

相关文章：

Matlab中的均值函数mean

数据结构知识学习小结

高精算法的用法及其优势

【Spring AOP】_切点类的切点表达式

多线程-定时任务线程池源码

初次使用 IDE 搭配 Lombok 注解的配置

云服数据存储接口：CloudSever

关于 QPalette设置按钮背景未显示出来的解决方法

上传文件到对象存储是选择前端还是后端

mysql下载与安装

Python练习(握手问题，进制转换，日期问题，位运算，求和)

小程序分类页面

HTML + CSS 题目

计算机视觉｜ViT详解：打破视觉与语言界限

Node JS 调用模型Xenova_all-MiniLM-L6-v2实战

React + TypeScript 实战指南：用类型守护你的组件

ASP.NET Core JWT认证与授权

【车规芯片】如何引导时钟树生长方向

突破传统：用Polars解锁ICU医疗数据分析新范式

《深度学习实战》第11集：AI大模型压缩与加速

golang进阶知识专项-理解值传递

OCPP与ISO 15118集成：实现即插即充与车网互动（V2G）- 慧知开源充电桩平台

大语言模型中温度参数（Temperature）的核心原理

K8s控制器Deployment详解

鸿蒙HarmonyOS评论功能小demo

基于PyTorch的深度学习3——基于autograd的反向传播

日期格式与字符串不匹配bug

打印三角形及Debug

大语言模型揭秘：从诞生到智能

Collab-Overcooked:专注于多智能体协作的语言模型基准测试平台