当前位置: 首页 > article >正文

Macro average 和 Weighted average【把每个类别的指标聚合成一个总体指标】

Macro average 和 Weighted average 是评价分类模型性能时常用的两种汇总方法它们本质上都是把每个类别的指标聚合成一个总体指标但对数据分布的敏感度不同。针对你的作物病害zero-shot分类项目它们的作用差异尤其重要。下面详细说明1.Macro Average宏平均定义对每个类别或每个作物先计算指标如准确率、F1然后简单平均。公式以准确率为例[\text{Macro Accuracy} \frac{1}{N} \sum_{i1}^{N} \text{Accuracy}_i](N) 是类别数或作物数每个类别/作物权重相等特点不受类别样本数量影响每个作物/类别同等重要。能暴露小样本类别的弱点在你的项目中sugarcane样本很多apple/potato样本少。如果只看加权平均小样本作物的低准确率可能被高样本作物掩盖。适合关注公平性或对所有类别一致性的任务。作用在你的项目中判断模型是否对每个作物都表现良好而不仅仅对样本量大的作物。用于验证“Simple模板略优于Enhanced”或“GCN收益普适性”避免被加权平均误导。2.Weighted Average加权平均定义每个类别/作物指标按其样本数量加权后求平均。公式以准确率为例[\text{Weighted Accuracy} \frac{\sum_{i1}^{N} n_i \cdot \text{Accuracy}i}{\sum{i1}^{N} n_i}](n_i) 是类别/作物 (i) 的样本数特点反映整体正确率多样本类别影响更大适合评估整体性能。可能掩盖小样本类别的低性能如果某个类别样本很少即使准确率很低对加权平均影响不大。适合生产环境关注总体准确率。作用在你的项目中当前报告使用加权平均结果被sugarcane等大样本作物主导。高加权平均可能掩盖apple/potato等小样本作物的严重问题导致误以为GCN在所有作物都有效。3.对比与选择特性Macro AverageWeighted Average样本量敏感性不敏感每个类别权重相等对样本量敏感大类别占主导反映的性能每个类别的公平表现总体准确率整体性能小样本类别弱点会被放大弱点可能被掩盖适用场景多类别不平衡关注公平性整体性能、生产环境在你项目中的作用发现apple/potato、tea低准确率问题展示整体benchmark表现加权平均51.52%结论Weighted average展示整体性能是报告中51.52%的指标来源。Macro average用于诊断每个作物的公平表现和潜在瓶颈尤其重要因为apple/potato、sugarcane等作物性能差异大。在你当前分析中必须计算Macro average否则结论可能误导“GCN整体有效”可能只是大样本作物带动的假象。

相关文章:

Macro average 和 Weighted average【把每个类别的指标聚合成一个总体指标】

Macro average 和 Weighted average 是评价分类模型性能时常用的两种汇总方法,它们本质上都是把每个类别的指标聚合成一个总体指标,但对数据分布的敏感度不同。针对你的作物病害zero-shot分类项目,它们的作用差异尤其重要。下面详细说明&…...

RPC超时原因

RPC 超时,3个方向:上游问题 下游问题 中间链路问题 一、上游(调用方)原因超时时间设太短 业务本身要 500ms,你超时只设 200ms,必超时。上游线程池耗尽 上游线程不够用,请求发不出去&#xff0…...

硬性条件全达标,入职3天就崩盘?DeepSeek深度拆解招聘伪胜任力陷阱:90%企业忽略的底层能力评估模型

为什么很多候选人简历上硬性条件完全符合岗位要求,入职后却很快暴露底层能力不足的问题?如何有效避免这种招聘失误?答:招聘中最大的陷阱莫过于"伪胜任力"现象——候选人表面条件完美匹配,实则缺乏支撑岗位长…...

ARM内核A核、R核和M核的异同点和应用场景

一、ARM内核A核、R核和M核的基本概念和异同点 ARM内核架构包括A核、R核和M核,它们各自具有不同的特点和应用场景: ARM Cortex-A核: 特点:Cortex-A核是ARM架构中的应用处理器核。它通常用于高性能计算和通用操作系统的执行&#…...

n8n 严重漏洞可导致RCE和存储凭据暴露

聚焦源代码安全,网罗国内外最新资讯!编译:代码卫士网络安全研究人员披露了位于n8n工作流自动化平台中的两个严重漏洞,它们可导致任意命令执行,现已修复。CVE-2026-27577(CVSS评分:9.4&#xff0…...

立创开源:基于N32G430与MPU6050的自行车RGB呼吸灯状态指示器设计与实现

立创开源:基于N32G430与MPU6050的自行车RGB呼吸灯状态指示器设计与实现 大家好,最近我把自己用了四年的自行车改装了一下,给它装上了一双会“呼吸”的眼睛。这是一个基于国产MCU N32G430和MPU6050六轴传感器的小装置,能根据你骑行…...

基于ESP32与多传感器融合的立创空气质量检测净化器DIY全攻略

基于ESP32与多传感器融合的立创空气质量检测净化器DIY全攻略 最近想给工作室弄个能实时监测空气质量的设备,市面上成品要么功能单一,要么价格不菲。正好看到立创开源平台上有位大佬分享了一个完整的空气质量检测净化器项目,功能非常全面&…...

QT径向渐变完全指南:从参数解析到高级特效(QRadialGradient详解)

QT径向渐变完全指南:从参数解析到高级特效 在UI设计领域,渐变效果一直是提升视觉层次感的利器。而QT框架中的QRadialGradient,更是让开发者能够轻松创建出令人惊艳的环形渐变效果。不同于常见的线性渐变,径向渐变以圆心为中心向外…...

ESP32端云协同语音助手:嵌入式AI交互系统设计与实现

1. 项目概述ESP32-AI语音助手是一个面向嵌入式边缘智能交互场景的软硬协同系统,其核心目标是将大语言模型(LLM)能力下沉至资源受限的MCU级平台,在不依赖手机或PC中转的前提下,实现端侧语音唤醒、语义理解、多模态响应与…...

Phi-4-mini-reasoning与Anaconda集成:数据科学工作流优化

Phi-4-mini-reasoning与Anaconda集成:数据科学工作流优化 1. 引言 如果你经常用Anaconda做数据分析,可能会遇到这样的情况:面对一堆复杂的数据,明明知道里面藏着有价值的信息,却不知道从哪里开始分析。或者遇到需要多…...

如何解决Windows系统AirPods功能缺失问题?AirPodsDesktop全方位增强方案实测

如何解决Windows系统AirPods功能缺失问题?AirPodsDesktop全方位增强方案实测 【免费下载链接】AirPodsDesktop ☄️ AirPods desktop user experience enhancement program, for Windows and Linux (WIP) 项目地址: https://gitcode.com/gh_mirrors/ai/AirPodsDes…...

RK3588-PPS GPIO 配置笔记总结

1. 概述 本文档详细介绍如何在 RK3588 平台上将 GPIO1_B1 配置为接收 PPS(Pulse Per Second,秒脉冲)信号,用于高精度时间同步。PPS 信号通常由 GPS 模块提供,可实现微秒级的时间同步精度。 2. 设备树配置 2.1 Pinctrl …...

GLM-OCR模型原理浅析:从卷积神经网络到Transformer的演进

GLM-OCR模型原理浅析:从卷积神经网络到Transformer的演进 最近在做一个文档识别的项目,需要从各种复杂的扫描件里提取文字信息。试了好几个开源方案,发现基于Transformer架构的OCR模型效果确实比传统方法强不少,尤其是对排版复杂…...

Qwen3-0.6B-FP8极速部署教程:Windows/Linux/macOS三端兼容方案

Qwen3-0.6B-FP8极速部署教程:Windows/Linux/macOS三端兼容方案 想在自己的电脑上跑一个大模型,但又担心配置不够、速度太慢?今天给大家介绍一个“小钢炮”级别的AI对话工具——基于Qwen3-0.6B-FP8模型的极速对话工具。它只有6亿参数&#xf…...

ST语言入门实战:从C语言到PLC控制的快速上手指南

ST语言实战:从C语言到工业控制的无缝迁移 如果你和我一样,是从C语言或者类似的通用编程语言领域转过来的,第一次接触ST语言时,可能会觉得既熟悉又陌生。熟悉的可能是那些IF、WHILE、:赋值符号,陌生的则是它运行的环境—…...

vue状态管理库vuex+pinia

文章目录vuexpiniavuex pinia...

为什么大多数 AI 失败,本质上是治理失败

过去几年,AI事故越来越多。AI聊天机器人输出违规内容推荐算法放大极端信息自动化系统做出错误决策AI客服给出危险建议很多公司把这些问题归结为:模型问题。但事实是:大多数 AI 失败,并不是模型失败。而是 治理失败。AI 失败的真实…...

【C++】一篇文章学会使用C++ 11 Lambda表达式

Lambda表达式的定义与设计初衷 什么是Lambda? Lambda是匿名函数(unnamed function),允许在代码中“就地定义、就地使用”,无需像普通函数那样先声明/定义再调用,也无需写函数对象(仿函数&#x…...

Source Han Serif CN:免费商用宋体的全方位应用指南

Source Han Serif CN:免费商用宋体的全方位应用指南 【免费下载链接】source-han-serif-ttf Source Han Serif TTF 项目地址: https://gitcode.com/gh_mirrors/so/source-han-serif-ttf 在设计领域,选择一款合适的字体往往是提升作品质感的关键一…...

5个技巧解决美的智能设备局域网控制难题

5个技巧解决美的智能设备局域网控制难题 【免费下载链接】midea_ac_lan Auto-configure and then control your Midea M-Smart devices (Air conditioner, Fan, Water heater, Washer, etc) via local area network. 项目地址: https://gitcode.com/gh_mirrors/mi/midea_ac_l…...

HY-MT1.5-1.8B优化升级:量化压缩至900MB,树莓派也能流畅运行

HY-MT1.5-1.8B优化升级:量化压缩至900MB,树莓派也能流畅运行 最近在折腾边缘设备上的AI应用,发现一个挺有意思的现象:很多号称“轻量级”的模型,真放到树莓派或者手机上一跑,要么内存爆了,要么…...

Starry Night Art Gallery效果展示:超现实构图中空间透视精度

Starry Night Art Gallery效果展示:超现实构图中空间透视精度 1. 引言:当代码遇见星空 想象一下,你走进的不是一个软件界面,而是一座深夜的美术馆。四周是深邃的墨蓝色墙壁,交互按钮闪烁着温润的金色光泽&#xff0c…...

7. GD32E230 SysTick滴答定时器:从寄存器配置到1ms精准延时实战

7. GD32E230 SysTick滴答定时器:从寄存器配置到1ms精准延时实战 大家好,我是老李,一个在嵌入式行业摸爬滚打了十几年的工程师。最近有不少朋友从STM32转战到国产的GD32平台,特别是GD32E230这款性价比很高的MCU,经常问我…...

腾讯优图Youtu-VL-4B-Instruct实战指南:图片理解与问答全流程

腾讯优图Youtu-VL-4B-Instruct实战指南:图片理解与问答全流程 1. 从一张图片开始,让AI看懂你的世界 想象一下,你手里有一张照片,可能是公司最新的销售数据图表,也可能是客户发来的产品设计图,或者是一张需…...

最优二叉查找树避坑指南:动态规划中的概率分配与子树合并陷阱

最优二叉查找树避坑指南:动态规划中的概率分配与子树合并陷阱 如果你在准备算法面试或者刷题时,曾经对着“最优二叉查找树”的题目发呆,感觉公式都懂,代码也能背,但一写就错,尤其是边界条件和概率累加总对不…...

Fish Speech 1.5企业知识库对接:Confluence/Notion文档自动语音化方案

Fish Speech 1.5企业知识库对接:Confluence/Notion文档自动语音化方案 1. 企业知识管理的新挑战与语音化机遇 现代企业面临着知识管理效率的痛点。Confluence和Notion中存储着大量宝贵的文档、培训材料和操作指南,但员工往往没有时间阅读这些文字内容。…...

Lite-Avatar形象库与Typora集成:技术文档自动化生成

Lite-Avatar形象库与Typora集成:技术文档自动化生成 1. 引言 技术文档编写一直是开发过程中的痛点。传统的文档编写方式需要手动整理代码、截图、说明文字,不仅耗时耗力,还容易出错。特别是当项目更新时,文档往往滞后于代码&…...

CLIP ViT-H-14图像编码服务实战:构建自有图像搜索引擎完整指南

CLIP ViT-H-14图像编码服务实战:构建自有图像搜索引擎完整指南 1. 项目介绍与核心价值 想象一下,你有一个包含数百万张图片的数据库,如何快速找到与某张图片相似的内容?传统的关键词搜索在这里完全失效,而基于内容的…...

ESP32-S3骑行码表设计:LVGL双缓冲与低功耗电源管理实战

1. 项目概述GPS-ESP32S3仪表盘是一款面向骑行场景的嵌入式便携式码表设备,以ESP32-S3R8为主控芯片,集成GNSS定位、电池管理、人机交互与数据记录功能。该设计并非通用型导航终端,而是聚焦于运动数据实时呈现与低功耗长期运行的工程实践&#…...

Python中finally的5个隐藏陷阱:为什么你的return值被偷偷修改了?

Python中finally的5个隐藏陷阱:为什么你的return值被偷偷修改了? 很多Python开发者都熟悉try...except...finally这个结构,知道finally块里的代码无论如何都会执行,常用于关闭文件、释放锁等资源清理工作。这听起来简单可靠&#…...