当前位置: 首页 > article >正文

【统计检验】T检验

统计检验必学T检验三种类型公式推导Python代码机器学习实战T检验是统计学、数据分析、机器学习中最常用、最基础的均值检验方法专门用来判断两组数据的均值是否存在显著差异。一、T检验到底是什么一句话看懂T检验 小样本、总体标准差未知时比较“均值是否有显著差异”的统计检验它要回答的核心问题两组数据的均值不一样是真的有差别还是只是随机误差适用场景样本量n 30小样本总体标准差未知数据近似服从正态分布只比较均值不比较方差二、T检验的三种核心类型必考必用T检验一共只有3种对应3种不同业务场景一定要分清1. 单样本 T 检验用途一组样本 和 已知总体均值 比较例子某班平均分是否显著不等于全校平均分公式tX‾−μ0s/n t \frac{\overline{X} - \mu_0}{s/\sqrt{n}}ts/n​X−μ0​​2. 独立样本 T 检验用途两组完全独立的样本比较例子男生成绩 vs 女生成绩新方法 vs 旧方法公式tX‾1−X‾2Sp1n11n2 t \frac{\overline{X}_1 - \overline{X}_2}{S_p \sqrt{\frac{1}{n_1}\frac{1}{n_2}}}tSp​n1​1​n2​1​​X1​−X2​​合并方差Sp(n1−1)s12(n2−1)s22n1n2−2 S_p\sqrt{\frac{(n_1-1)s_1^2(n_2-1)s_2^2}{n_1n_2-2}}Sp​n1​n2​−2(n1​−1)s12​(n2​−1)s22​​​3. 配对样本 T 检验用途同一组对象前后两次测量比较例子减肥前体重 vs 减肥后体重训练前成绩 vs 训练后成绩思路先算差值再对差值做单样本T检验三、T分布是什么和正态分布有什么区别T分布是小样本下的正态分布形状由自由度 df决定T分布特点对称、钟形和正态分布很像自由度越小尾部越厚更能容忍小样本波动自由度越大越接近标准正态分布自由度公式单样本dfn−1df n-1dfn−1独立样本dfn1n2−2df n_1n_2-2dfn1​n2​−2四、Python 代码1T分布与正态分布对比可视化importnumpyasnpimportscipy.statsasstatsimportmatplotlib.pyplotasplt# 生成x轴数据xnp.linspace(-5,5,100)# 计算不同分布的密度t2stats.t.pdf(x,df2)t10stats.t.pdf(x,df10)normstats.norm.pdf(x)# 绘图plt.figure(figsize(8,5))plt.plot(x,t2,labelt-distribution df2,cred)plt.plot(x,t10,labelt-distribution df10,cblue)plt.plot(x,norm,labelNormal,cgreen,linestyle--)plt.title(T分布 vs 正态分布)plt.xlabel(x)plt.ylabel(Density)plt.legend()plt.grid(alpha0.3)plt.show()五、Python 代码2独立样本T检验最常用模拟两组成绩判断是否有显著差异importnumpyasnpimportscipy.statsasstatsimportseabornassnsimportmatplotlib.pyplotasplt# 生成数据np.random.seed(0)group1np.random.normal(60,10,30)# 方法Agroup2np.random.normal(65,12,30)# 方法B# 独立样本T检验t_stat,p_valuestats.ttest_ind(group1,group2)print(fT 统计量:{t_stat:.4f})print(fP 值:{p_value:.4f})# 分布对比图plt.figure(figsize(8,5))sns.histplot(group1,colorblue,kdeTrue,labelGroup1,statdensity,bins10)sns.histplot(group2,colorred,kdeTrue,labelGroup2,statdensity,bins10)plt.title(两组数据分布对比)plt.legend()plt.show()结果怎么看p 0.05差异显著拒绝原假设p ≥ 0.05差异不显著不能拒绝原假设六、Python 代码3机器学习中的应用——特征选择T检验及其等价的F检验是分类任务特征筛选神器判断特征在不同类别间是否有显著差异。fromsklearn.datasetsimportload_irisfromsklearn.feature_selectionimportf_classiffromsklearn.linear_modelimportLogisticRegressionfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score# 数据集dataload_iris()X,ydata.data,data.target# 方差分析F检验等价于多分类T检验f_vals,p_valsf_classif(X,y)print(特征F值,f_vals.round(2))print(特征P值,p_vals.round(4))# 筛选显著特征p0.05X_selectedX[:,p_vals0.05]# 建模X_train,X_test,y_train,y_testtrain_test_split(X_selected,y,test_size0.3,random_state42)modelLogisticRegression()model.fit(X_train,y_train)accaccuracy_score(y_test,model.predict(X_test))print(f筛选后特征数{X_selected.shape[1]})print(f模型准确率{acc:.4f})七、T检验使用步骤万能流程明确问题单样本/独立样本/配对样本检验正态性T检验要求数据近似正态计算 t 统计量查看 p 值下结论p 0.05 → 差异显著p ≥ 0.05 → 差异不显著八、超清晰总结背诵版T检验 小样本、方差未知时的均值检验三种类型单样本、独立样本、配对样本T分布自由度越小越扁尾越大越接近正态看 p 值判断显著性p 0.05 显著机器学习用途特征选择筛选显著差异特征

相关文章:

【统计检验】T检验

统计检验必学:T检验|三种类型公式推导Python代码机器学习实战 T检验是统计学、数据分析、机器学习中最常用、最基础的均值检验方法,专门用来判断两组数据的均值是否存在显著差异。一、T检验到底是什么?(一句话看懂&…...

python微信小程序的基于Android的医院健康咨询平台 患者健康数据评估系统

目录实现计划概述系统架构设计后端开发(Python)微信小程序开发Android平台集成健康评估算法数据安全与合规测试与部署维护与更新项目技术支持可定制开发之功能创新亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作…...

动力域-BMS电池管理系统半实物仿真测试

分布式架构、高实时仿真的BMS半实物仿真测试系统...

【异常】OpenClaw 启动异常:插件路径丢失plugin: plugin path not found与未知渠道unknown channel id: feishu报错排查指南

在部署或升级 OpenClaw 网关时,由于本地依赖缺失或配置文件未同步更新,经常会遇到插件无法加载的异常。本文将针对典型的“飞书插件丢失”及“记忆组件缺失”报错提供完整的排查与解决思路。 一、报错内容 在启动 OpenClaw 时,控制台或日志输出如下 JSON 格式的异常提示: …...

TikTok引发算法竞赛,Meta与TikTok陷有害内容争议

算法竞赛下,Meta与TikTok有害内容增多举报人向BBC透露,TikTok凭借极具吸引力的短视频推荐算法颠覆社交媒体行业后,引发了算法竞赛。Meta和TikTok在对自家算法进行内部研究后发现,愤怒情绪能推动用户参与度,于是做出了一…...

【2026官方最新】贵州工商职业大学几点熄灯?早操晚自习全解

大学的日常作息直接关系到未来三年的生活幸福感。很多新生在填报志愿前都会好奇:学校管得严不严?作息时间是怎么安排的?为了解答大家的疑惑,本文根据2026年贵州工商职业学院官方最新发布的日常管理与作息制度,为您进行…...

Unity像素游戏精灵导入最佳实践

本文针对 Unity 2D 像素风格游戏,总结了一套从纹理导入到平台优化的完整工作流,帮你解决像素模糊、边缘黑边、碰撞不准、包体过大等常见问题,让你的像素资源在游戏中呈现最佳效果。一、前言在开发像素风格2D游戏时,纹理导入设置直…...

3年总结-构建企业或个人知识库踩的10大致命坑文章内容

说白了,很多人搞企业AI落地,以为花几十万买个大模型或者搞个牛逼的提示词,业务就能直接起飞。如果你有这个想法,那我劝你赶紧刹车,不然钱砸进去连个水花都听不见。AI就像你花重金招来的一个名校博士生,智商…...

三层电梯S7 - 1200 PLC与TP700触摸屏博途V15联机程序开发之旅

3三层电梯西门子S7-1200PLC和TP700触摸屏博途V15联机程序666,带自动升降功能,设计要求,开门等待5S最近搞了个三层电梯的项目,用的是西门子S7 - 1200 PLC搭配TP700触摸屏,在博途V15环境下开发程序,还带自动升…...

字符串对比-进阶题11

字符串对比 题目 问题描述给定两个仅由大写字母或小写字母组成的字符串(长度介于1到10之间),它们之间的关系是以下4种情况之一:1:两个字符串长度不等。比如 Beijing 和 Hebei2:两个字符串不仅长度相等,而且相应位置上的…...

OpenClaw 3.13 正式发布:新增 Chrome DevTools MCP、会话绑定、插件生态全面升级

OpenClaw 是一款强大的 AI 助手框架,支持多平台接入、浏览器自动化、代码执行等功能。近日,OpenClaw 3.13 版本正式发布,带来了多项重要更新。 🚀 重要新特性 1. Chrome DevTools MCP 支持 新增官方 Chrome DevTools MCP 附加模…...

MCGS配方功能学习

MCGS配方使用与一般触摸屏(例如西门子触摸屏)等不太一样,今天通过MCGS系统帮助手册,利用里面的脚本介绍,组态了MCGS配方的使用方法,通过脚本实现,确实比较灵活。...

管理者不做什么比做什么更重要

1. 不做管理上的极端派 “严格”与“宽容”之间找到平衡点:对事要严,对人要宽。 既要有原则、有底线,对错误坚决纠正,对工作严格要求;也要有人情味、有温度,体谅下属的难处,关心下属的成长 2.…...

探索基于龙贝格观测器的 PMSM 无传感器控制

该模型采用龙贝格观测器进行无传感器控制 其利用 PMSM 数学模型构造观测器模型,根据输出的偏差反馈信号来修正状态变量。 当观测的电流实现与实际电流跟随时, 可以从观测的反电势计算得到电机的转子位置信息,形成跟踪闭环估计。 龙伯格观测器…...

Nginx 的性能调优与深度监控

一、Nginx 性能调优(核心优化方向)通过优化配置充分利用硬件资源,减少资源浪费,提升并发处理能力和响应速度,涵盖基础配置、连接管理、缓存与压缩等关键维度。1. 基础环境与进程优化运行用户与组配置:避免使…...

2026年光伏构网核心服务商全景解析:五大技术路线如何重塑新型电力系统

在全球能源转型迈向纵深的关键节点,以风电、光伏为代表的新能源正加速从“补充能源”向“主力电源”跃迁。然而,高比例、强波动的新能源大规模并网,对传统电力系统的频率稳定、电压支撑与惯量响应能力构成前所未有的挑战。在此背景下&#xf…...

2026年3月18日人工智能早间新闻

各位读者,早上好。今天是2026年3月18日,星期三。欢迎收看人工智能早间新闻。昨日,从英伟达GTC大会到国内产业一线,人工智能领域释放出密集信号——算力竞赛正从地面延伸至太空,智能体加速从概念走向实干,而…...

【深度思考】用了 Cursor 之后,为什么我反而更焦虑了?——AI 时代的程序员生存法则

摘要:最近深度使用了 Cursor 等 AI 编程助手,效率提升的同时,却产生了一种“知识空心化”的危机感。本文记录了从“依赖 AI”到“重新审视基础”的心路历程,探讨了在 AI 辅助编程时代,程序员的核心竞争力究竟发生了什么…...

【晶振行业的未来演进蓝图】

在电子信息产业的精密运转体系中,晶振是当之无愧的“时间基准核心”,其性能直接决定着设备的同步精度与运行稳定性。随着5G向6G演进、AI算力爆发、智能驾驶普及等科技浪潮的推动,晶振行业正迎来技术突破与市场扩容的双重机遇,呈现…...

C++实现DNA互补链转换:从错误到正确的代码演变

引言在生物信息学中,DNA由四种碱基组成:腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和胞嘧啶(C)。根据碱基互补配对原则,A与T配对,G与C配对。给…...

实战爬虫对抗 · 第 2 篇:请求层对抗——用好 requests 打穿 80% 简单反爬

一、前情回顾:先把“长相”整对,再谈对抗在第 1 篇里,我们画了一张反爬全景图。请求层是最外圈的一道“身份证检查”:浏览器发的是一整套 Header Cookie 正常流程新手脚本只发一个裸 requests.get(url)很多时候,你压…...

《鸽姆智库商业计划书》GG3M Think Tank Business Plan

🕊️《鸽姆智库商业计划书》🕊️ GG3M Think Tank Business Plan(中英对照 国际标准版)📌 1. 执行摘要中文鸽姆智库是一家基于人工智能与知识工程的创新型智库平台,致力于为企业、政府机构与个人提供智能化…...

油茶果成熟度检测数据集VOC+YOLO格式264张2类别

注意数据集中图片110张是原图剩余为增强生成图片,主要采取旋转增强算法生成数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数):264标…...

315健康首选:告别锰超标,京尚纯陶瓷更放心

315重磅曝光:食品级不锈钢餐具乱象丛生,近7成锰含量超标。过量锰直接损伤神经系统,导致记忆力下降,尤其影响儿童大脑与身体发育,长期接触提升致癌风险。锅具天天接触高温食物,材质不过关,等于长…...

openclaw 使用亚马逊amazon-bedrock模型的配置方法

OPENCLAW默认不支持选择AWS上的amazon-bedrock模型,因此,要想用AWS上的模型,只能自行修改它的配置了。 1、增加亚马逊的令牌环境变量 在~/.openclaw/下创建一个.env环境变量文件 输入如下内容:注意键名区分大小写 AWS_ACCESS_KEY_…...

求大佬指导zynq Pl的quad spi 标准模式作为从机的配置

配置之后不知道什么原因,一直收到错误的数据。我的目的是使用zynq作为spi从机,接收2.6M左右的不定长数据,速率要求能达到30M...

2026 Temu卖家必看:终于被我研制出“核出高价”的方法!利润涨了,还不伤链接✨

引⾔📝做Temu的你是不是这样:每天提心吊胆等核价,一出价就心惊肉跳;平台一让降价就陷入两难——降了没利润,不降没流量;手动盯着改价累到emo🙍🏻,一不小心还亏本&#xf…...

OpenClaw 吾码小龙虾

🦞 Microi.OpenClaw 吾码小龙虾 让每一个人都能轻松拥有自己的 AI 智能助手 国内网络直连 无需额外网络工具 一键部署全套 AI 环境 秒级接入主流大模型 📖 简介 Microi.OpenClaw 吾码小龙虾 是 OpenClaw 的 一站式本地桌面管理平台,基于 …...

项目文章 | Nat Commun CUTTag+RNA-seq助力解析组蛋白乳酸化介导的增生性疤痕形成机制

增生性疤痕(hypertrophic scar, HS)是一种以成纤维细胞过度活化和细胞外基质异常沉积为特征的纤维增生性疾病。代谢重组(向有氧糖酵解转变)和组蛋白乳酸化修饰在多种纤维化疾病中被发现,但其在增生性疤痕中的具体作用和…...

如何在 iPhone/iPad 上恢复已删除的 PDF 文件

在日常使用 iPhone 或 iPad 的过程中,我们经常会保存各种 PDF 文件,例如学习资料、工作文档、电子书或合同。然而,误删 PDF 文件的情况也十分常见。许多用户只有在删除文件后才意识到它的重要性,然后开始寻找恢复方法。那么&#…...