【SPSS】基于因子分析法对水果茶调查问卷进行分析
🤵♂️ 个人主页:@艾派森的个人主页
✍🏻作者简介:Python学习者
🐋 希望大家多多支持,我们一起进步!😄
如果文章对你有帮助的话,
欢迎评论 💬点赞👍🏻 收藏 📂加关注+
目录
1.项目背景
2.项目简介
2.1数据集介绍
2.2技术工具
3.算法理论
4.实验过程
4.1数据探索
4.2因子分析
4.3因子命名
5.总结
摘要
随着时代的发展,人们对生活品质的要求不断提高,更加追求健康的生活方式。近年来,随着水果茶消费需求激增,将年轻消费者喜爱的水果饮品与中老年消费者偏好的茶以一种喜闻乐见的方式结合起来,开辟了传统茶饮的新市场。在传承与创新中,水果茶饮接受着消费浪潮的助推迅速崛起,越来越成为符合人群消费需求的新饮品品类。但目前水果茶饮品市场为使得水果茶茶饮从视觉效果上看起来更富有层次感,使口感和味道更加丰富,多数传统现制茶饮通过简单“堆料”来吸引消费者;且为了压缩原料成本,商家多使用水果罐头等水果加工品而不采用新鲜水果,使得消费者出于对原生本味和天然健康的追求难以被满足。本次实验使用因子分析对水果茶调查问卷中的一道量标题进行分析,最终用两个因子品质追求型和品牌效益型来表示量表题的9个因子。
1.项目背景
1.中国水果茶文化背景
中国是茶的故乡,无论是文人骚客的“琴棋书画诗酒茶”,还是普通百姓的“柴米油盐酱醋茶”,茶都是必不可少的。在中国饮食历史上,茶和果有着密切的联系。早在魏晋南北朝时期就出现了“茶果”这一名词,既指饮茶时以果为茶食,也指以果入茶的茶叶饮用方式。饮茶时用各种果品作为茶食在历代典籍中多有记载。《晋书》载,东晋桓温“每宴惟下七奠,拌茶果而已”。吴兴太守陆纳招待谢安将军时也只是“所设惟茶果而已”。唐代以后以果佐茶更为普遍,如韦应物“茶果邀真侣,觞酌洽同心”,陆游“瓜冷霜刀开碧玉,茶香铜碾破苍龙”都描述了以茶待客,以果伴茶的情景。以果入茶的茶叶饮用方式在魏晋南北朝就已形成,这是现代水果茶的雏形。以果品入茶的记载在元代杂剧中频繁出现,有茶中放乌梅煎制的“梅茶”、茶汤中加杏仁等果干的“杏汤”、加木瓜的“木瓜茶”、用荔枝调制的“荔枝膏茶”、以橙子的果肉调制的“金橙茶”等。可以说,元代用各种果品调制茶汤已经相当普遍。以果入茶的饮茶方式一直流传至今,果品越来越丰富,茶饮形式也越来越多样,逐渐形成现在的新式水果茶。
2.水果茶饮品已成为当代潮流
随着时代的发展,人们对生活品质要求不断提高,追求更加健康的生活方式,而饮品作为一种生活消费的必需品,也被人们赋予了更高要求与期望。在传承与创新中,新式茶饮接受着消费浪潮的助推迅速崛起,越来越成为符合人群消费需求的新饮品品类。而水果茶饮品因其以鲜果及原叶茶作为原材料的特点,极大满足了人们对饮品的口感丰富、原料健康的预期要求,受到了大量消费者的喜爱与追捧。
水果茶的大热也在于它打破了以往新老消费者市场的明显界限,将年轻消费者喜爱的水果饮品与中老年消费者偏好的茶以一种喜闻乐见的方式结合起来,开辟了传统茶饮的新市场。水果茶不仅将茶饮转变成为了一种“续命神器”,更让其成为了一种消费热点、社交文化。喜茶、奈雪、茶颜悦色等全国知名茶饮店不断推陈出新,开辟出一系列高颜值、好口感的水果茶产品板块,如以霸王桶装水果茶作为产品核心的凝萃水果茶,无一不在将水果茶推向潮流顶端,无一不在改变着人们对于茶饮的传统认知。现在,水果茶饮品在人们的生活中已经越来越常见、越来越受欢迎,甚至成为了中老年人尝鲜的首选饮品与年轻人“养生局”的必备饮品。针对消费市场的高需求,水果茶的品质也将面临更高考验,因此水果茶原料的品质以及新鲜程度严重影响着水果茶行业的发展。如何选择质优量大价格优惠的果品、茶品也成为了水果茶商家关注的核心问题。
2.项目简介
2.1数据集介绍
本次数据集来源于天池网,数据集是一份关于水果茶调查问卷中的一道量表题数据 ,共有1381条数据, 9个维度,每个维度值范围为1-5,具体信息如下表:
属性名称 | 数据类型 |
名称 | Int整数类型 值范围1-5 |
包装 | Int整数类型 值范围1-5 |
品质 | Int整数类型 值范围1-5 |
价格 | Int整数类型 值范围1-5 |
口味 | Int整数类型 值范围1-5 |
制作过程透明 | Int整数类型 值范围1-5 |
服务态度 | Int整数类型 值范围1-5 |
网络热度 | Int整数类型 值范围1-5 |
品牌效应 | Int整数类型 值范围1-5 |
2.2技术工具
SPSS数据分析软件
3.算法理论
因子分析(Factor Analysis)是一种数据简化的技术。它通过研究众多变量之间的内部依赖关系探求观测数据中的基本结构,并用少数几个假想变量来表示其基本的数据结构。这几个假想变量能够反映原来众多变量的主要信息。原始的变量是可观测的显在变量,而假想变量是不可观测的潜在变量,称为因子。
例如,在企业形象或品牌形象的研究中,消费者可以通过一个由24个指标构成的评价体系评价百货商城的24个方面的优劣。但消费者主要关心三个方面,即商店的环境、商店的服务和商品的价格。因子分析方法可以通过24个变量找出反映商店环境、商店服务水平和商品价格的3个潜在的因子,对商店进行综合评价。这3个公共因子可以表示为:
1.因子分析与主成分分析的区别
主成分分析仅仅是变量变换,而因子分析需要构造因子模型。
因子分析:潜在的假想变量和随机影响变量的线性组合表示原始变量。
主成分分析:原始变量的线性组合表示新的综合变量,即主成分。
因子分析数学模型
假设有P个变量X,有m个因子(m≤p),则因子分析的数学模型可以表示如下:
2.因子旋转
若因子分析中得出的各个因子有明确的含义,则因子分析的模型会更加易于解释和有实际意义。在因子分析中可以对因子载荷矩阵进行旋转,使每个变量仅在一个公共因子上有较大的载荷,而在其余的公共因子上的载荷比较小。通过旋转,因子可以有更加明确的含义。常用的一种方法是方差最大旋转。
3.因子得分及其计算
前面我们主要解决了用公共因子的线性组合来表示一组观测变量的有关问题。如果要使用这些因子做其他的研究,比如把得到的因子作为自变量来进行回归分析,对样本进行分类或评价,就需要计算每个个体在每个因子上的得分。
要计算因子得分,需要估计以下表达式:
4.因子分析的步骤
因子分析解决的3个基本问题:
因子载荷阵A的估计
当因子难以得到合理的解释时,对因子载荷阵进行正交变换,即因子旋转。对因子的实际意义做出合理的解释。
给出每个变量(或样品)关于m个公共因子的得分,通常表示为原始变量的线性组合,即因子得分函数。对公共因子做出估计。
因子分析的步骤:
(1)根据问题选取原始变量。
(2)求其相关阵R,探讨其相关性,
(3)从R求解初始公共因子F及其因子载荷矩阵A(主成分法)。
(4)因子旋转,分析因子的含义。
(5)计算因子得分函数。
(6)根据因子得分值进行进一步分析(例如综合评价)。
5.因子分析与主成分分析的区别和联系
(1)因子分析、主成分分析都是重要的降维方法(即数据简化技术),因子分析可以看作主成分分析的推广和发展。
(2)主成分分析不能作为一个模型来描述,它只能作为一般的变量变换,主成分是可观测的原始变量的线性组合。因子分析需要构造因子模型,公共因子是潜在的不可观测的变量,一般不能表示为原始变量的线性组合。
(3)因子分析是用潜在的、不可观测的变量和随机变量的线性组合来表示原始变量,即通过这样的分解来分析原始变量的协方差结构(相依关系)。
4.实验过程
4.1数据探索
首先使用SPSS软件打开数据集如下:
查看数据描述性统计
从描述性统计中我们可以看出每个变量的个数总计、最大最小值、合计总数、均值、标准差、方差、偏度和峰度等信息。
4.2因子分析
结果如下:
从描述性统计结果中我们可以看见每个变量的平均值、标准偏差、个案数等信息。
从相关性矩阵中可以看到,每个变量与每个变量之间的相关性高。如从表中可以看到包装与名称的相关系数是 0.530。从显著性值可以看每个变量与每个变量之间是否显著相关。如包装和名称的显著性0.000<0.05,说明这两个变量相关性显著。从表中发现全部的概率P值都是小于 0.05的,说明这些变量之间相关性显著。
KMO 检验统计量是用于比较变量间简单相关系数和偏相关系数的指标。主要应用于多元统计的因子分析。KMO 统计量是取值在0和1之间。0.9 以上表示非常适合;0.8 表示适合;0.7 表示一般;0.6 表示不太适合;0.5 以下表示极不适合。对于此实验的KMO值为0.846说明数据适合做因子分析。从巴特勒球形检验看出显著性水平为0,小于0.05,拒绝原假设,综合这两个结果,说明此数据很适合做因子分析。
从公因子方差表中可以看到提取值都比较高,表明变量中大部分信息能被因子所提取,说明因子分析结果有效。
总方差解释图表,也称主成分列表。一个因子所解释的方差比例越高,这个因子包含原有变量信息的量就越多。第一个成分的初始特征值为4.443能解释的方差比例为49.363%,第二个特征 值为1.326,能解释的方差比例为14.729。其余成分都小于1,说明这几个成分的解释力度还不如直接引入原变量大。这九个变量只需要提取出头两个成分即可。
碎石图中,从第二个成分以后的特征值就降得非常低。第二个成分就是这一图形的“拐点”。在这一实例中,只需要提取两个主要成分就行了。
表中列出未使用旋转方法时使用因子能解释的各个变量的比例(各变量的信息被主成分提取了多少)
表中列出了使用旋转方法后因子能解释的各个变量的比例。和上面未旋转对比可以看出,旋转后,原先较大的比例值仍然大,较小的比例则变得更小。
成分转换矩阵表,用来说明旋转前后主成份间的系数对应关系。
从旋转后的空间中的组件图中可以看到,网络热度、名称、品牌效应、包装属于一类成分,其余属于另外一类。
4.3因子命名
通过以上的因子分析,我们可以看出,品质、价格、口味、制作过程透明、服务态度归属到一类因子,我们可以命名为“品质追求型”;将名称、包装、网络热度、品牌效应命名为“品牌效益型”。
5.总结
通过本次因子分析实验,我们将一份关于水果茶调查问卷中的一道量表题9个维度的数据,最终用了两个因子来表示,用品质追求型因子来表示品质、价格、品味、制作过程透明和服务态度这几个因子,用品牌效益型来表示名称、包装、网络热度、品牌效应这几个因子。
资料获取,更多粉丝福利,关注下方公众号获取
相关文章:

【SPSS】基于因子分析法对水果茶调查问卷进行分析
🤵♂️ 个人主页:艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞Ǵ…...

ElasticSearch学习篇12_《检索技术核心20讲》基础篇
背景 学习极客实践课程《检索技术核心20讲》https://time.geekbang.org/column/article/215243 课程分为基础篇、进阶篇、系统案例篇 主要记录企业课程学习过程课程大纲关键点,以文档形式记录笔记。 内容 检索技术:它是更底层的通用技术,…...

Reids高频面试题汇总总结
一、Redis基础 Redis是什么? Redis是一个开源的内存数据存储系统,它可以用作数据库、缓存和消息中间件。Redis支持多种数据结构,如字符串、哈希表、列表、集合、有序集合等,并提供了丰富的操作命令来操作这些数据结构。Redis的主要特点是什么? 高性能:Redis将数据存储在内…...

19 - grace数据处理 - 补充 - 地下水储量计算过程分解 - 冰后回弹(GIA)改正
19 - grace数据处理 - 补充 - 地下水储量计算过程分解 - 冰后回弹(GIA)改正 0 引言1 gia数据处理过程0 引言 由水量平衡方程可以将地下水储量的计算过程分解为3个部分,第一部分计算陆地水储量变化、第二部分计算地表水储量变化、第三部分计算冰后回弹改正、第四部分计算地下…...

车载客流统计设备:双目3D还原智能统计算法的应用与优势
随着城市交通的日益繁忙和公共交通系统的不断完善,对公交车等交通工具的客流统计和分析变得越来越重要。传统的客流统计方法往往存在效率低下、精度不足等问题,难以满足现代城市交通管理的需求。而基于双目3D还原智能统计算法的车载客流统计设备…...

U盘无法打开?数据恢复与预防措施全解析
在日常生活和工作中,U盘已成为我们存储和传输数据的重要工具。然而,有时我们会遇到U盘无法打开的情况,这无疑给我们带来了诸多不便。本文将深入探讨U盘打不开的现象、原因及解决方案,并分享如何预防此类问题的发生。 一、U盘无法访…...

apollo版本更新简要概述
apollo版本更新简要概述 Apollo 里程碑版本9.0重要更新Apollo 开源平台 9.0 的主要新特征如下:基于包管理的 PnC 扩展开发范式基于包管理的感知扩展开发范式全新打造的 Dreamview Plus 开发者工具感知模型全面升级,支持增量训练 版本8.0版本6.0 Apollo 里…...

基于心电疾病分类的深度学习模型部署应用于OrangePi Kunpeng Pro开发板
一、开发板资源介绍 该板具有4核心64位的处理器和8TOPS的AI算力,让我们验证一下,在该板上跑深度学习模型的效果如何? 二、配网及远程SSH登录访问系统 在通过microusb连接串口进入开发板调试,在命令行终端执行以下命令 1&#…...

vue中axios的使用
1.get请求 axios.get(http://127.0.0.1:2333/show_course, {params: {param: choice} }) .then((response) > {this.list response.data; }) .catch((error) > {console.error(error); }); 2.post请求:当需要向服务器提交数据以创建新资源时使用。例如&…...

Spark SQL【Java API】
前言 之前对 Spark SQL 的影响一直停留在 DSL 语法上面,感觉可以用 SQL 表达的,没有必要用 Java/Scala 去写,但是面试一段时间后,发现不少公司还是在用 SparkSQL 的,京东也在使用 Spark On Hive 而不是我以为的 Hive O…...

文心智能体平台丨创建你的四六级学习小助手
引言 在人工智能飞速发展的今天,我们迎来了文心智能体平台。该平台集成了最先进的人工智能技术,旨在为用户提供个性化、高效的学习辅助服务。今天,我们将向大家介绍如何利用文心智能体平台,创建一个专属于你的四六级学习小助手。…...

js全国省市区JSON数据(全)
AreaJson 就是全国省市区的具体数据信息,下面我自定义了一些方法,获取数据用的,不需要的可以删掉,只拿JSON内的数据即可 const AreaJson [{"name": "北京市","city": [{"name": "…...

轻量级 C Logger
目录 一、描述 二、实现效果 三、使用案例 四、内存检测 一、描述 最近实现一个 WS 服务器,内部需要一个日志打印记录服务器程序的运行过程,故自己实现了一个轻量级的 logger,主要包含如下特征: 可输出 debug、info、warn、er…...

哪里能下载到合适的衣柜3D模型素材?
室内设计师在进行家居设计时,衣柜3D模型素材是非常重要的工具。那么,哪里能下载到合适的衣柜3D模型素材呢? 一、建e网: ①建e网是一个专注于3D模型素材分享的平台,上面可以找到大量的衣柜3D模型。 ②该网站提供的模型种类丰富&am…...

计算机毕业设计 | SpringBoot+vue仓库管理系统(附源码)
1,绪论 1.1 项目背景 随着电子计算机技术和信息网络技术的发明和应用,使着人类社会从工业经济时代向知识经济时代发展。在这个知识经济时代里,仓库管理系统将会成为企业生产以及运作不可缺少的管理工具。这个仓库管理系统是由:一…...

【Python】解决Python报错:TypeError: can only concatenate str (not “int“) to str
🧑 博主简介:阿里巴巴嵌入式技术专家,深耕嵌入式人工智能领域,具备多年的嵌入式硬件产品研发管理经验。 📒 博客介绍:分享嵌入式开发领域的相关知识、经验、思考和感悟,欢迎关注。提供嵌入式方向…...

大数据技术分享 | Kylin入门系列:基础介绍篇
Kylin入门教程 在大数据时代,如何高效地处理和分析海量数据成为了企业面临的挑战之一。Apache Kylin作为一个开源的分布式分析引擎,提供了Hadoop之上的SQL查询接口及多维分析(OLAP)能力,使得对超大规模数据集的分析变…...

程序猿转型做项目经理一定要注意这 5 个坑
前言 国内的信息系统项目经理,很多都是从技术骨干转型的,我就是这样一路走过来的,这样有很多好处,比如技术过硬容易服众、熟悉开发流程更容易把控项目进度和质量、开发过程中碰到难题时更好组织攻坚等等,但是所谓成也…...

【Python爬虫】案例_github模拟登录
import requests import re from datetime import datetimedef login():sessionrequests.session()session.headers {User-Agent :XXXX #写自己的}url1 https://github.com/loginres_1 session.get(url1).content.decode()token re.findall(name"authenticity_token&q…...

小红书图文笔记怎么做?纯干货!
小红书图文笔记的制作是一门艺术,它需要结合精美的图片和有价值的内容,以吸引和留住用户的注意力。伯乐网络传媒给大家分享制作小红书图文笔记的干货指南,包括准备、制作、发布和优化的各个环节。 一、准备阶段 确定目标受众:找到…...

RocketMQ .NET
RocketMQ 是一款由阿里巴巴集团开发并开源给Apache软件基金会的分布式消息及流处理平台。以其高吞吐量、低延迟、高可用性等特点而广受欢迎。支持Java,C, Python, Go, .NET等。 异步解耦:可以实现上游和下游业务系统的松耦合设计,使得服务部…...

知攻善防应急响应靶机训练-Web2
前言: 本次应急响应靶机采用的是知攻善防实验室的Web-2应急响应靶机 靶机下载地址为: https://pan.quark.cn/s/4b6dffd0c51a 相关账户密码 用户:administrator 密码:Zgsfqq.com 解题过程: 一、攻击者的IP地址(两个)…...

opencv进阶 ——(七)图像处理之寸照换背景
寸照换背景,通常指的是将个人证件照片的背景色更换为另一种颜色,如白色、蓝色或红色等,以满足不同用途的要求。例如,护照照片通常要求白色背景,而身份证照片可能需要蓝色背景。这个过程通常涉及到图像处理技术…...

每日复盘-20240529
20240529 六日涨幅最大: ------1--------300956--------- 英力股份 五日涨幅最大: ------1--------301361--------- 众智科技 四日涨幅最大: ------1--------301361--------- 众智科技 三日涨幅最大: ------1--------300637--------- 扬帆新材 二日涨幅最大: ------1--------30…...

mybatis问题汇总
Mapped Statements collection does not contain value for mapper.xml中namespace存在问题 使用 ${}实现关键字(表名、列名)的可变 #{} 和 ${} 的区别...

Kafka SSL认证
证书生成 在kafka安装目录下/certificates生成keystore和trust文件,在其中一台机器声生成证书,然后将 生成的server.keystore.jks和server.truststore.jks文件拷贝其他broker节点上去即可 1.生成keystore [rootm1 certificates]# keytool -keystore se…...

【Spring】认识 Spring AOP
认识 Spring AOP 1.什么是 AOP2.AOP 中的概念3.用 AOP 方式管理日志3.1 编写 AOP 日志注解类3.2 编写控制器用于测试 1.什么是 AOP AOP(Aspect Oriented Program,面向切面编程)把业务功能分为核心、非核心两部分。 核心业务功能:…...

什么是访问控制漏洞
什么是AC Bugs? 实验室 Vertical privilege escalation 仅通过隐藏目录/判断参数来权限控制是不安全的(爆破url/爬虫/robots.txt/Fuzz/jsfinder) Unprotected functionality 访问robots.txt 得到隐藏目录,访问目录 ,…...

python基于百度,哈工大等停用表进行的中文分词
import os import pandas as pd import jieba# 加载停用词 def load_stopwords(filenames):stopwords set()for filename in filenames:with open(filename, r, encodingutf-8) as f:for line in f:stopwords.add(line.strip())return stopwords# 中文分词并去除停用词 def se…...

【学习笔记】计算机组成原理(七)
指令系统 文章目录 指令系统7.1 机器指令7.1.1 指令的一般格式7.1.2 指令字长 7.2 操作数类型和操作类型7.2.1 操作数类型7.2.2 数据在存储器中的存放方式7.2.3 操作类型 7.3 寻址方式7.3.1 指令寻址7.3.1.1 顺序寻址7.3.1.2 跳跃寻址 7.3.2 数据寻址7.3.2.1 立即寻址7.3.2.2 直…...