【数据分析实战】冰雪大世界携程景区评价信息情感分析采集词云
文章目录
- 引言
- 数据采集
- 数据集展示
- 数据预处理
- 数据分析
- 评价总体情况分析
- 本人浅薄分析
- 各游客人群占比分析
- 本人浅薄分析
- 各评分雷达图
- 本人浅薄分析
- 差评词云-可视化
- 本人浅薄分析
- 好评词云-可视化
- 本人浅薄分析
- 综合分析
- 写在最后
今年冬天,哈尔滨冰雪旅游"杀疯了",在元旦假期更是被南方游客"包场"。据哈尔滨市文化广电和旅游局提供大数据测算,截至元旦假日第3天,哈尔滨市累计接待游客304.79万人次,实现旅游总收入59.14亿元。游客接待量与旅游总收入达到历史峰值。
“不是北欧去不起,而是哈尔滨更有性价比。”
“零下二十摄氏度,我在哈尔滨当‘俄式公主’。”
引言
最近几天,哈尔滨冰雪大世界也屡登社交平台热搜榜。
12月18日上午,第二十五届哈尔滨冰雪大世界开园,不到3小时,预约游玩人数已达40000人。火爆之下,游客现场大喊“退票”的视频却在网络热传。据悉,冰雪大世界有几个热门项目需要线上预约后才能玩,不少游客吐槽,这些项目不仅难约,约上后排队时间也很长,以致引发不满。舆情发酵后,次日,景区发布致歉声明并推出整改措施,哈尔滨文旅局领导赴冰雪大世界现场督导。
今天,我们通过Python采集点评网站(携程)上网友对哈尔滨冰雪大世界的评价,通过数据分析一下游客对冰雪大世界的各个不满意的点和值得学习的点。
数据采集
数据采集是数据分析的前提,在数据采集阶段,我选择了在携程网站上获取用户公开评价冰雪大世界的数据。使用了Python编程语言,结合相关库如Requests和JSON,通过网页爬虫技术实现了数据的自动抓取。共采集到5528条公开评价数据。
采集难度★★
数据集展示
_id | publishTime | score | content | publishTypeTag | ipLocatedName | touristTypeDisplay | |
---|---|---|---|---|---|---|---|
0 | 180204656 | /Date(1703671819000+0800)/ | 5 | 太壮观啦,上一次是10年前来的,变化很大… | 2023-12-27 发布点评 | 上海 | 情侣夫妻 |
需要采集数据的可以联系我~
vvvvvv:176-1035-2720
数据预处理
使用了Python中一些强大的数据处理和分析工具,包括:
Pandas:用于数据清洗和整理。
Numpy:进行数学运算,如计算评分占比。
Pyecharts:生成可视化图表,直观展示分析结果。
预处理了发布日期的杂乱文字,还将一些分值拆分了出来。
_id | publishTime | score | content | publishTypeTag | ipLocatedName | touristTypeDisplay | 景色 | 趣味 | 性价比 | |
---|---|---|---|---|---|---|---|---|---|---|
0 | 180204656 | /Date(1703671819000+0800)/ | 5 | 太壮观啦,上一次是10年前来的,变化很大… | 2023-12-27 | 上海 | 情侣夫妻 | 5 | 5 | 5 |
数据分析
通过pyecharts配合pandas、numpy进行了各个指标的分析。
评价总体情况分析
统计不同评分的占比,观察整体满意度。
本人浅薄分析
-
总体评分分布:
- 大多数用户给予景区较高的评分,特别是5分和4分,分别占总评价的69.05%和13.44%。可以看出大多数的游客对景区的整体体验是持积极态度。
-
主要评分集中在高分:
- 有近90%的用户给予3分及以上的评分,说明整体来说,景区受到了较为积极的评价。
各游客人群占比分析
通过用户评价中提到的信息,分析不同人群的占比。
本人浅薄分析
-
主要人群占比:家庭亲子、朋友出游和情侣夫妻是该景区的主要游客群体,分别占比较大。可以看出冰雪大世界在家庭、朋友和情侣旅行市场有较好的吸引力。
-
其他出游和商务出差占比较低:相较于其他出游和商务出差,这两类人群在评价中的占比相对较低。可以看出该景区的特色更适合休闲度假和亲子游,而在商务和其他类型旅行方面有发展空间。
各评分雷达图
本人浅薄分析
-
总体评分较高:雷达图上各项评分都在4分以上,显示大多数游客对景区的各方面评价都较为满意。这是一个积极的信号,说明景区在整体上受到游客的好评。
-
景色和景区评分相对较高:从雷达图中可以看出,景色和景区方面的评分较高,可能是景区的自然风光和整体设计得到了游客的好评。这是景区的优势,值得进一步宣传。
差评词云-可视化
差评:分值为1、2的定义为差评
本人浅薄分析
问题关键词:预约、排队、滑梯、摩天轮、体验、小时、退票、黄牛是差评中出现频率较高的关键词。这些词反映了一些问题,如预约流程、排队体验、设备运行时间等。景区可能需要关注这些方面,以改善游客体验。
好评词云-可视化
本人浅薄分析
- 好评关键词:哈尔滨、滑梯、很漂亮、不错、灯光、冰雕、值得是好评中出现频率较高的关键词。这些词反映了游客对景区整体美观性、设施、服务的积极评价。景区可以借助这些优势进一步宣传和推广。
综合分析
-
冰雪大世界在吸引家庭亲子、朋友出游和情侣夫妻方面表现较好,可进一步加强在这些人群中的宣传和推广。
-
差评中的问题关键词提示了一些流程和体验问题,景区可能需要优化一些运营方面的细节,以提升整体用户满意度。
-
好评中的关键词反映了景区的美丽和特色,景区可以通过这些优势进行更有针对性的宣传。
-
总体评分较高,但仍有一些方面可以改进,比如提升性价比。景区可通过进一步了解游客需求,优化服务和提升设施,以提高整体满意度和吸引更多游客。
写在最后
通过对冰雪大世界5528条携程用户公开评价的深入分析,我们深入了解了游客的评价情况,以及景区在不同方面的优势和改进空间。
该分析仅供学习交流使用,禁止用于商业用途,不构成任何投资建议。
大数据分析为运营和各行业带来了前所未有的机会,使企业能够更敏锐地洞察市场、优化运营,并更有效地应对竞争和变革。在信息时代,充分利用大数据分析,将成为企业取得竞争优势的不可忽视的关键要素。
本人数据分析领域的从业者,拥有专业背景和能力,可以为您的数据挖掘和分析需求提供支持。期待着能够与您共同探索更多有意义的数据洞见,为您的项目和业务提供数据分析方面的帮助。
创作不易,如果你觉得有帮助,请点个赞支持一下。你的鼓励是我创作的最大动力,期待未来能为大家带来更多有趣的分析文章。感谢大家的阅读和支持!
相关文章:

【数据分析实战】冰雪大世界携程景区评价信息情感分析采集词云
文章目录 引言数据采集数据集展示数据预处理 数据分析评价总体情况分析本人浅薄分析 各游客人群占比分析本人浅薄分析 各评分雷达图本人浅薄分析 差评词云-可视化本人浅薄分析 好评词云-可视化本人浅薄分析 综合分析写在最后 今年冬天,哈尔滨冰雪旅游"杀疯了&q…...

BIND-DNS配置介绍
一、主要配置文件 /etc/named.conf options { //Option 段全部配置 listen-on port 53 { 127.0.0.1; };//表示BIND将在53端口监听,若需要对所有IP进行监听,则修改为// listen-on port 53 { any; }; directory "/var/named"…...
Python技巧
Python,现如今非常热门的一种编程语言,在人工智能中大放异彩。做任何事都需要技巧,这可以大大提高效率,学习Python,同样如此! 第一个就是assret语句,让我们看下面一个关于折扣的例子: def dic…...

几种常见的CSS三栏布局?介绍下粘性布局(sticky)?自适应布局?左边宽度固定,右边自适应?两种以上方式实现已知或者未知宽度的垂直水平居中?
几种常见的CSS三栏布局 流体布局 效果: 参考代码: <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1…...

箭头函数 - JavaScript的新宠儿
📢 鸿蒙专栏:想学鸿蒙的,冲 📢 C语言专栏:想学C语言的,冲 📢 VUE专栏:想学VUE的,冲这里 📢 CSS专栏:想学CSS的,冲这里 Ǵ…...

操作系统期末复习知识点
目录 一.概论 1.操作系统的介绍 2.特性 3.主要功能 4.作用 二.进程的描述与控制 1.进程的定义 2.特性 3.进程的创建步骤 4.基本状态转化 5.PCB的作用 6.进程与线程的比较 三.进程同步 1.同步的概念(挺重要的) 2.临界区 3.管程和进程的区…...
[英语学习][23][Word Power Made Easy]的精读与翻译优化
[序言] 译者的这次翻译, 完全直译, 生硬无比. [英文学习的目标] 提升自身的英语水平, 对日后编程技能的提升有很大帮助. 希望大家这次能学到东西, 同时加入我的社区讨论与交流英语相关的内容. [原著英文与翻译版对照][第22页] Knowledge is chiefly in the form of words…...

吉林大学19、21级计算机学院《计算机网络》期末真题试题
一、21级(考后回忆) 一、不定项选择(一共10个选择题,一个两分,选全得满分) 不定项:可以选择1~4个 考点有: ①协议、服务 ②码分多路复用通过接受码片序列,求哪个站点发送…...

python练习3【题解///考点列出///错题改正】
一、单选题 1.【单选题】 ——可迭代对象 下列哪个选项是可迭代对象( D)? A.(1,2,3,4,5) B.[2,3,4,5,6] C.{a:3,b:5} D.以上全部 知识点补充——【可迭代对象】 可迭代对象(iterable)是指可以通过迭代ÿ…...

LINUX服务器防火墙nf_conntrack问题一例
一、故障现象 业务反馈服务异常,无法响应请求,从系统日志 dmesg 或 /var/log/messages 看到大量以下记录:kernel: nf_conntrack: table full, dropping packet. 二、问题分析 业务高峰期服务器访问量大,内核 netfilter 模块 conntrack 相关参…...

经典八股文之RocketMQ
核心概念 NameServer nameserver是整个rocketmq的大脑,是rocketmq的注册中心。broker在启动时向所有nameserver注册。生产者在发送消息之前先从 NameServer 获取 Broker 服务器地址列表(消费者一 样),然后根据负载均衡算法从列表中选择一台服务器进行消…...
Pandas之从sql库中导入数据的几种方法分析
1.使用mysql-connector-python库将SQL文件导入到Python中,并查询数据库中的表 确保已经安装mysql-connector-python库 #导入模块 import mysql.connector# 建立与MySQL数据库的连接 conn mysql.connector.connect(host"localhost",user"username&…...
18. Mysql 存储过程,实现动态数据透视
文章目录 概述常见操作创建存储过程存储过程局部变量定义和赋值查看存储过程删除存储过程调用存储过程 示例-动态数据透视详细讲解总结参考资料 概述 Mysql 存储过程是一组预先编译的 sql 语句集合,它们被存储在数据库中,并可以被多次调用执行。存储过程…...

VuePress部署到GitHub Pages
一、git push自动部署 1、创建用于工作流的文件 在项目根目录下创建一个用于 GitHub Actions 的工作流 .yml 文件 name: docson:# 每当 push 到 main 分支时触发部署push:branches: [main]# 手动触发部署workflow_dispatch:jobs:docs:runs-on: ubuntu-lateststeps:- uses: a…...

git 本地仓库
本地仓库 start.bat 启动...

Hive实战:分科汇总求月考平均分
文章目录 一、实战概述二、提出任务三、完成任务(一)准备数据1、在虚拟机上创建文本文件2、上传文件到HDFS指定目录 (二)实现步骤1、启动Hive Metastore服务2、启动Hive客户端3、创建分区的学生成绩表4、按分区加载数据5、查看分区…...

快速搭建知识付费小程序,3分钟即可开启知识变现之旅
明理信息科技知识付费saas租户平台 在当今数字化时代,知识付费已经成为一种趋势,越来越多的人愿意为有价值的知识付费。然而,公共知识付费平台虽然内容丰富,但难以满足个人或企业个性化的需求和品牌打造。同时,开发和…...

【计算机图形学划重点】第一讲-Pipeline and Introduction
基础知识 Vertex(顶点) define the location of primitives in space, and consists of vertex stream. 顶点用于定义空间中基本图形(primitives)的位置。它包含了一个顶点流(vertex stream),…...

面试题-DAG 有向无环图
有向无环图用于解决前后依赖问题,在Apollo中用于各个组件的依赖管理。 在算法面试中,有很多相关题目 比如排课问题,有先修课比如启动问题,需要先启动1,才能启动2 概念 顶点: 图中的一个点,比…...

vite + vue3引入ant design vue 报错
npm install ant-design-vue --save下载插件并在main.ts 全局引入 报错 解决办法一: main.ts注释掉全局引入 模块按需引入 解决办法二 将package.json中的ant-design-vue的版本^4.0.0-rc.4改为 ^3.2.15版本 同时将将package-lock.json中的ant-design-vue的版本…...
Python爬虫实战:研究MechanicalSoup库相关技术
一、MechanicalSoup 库概述 1.1 库简介 MechanicalSoup 是一个 Python 库,专为自动化交互网站而设计。它结合了 requests 的 HTTP 请求能力和 BeautifulSoup 的 HTML 解析能力,提供了直观的 API,让我们可以像人类用户一样浏览网页、填写表单和提交请求。 1.2 主要功能特点…...

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型
摘要 拍照搜题系统采用“三层管道(多模态 OCR → 语义检索 → 答案渲染)、两级检索(倒排 BM25 向量 HNSW)并以大语言模型兜底”的整体框架: 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后,分别用…...

基于距离变化能量开销动态调整的WSN低功耗拓扑控制开销算法matlab仿真
目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.算法仿真参数 5.算法理论概述 6.参考文献 7.完整程序 1.程序功能描述 通过动态调整节点通信的能量开销,平衡网络负载,延长WSN生命周期。具体通过建立基于距离的能量消耗模型&am…...

以下是对华为 HarmonyOS NETX 5属性动画(ArkTS)文档的结构化整理,通过层级标题、表格和代码块提升可读性:
一、属性动画概述NETX 作用:实现组件通用属性的渐变过渡效果,提升用户体验。支持属性:width、height、backgroundColor、opacity、scale、rotate、translate等。注意事项: 布局类属性(如宽高)变化时&#…...

Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility
Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility 1. 实验室环境1.1 实验室环境1.2 小测试 2. The Endor System2.1 部署应用2.2 检查现有策略 3. Cilium 策略实体3.1 创建 allow-all 网络策略3.2 在 Hubble CLI 中验证网络策略源3.3 …...

微信小程序 - 手机震动
一、界面 <button type"primary" bindtap"shortVibrate">短震动</button> <button type"primary" bindtap"longVibrate">长震动</button> 二、js逻辑代码 注:文档 https://developers.weixin.qq…...
linux 错误码总结
1,错误码的概念与作用 在Linux系统中,错误码是系统调用或库函数在执行失败时返回的特定数值,用于指示具体的错误类型。这些错误码通过全局变量errno来存储和传递,errno由操作系统维护,保存最近一次发生的错误信息。值得注意的是,errno的值在每次系统调用或函数调用失败时…...

HBuilderX安装(uni-app和小程序开发)
下载HBuilderX 访问官方网站:https://www.dcloud.io/hbuilderx.html 根据您的操作系统选择合适版本: Windows版(推荐下载标准版) Windows系统安装步骤 运行安装程序: 双击下载的.exe安装文件 如果出现安全提示&…...
unix/linux,sudo,其发展历程详细时间线、由来、历史背景
sudo 的诞生和演化,本身就是一部 Unix/Linux 系统管理哲学变迁的微缩史。来,让我们拨开时间的迷雾,一同探寻 sudo 那波澜壮阔(也颇为实用主义)的发展历程。 历史背景:su的时代与困境 ( 20 世纪 70 年代 - 80 年代初) 在 sudo 出现之前,Unix 系统管理员和需要特权操作的…...
【服务器压力测试】本地PC电脑作为服务器运行时出现卡顿和资源紧张(Windows/Linux)
要让本地PC电脑作为服务器运行时出现卡顿和资源紧张的情况,可以通过以下几种方式模拟或触发: 1. 增加CPU负载 运行大量计算密集型任务,例如: 使用多线程循环执行复杂计算(如数学运算、加密解密等)。运行图…...