【爬虫逆向】Python逆向采集猫眼电影票房数据

进行数据抓包,因为这个网站有数据加密


!pip install jsonpath
Collecting jsonpathDownloading jsonpath-0.82.2.tar.gz (10 kB)Preparing metadata (setup.py) ... done
Building wheels for collected packages: jsonpathBuilding wheel for jsonpath (setup.py) ... doneCreated wheel for jsonpath: filename=jsonpath-0.82.2-py3-none-any.whl size=6724 sha256=0b69428c90f399b387b7b81227fc625ad5099b67ef9eba6d38787a548034cb12Stored in directory: /home/mw/.cache/pip/wheels/2c/2a/fa/87e26ec807b9a21dd0464eb1319cc3ad51b0c9e505fe6b7396
Successfully built jsonpath
Installing collected packages: jsonpath
Successfully installed jsonpath-0.82.2
# 导入需要的库
import base64
import hashlib
import math
import random
import time
import jsonpath
import pandas as pd
import requests
对User-Agent与signKey分别进行解密,这里就不扣js了,主要是找规律,大家有什么问题可以给我留言,我看见都会回的
def getData():url = 'https://piaofang.maoyan.com/dashboard-ajax/movie'useragents = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36 Edg/115.0.1901.183'headers = {'User-Agent':useragents,'Referer':'https://piaofang.maoyan.com/dashboard/movie'}useragents = str(base64.b64encode(useragents.encode('utf-8')),'utf-8')index = str(round(random.random() * 1000))times = str(math.ceil(time.time() * 1000))# "method=GET&timeStamp={}&User-Agent={}&index={}&channelId=40009&sVersion=2&key=A013F70DB97834C0A5492378BD76C53A"content = "method=GET&timeStamp={}&User-Agent={}&index={}&channelId=40009&sVersion=2&key=A013F70DB97834C0A5492378BD76C53A".format(times,useragents,index)md5 = hashlib.md5()md5.update(content.encode('utf-8'))sign = md5.hexdigest()params = {'orderType': '0','uuid': '17d79b87a00c8-015087c7514df4-5919145b-144000-17d79b87a00c8',# 时间戳'timeStamp': times,# base64加密'User-Agent': useragents,# 随机数 * 1000取整'index': index,'channelId': '40009','sVersion': '2',# md5加密'signKey': sign}
代码详情
电影名称 上映时间 上座率 场均人次 票房占比 综合票房 排片场次 排片占比 0 拯救嫌疑人 上映22天 1.6% 2.3 39.2% 5.17亿 88158 28.3% 1 无价之宝 上映13天 1.7% 2.0 22.1% 1.26亿 58656 18.8% 2 饥饿游戏:鸣鸟与蛇之歌 上映6天 1.2% 1.8 14.1% 4310.6万 46166 14.8% 3 红猪 上映6天 1.7% 2.0 4.9% 1554.3万 14776 4.7% 4 志愿军:雄兵出击 上映56天 2.7% 2.7 3.5% 8.23亿 7329 2.3% 5 惊奇队长2 上映13天 0.3% 0.5 2.6% 1.08亿 33697 10.8% 6 河边的错误 上映33天 1.3% 1.4 2.3% 2.97亿 8989 2.8% 7 二手杰作 上映27天 0.9% 1.0 1.4% 1.14亿 8860 2.8% 8 坚如磐石 上映56天 1.3% 1.3 1.4% 13.48亿 5759 1.8% 9 觅渡 上映87天 65.6% 58.1 1.0% 2350.1万 96 <0.1% 10 前任4:英年早婚 上映56天 1.2% 1.1 0.9% 10.10亿 4666 1.5% 11 追缉 上映12天 0.4% 0.5 0.7% 2061.4万 11903 3.8% 12 莫斯科行动 上映55天 1.2% 1.2 0.7% 6.62亿 3323 1.0% 13 家园·重返地球之战 上映20天 45.8% 52.1 0.6% 104.4万 63 <0.1% 14 吾爱敦煌 上映6天 0.7% 0.7 0.6% 624.6万 4580 1.4% 15 小马鞭 上映38天 14.6% 15.4 0.3% 748.1万 120 <0.1% 16 开国将帅授衔1955 点映 38.5% 389.0 0.3% 14.6万 2 <0.1% 17 我本是高山 点映 37.5% 69.3 0.3% 1570.0万 16 <0.1% 18 古庙迷杀 上映6天 0.6% 0.6 0.2% 102.4万 3455 1.1% 19 八百矿工上井冈 57.4% 73.3 0.2% 450.8万 24 <0.1% 20 白塔之光 上映27天 12.5% 11.7 0.2% 683.3万 128 <0.1% 21 迷你特工队之汉堡大作战 上映12天 0.3% 0.3 0.1% 1277.1万 3387 1.0% 22 汪汪队立大功大电影2:超能大冒险 上映55天 0.7% 0.7 0.1% 1.35亿 1624 0.5% 23 千里送鹤 上映7天 2.3% 2.4 0.1% 30.2万 396 0.1% 24 奥本海默 上映85天 1.8% 1.9 0.1% 4.50亿 245 <0.1% 25 贝肯熊:火星任务 上映56天 0.4% 0.4 <0.1% 8095.0万 771 0.2% 26 单声 16.2% 39.7 <0.1% 20.0万 6 <0.1% 27 喜马拉雅之灵 上映6天 0.7% 0.8 <0.1% 51.8万 310 <0.1% 28 过山榜 点映 97.7% 172.0 <0.1% 8049 1 <0.1% 29 一个和四个 上映27天 0.6% 0.5 <0.1% 484.4万 361 0.1% .. ... ... ... ... ... ... ... ... 45 穿越烽火 29.0% 25.0 <0.1% 94.7万 2 <0.1% 46 此生有约 41.1% 35.0 <0.1% 61.8万 1 <0.1% 47 普通男女 上映20天 0.4% 0.4 <0.1% 115.6万 72 <0.1% 48 替身纸人 上映41天 0.5% 0.5 <0.1% 458.9万 70 <0.1% 49 我爸没说的那件事 上映20天 0.1% 0.1 <0.1% 415.8万 214 <0.1% 50 最好的相遇 上映34天 0.2% 0.2 <0.1% 1689.6万 74 <0.1% 51 看不见的顶峰 上映27天 0.3% 0.4 <0.1% 138.7万 49 <0.1% 52 故园飘梦 上映31天 0.4% 0.5 <0.1% 39.1万 42 <0.1% 53 思念爱 上映12天 0.5% 0.4 <0.1% 3.3万 29 <0.1% 54 我是哪吒2之英雄归来 上映55天 0.2% 0.2 <0.1% 1754.2万 60 <0.1% 55 心愿房间 上映23天 0.4% 0.5 <0.1% 9.0万 15 <0.1% 56 洛神 2.8% 3.3 <0.1% 1.5万 3 <0.1% 57 小美人鱼之大海怪传说 上映55天 0.1% 0.2 <0.1% 643.7万 39 <0.1% 58 侏罗纪公园3D 2.0% 3.0 <0.1% 3.49亿 1 <0.1% 59 失而复得 上映26天 0.1% 0.1 <0.1% 459.8万 34 <0.1% 60 午夜迷途 0.5% 0.5 <0.1% 288.4万 8 <0.1% 61 疯狂大营救 上映55天 0.7% 0.4 <0.1% 89.9万 11 <0.1% 62 碧玉簪 4.0% 4.0 <0.1% 2.3万 1 <0.1% 63 小黄人大眼萌:神偷奶爸前传 1.3% 2.0 <0.1% 2.37亿 1 <0.1% 64 青春就这么过 上映12天 0.2% 0.3 <0.1% 8.6万 8 <0.1% 65 党的女儿 1.3% 1.0 <0.1% 6.2万 2 <0.1% 66 命中注定与你为敌 6.8% 2.0 <0.1% 9.3万 1 <0.1% 67 借东风 3.7% 3.0 <0.1% 3935 1 <0.1% 68 洋子的困惑 上映26天 0.3% 0.3 <0.1% 44.8万 7 <0.1% 69 欢乐好声音 0.6% 1.0 <0.1% 2.15亿 1 <0.1% 70 永安镇故事集 上映76天 1.2% 1.0 <0.1% 322.2万 1 <0.1% 71 朱英国 上映10天 0.1% 0.2 <0.1% 2.9万 5 <0.1% 72 流水落花 上映69天 0.2% 0.3 <0.1% 28.6万 3 <0.1% 73 北京2022 0.1% 0.2 <0.1% 3053.6万 5 <0.1% 74 None 上映22天 None None None None None None[75 rows x 8 columns]
猫眼电影数据可视化
这个做的比较着急,欢迎大家fork项目,一起学习,一起改进
import pandas as pd
data=pd.read_csv("/home/mw/input/maoyan8911/猫眼电影.csv")
data
| 电影名称 | 上映时间 | 上座率 | 场均人次 | 票房占比 | 综合票房 | 排片场次 | 排片占比 | |
|---|---|---|---|---|---|---|---|---|
| 0 | 拯救嫌疑人 | 上映22天 | 1.4% | 2.0 | 38.5% | 5.15亿 | 88298.0 | 28.3% |
| 1 | 无价之宝 | 上映13天 | 1.4% | 1.7 | 21.7% | 1.25亿 | 58746.0 | 18.8% |
| 2 | 饥饿游戏:鸣鸟与蛇之歌 | 上映6天 | 1.1% | 1.5 | 14.4% | 4271.1万 | 46224.0 | 14.8% |
| 3 | 红猪 | 上映6天 | 1.5% | 1.8 | 5.2% | 1545.3万 | 14796.0 | 4.7% |
| 4 | 志愿军:雄兵出击 | 上映56天 | 2.5% | 2.6 | 3.9% | 8.23亿 | 7333.0 | 2.3% |
| 5 | 惊奇队长2 | 上映13天 | 0.3% | 0.4 | 2.6% | 1.08亿 | 33801.0 | 10.8% |
| 6 | 河边的错误 | 上映33天 | 1.2% | 1.2 | 2.4% | 2.97亿 | 8997.0 | 2.8% |
| 7 | 二手杰作 | 上映27天 | 0.8% | 0.8 | 1.4% | 1.14亿 | 8871.0 | 2.8% |
| 8 | 坚如磐石 | 上映56天 | 1.2% | 1.2 | 1.4% | 13.48亿 | 5763.0 | 1.8% |
| 9 | 前任4:英年早婚 | 上映56天 | 0.9% | 0.9 | 0.8% | 10.10亿 | 4668.0 | 1.4% |
| 10 | 觅渡 | 上映87天 | 75.0% | 38.8 | 0.7% | 2342.4万 | 95.0 | <0.1% |
| 11 | 追缉 | 上映12天 | 0.3% | 0.4 | 0.7% | 2058.5万 | 11933.0 | 3.8% |
| 12 | 莫斯科行动 | 上映55天 | 1.0% | 1.0 | 0.7% | 6.62亿 | 3326.0 | 1.0% |
| 13 | 吾爱敦煌 | 上映6天 | 0.7% | 0.7 | 0.6% | 624.2万 | 4593.0 | 1.4% |
| 14 | 家园·重返地球之战 | 上映20天 | 40.9% | 45.5 | 0.6% | 102.6万 | 62.0 | <0.1% |
| 15 | 开国将帅授衔1955 | 点映 | 38.5% | 389.0 | 0.3% | 14.6万 | 2.0 | <0.1% |
| 16 | 我本是高山 | 点映 | 39.5% | 73.9 | 0.3% | 1570.0万 | 15.0 | <0.1% |
| 17 | 八百矿工上井冈 | NaN | 57.4% | 73.3 | 0.3% | 450.8万 | 24.0 | <0.1% |
| 18 | 白塔之光 | 上映27天 | 12.5% | 11.7 | 0.2% | 683.3万 | 128.0 | <0.1% |
| 19 | 小马鞭 | 上映38天 | 8.8% | 9.1 | 0.2% | 745.1万 | 120.0 | <0.1% |
| 20 | 古庙迷杀 | 上映6天 | 0.3% | 0.4 | 0.2% | 99.7万 | 3494.0 | 1.1% |
| 21 | 迷你特工队之汉堡大作战 | 上映12天 | 0.3% | 0.3 | 0.1% | 1277.1万 | 3387.0 | 1.0% |
| 22 | 汪汪队立大功大电影2:超能大冒险 | 上映55天 | 0.7% | 0.7 | 0.1% | 1.35亿 | 1623.0 | 0.5% |
| 23 | 千里送鹤 | 上映7天 | 2.3% | 2.4 | 0.1% | 30.2万 | 398.0 | 0.1% |
| 24 | 奥本海默 | 上映85天 | 1.7% | 1.8 | 0.1% | 4.50亿 | 245.0 | <0.1% |
| 25 | 贝肯熊:火星任务 | 上映56天 | 0.4% | 0.4 | <0.1% | 8095.0万 | 771.0 | 0.2% |
| 26 | 单声 | NaN | 16.2% | 39.7 | <0.1% | 20.0万 | 6.0 | <0.1% |
| 27 | 过山榜 | 点映 | 97.7% | 172.0 | <0.1% | 8049 | 1.0 | <0.1% |
| 28 | 喜马拉雅之灵 | 上映6天 | 0.7% | 0.7 | <0.1% | 51.8万 | 310.0 | <0.1% |
| 29 | 一个和四个 | 上映27天 | 0.5% | 0.5 | <0.1% | 484.3万 | 359.0 | 0.1% |
| ... | ... | ... | ... | ... | ... | ... | ... | ... |
| 45 | 此生有约 | NaN | 41.1% | 35.0 | <0.1% | 61.8万 | 1.0 | <0.1% |
| 46 | 画魔人 | 上映27天 | 0.1% | 0.1 | <0.1% | 198.8万 | 348.0 | 0.1% |
| 47 | 普通男女 | 上映20天 | 0.4% | 0.4 | <0.1% | 115.6万 | 72.0 | <0.1% |
| 48 | 我爸没说的那件事 | 上映20天 | 0.1% | 0.1 | <0.1% | 415.8万 | 215.0 | <0.1% |
| 49 | 替身纸人 | 上映41天 | 0.3% | 0.4 | <0.1% | 458.9万 | 71.0 | <0.1% |
| 50 | 看不见的顶峰 | 上映27天 | 0.3% | 0.3 | <0.1% | 138.7万 | 49.0 | <0.1% |
| 51 | 最好的相遇 | 上映34天 | 0.1% | 0.1 | <0.1% | 1689.6万 | 74.0 | <0.1% |
| 52 | 故园飘梦 | 上映31天 | 0.3% | 0.4 | <0.1% | 39.1万 | 42.0 | <0.1% |
| 53 | 我是哪吒2之英雄归来 | 上映55天 | 0.2% | 0.2 | <0.1% | 1754.2万 | 60.0 | <0.1% |
| 54 | 思念爱 | 上映12天 | 0.3% | 0.3 | <0.1% | 3.2万 | 29.0 | <0.1% |
| 55 | 心愿房间 | 上映23天 | 0.4% | 0.5 | <0.1% | 9.0万 | 15.0 | <0.1% |
| 56 | 洛神 | NaN | 2.8% | 3.3 | <0.1% | 1.5万 | 3.0 | <0.1% |
| 57 | 小美人鱼之大海怪传说 | 上映55天 | 0.1% | 0.2 | <0.1% | 643.7万 | 39.0 | <0.1% |
| 58 | 侏罗纪公园3D | NaN | 2.0% | 3.0 | <0.1% | 3.49亿 | 1.0 | <0.1% |
| 59 | 疯狂大营救 | 上映55天 | 0.7% | 0.4 | <0.1% | 89.9万 | 11.0 | <0.1% |
| 60 | 碧玉簪 | NaN | 4.0% | 4.0 | <0.1% | 2.3万 | 1.0 | <0.1% |
| 61 | 小黄人大眼萌:神偷奶爸前传 | NaN | 1.3% | 2.0 | <0.1% | 2.37亿 | 1.0 | <0.1% |
| 62 | 青春就这么过 | 上映12天 | 0.2% | 0.2 | <0.1% | 8.6万 | 9.0 | <0.1% |
| 63 | 党的女儿 | NaN | 1.3% | 1.0 | <0.1% | 6.2万 | 2.0 | <0.1% |
| 64 | 命中注定与你为敌 | NaN | 6.8% | 2.0 | <0.1% | 9.3万 | 1.0 | <0.1% |
| 65 | 午夜迷途 | NaN | 0.2% | 0.2 | <0.1% | 288.4万 | 9.0 | <0.1% |
| 66 | 失而复得 | 上映26天 | 0.0% | <0.1 | <0.1% | 459.8万 | 34.0 | <0.1% |
| 67 | 借东风 | NaN | 3.7% | 3.0 | <0.1% | 3935 | 1.0 | <0.1% |
| 68 | 洋子的困惑 | 上映26天 | 0.3% | 0.3 | <0.1% | 44.8万 | 7.0 | <0.1% |
| 69 | 欢乐好声音 | NaN | 0.6% | 1.0 | <0.1% | 2.15亿 | 1.0 | <0.1% |
| 70 | 永安镇故事集 | 上映76天 | 1.2% | 1.0 | <0.1% | 322.2万 | 1.0 | <0.1% |
| 71 | 朱英国 | 上映10天 | 0.1% | 0.2 | <0.1% | 2.9万 | 5.0 | <0.1% |
| 72 | 流水落花 | 上映69天 | 0.2% | 0.3 | <0.1% | 28.6万 | 3.0 | <0.1% |
| 73 | 北京2022 | NaN | 0.1% | 0.2 | <0.1% | 3053.6万 | 5.0 | <0.1% |
| 74 | NaN | 上映22天 | NaN | NaN | NaN | NaN | NaN | NaN |
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 75 entries, 0 to 74
Data columns (total 8 columns):
电影名称 74 non-null object
上映时间 55 non-null object
上座率 74 non-null object
场均人次 74 non-null object
票房占比 74 non-null object
综合票房 74 non-null object
排片场次 74 non-null float64
排片占比 74 non-null object
dtypes: float64(1), object(7)
memory usage: 4.8+ KB
数据缺省值处理
# 去除空值
data.dropna(inplace=True)
data
| 电影名称 | 上映时间 | 上座率 | 场均人次 | 票房占比 | 综合票房 | 排片场次 | 排片占比 | |
|---|---|---|---|---|---|---|---|---|
| 0 | 拯救嫌疑人 | 上映22天 | 1.4% | 2.0 | 38.5% | 5.15亿 | 88298.0 | 28.3% |
| 1 | 无价之宝 | 上映13天 | 1.4% | 1.7 | 21.7% | 1.25亿 | 58746.0 | 18.8% |
| 2 | 饥饿游戏:鸣鸟与蛇之歌 | 上映6天 | 1.1% | 1.5 | 14.4% | 4271.1万 | 46224.0 | 14.8% |
| 3 | 红猪 | 上映6天 | 1.5% | 1.8 | 5.2% | 1545.3万 | 14796.0 | 4.7% |
| 4 | 志愿军:雄兵出击 | 上映56天 | 2.5% | 2.6 | 3.9% | 8.23亿 | 7333.0 | 2.3% |
| 5 | 惊奇队长2 | 上映13天 | 0.3% | 0.4 | 2.6% | 1.08亿 | 33801.0 | 10.8% |
| 6 | 河边的错误 | 上映33天 | 1.2% | 1.2 | 2.4% | 2.97亿 | 8997.0 | 2.8% |
| 7 | 二手杰作 | 上映27天 | 0.8% | 0.8 | 1.4% | 1.14亿 | 8871.0 | 2.8% |
| 8 | 坚如磐石 | 上映56天 | 1.2% | 1.2 | 1.4% | 13.48亿 | 5763.0 | 1.8% |
| 9 | 前任4:英年早婚 | 上映56天 | 0.9% | 0.9 | 0.8% | 10.10亿 | 4668.0 | 1.4% |
| 10 | 觅渡 | 上映87天 | 75.0% | 38.8 | 0.7% | 2342.4万 | 95.0 | <0.1% |
| 11 | 追缉 | 上映12天 | 0.3% | 0.4 | 0.7% | 2058.5万 | 11933.0 | 3.8% |
| 12 | 莫斯科行动 | 上映55天 | 1.0% | 1.0 | 0.7% | 6.62亿 | 3326.0 | 1.0% |
| 13 | 吾爱敦煌 | 上映6天 | 0.7% | 0.7 | 0.6% | 624.2万 | 4593.0 | 1.4% |
| 14 | 家园·重返地球之战 | 上映20天 | 40.9% | 45.5 | 0.6% | 102.6万 | 62.0 | <0.1% |
| 15 | 开国将帅授衔1955 | 点映 | 38.5% | 389.0 | 0.3% | 14.6万 | 2.0 | <0.1% |
| 16 | 我本是高山 | 点映 | 39.5% | 73.9 | 0.3% | 1570.0万 | 15.0 | <0.1% |
| 18 | 白塔之光 | 上映27天 | 12.5% | 11.7 | 0.2% | 683.3万 | 128.0 | <0.1% |
| 19 | 小马鞭 | 上映38天 | 8.8% | 9.1 | 0.2% | 745.1万 | 120.0 | <0.1% |
| 20 | 古庙迷杀 | 上映6天 | 0.3% | 0.4 | 0.2% | 99.7万 | 3494.0 | 1.1% |
| 21 | 迷你特工队之汉堡大作战 | 上映12天 | 0.3% | 0.3 | 0.1% | 1277.1万 | 3387.0 | 1.0% |
| 22 | 汪汪队立大功大电影2:超能大冒险 | 上映55天 | 0.7% | 0.7 | 0.1% | 1.35亿 | 1623.0 | 0.5% |
| 23 | 千里送鹤 | 上映7天 | 2.3% | 2.4 | 0.1% | 30.2万 | 398.0 | 0.1% |
| 24 | 奥本海默 | 上映85天 | 1.7% | 1.8 | 0.1% | 4.50亿 | 245.0 | <0.1% |
| 25 | 贝肯熊:火星任务 | 上映56天 | 0.4% | 0.4 | <0.1% | 8095.0万 | 771.0 | 0.2% |
| 27 | 过山榜 | 点映 | 97.7% | 172.0 | <0.1% | 8049 | 1.0 | <0.1% |
| 28 | 喜马拉雅之灵 | 上映6天 | 0.7% | 0.7 | <0.1% | 51.8万 | 310.0 | <0.1% |
| 29 | 一个和四个 | 上映27天 | 0.5% | 0.5 | <0.1% | 484.3万 | 359.0 | 0.1% |
| 30 | 好像也没那么热血沸腾 | 上映56天 | 0.4% | 0.4 | <0.1% | 1.75亿 | 392.0 | 0.1% |
| 31 | 不动声色 | 上映6天 | 0.6% | 0.6 | <0.1% | 8.9万 | 208.0 | <0.1% |
| 32 | 我的姐妹是网红之追梦花 | 上映27天 | 3.3% | 10.2 | <0.1% | 18.4万 | 6.0 | <0.1% |
| 33 | 珍·古道尔的传奇一生 | 上映37天 | 0.8% | 0.8 | <0.1% | 314.4万 | 127.0 | <0.1% |
| 34 | 美好人间 | 上映10天 | 75.1% | 41.3 | <0.1% | 3.1万 | 3.0 | <0.1% |
| 35 | 傍晚向日葵 | 点映 | 59.0% | 91.0 | <0.1% | 2.7万 | 1.0 | <0.1% |
| 39 | 困兽 | 上映27天 | 0.1% | 0.1 | <0.1% | 2102.4万 | 578.0 | 0.1% |
| 40 | 黄鹤楼之盐道迷局 | 上映34天 | 13.0% | 11.6 | <0.1% | 13.3万 | 7.0 | <0.1% |
| 46 | 画魔人 | 上映27天 | 0.1% | 0.1 | <0.1% | 198.8万 | 348.0 | 0.1% |
| 47 | 普通男女 | 上映20天 | 0.4% | 0.4 | <0.1% | 115.6万 | 72.0 | <0.1% |
| 48 | 我爸没说的那件事 | 上映20天 | 0.1% | 0.1 | <0.1% | 415.8万 | 215.0 | <0.1% |
| 49 | 替身纸人 | 上映41天 | 0.3% | 0.4 | <0.1% | 458.9万 | 71.0 | <0.1% |
| 50 | 看不见的顶峰 | 上映27天 | 0.3% | 0.3 | <0.1% | 138.7万 | 49.0 | <0.1% |
| 51 | 最好的相遇 | 上映34天 | 0.1% | 0.1 | <0.1% | 1689.6万 | 74.0 | <0.1% |
| 52 | 故园飘梦 | 上映31天 | 0.3% | 0.4 | <0.1% | 39.1万 | 42.0 | <0.1% |
| 53 | 我是哪吒2之英雄归来 | 上映55天 | 0.2% | 0.2 | <0.1% | 1754.2万 | 60.0 | <0.1% |
| 54 | 思念爱 | 上映12天 | 0.3% | 0.3 | <0.1% | 3.2万 | 29.0 | <0.1% |
| 55 | 心愿房间 | 上映23天 | 0.4% | 0.5 | <0.1% | 9.0万 | 15.0 | <0.1% |
| 57 | 小美人鱼之大海怪传说 | 上映55天 | 0.1% | 0.2 | <0.1% | 643.7万 | 39.0 | <0.1% |
| 59 | 疯狂大营救 | 上映55天 | 0.7% | 0.4 | <0.1% | 89.9万 | 11.0 | <0.1% |
| 62 | 青春就这么过 | 上映12天 | 0.2% | 0.2 | <0.1% | 8.6万 | 9.0 | <0.1% |
| 66 | 失而复得 | 上映26天 | 0.0% | <0.1 | <0.1% | 459.8万 | 34.0 | <0.1% |
| 68 | 洋子的困惑 | 上映26天 | 0.3% | 0.3 | <0.1% | 44.8万 | 7.0 | <0.1% |
| 70 | 永安镇故事集 | 上映76天 | 1.2% | 1.0 | <0.1% | 322.2万 | 1.0 | <0.1% |
| 71 | 朱英国 | 上映10天 | 0.1% | 0.2 | <0.1% | 2.9万 | 5.0 | <0.1% |
| 72 | 流水落花 | 上映69天 | 0.2% | 0.3 | <0.1% | 28.6万 | 3.0 | <0.1% |
# 猫眼电影上座率前10分析
data_sorted = data.sort_values(by='上座率', ascending=False)
data_top10=data_sorted.head(10)
data_top10
| 电影名称 | 上映时间 | 上座率 | 场均人次 | 票房占比 | 综合票房 | 排片场次 | 排片占比 | |
|---|---|---|---|---|---|---|---|---|
| 27 | 过山榜 | 点映 | 97.7% | 172.0 | <0.1% | 8049 | 1.0 | <0.1% |
| 19 | 小马鞭 | 上映38天 | 8.8% | 9.1 | 0.2% | 745.1万 | 120.0 | <0.1% |
| 34 | 美好人间 | 上映10天 | 75.1% | 41.3 | <0.1% | 3.1万 | 3.0 | <0.1% |
| 10 | 觅渡 | 上映87天 | 75.0% | 38.8 | 0.7% | 2342.4万 | 95.0 | <0.1% |
| 35 | 傍晚向日葵 | 点映 | 59.0% | 91.0 | <0.1% | 2.7万 | 1.0 | <0.1% |
| 14 | 家园·重返地球之战 | 上映20天 | 40.9% | 45.5 | 0.6% | 102.6万 | 62.0 | <0.1% |
| 16 | 我本是高山 | 点映 | 39.5% | 73.9 | 0.3% | 1570.0万 | 15.0 | <0.1% |
| 15 | 开国将帅授衔1955 | 点映 | 38.5% | 389.0 | 0.3% | 14.6万 | 2.0 | <0.1% |
| 32 | 我的姐妹是网红之追梦花 | 上映27天 | 3.3% | 10.2 | <0.1% | 18.4万 | 6.0 | <0.1% |
| 4 | 志愿军:雄兵出击 | 上映56天 | 2.5% | 2.6 | 3.9% | 8.23亿 | 7333.0 | 2.3% |
data_top10['电影名称'].tolist()
['过山榜','小马鞭','美好人间','觅渡','傍晚向日葵','家园·重返地球之战','我本是高山','开国将帅授衔1955','我的姐妹是网红之追梦花','志愿军:雄兵出击']
percentage=data_top10['上座率'].tolist()
data_shangan=[percentage.replace("%", "") for percentage in percentage]
data_shangan
['97.7', '8.8', '75.1', '75.0', '59.0', '40.9', '39.5', '38.5', '3.3', '2.5']
from pyecharts.charts import Bar,Line,Map,Page,Pie
from pyecharts import options as opts
from pyecharts.globals import SymbolType
from pyecharts.charts import Bar
# from pyecharts.charts import opts
#条形图
#bar1 = Bar(init_opts=opts.InitOpts(width='1350px', height='750px'))
bar1 = Bar()
bar1.add_xaxis(data_top10['电影名称'].tolist())
bar1.add_yaxis('', data_shangan)
bar1.set_global_opts(title_opts=opts.TitleOpts(title='猫眼电影上座率前10分析'),xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=-15)),visualmap_opts=opts.VisualMapOpts(max_=28669)) bar1.render_notebook()
相关文章:
【爬虫逆向】Python逆向采集猫眼电影票房数据
进行数据抓包,因为这个网站有数据加密 !pip install jsonpathCollecting jsonpathDownloading jsonpath-0.82.2.tar.gz (10 kB)Preparing metadata (setup.py) ... done Building wheels for collected packages: jsonpathBuilding wheel for jsonpath (setup.py) .…...
解析服务器下载速度:上行、下行与带宽之谜
在日常使用中,我们经常会遇到从服务器下载内容速度忽快忽慢的情况,即便服务器的硬件配置如4核CPU、8GB内存和12Mbps的带宽看似足够。为何会出现这种现象?这背后涉及到网络中的上行、下行以及带宽等关键概念。本文旨在揭开这些术语背后的含义&…...
计算机网络的概念
目录 <计算机网络的定义> <计算机网络的形成与发展> 1.第一阶段远程联机阶段----60年代以前: 2.第二阶段多机互联网络阶段----60年代中期: 3.第三阶段标准化网络阶段----70年代末: 4.第四阶段网络互联与高速网络阶段一90年代: <计算机网络的未来--下一代…...
MATLAB中的脚本和函数有什么区别?
MATLAB中的脚本和函数是两种不同的代码组织方式,它们在结构、功能和使用方式上有显著的区别。以下是对这两种方式的详细解释,总计约2000字。 一、MATLAB脚本 MATLAB脚本是一种包含多条MATLAB命令的文件,这些命令按照在文件中的顺序依次执行…...
从电影《沙丘》说起——对人工智能的思考
正文 从《沙丘》开始说起 之前看《沙丘》电影,里面有一类角色叫门泰特,这类人大脑可以飞快地运算,在电影设定里是替换人工智能、机器运算的存在。男主保罗也是这类型的人,但他可能基因更强大,吸食了香料后࿰…...
使用Python进行自然语言处理(NLP):NLTK与Spacy的比较【第133篇—NLTK与Spacy】
👽发现宝藏 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。【点击进入巨牛的人工智能学习网站】。 使用Python进行自然语言处理(NLP):NLTK与Spacy的比较 自…...
学习笔记--在线强化学习与离线强化学习的异同(3)
这篇博文很多部分仅代表个人学习观点,欢迎大家与我一起讨论 强化学习与离线强化学习的区别 强化学习和离线强化学习都是机器学习的分支,主要用于训练智能体以在不断尝试和错误的过程中学习如何最大化累积奖励。它们之间的主要区别在于数据的获取方式和训…...
使用Thymeleaf导出PDF,页眉插入图片与内容重叠?
CSS 打印分页功能 需求:打印 在第一页的内容被挤到第二页的时候,又想每一页页头都有相同的样式,使用页眉。 问题:第二页的内容与页眉重叠了? 查各路找出的原因:header 页眉不占空间 解决:不…...
python网络编程:通过socket实现TCP客户端和服务端
目录 写在开头 socket服务端(基础) socket客户端(基础) 服务端实现(可连接多个客户端) 客户端实现 数据收发效果 写在开头 近期可能会用python实现一些网络安全工具,涉及到许多关于网络…...
论文阅读——RSGPT
RSGPT: A Remote Sensing Vision Language Model and Benchmark 贡献:构建了一个高质量的遥感图像描述数据集(RSICap)和一个名为RSIEval的基准评估数据集,并在新创建的RSICap数据集上开发了基于微调InstructBLIP的遥感生成预训练…...
长连接技术
个人学习记录,欢迎指正 1.轮询 1.1 轮询的形式 短连接轮询 前端每隔一段时间向服务端发起一次Http请求来获取数据。 const shortPolling () > { const intervalHandler setInterval(() > {fetch(/xxx/yyy).then(response > response.json()).then(respo…...
供电系统分类详解
一、供电系统分类 电力供电系统一般有5种供电模式,常用的有:IT系统,TT系统,TN系统,其中TN系统又可以分为TN-C,TN-S,TN-C-S。 1、TN-C系统(三相四线制) 优点: 该系统中…...
基于centos7的k8s最新版v1.29.2安装教程
k8s概述 Kubernetes 是一个可移植、可扩展的开源平台,用于管理容器化的工作负载和服务,可促进声明式配置和自动化。 Kubernetes 拥有一个庞大且快速增长的生态,其服务、支持和工具的使用范围相当广泛。 Kubernetes 这个名字源于希腊语&…...
【赠书第20期】AI绘画与修图实战:Photoshop+Firefly从入门到精通
文章目录 前言 1 入门篇:初识Photoshop与Firefly 2 进阶篇:掌握Photoshop与Firefly的核心技巧 3 实战篇:运用Photoshop与Firefly进行创作 4 精通篇:提升创作水平,拓展应用领域 5 结语 6 推荐图书 7 粉丝福利 前…...
如何在并行超算云上玩转PWmat③:使用Q-Flow提交计算的案例演示
3月的每周二下午14:00我们将会在并行直播间为大家持续带来线上讲座。前面两期我们分享了”PWmat特色功能和应用“以及“如何在并行超算云平台使用PWmat计算软件”主题讲座,回看视频和PPT已上传至B站”龙讯旷腾“账号内。 本周张持讲师将继续带着大家手把手上机教学…...
html5cssjs代码 017样式示例
html5&css&js代码 017样式示例 一、代码二、解释 这段HTML代码定义了一个网页的基本结构,包括头部、主体和尾部。在头部中,设置了网页标题、字符编码和样式。主体部分包含一个标题和一个表格,表格内分为两个单元格,左侧为…...
Vue.js动画
Vue.js动画 Vue.js动画是指在Vue组件中通过添加/移除CSS类或应用CSS过渡/动画效果来实现的视觉效果。这些动画可以帮助改善用户体验,使界面更加生动和吸引人。 Vue.js提供了两种类型的动画:过渡和动画。 过渡:过渡是在元素插入、更新或删除…...
信号与系统学习笔记——信号的分类
目录 一、确定与随机 二、连续与离散 三、周期与非周期 判断是否为周期函数 离散信号的周期 结论 四、能量与功率 定义 结论 五、因果与反因果 六、阶跃函数 定义 性质 七、冲激函数 定义 重要关系 作用 一、确定与随机 确定信号:可以确定时间函数…...
PyTorch深度学习实战(39)——小样本学习
PyTorch深度学习实战(39)——小样本学习 0. 前言1. 小样本学习简介2. 孪生网络2.1 模型分析2.2 数据集分析2.3 构建孪生网络 3. 原型网络3. 关系网络小结系列链接 0. 前言 小样本学习 (Few-shot Learning) 旨在解决在训练集中只有很少样本的情况下进行分…...
论文阅读——Vision Transformer with Deformable Attention
Vision Transformer with Deformable Attention 多头自注意力公式化为: 第l层transformer模块公式化为: 在Transformer模型中简单地实现DCN是一个non-trivial的问题。在DCN中,特征图上的每个元素都单独学习其偏移,其中HWC特征图上…...
生成xcframework
打包 XCFramework 的方法 XCFramework 是苹果推出的一种多平台二进制分发格式,可以包含多个架构和平台的代码。打包 XCFramework 通常用于分发库或框架。 使用 Xcode 命令行工具打包 通过 xcodebuild 命令可以打包 XCFramework。确保项目已经配置好需要支持的平台…...
【快手拥抱开源】通过快手团队开源的 KwaiCoder-AutoThink-preview 解锁大语言模型的潜力
引言: 在人工智能快速发展的浪潮中,快手Kwaipilot团队推出的 KwaiCoder-AutoThink-preview 具有里程碑意义——这是首个公开的AutoThink大语言模型(LLM)。该模型代表着该领域的重大突破,通过独特方式融合思考与非思考…...
什么是库存周转?如何用进销存系统提高库存周转率?
你可能听说过这样一句话: “利润不是赚出来的,是管出来的。” 尤其是在制造业、批发零售、电商这类“货堆成山”的行业,很多企业看着销售不错,账上却没钱、利润也不见了,一翻库存才发现: 一堆卖不动的旧货…...
将对透视变换后的图像使用Otsu进行阈值化,来分离黑色和白色像素。这句话中的Otsu是什么意思?
Otsu 是一种自动阈值化方法,用于将图像分割为前景和背景。它通过最小化图像的类内方差或等价地最大化类间方差来选择最佳阈值。这种方法特别适用于图像的二值化处理,能够自动确定一个阈值,将图像中的像素分为黑色和白色两类。 Otsu 方法的原…...
鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个生活电费的缴纳和查询小程序
一、项目初始化与配置 1. 创建项目 ohpm init harmony/utility-payment-app 2. 配置权限 // module.json5 {"requestPermissions": [{"name": "ohos.permission.INTERNET"},{"name": "ohos.permission.GET_NETWORK_INFO"…...
PL0语法,分析器实现!
简介 PL/0 是一种简单的编程语言,通常用于教学编译原理。它的语法结构清晰,功能包括常量定义、变量声明、过程(子程序)定义以及基本的控制结构(如条件语句和循环语句)。 PL/0 语法规范 PL/0 是一种教学用的小型编程语言,由 Niklaus Wirth 设计,用于展示编译原理的核…...
学校时钟系统,标准考场时钟系统,AI亮相2025高考,赛思时钟系统为教育公平筑起“精准防线”
2025年#高考 将在近日拉开帷幕,#AI 监考一度冲上热搜。当AI深度融入高考,#时间同步 不再是辅助功能,而是决定AI监考系统成败的“生命线”。 AI亮相2025高考,40种异常行为0.5秒精准识别 2025年高考即将拉开帷幕,江西、…...
Java求职者面试指南:计算机基础与源码原理深度解析
Java求职者面试指南:计算机基础与源码原理深度解析 第一轮提问:基础概念问题 1. 请解释什么是进程和线程的区别? 面试官:进程是程序的一次执行过程,是系统进行资源分配和调度的基本单位;而线程是进程中的…...
MySQL 部分重点知识篇
一、数据库对象 1. 主键 定义 :主键是用于唯一标识表中每一行记录的字段或字段组合。它具有唯一性和非空性特点。 作用 :确保数据的完整性,便于数据的查询和管理。 示例 :在学生信息表中,学号可以作为主键ÿ…...
使用SSE解决获取状态不一致问题
使用SSE解决获取状态不一致问题 1. 问题描述2. SSE介绍2.1 SSE 的工作原理2.2 SSE 的事件格式规范2.3 SSE与其他技术对比2.4 SSE 的优缺点 3. 实战代码 1. 问题描述 目前做的一个功能是上传多个文件,这个上传文件是整体功能的一部分,文件在上传的过程中…...
