春节档排片地域可视化分析
数据来源:https://www.heywhale.com/mw/project/6201173f7a7c9a0017c3236a/dataset
一、明确问题
- 春节档排片地域分布
二、数据清洗
通过excel的筛选功能发现:有些场次是空值,将空值筛选出来如下:
再看看这些电影的其它城市的场次数据:
我们不知道遗漏的价值有多少,如果看看其他城市的情况,次数相对较少,所以我们在这里删除遗漏的电影。
[En]
We don't know how much the missing value is, and if we look at the situation in other cities, the number of times is relatively small, so here we delete the missing movies.
; 三、数据分析
采用群组分析方法,将数据按城市水平分组,并对比。
- 研究思路
数据导入Navicat—通过where语句删除不研究的电影—通过GROUP BY进行数据—将同组一个星期的所有场次加和输出—Excel绘制堆积条形图 - 编程实现
SELECT 城市,电影,SUM(场次) AS 场次
FROM 春节档地域分布
WHERE 电影 NOT IN ('CLevel','CityLevel','702084|带你去见我妈','708119|独家头条','697410|魔法精灵')
GROUP BY 城市,电影
下面是部分结果:
将数据导出,进行后续excel的绘图分析。
- Excel绘制堆积条形图
利用数据透视表,将每个电影在每类城市的场次一一展现如下:
根据上表绘制堆积条形图如下:
- 结论
一是无论是什么样的城市,长津湖水闸大桥布置次数最多。第二个和第三个分别是杀手不是很冷静,不是很神奇。愚蠢的孩子。[En]
First, no matter what kind of city it is, the Watergate Bridge of Changjin Lake has been arranged for the most times. The second and third respectively is that the killer is not very calm and miraculous. Stupid kid.
第二,赛事数量与城市类别之间不存在线性关系。总的来说,电影放映集中在二三四线城市,这可能与一线城市居民大部分时间花在工作上,五线城市居民消费水平不高有关。
[En]
Second, there is no linear relationship between the number of events and the category of cities. Generally speaking, movie shows are concentrated in second -, third-and fourth-tier cities, which may be related to the fact that residents in first-tier cities spend most of their time at work and that the consumption level of residents in fifth-tier cities is not high.
Original: https://blog.csdn.net/weixin_49924760/article/details/123024675
Author: weixin_49924760
Title: 【春节档排片地域可视化分析】

PICASSO,一个高效的搜推广稀疏训练解决方案

006-中断

如何利用词嵌入技术来进行微博情绪分类

ModelCheckpoint自动保存模型

主流开源分布式图数据库 Benchmark

tensorflow神经网络多维曲线拟合

有点奇怪!访问目的网址,主机能容器却不行

用pyinstaller打包多个python文件及问题解决(较全总结)

运行Tensorboard可视化文件

Python neo4j建立知识图谱,药品知识图谱,neo4j知识图谱,知识图谱的建立过程,智能用药知识图谱,智能问诊必备知识图谱

目标跟踪评估绘图(2):Windows10环境OTB100数据集配置,绘制成功率和精确度曲线图,绘制目标跟踪框图,并与其他算法比较

grpcio-1.41.1的安装以及排错记录(wheel的一大用处)

前端矩阵知识

Keras深度学习(6)-多标签多分类之验证码识别
