电子游戏数据分析报告

人工智能34

数据分析报告结论:

1.时间维度分析,从全球各地区的销售额变化趋势来看,全球销售额整体是从1980年开始逐步上升直到2008年达到销量顶峰后逐步降低,2008年后直接逐步下降,局部在2000年及2003年都有稍有下跌,2008年后的下降可能是与2008年全球金融危机的冲击以及新星互联网手游的兴起有关。

在全球地区销量的比较中发现,北美销量保持第一,欧洲销量第二,其次是日本,最后是其他地区。北美、欧洲等地区销售走势的波动与全球整体销售走势基本一致。不过,日本销量的变化则有所不同。因为日本游戏市场从1980年到1982年还没有起步,前几年的游戏销量基本为零,之后日本销量的整体变化是2006年前逐步增加。在2006年达到顶峰后,逐渐下降,领先于2008年全球整体销售趋势。

[En]

In the comparison of global regional sales, it is found that sales remain the first in North America, the second in Europe, followed by Japan and finally other regions. The fluctuation of sales trend in North America, Europe and other regions is basically consistent with the overall global sales trend. However, the change of sales volume in Japan is different. Because the Japanese game market has not yet started from 1980 to 1982, the game sales in the first few years are basically zero, and then the overall change of sales in Japan is a gradual increase before 2006. after reaching its peak in 2006, it gradually declined, ahead of the overall global sales trend in 2008.

从日本与全球每年的销量份额占比分布来看,日本的销量份额占比变化幅度较大,初始发展阶段的1983-1995年之间,日本地区的市场平均销售额每年占据全球市场销售额的41%,该阶段日本地区的游戏销售比较火爆占有较大的市场,出场即巅峰的既视感,1995年之后的年份,日本地区所占全球市场的份额不断下降,最终维持在全球市场的10%左右。日本地区游戏销量暴增的原因有游戏类型种类增多,日本用户更喜欢本土化游戏,Nintendo(任天堂)日本地区销售份额独占第一。

2.从产品类型维度分析,全球游戏销量TOP4的是Action(运动),Sports(运动),Shooter(射击),Role-Playing(角色扮演)类型的游戏,都占比整体销量的10%以上,以上4种类型的销量总占比达57%,反之销量垫底是Puzzle(智力),Adventure(探险),Strategy(策略)类型的游戏,三者销量占比都在10%以下。Action(运动)类型游戏销量最好,受众更多,盈利状况最好,是游戏用户的吸引点和游戏偏好,游戏公司可多关注Action类型的游戏开发和优化,抓住用户痛点,实现盈利增长。

其中Action游戏类型中的Grand Theft Auto系列游戏的销量最好并且该系列游戏类型占据了Action类型游戏的前四名,并且从平台维度分析Action类型的游戏发布的平台最多,平台受众面广,适合在更多的平台上发布。

从地区销量维度分析,看纵向游戏类型,对于销量最好的Action类型游戏来说,北美地区的用户占比最大,日本地区的占比最小,说明北美用户更为偏好Action类型游戏,所以对于Action类型的游戏公司运营及发布时可多偏向北美用户。横向来看,日本地区用户更为偏好Role-Playing(角色扮演)类型游戏,其次是Strategy(策略)类型游戏,所以针对日本地区用户,游戏设计团队可重点挖掘日本用户的游戏属性,实现日本地区游戏本土化。

3.从平台销量的维度分析,销量最好的TOP6平台是PS2、X360、PS3、Wii、DS、PS,前六分布的销量就占据整体销量的83%,其中TOP4平台销量占比达到了60%,这些游戏平台的受众较广,受消费者的认可,消费者更愿意在这些平台付费购买游戏,所以游戏公司发布游戏时可考虑主要在这些平台进行游戏发布。结合地区分布来看,全球各地区的top10平台分布重合度较高,分析部分地区的平台销量为0,游戏公司应调整策略甚至予以放弃。

对于游戏销量最好的PS2平台来说,EA(电艺)出版商的贡献值是最大的,贡献值占比高达20%,其中贡献销量占比前五的出版商占据55%的份额,前十的供应商贡献值销量占比达74%,其余的162家出版商的贡献值仅占剩下的26%,符合二八原则。

4.从出版商维度分析,以销量来看,日本的游戏出版公司Nintendo(任天堂)销量最好,占据世界销量的20.3%的市场份额,占据绝对优势,其次是占比12.4%的EA(电艺)和8.2%的Activision(动视),Nintendo(任天堂)的游戏最受到全球消费者的认可。

从游戏发布数量来看,EA(电艺)游戏出版公司是发布游戏最为频繁的公司,发布总数达1399个,占据全球发布量的8%,发布数量达900个以上的仅前四家公司,发布数量前十的公司占据了全球游戏发布总量的50%。但是有更多的公司游戏研发能力不足。

本文的组织结构如下:

一、分析背景

二、分析目的

三、理解数据

四、明确问题

五、分析思路

六、清洗数据

七、数据分析

八、总结和建议

一、分析背景

本次分析所采用的数据来源于kaggle上的Video Game Sales数据集 ,该数据集是通过基于使用Python的BeautifulSoup包的爬虫从vgchartz.com网站上获取,主要描述了全球电子游戏市场的1980年到2017年各游戏类型、出版商、发布平台、全球与地区的游戏销售额情况。

电子游戏(electronic Games)又称电玩游戏,是指所有依托于电子设备平台而运行的交互游戏,狭义的时候称视频游戏。根据运行媒介的不同分为五类:主机游戏(狭义的,此处专指家用机游戏,又称视频游戏控制台)、掌机游戏街机游戏电脑游戏手机游戏。在国外有时包括用于赌博的老虎机和柏青哥以及弹珠台。完善的电子游戏在20世纪末出现,改变了人类进行游戏的行为方式和对游戏一词的定义,属于一种随科技发展而诞生的文化活动。游戏产业与市场分析报告

因电子游戏必须依托电子设备,而游戏软件的发展一直和硬件的发展相辅相成, 所以可依其运行媒介对其进行分类。电子游戏常见的运行媒介有家用机掌机街机、电脑、手机。电子游戏软件与运行媒介两者是一种模组化(Modulized)的关系。一般而言,电子游戏的运行媒介各有不同市场,因此不宜以相同的标准来比较,即使它们之间的游戏常常相互移植。

二、分析目的

本文通过VG电子游戏销售数据对近三十年来电子游戏行业在全球的发展概况进行分析,找出不同类型的电子游戏的销售市场分布情况,了解全球游戏市场分布和特点,洞察数据特性,为各游戏出版公司的游戏销量提高以及未来游戏市场策略的调整提供数据决策支持。

三、理解数据

1.数据表结构

电子游戏数据分析报告

2. 字段理解

RANK-总销售额的排名
Name-游戏的名字
Platform-游戏发布平台(即PC,PS4等)
Year-游戏发行的年份
Genre-游戏的类型
Publisher-游戏的出版者
NA_Sales -北美地区销售额(百万)
EU_Sales -欧洲地区销售额(百万)
JP_Sales -日本地区销售额(百万)
Other_Sales—世界其他地区销售额(百万)
Global_Sales—全球销售总额。

四、明确问题

1.各年度游戏总销量有何变化,全球各地区销量趋势变化是否一致;目前游戏市场的发展趋势是怎样的?

2.哪种游戏类型销量是最好的?哪种游戏类型的游戏发布数量最多?排在前十的都是什么类型的游戏?

3.不同地区畅销的游戏类型是怎样的?不同地区的用户游戏偏好如何?该如何调整策略?

4.全球各个地区的销量是怎样的?在不同地区游戏的销售情况如何?

5.哪个游戏平台发布数量最多?最有发展潜力?各游戏平台的销量贡献值如何?

6.哪个游戏出版商发布的游戏数量最多?哪个游戏出版商发布的游戏是最受欢迎的?

7.哪些游戏出版商销量最高?最具游戏研发实力?

五、分析思路

对企业存在的问题进行梳理,分为以下几个维度进行分析,并得出销售分析的结论和建议。

[En]

The business problems are sorted out and divided into the following dimensions for analysis, and the conclusions and suggestions of sales analysis are drawn.

电子游戏数据分析报告

六、清洗数据

数据清洗通用流程:电子游戏数据分析报告

6.1 选择子集
从收集的数据集中筛选与业务分析相关的列(字段),并隐藏不相关的列。这里需要注意的是隐藏不需要的字段,最好不要直接删除数据,以确保数据的完整性。此数据集中的所有字段都是必填项,因此无需隐藏。

[En]

Columns (fields) related to business analysis are filtered from the collected dataset, and unrelated columns are hidden. What we need to pay attention to here is to hide the unwanted fields, and it is best not to delete the data directly to ensure the integrity of the data. All fields in this dataset are required, so there is no need to hide.

6.2 列名重命名
为了便于后续理解数据的真实业务含义,对不明确的列名进行了重命名。这里,将两个表中所有列的英文列名重命名为中文列名。

[En]

In order to facilitate the subsequent understanding of the true business meaning of the data, the unclear column names are renamed. Here, rename the English column names of all the columns in the two tables to Chinese column names.

6.3 删除重复值
重复值会影响数据的准确性,删除重复值可确保数据是唯一的。由于同一个游戏在不同的年份可能有不同的版本,所以当所有列的数据被复制时,它被视为重复数据。从数据集中删除重复值,并发现没有重复值。

[En]

Duplicate values interfere with the accuracy of the data, and deleting duplicate values ensures that the data is unique. Since the same game can have different versions in different years, it is considered as duplicate data when the data of all columns are duplicated. Delete the duplicate values from the dataset and find that there are no duplicate values.

6.4 缺失值处理
缺失值:缺失值会影响数据的准确性。直接过滤查看每一列,查看每一列数据。发现在年份字段中有273个缺失值,在游戏发行商字段中有36个缺失值,两者都占总数据集的1.86%。由于这些数据占总数据的比例相对较低,删除这些数据对整体数据的分析影响不大,所以删除这些缺失值。

[En]

Missing values: missing values affect the accuracy of the data. Filter and view each column directly, and check the data of each column. It is found that there are 273 missing values in the year field and 36 missing values in the game publisher field, both of which account for 1.86% of the total data set. Due to the relatively low proportion of the total data, deleting these data has little impact on the analysis of the overall data, so delete these missing values.

缺失值的3种查找方法:

1.直接看各列字段的计数值是否相同;

2.对各列字段进行筛选操作查看各列有没有空值;

3.采用定位条件对各列字段进行空值定位: 1、选中游戏类型列,点击编辑-查找-转到;2、点击定位条件-选择空值后,点击确定;

缺失值共有4种处理方式:

1.数据量较少且缺失值可推测出时,可通过手动补齐数据;

2.缺失值数据量占比较少,对整体数据量影响不大时,可直接删除缺失数据;

3.当需要利用缺失值所在行的数据时,可用平均值进行代替;

4.根据缺失值具体情况,可用相关统计模型计算出的值进行代替;

6.5 一致化处理
同质化:同质化是指数据有统一的标准和命名。每个数据列没有统一的格式值,方便后续的数据分析工作;由于数据集结构合理,格式统一,不需要进行一致性处理。

[En]

Homogenization: homogenization means that data has a unified standard and naming. There is no uniform format value in each data column to facilitate the subsequent data analysis work; because the data set structure is reasonable, the format is unified, so there is no need for consistency processing.

6.6异常值处理
本数据集容易出现异常值的是年份和销售额字段,对于年份字段,查看该字段,发现年份是从1980年连续到2017年,然后直接跳到2020年,而且2020年的数据仅1条,比较存疑,而进行网络查询,发现是该游戏是2009年Ubisoft在北美发布上市的,所以将该数据年份更改为2009。对于销售额字段,经过数据分析的描述统计,看各个销售额的平均值及最大最小值,发现并没有不合理的地方。所以不对这些字段进行处理。

电子游戏数据分析报告

6.7数据排序
将数据集按年份进行升序排序,发现2017年份的数据量只有3行,由于数据量太少不符合实际,所以对2017年的数据进行删除,在这里主要分析1980年到2016年的电子游戏销量情况。

经过上述数据清理步骤,所有数据集都已清理完毕,现在清理后的数据集的数据比较干净,为后续的数据分析工作奠定了基础。清理后,数据集中的数据量为16290个条目。

[En]

After the above data cleaning steps, all the data sets have been cleaned, and now the data of the cleaned data sets are relatively clean, which lays the foundation for the follow-up data analysis work. After cleaning, the amount of data in the dataset is * 16290 entries.*

七、数据分析

7.1 时间序列维度分析

1.全球与地区销售趋势分析

首先从整体销售额出发,根据时间序列,分析1980年到2016年以来的全球及各地区的销售额变化趋势分布情况,对全球和各地区的整体的销售趋势先有个基本的了解。

电子游戏数据分析报告

>>>从全球和各地区的销售额变化趋势来看,全球销售额整体情况是从1980年开始逐步上升直到2008年达到销量顶峰后逐步降低,局部在2000年及2003年都有下跌趋势,2008年后的下降可能是与2008年全球金融危机的冲击以及由于互联网的兴起使得游戏逐步转到PC电脑、手机平台以及VR等新概念有所关系。结合现实游戏体验,近年来的网游及手游的强势兴起和竞争确实有力地冲击了传统平台的游戏份额,所以传统游戏份额的下跌不可避免。

在地区销量对比中发现,北美销量仍居首位,欧洲次之,日本次之。北美、欧洲等地区销售走势的波动与全球整体销售走势基本一致。然而,人们发现,日本的销售变化与此不同。因为日本游戏市场从1980年到1982年还没有起步,前几年的游戏销量基本为零,之后日本销量的整体变化是2006年前逐步增加。在2006年达到顶峰后,逐渐下降,领先于2008年全球整体销售趋势。

[En]

In the comparison of regional sales, it is found that sales remain the first in North America, the second in Europe, followed by Japan. The fluctuation of sales trend in North America, Europe and other regions is basically consistent with the overall global sales trend. However, it is found that the change of sales in Japan is different from this. Because the Japanese game market has not yet started from 1980 to 1982, the game sales in the first few years are basically zero, and then the overall change of sales in Japan is a gradual increase before 2006. after reaching its peak in 2006, it gradually declined, ahead of the overall global sales trend in 2008.

2.日本与全球的销量占比变化

由于日本销量变化速度与整体不一致,上图变化趋势较为粗略,为更直观地了解日本销量变化趋势,现将日本及全球销量占比如下。

[En]

As the pace of sales change in Japan is not consistent with that of the whole, and the trend of change in the above chart is relatively rough, in order to more intuitively understand the changing trend of sales in Japan, the proportion of sales in Japan and the world is as follows.

电子游戏数据分析报告

>>>从日本与全球每年的销量份额占比分布来看,日本的销量份额占比变化幅度较大, 在全球电子游戏还在初始发展阶段的1983-1995年之间,日本地区的市场平均销售额每年占据全球市场销售额的41%,占比较大不容小觑,说明日本该阶段日本地区的游戏销售比较火爆占有较大的市场,出场即巅峰的既视感,之后的年份,日本地区所占全球市场的份额不断下降,最终维持在全球市场的10%左右。

3.日本销量暴增的原因分析-游戏类型维度

首先在1983-1995年日本地区游戏暴增时期特定选取1983年、1986年和1995年的具体游戏类型分布,从日本地区游戏销量暴增时的各游戏类型的销量情况的角度进行原因分析。

电子游戏数据分析报告

电子游戏数据分析报告

电子游戏数据分析报告

>>>日本地区在游戏初始阶段,对比前三年的游戏销售额的0销量,1983年日本地区支撑游戏销量增长的仅有的游戏类型是Platform(平台),Sports(竞技),Misc(混合),其中Platform类型的游戏销量最高,占比达44.6%,实现日本地区游戏销量从无到有,此时其他类型游戏销量为0,此时仅有3种类型游戏在市场发布。

在1986年的游戏销售类型分布中发现游戏类型数量和销售额相对于1983年都有所增加,Platform(平台),Action(动作),Shooter(射击)类型游戏占据销量前三,Sports(竞技)游戏排名第四,前四者类型游戏销量占比达99%。其中Misc(混合)类型未上排名,说明混合类游戏渐渐被用户抛弃。1986年时游戏类型数量增至6种。随后与1995年的各游戏类型销量对比发现,销量占比前三的变成了Role-Playing(角色扮演)、Fighting(战斗)、Platform(平台)类型游戏,Sport(竞技)和Shooter(射击)、Misc(混合)类型游戏紧随其后,此时游戏类型相对1985年增加至12种以上。同理,查看其他年份的游戏销量对比并得出结论。

综上所述,从游戏类型来看,日本游戏销量激增的原因是日本发布的游戏类型更加多样,发布的游戏数量逐年增加,用户对游戏的需求不断增加,游戏的流行风格也在逐年发生变化。这一变化令人惊叹,在1983至1995年间迅速占据了全球40%以上的市场份额。

[En]

To sum up, from the perspective of game types, the reason for the surge in game sales in Japan is that the types of games released in Japan are more diverse, the number of games released is increasing year by year, the demand for games by users is increasing and the popular style of games is changing year by year. The change is amazing, rapidly occupying more than 40% of the global market share between 1983 and 1995.

4.日本销量暴增的原因分析-出版商维度

从出版商的维度查看日本地区游戏用户对于出版商的销费偏好。

电子游戏数据分析报告

>>>从出版商的维度,在1983年到1995年日本地区游戏销量爆发的时期,日本地区的用户尤其偏好本土出版商的游戏,Nintendo(任天堂)稳稳占据日本地区销量第一,达到116百万美元远超销量第二的公司,销量第二的日本公司Namco Bandai Games(万代南梦宫)也仅仅25百万美元销售额,观察其他出版商分布,发现日本地区之外的出版商的游戏在日本的销售额都比较少,日本地区游戏用户更偏好本土游戏。

7.2 产品类型维度分析

1.各类型游戏全球销量分布

从游戏产品类型维度分析全球销售情况,了解不同类型游戏在销售数据分布上的差异。

[En]

Analyze the global sales situation from the dimension of game product types, and understand the differences in the distribution of sales data of different types of games.

电子游戏数据分析报告

电子游戏数据分析报告

>>>从全球销售额的角度来看不同产品类型的游戏销量,销量最好的是Action(运动),Sports(运动),Shooter(射击)Role-Playing(角色扮演)类型的游戏,都真占比整体销量的10%以上,以上4种类型的销量总占比达57%,销量垫底是Puzzle(智力),Adventure(探险),Strategy(策略)类型的游戏,三者销量占比都在10%以下。Action(运动)类型游戏销量最好,受众更多,盈利状况最好,是游戏用户的吸引点和游戏偏好,游戏公司可多关注Action类型的游戏开发和优化,抓住用户痛点,实现盈利增长。

2.销量最高类型游戏的TOP6分布-Action类型为例

为了细化了解具体是哪些游戏,以销量最好的Action类型游戏为例,分析该类型游戏下的前6名游戏销量。

电子游戏数据分析报告

>>>在全球总销量最高的Action游戏类型中查看Top6具体游戏的销量分布,发现Grand Theft Auto系列游戏的销量最好并且该系列游戏类型占据了Action类型游戏的前四名,说明Action抓住了用户痛点,值得Action类型开发游戏的出版商研究。

3.各类型游戏的发行平台数量分布

统计不同类型游戏的平台数量,了解不同类型游戏的平台偏好。

[En]

Statistics of the number of platforms for different types of games, to understand the platform preference of different types of games.

电子游戏数据分析报告

>>>由上图可知,Action类型的游戏发布的平台最多,平台受众面广,适合在更多的平台上发布游戏,用户得以在不同平台享受游戏,受平台的限制较少,这进一步促进了用户对于Action类型游戏的喜爱以及该类型游戏销量的提升。

4.畅销类型游戏的平台分布-Action类型为例

销量最好的游戏类型是Action类型,查看该类型游戏的平台发布情况,探究销量好的游戏的特点。

电子游戏数据分析报告

>>>Action类型游戏发布的各类平台都有涉及。主要的发布平台前四是PS3、PS2、DS、X360,都在300次发布数以上,说明游戏更新换代较快,优化更为频繁,同时也说明这些平台的用户量广,用户游戏体验更好,游戏公司可增加在这些平台发布的比例,更有利于用户的下载以及更好的游戏服务体验。

5.不同地区的游戏类型销量对比

地区维度和游戏类型维度以销售额数字汇总,数值按全球销售额降序排列,每个地区排名前十的游戏类型以黄色显示。

[En]

The regional dimensions and game type dimensions are summarized in terms of sales figures, the values are sorted in descending order by global sales, and the top 10 game types in each region are displayed in yellow.

电子游戏数据分析报告

>>>从不同地区的纵向维度看,各类型游戏的销量都有所重叠,特别是前十销量高度重叠。纵横向按类型的维度看列表的形式不够直观,但是能够通过销量数值显示地区销量情况。

6.各类型游戏的地区销量对比

按照区域销售的形式堆叠各种类型的游戏,展示每类游戏的区域销售份额分布,展示不同区域用户的游戏销售偏好。

[En]

Stack various types of games according to the form of regional sales, show the regional sales share distribution of each type of games, and show the game sales preferences of users in different regions.

电子游戏数据分析报告

>>>从上图表可知各类型游戏的地区销量分布,以纵向游戏类型来说,展示不同地区的游戏用户的消费偏好,对于销量最好的Action类型游戏来说,北美地区的用户占比最大,日本地区的占比最小,说明北美用户更为偏好Action类型游戏,所以对于Action类型的游戏公司运营及发布时可多偏向北美用户。横向来看,日本地区用户更为偏好Role-Playing(角色扮演)类型游戏,其次是Strategy(策略)类型游戏,所以针对日本地区用户,游戏设计团队可重点挖掘日本用户的游戏属性,实现日本地区游戏本土化。以横向各地区销量进行对比,各类型游戏中北美地区的销量占比最大,其次是欧洲地区、日本地区。其他类型游戏的地区用户偏好分析同理。

7.3 发布平台维度分析

1.游戏销量TOP10的平台分布

根据游戏发布平台的维度,分析了游戏的销售分布及其占比,分析了游戏公司发布的合适平台的选择偏好。

[En]

According to the dimension of the release platform of the game, this paper analyzes the sales distribution and its proportion, and analyzes the selection preference of the appropriate platform released by the game company.

电子游戏数据分析报告

>>>由以上可知,各平台游戏销量的TOP平台10分布中,销量最好的平台TOP6是PS2、X360、PS3、Wii、DS、PS,这前六分布的销量就占据整体销量的83%,其中销量TOP4平台占比超过一半以上,占比达到了60%,说明这些游戏平台的受众较广,受消费者的认可,消费者更愿意在这些平台付费购买游戏,所以游戏公司发布游戏时可考虑主要在这些平台进行游戏发布。 结合上面Action类型游戏的发布平台数量分布,再次印证了该分析观点。

2.不同地区畅销游戏平台对比

用数据透视表汇总数据,然后按照全球销售额降序排名,再用条件格式函数表示各地区销售额前十大发布平台,直观展现全球各地区前十大游戏平台分布情况。

[En]

Use the PivotTable to summarize the data, and then rank according to the descending order of global sales, and then use the conditional format function to express the top ten release platforms of sales in each region, and intuitively show the distribution of the top ten game platforms in all regions of the world.

电子游戏数据分析报告

>>>由以上表格数据直观显示各地区的游戏平台情况,与全球游戏销量的平台对比,各地区的游戏平台前十大部分都有所重合,其中欧洲地区以及其他地区的平台销量分布高度重合,日本地区和北美的平台前十分布稍微有差异,这体现了不同地区用户的游戏平台偏好,可以针对该用户偏好做好不同地区的游戏平台发布。同时也可以看到不同地区的销量末尾的游戏平台出现较多销售额为0的情况,其中欧洲、北美、其他地区的NG、WS、TG16等类型的游戏销量为0,可能用户的受众面较小,用户认可的数量不多,所以游戏公司发布的时候可根据该情况尽量减少或者避开这些平台的游戏发布,调整策略,减少在这些平台的运营精力和资金。

3.畅销平台的出版商贡献值对比-PS2为例

重点分析最畅销的PS2游戏平台的出版商贡献值分布,了解不同出版商在PS2平台的贡献额分布情况,由于涉及的平台总共有172个,数量众多,所以为了方便可视化显示,展示分析前十销量的平台,将其余的平台销量汇总归结为其他类型销量。

电子游戏数据分析报告

>>>由图表可知,对于游戏销量最好的PS2平台来说,EA出版商的贡献值是最大的,贡献值占比高达20%,其中贡献销量占比前五的出版商占据55%的份额,前十的供应商贡献值销量占比达74%,其余的162家出版商的贡献值仅占剩下的26%,符合二八原则。

7.4 游戏出版商维度分析

1.不同出版商的销量及其占比分布

对于历年发行商的游戏销售情况,对销售额排名前12位的发行商及其占比按降序进行筛选和排序。

[En]

For the game sales of publishers in all years, the top 12 publishers' sales value and their proportion are screened and sorted in descending order.

电子游戏数据分析报告

>>>从全球销量来看,日本的游戏出版公司Nintendo(任天堂)销量最好,占据世界销量的20.3%的市场份额,占据绝对优势,其次是占比12.4%的EA(电艺)和8.2%的Activision(动视),任天堂的游戏最受到全球消费者的认可。

2.各出版商的发布游戏数量分布

从发行量入手,探索各发行商的游戏发行量,进一步发现发行商在游戏设计、开发、发行方面的实力。

[En]

Starting from the number of releases, explore the number of game releases of various publishers, and further discover the strength of the game design, development and publication of publishers.

电子游戏数据分析报告

>>>全球总的游戏出版发布数量16286个,数量太多,其中包括同一游戏的更新导致的不同版本。这里取前13个游戏发布数量达300个以上的出版商分布,其余出版商的游戏发布数量归结为其他出版商。可以看到EA(电艺)游戏出版公司是发布游戏最为频繁的公司,发布总数达1399个,占据全球发布量的8%,发布数量达900个以上的仅前四家公司,发布数量前十的公司占据了全球游戏发布总量的50%。

在其他出版商的分布中,游戏发布数量小于100次以内的数量达547家,游戏发布数量小于10次以内的数量达424家,其中仅发布1次的游戏出版公司有192家,占整体发布数量的1.2%,说明有更多的公司研发能力不够,设计实力不足,游戏行业之间竞争压力大。

八、总结和建议

1.时间维度分析,从全球各地区的销售额变化趋势来看,全球销售额整体是从1980年开始逐步上升直到2008年达到销量顶峰后逐步降低,2008年后直接逐步下降,局部在2000年及2003年都有稍有下跌,2008年后的下降可能是与2008年全球金融危机的冲击以及新星互联网手游的兴起有关。

在全球地区销量的比较中发现,北美销量保持第一,欧洲销量第二,其次是日本,最后是其他地区。北美、欧洲等地区销售走势的波动与全球整体销售走势基本一致。不过,日本销量的变化则有所不同。因为日本游戏市场从1980年到1982年还没有起步,前几年的游戏销量基本为零,之后日本销量的整体变化是2006年前逐步增加。在2006年达到顶峰后,逐渐下降,领先于2008年全球整体销售趋势。

[En]

In the comparison of global regional sales, it is found that sales remain the first in North America, the second in Europe, followed by Japan and finally other regions. The fluctuation of sales trend in North America, Europe and other regions is basically consistent with the overall global sales trend. However, the change of sales volume in Japan is different. Because the Japanese game market has not yet started from 1980 to 1982, the game sales in the first few years are basically zero, and then the overall change of sales in Japan is a gradual increase before 2006. after reaching its peak in 2006, it gradually declined, ahead of the overall global sales trend in 2008.

从日本与全球每年的销量份额占比分布来看,日本的销量份额占比变化幅度较大,初始发展阶段的1983-1995年之间,日本地区的市场平均销售额每年占据全球市场销售额的41%,该阶段日本地区的游戏销售比较火爆占有较大的市场,出场即巅峰的既视感,1995年之后的年份,日本地区所占全球市场的份额不断下降,最终维持在全球市场的10%左右。日本地区游戏销量暴增的原因有游戏类型种类增多,日本用户更喜欢本土化游戏,Nintendo(任天堂)日本地区销售份额独占第一。

2.从产品类型维度分析,全球游戏销量TOP4的是Action(运动),Sports(运动),Shooter(射击),Role-Playing(角色扮演)类型的游戏,都占比整体销量的10%以上,以上4种类型的销量总占比达57%,反之销量垫底是Puzzle(智力),Adventure(探险),Strategy(策略)类型的游戏,三者销量占比都在10%以下。Action(运动)类型游戏销量最好,受众更多,盈利状况最好,是游戏用户的吸引点和游戏偏好,游戏公司可多关注Action类型的游戏开发和优化,抓住用户痛点,实现盈利增长。

其中Action游戏类型中的Grand Theft Auto系列游戏的销量最好并且该系列游戏类型占据了Action类型游戏的前四名,并且从平台维度分析Action类型的游戏发布的平台最多,平台受众面广,适合在更多的平台上发布。

从地区销量维度分析,以纵向游戏类型来说,对于销量最好的Action类型游戏来说,北美地区的用户占比最大,日本地区的占比最小,说明北美用户更为偏好Action类型游戏,所以对于Action类型的游戏公司运营及发布时可多偏向北美用户。横向来看,日本地区用户更为偏好Role-Playing(角色扮演)类型游戏,其次是Strategy(策略)类型游戏,所以针对日本地区用户,游戏设计团队可重点挖掘日本用户的游戏属性,实现日本地区游戏本土化。

3.从平台销量的维度分析,销量最好的TOP6平台是PS2、X360、PS3、Wii、DS、PS,前六分布的销量就占据整体销量的83%,其中TOP4平台销量占比达到了60%,这些游戏平台的受众较广,受消费者的认可,消费者更愿意在这些平台付费购买游戏,所以游戏公司发布游戏时可考虑主要在这些平台进行游戏发布。结合地区分布来看,全球各地区的top10平台分布重合度较高,分析部分地区的平台销量为0,游戏公司应调整策略甚至予以放弃。

对于游戏销量最好的PS2平台来说,EA(电艺)出版商的贡献值是最大的,贡献值占比高达20%,其中贡献销量占比前五的出版商占据55%的份额,前十的供应商贡献值销量占比达74%,其余的162家出版商的贡献值仅占剩下的26%,符合二八原则。

4.从出版商维度分析,以销量来看,日本的游戏出版公司Nintendo(任天堂)销量最好,占据世界销量的20.3%的市场份额,占据绝对优势,其次是占比12.4%的EA(电艺)和8.2%的Activision(动视),Nintendo(任天堂)的游戏最受到全球消费者的认可。

从游戏发布数量来看,EA(电艺)游戏出版公司是发布游戏最为频繁的公司,发布总数达1399个,占据全球发布量的8%,发布数量达900个以上的仅前四家公司,发布数量前十的公司占据了全球游戏发布总量的50%。但是有更多的公司游戏研发能力不足。

Original: https://blog.csdn.net/weixin_55077976/article/details/123800968
Author: Williams W
Title: 电子游戏数据分析报告



相关阅读

Title: RuntimeError: element 0 of tensors does not require grad and does not have a grad_

今天在跑代码的过程中,因为要训练一个模型然后在测试阶段使用PGD来生成相应的adv_image来测试这个模型,结果运行到测试阶段出现下面的问题。

报错如下:
RuntimeError: element 0 of tensors does not require grad and does not have a grad_

我的代码如下:

def validate_roubst(val_loader, model, criterion, epoch, args, log=None, tf_writer=None, flag='roubst_val'):
    batch_time = AverageMeter('Time', ':6.3f')
    losses = AverageMeter('Loss', ':.4e')
    top1 = AverageMeter('Acc@1', ':6.2f')
    top5 = AverageMeter('Acc@5', ':6.2f')

    model.eval()
    all_preds = []
    all_targets = []

    with torch.no_grad():
        end = time.time()
        for i, (input, target) in enumerate(val_loader):
            if args.gpu is not None:

                print('............')

            input = input.cuda(args.gpu, non_blocking=True)
            target = target.cuda(args.gpu, non_blocking=True)

            attack_method = PGD(model, args.device)
            adv_example = attack_method.generate(input, target, epsilon = 8/255, num_steps = 20, step_size = 0.01, clip_max = 1.0, clip_min = 0.0, print_process = False, bound = 'linf')

            output = model(adv_example)
            loss = criterion(output, target)

            acc1, acc5 = accuracy(output, target, topk=(1, 5))
            losses.update(loss.item(), input.size(0))
            top1.update(acc1[0], input.size(0))
            top5.update(acc5[0], input.size(0))

            batch_time.update(time.time() - end)
            end = time.time()

            _, pred = torch.max(output, 1)
            all_preds.extend(pred.cpu().numpy())
            all_targets.extend(target.cpu().numpy())

            if i % args.print_freq == 0:
                output = ('Test: [{0}/{1}]\t'
                            'Time {batch_time.val:.3f} ({batch_time.avg:.3f})\t'
                            'Loss {loss.val:.4f} ({loss.avg:.4f})\t'
                            'Prec@1 {top1.val:.3f} ({top1.avg:.3f})\t'
                            'Prec@5 {top5.val:.3f} ({top5.avg:.3f})'.format(
                    i, len(val_loader), batch_time=batch_time, loss=losses,
                    top1=top1, top5=top5))
                print(output)
        cf = confusion_matrix(all_targets, all_preds).astype(float)
        cls_cnt = cf.sum(axis=1)
        cls_hit = np.diag(cf)
        cls_acc = cls_hit / cls_cnt
        output = ('{flag} Results: Prec@1 {top1.avg:.3f} Prec@5 {top5.avg:.3f} Loss {loss.avg:.5f}'
                .format(flag=flag, top1=top1, top5=top5, loss=losses))
        out_cls_acc = '%s Class Accuracy: %s'%(flag,(np.array2string(cls_acc, separator=',', formatter={'float_kind':lambda x: "%.3f" % x})))
        print(output)
        print(out_cls_acc)
        if log is not None:
            log.write(output + '\n')
            log.write(out_cls_acc + '\n')
            log.flush()

        tf_writer.add_scalar('loss/test_'+ flag, losses.avg, epoch)
        tf_writer.add_scalar('acc/test_' + flag + '_top1', top1.avg, epoch)
        tf_writer.add_scalar('acc/test_' + flag + '_top5', top5.avg, epoch)
        tf_writer.add_scalars('acc/test_' + flag + '_cls_acc', {str(i):x for i, x in enumerate(cls_acc)}, epoch)

     return top1.avg

出了问题当然要找到解决方案:

2.1 方案1

大多数人是说要加这一句:

loss.requires_grad_(True) #加入此句就行了

具体做法就是:

loss = criterion(output, target)
loss.requires_grad_(True) # 加入此句在这个位置
...

loss.backward()

但是经过本人尝试,还是没有什么用,因为我在train阶段不会 出现错误,只有在test阶段就报错。

2.2 方案2

回到本质,或者从错误报告的角度来看,错误提示大致意味着元素不需要渐变。

[En]

To return to the essence, or from the point of view of error reporting, the error hint roughly means that the element does not require a gradient.

然后我仔细瞅了瞅我那段代码,发现了一个可疑之处: with torch.no_grad()
最后仔细查看了这个东西的一些使用规则(参考文献1):

with torch.no_grad()则主要是 用于停止autograd模块的工作,以起到加速和节省显存的作用,具体行为就是停止gradient计算,从而节省了GPU算力和显存,但是并不会影响dropout和batchnorm层的行为。

看到我上面加粗的字体了吧,原来使用with torch.no_grad()就不会自动求梯度了,因为我们使用PGD生成adv_image需要求梯度,所以加上with torch.no_grad()就导致了我们无法求梯度,最终出现了下面的错误。

故解决方案为:

将 with torch.no_grad() 去掉

Original: https://blog.csdn.net/wyf2017/article/details/123156380
Author: 流年若逝
Title: RuntimeError: element 0 of tensors does not require grad and does not have a grad_

相关文章
PyQT5播放音频 人工智能

PyQT5播放音频

最近自己写的一个软件需要在持续监测T-box的信号强度值时,领导提出在信号低于阈值时给出警报或指示,之前的想法是在软件界面上加一个指示灯,但这样还是需要Tester去盯着屏幕,这样不友好,所以索性在通...
基于Tensorflow的环境声音分类 人工智能

基于Tensorflow的环境声音分类

本章我们来介绍如何使用Tensorflow训练一个区分不同音频的分类模型,例如你有这样一个需求,需要根据不同的鸟叫声识别是什么种类的鸟,或者识别环境中的声音类型(空调声、汽车鸣笛声、儿童玩耍声、狗叫声...
Python语音转文字、音频切割、语音识别 人工智能

Python语音转文字、音频切割、语音识别

大家好,我是 一行 不知道你有没有录过自我介绍的视频,尤其是那种加上PPT播放的长时间视频 可能因为说错一句话就得重来,又或者因为思考而暂停时间太久又得重来,以至于弄了两个小时才做好五分钟的视频 所以...