精品案例 英超进球谁最强

 

本案例收集了2012到2013赛季的英超赛事数据。数据集记录了16支球队的部分球员(166位)在当前赛季的各种表现以及下个赛季的进球数,通过数据分析,对于评价球员场上表现以及预测球员下赛季进球有一定帮助。...



英格兰足球超级联赛简称英超,是英格兰足球总会属下的职业足球联赛,欧洲五大联赛之一,由20支球队组成。英超联赛成立于1992年2月20日,其前身是英格兰足球甲级联赛。英超一直以来被认为是世界上最好的联赛之一,快节奏、竞争激烈、强队众多,现已成为世界上最受欢迎的体育赛事,也是收入最高的足球联赛。

英超赛场上诞生了许多伟大球员,已经退役的著名球员包括亨利(阿森纳)、吉格斯(曼联)、阿兰希勒(纽卡斯尔)等。在现役球员中,也有许多在英超赛场上大放异彩。



随着科技的发展和大数据产业的兴起,传统的足球赛事逐渐与新兴的数据分析相结合,这种趋势将足球产业的发展推向了新的高度。



本案例收集了2012到2013赛季的英超赛事数据。数据集记录了16支球队的部分球员(166位)在当前赛季的各种表现以及下个赛季的进球数。



本案例的数据虽然略陈旧,来自2012到2013赛季,但数据分析思路可以借鉴,对于评价球员场上表现以及预测球员下赛季进球有一定帮助。
我是“背景介绍”与“数据分析”的分割线
小编将2012到2013赛季英超球队的进球失球比标注在地图上(想学习如何用R语言绘制地图请移步阅读原文)。这个赛季的三甲球队分别是曼联、曼城和切尔西。冠军曼联进球数86个,在所有球队中遥遥领先,进球失球比高达2。亚军曼城虽然进球数不多(66个),但凭借坚固的防守,失球数最少(34个),进球比是1.94。季军切尔西队的进球失球比为1.92。



2012到2013赛季的最佳射手前三名分别是范佩西、苏亚雷斯和贝尔,进球数分别是26个、23个和23个。在下一赛季,苏亚雷斯表现突出,一举登上射手榜首位,进球数达到31个。而贝尔则在下一赛季转会皇家马德里。



数据集中的166位球员有86人是中场,50人是后卫,30人是前锋。在2012到2013赛季贡献了624个进球。前锋位置的球员的人均进球数与最大进球数均为最高,30位前锋共贡献了264个进球,占总进球数的42.31%;后卫球员的人均进球数和最大进球数均为最低。其中,进球最多的前锋为范佩西(26个),中场为本特克(19个),后卫为伊万和贝恩斯(5个)。



球员在场上的进球表现存在一定的连贯性,这从本赛季 vs. 下赛季进球的散点图中可一窥一二。大部分球员的进球表现在2012-2013赛季和2013-2014赛季是非常相似的。比如,苏亚雷斯在2012-2013赛季以及2013-2014赛季中都有上佳表现。但同时,少数球员在两个赛季中的表现存在了较大的差异,最典型的就是范佩西,在2013-2014赛季进球数相较于2012-2013赛季下滑了不少。



为了评价球员在场上的整体表现,小编从数据集中选取了22个技术指标,进行因子分析。因子分析是多元统计中的降维方法,目的在于寻找影响一组变量的公共潜在因素。对因子分析感兴趣的同学,请关注狗熊会媛子美女的“数据江湖之多元剑法”系列。这22个指标之间的相关性展示在下图当中(感谢云伯伯的corrplot包,自从开始使用之后,妈妈再也不用担心我的数据可视化了)。部分变量的线性相关性较强(例如射门次数和射正次数),数据集比较适合进行因子分析。



因子分析的结果表明,保留3个公共因子,累积方差贡献率可以达到58.82%。根据主成分法估计的因子载荷矩阵,三个因子分别为进攻因子、防守中场因子防守后卫因子(别问水妈为什么叫这三个名字,资深球迷给起的,听球迷的)。



根据因子得分,小编分别找出了在三个因子上得分最高的球员,代表进攻型、防守中场型和防守后卫型球员。



因子分析的结果,只是基于本案例的样本数据,由于搜集到的场上技术指标并不全面(例如传球成功次数,控球时间等关键指标未考虑),对于球员的整体评价无法做到完美。

在统计建模部分,本案例进一步建立了泊松回归模型,预测球员的下一赛季进球数。对模型感兴趣的熊孩子们,可以到精品案例微店进行购买。

末了,送上水妈家里两只球迷的看球日常,感谢大家对水妈和关关精品案例系列的支持,我们继续努力。
>>>>

点击左下角“阅读原文”即可下载分析报告、代码、PPT 。

如果您对我们的内容感兴趣,请关注微信公众号“狗熊会”,或扫描下方二维码


点击下面“阅读原文”有分析报告、代码、PPT


    关注 狗熊会


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册