颜强专栏:足球数据,深度挖掘

 

预判威胁、宽度序列,这样的术语,你觉得应该属于哪个行业?...



预判威胁、宽度序列,这样的术语,你觉得应该属于哪个行业?

当“预期进球”(expected Goals,简称XG)还属于媒体传播相对较,新足球(新足球)专业词汇时,XT(预判威胁,或者预期威胁)等,早已经是欧洲职业,俱乐部的数据分析师们,日常使用的专业数据。

科技可以帮助分析球员,的每一次跑位和选择。
界外球也要量化分析

进行数据化分析的,不仅是那些欧冠,常客的豪门俱乐部,哪怕是一些二,三级联赛俱乐部,像英冠布伦特福德这种,都特别善于借助现代科技手段,维持俱乐部运营。

他们早就进入了职业体育数据化分析和数据化,管理的moneyball时代——通过大数据采集,深度分析,得出来的从数字角度解析足球的新方式,(新方式)。

每个职业俱乐部,都会竭尽全力取得竞争方面的,些许优势。在欧洲一度,所向披靡的利物浦,就是这当中的一个,杰出代表。就在界外球这一个细节上,利物浦从上季开始,就请到了一位叫托马斯·格罗内马克的专家来,在每一个细节上,加深积累和优化,提高球队的竞争优势。

就界外球这一项指,标的提升,让利物浦从上赛季在英超界外球,抛出之后的控球成功率的联赛倒数第3位,上升到了全欧洲的第2位。

而过去3个赛季有一项,数据指标,从最开始被怀疑甚至,被嘲笑,而变得越来越被人所接受,那就是XG(expected goals),“预期进球”,或者“期待进球”。这项数据刚出现时,经验主义的传统足球人士,不屑一顾,认为进球能否产生,如何可能通过数据量化来“期待”?

但这一项数据,如今在衡量球队,进攻机会方面,已经成为了高识别性术语,不光是媒体专家和评论员,球迷也开始越来越多地,使用类似数据。

XG的运用,最早出现在2017-2018赛季英国BBC的《当日比赛》(MOTD)节目当中,用来衡量特定区域的射门,得分可能。

这项数据背后,其实有着海量数据,对于不同球员不同球队不同,场上位置,都有着精细分析。之所以迅速被广泛接纳,是因为xg确实对球队和球员,射门得分可能,有了更量化的分析。

球员的每一组,数据都将建模。
控球压力,清晰指导

xg只是职业足球数据,的冰山一角,一些更深入、看似却更模糊的足球数据,度量早已存在,例如防守压力。

压力这个概念,在竞赛过程中,很难用来被量化,而防守的很多数据,过往很容易被忽视,除了拦截和铲球。但这项“对于控球的压力”(pressures on the ball),能让观察者对球队的,防守能力有了更好的认知。

所谓控球压力,度量的产生,是一个球员控球状态下,防守方队员逼近到,2米范围内的状态,来进行部分衡量。根据英超本季前,25轮的数据分析,曼城和利物浦是在对方,半场施加防守压力最强的球队。

而在另一端,阿斯顿维拉和诺维奇,则是在本方禁区附近、遭受最大控球压力的球队。

个体球员的防守能力同样也可以用这,项数据来分析。足球数据公司statsbomb,就提供个体球员施加“控球压力”的评估,像切尔西后腰坎特,平均每场比赛他能有3.2次成功的铲球和,2次成功的断球,这是简单防守数据。

在“控球压力”这一项,坎特每场比赛能够给,对手施加22次有效压力。这对于了解一个球员,的活跃性、防守能力的特点,便具备了更深入一层,的数据挖掘。

哪怕逐渐司空见惯的XG,也能在数据挖掘和提炼上,得出一些经验主义无法,分析出来的内容:通过vr技术实现的一些,球场位置和人体移动识别,能对防守队员站位,具备更清晰的区分,这样就能更明确地分析出,防守方是如何来应对所,期待进球的。

这项数据的合理运用,能帮助进攻球员更科学地寻找,防守方的弱点,也能帮助防守方通过对进攻方组合以及,个体特点的分析,来实现更好的拦截防守。

许多俱乐部早已开始使用这样的,深度数据知识,像曼城俱乐部在曼奇尼,时代,就对防守球员有着,清晰的数据使用指导。

前曼城右后卫理查兹,在曼奇尼麾下,每场比赛开始前,都会有俱乐部,分析师拿着ipad,向他仔细讲述对方进攻队员,的移动特点——数据经过量化归纳后,给球员传递的,是相对简单的应对,方案建议。

精细化大数据,早已是现代足球的,基本配置。
预判威胁,期待助攻

期待助攻(XA,expected assist),这项数据也在广泛扩散中。

助攻跟进球直接相关,通过计算,得出一名球员创造,机会的能力、创造出来机会的优劣等级,能分析出球员在,进攻中扮演的组织者角色。

数据分析公司Understat,在xa这一项,上有经年积累。他们对英超本季,的分析显示,截止到1月初,曼城的斯特林在,xa数量上领先,但质量上相对落后——他能创造很多机会,不过最终形成助攻的比例——“期待助攻”和实际助攻的比例,是6比1。

这说明斯特林在最后,一传的精度、与队友配合纯度上,还有很大的提高空间。

这项数据对于,那些有创造性、场上使命更是,助攻的球员来说,是非常直观的,一种衡量标尺,因此以实际助攻数和“期待助攻数”两项相加,你会发现德布劳内,仍然是英超最有创造力、最能够为队友创造,得分机会的球员。排名第二的,是利物浦的阿诺德。

还有不少球员xa指数,很高,但最终实际助攻,数不是特别出色,这当中隐藏的因素,是队友得到高质量“期待助攻”后,在“期待进球”这一项上完成得不够理想。

这样的数据,属于更深一层的数据挖掘。“预判威胁”、“期待威胁”,这一项上数据的,提炼难度非常高,因为这需要掌握更全面,的数据和整体分析能力。

国际象棋比赛,只有最后将军那一步,才被认为是决定性的,但之前的优势累积,如足球比赛中的传球盘带、射门等“预判威胁”(expected threat),提炼出来后,对深入理解足球比赛,的整体性,战术执行效果,乃至每一次球的移动、以及每一个不同球员操作,的质量,都有了更精准的把控。

“预判威胁”的排名里,上季最有威胁的几位,分别是阿扎尔、德布劳内和马赫雷斯,此外也能找到伊沃比、特里皮尔的名字。

还有宽度序列(Width per sequence),如果大家观察瓜,迪奥拉麾下的曼城,经常能看到在进攻当中,曼城会充分利用两条边路,来拉松对手防线,边路下底之后,有很多和中路的衔接,最终进球往往能在,小禁区射门完成。

opta提炼的,一项数据领域,就是宽度序列,来衡量一支球队平均进攻,当中所使用的球场宽度,分析出球队两,边路进攻的能力。这项指数,曼城当然领先,此外还有切尔西和布莱顿;纽卡斯尔、伯恩利和沃特福德,则是进攻最为狭窄的球队。

足球不是数字游戏,但是在科技加成之后,用数据深度、再深度地挖掘足球和各种,职业体育竞技,对从业者提供的科学助力,史无前例。


    关注 颜强


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册