【干货】大数据时代,足球这项运动却还刚刚走出石器时代

 

如果你现在打开《泰晤士报》的网站首页,你会发现它竟然是如此的落后——整版看下来没有一个数据新闻,连广告都不是...



如果你现在打开《泰晤士报》的网站首页,你会发现它竟然是如此的落后——整版看下来没有一个数据新闻,连广告都不是根据大数据筛选的,我一个在美国的人,给我竟然推送的是英国剃须膏的广告。

而打开《纽约时报》和《华尔街日报》,你会发现不仅有许多数据可视化的文章,还有专门的选举民调页面,根据大数据分析川普和希拉里的选情。

从新闻业的角度来看,世界其他媒体和美国媒体的差距无疑是巨大的。这也许是所有行业的一个缩影。当我们把目光投向体育行业时,同样有一个美国人不玩、世界其他人民疯狂热爱的运动,在数据方面远远落后。

直到二十一世纪早期,也就是十几年前,一家叫Opta的公司才正式开始统计足球除进球、助攻、控球率等之外的高阶数据。什么叫高阶数据呢?

在棒球、篮球等数据统计极其发达的运动领域,高阶数据包含了:球员间横向对比、球员本身纵向对比、球员历史对比、效率对比、各单项贡献值对比……如果认真谈谈体育大数据,我们需要至少五篇万字文章来解释篮球这单单一项运动的高阶数据,更别提棒球这项数据更加复杂的运动。

而球迷或许很难相信,在今天这么一个大数据时代,足球界的数据统计,才刚刚摆脱石器时代,进入青铜时代。

回到开头。在Opta这家公司之前,没有一家公司或机构统计与射门尝试有关的数据,更别提射中门框范围内的数据。幸好,Opta是一家有理想的数据公司。他们决定像美国的体育业学习,将足球数据上升到一个新的高度。

其中一项尝试,便是引入Expetced Goals这一概念。我们可以将它翻译为“期望进球数”,抑或“理论进球数”。这一数据是由各种无法量化的因素,包括射门质量和射门位置等因素衡量后,对各支球队理论上创造的进球进行分析或预测。



例如上图。根据Opta公司的数据分析,阿森纳、曼城和热刺是理论上可以获得进球最多的球队。而理论上失球最多的前三甲则为曼联、桑德兰和诺维奇。

当然,业内对这一数据嗤之以鼻。



如上图显示,如果“理论进球数”这一数据概念有效,那么上图的圆点应该尽可能地靠拢颜色区域。然而你会发现,大多数中庸球队的表现符合预期,但很多强队的表现却完全无法用模型来解释。

但毕竟这只是一家公司的一次尝试。实际上,跟很多球迷一样,我也认为类似的数据抑或预测毫无价值,毕竟球是球员踢出来的,不是专家算出来的。不过当我研究美国体育大数据时,我发现一个足球界并没有获得认可的公理:

数据本身是会成长的。

拿NBA举例来说,在高速摄像机和转播技术发展之前,大多数的数据都跟球和篮筐有关,就像现在的足球,围绕在进球和传球上。但随着转播技术的发展,NBA的高阶数据开始转向了球员本身,所谓的“以人为本”。例如,真实命中率这一项,就是考虑了球员射球时的位置和时间,剔除了压哨球、三分球等高难度的尝试,最后算出来的高阶命中率数据。

所以数据本身会成长这个道理,是基于转播技术以及数据年份积累所得。足球运动本身统计的难度和历史的遗留问题无疑给运动统计学增加了难度,但这种难度是可以通过技术克服的。

另一家公司,STATS,正在尝试将足球带入工业时代。正如其名,数据是它唯一在乎的事情。



转播技术层面,STATS引入了两种技术。如上图所示,一种是SportVU技术,着重于统计球的运行、球员表现以及体力等等。而右边图片所示,Pixellot,则是新的4K技术,可以锁定单名球员的表现,并且进行分析。

而这两种技术,都已经在NBA赛场上投入多年。在NBA层面,通过与英特尔公司的深入合作,NBA现在不仅可以360度无死角重放画面,还可以定格、逐帧分析球员。

很多球迷看了以后会说:“为什么我要在乎这些?我能看到进球,享受比赛就行了。重要的是过程。数据是冷冰冰的。”

没错,数据是死的,但它和金钱有关。足球虽然是世界第一运动,但每个联赛之间的转播差距、解说水平以及数据分析水平都有着极大的差距。NBA、MLB等美国顶级赛事联赛制定了无数的行业规则,将体育提升到了新的高度,也是其产业化的靠山之一。更不用说,无数的高阶数据养活了像ESPN这样媒体的无数编辑。没了这些数据,他们分析时就与占卜师无疑,都是天马行空。只有有了数据,在做内容上才能寻求突破。

想要理解这一点,看看美国大选就行了。在过去的电视时代,美国大选成了最流行的电视节目,家家户户必看。而现在的网络时代,美国大选又成了人们茶余饭后的谈资。想要深入地开发“选举”这一IP,数据无疑起了决定性的作用。数据不仅可以分析选情,更重要的是,它可以解释候选人之间的政策差别,从而帮助人们更好地理解政治。

同理,许多数据被拿来预测以及分析球员和球队,但这些数据的本意却不是如此。它们的真实作用是帮助球迷更好地理解这项运动,甚至可以帮助教练更好地理解训练等。如果足球能够更好地发展大数据统计,那么我们就能更好地理解为什么中国队会落后于亚洲诸强,而不是仅仅叫嚣着下课、解散、退票等等。

体育行业就像是文明的缩影,工业的进步才能推动思想的跳跃。想要球迷更加理性地讨论,想要球队更有针对性地训练,想要体育产业更健康地发展,大数据统计势在必行。而足球,在这方面才刚刚起步。


    关注 马男看球


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册