【数据派】美国最夯的统计数据WAR(打者篇-上)

 

WAR,WinsAvobeReplacement,身为现代棒球迷,不得不懂的数据之一。随着计算机科技越来...






WAR,Wins AvobeReplacement,身为现代棒球迷,不得不懂的数据之一。随着计算机科技越来越进步,棒球统计也有更进步的方法,从以前因为没有科技分析所以使用用纸笔就能计算的防御率,打点,打击率等数据,而现在既然有进步的科技仪器可以帮忙建文件,那么跑回归分析,利用计算机记录球员在场上一举一动的贡献是必然之趋势。

其中,WAR又是赛伯计算学(Sabermetrics‍)的集大成之作。赛伯计算学从1970年代崭露头角,经过40年的洗礼,终于在2008年左右找到了量化球员在场上"任何一举一动"的方法,这就是WAR,目前球界最完美的数据,也是衡量一个球员能拿多高薪水的重要数据。

不过WAR既然要量化球员的"任何一举一动",他公式比较繁琐,难懂是必然的。他也算非常新颖的数据,所以即使美国本地WAR已经很普及了,也有不少球迷不知道其具体的计算方式和原理。究竟WAR是怎么算出来的,本文将一块带您了解!



~定义~

首先,我们在了解WAR怎么算之前,就应该先了解定义。在讲解定义之前,容我问个问题。有一天,从来不看棒球的老妈看到你在看球赛,指着电视的某个球员问:他的成绩如何?强吗?试问以下你回答的答案哪一个最容易让你妈理解:

1.他今年有80分打点。

2.他今年打击率0.295。

3.他今年的wOBA是0.355

4.他今年的长打率是0.432

5.他今年有3.80防御率

6.他今年有17次救援成功

7.球队有他,一年可以多拿下5胜.

试问:在上述七个中,哪个比较让"外行人"一看就懂呢?不是ERA,不是wOBA.外行人会知道什么是防御率,防御率好坏的标准吗?但是如果你跟外行人讲球队多了X可以赢Y胜,简直是一目了然。这就是WAR好用的地方。

因为球员交出1WAR,他所属的球队在球季胜场数就会多一胜,你要比球员贡献,不用把一堆各方面数据(打击,防守,跑垒等等全搬出来),你只要了解球员可以给球队几胜,这样就可以直接比较不同球员的贡献值了。因此,WAR不仅是很先进很全方位的数据之外,他的意思还很简单明了:1WAR=1胜。那么,WAR公式到底要怎么计算呢?首先,让我们先从打者的计算开始。

1.打击。

一名野手在场上,最主要的任务,打击绝对是其中之一。举2008年的Adrian Beltre来说,他当年的打击三围是.266/.327/.457,我们知道这是一份联盟很常见的一份打击成绩,但有多少价值?我们永远回答不出来。所以,要考虑球员在打击区上到底有多少价值必须要有更进阶的方法。首先,我们找出球员的wOBA. wOBA这个数据,在美国数据网站Fangraphs每位球员的个人成绩档案中都能查的到。

当然,既然本篇是解释算法文,那我毫无疑问的要在这里解释wOBA要怎么算。由于每年联盟的投打消长以及联盟环境不太相同,因此由计算机跑回归分析的wOBA计算公式每年都会有一点点的微调,但影响不大,如果要求方便,FG网站都已经帮你算好好了,去查一下即可。那么wOBA公式究竟怎么算?

由于2014还没打完,公式还不能确定,我们这里就先拿2013的wOBA公式版本来解释wOBA算法。公式如下:(0.690×uBB+0.722×HBP+0.888×1B+1.271×2B+1.616×3B+2.101×HR)÷(AB+BB-IBB+SF+HBP)。其中,uBB是非故意四坏球保送,HBP是触身球,而IBB则是故意四坏,SF是高飞牺牲打。wOBA是靠着计算机长期建文件之后来算各种打击情况的预期得分值平均。



比如说公式中的2B,也就是二垒安打,之所以会乘上1.27,就是因为整个球季平均下来,只要球员在该年在球赛中打出二垒安打,整年大联盟的平均是打出二垒安打的该局,所有球队平均可以在那局得1.271分。别误会,并不是在该年某局打一支2B球队就会在该局得1.271分。当然也有可能该局球队打击正好爆发拿个单局6分,但也有可能在该局一分都得不到。

所以,wOBA给2B的加权1.27的意义是"该年平均"只要打出2B球队在该局的"平均得分"为1.27,因此,这是长期下来,也就是靠着一整个球季的数据文件,在去做平均,这就是我们所谓的回归分析,靠着计算机记载一整个球季的数据,再去求平均值。

解释完wOBA的公式之后,我们取得了球员们的wOBA(也可以去FG查)。如果一名球员有.355wOBA,他的攻击价值是多少?我们还是不知道。所以接下来要做的事是把wOBA转换成分数,对,就是棒球场上球队可以打下几分的那个得分数。(Runs)。把wOBA转换成得分,我们称这个数据为wRAA,这个数据跟wOBA一模一样,在美国进阶数据网站Fangraphs的球员个人页面上都能查到这个成绩。



怎么把wOBA转换成wRAA?当然,Fangraphs网站上都能查到数据了,但这里还是解释一下要怎么算。wRAA公式如下:(球员wOBA-联盟wOBA)÷1.277×球员打席。

"1.277"这个数字每年同样会因为联盟环境不同而有小幅微调,但影响不大,"1.277"为2013球季之数字。把Adrian Beltre在2008年球季的wOBA带入公式,他该年球季的wRAA为3.9。

3.9定义为何?由于wRAA的英文全称是weighted "runs aboveaverage",顾名思义,wRAA 3.9的意涵为"比联盟平均打者多攻下3.9分",也就是说联盟平均打者wRAA 0,Adrian Beltre可以比平均打者多为球队攻下3.9分。wRAA算完之后,我们要再算入球场校正。为什么?我们都知道,大联盟球场有些利于打者,有些不利。在水手球场和落矶球场各打出20发全垒打,难度不同,价值当然也不同。

Adrian Beltre当年在水手队打球,所以理论上难度会比较高,他的账面wRAA很不利,所以要经过球场校正调整。wRAA要怎么球场校正?同解,校正过后的数据Fangraphs同样能查到,但这边依然解释算法。



wRAA球场校正公式如下:

wRAA+(联盟每打席的平均得分数- 联盟每打席的平均得分数÷球场校正数值)×打席。

首先,什么是联盟每打席平均得分数?就是把大联盟一整个球季所有的打席数除上该年大联盟所有的得分数即是答案,不用自己算,同样的,Fangraphs一样查的到。2013球季这个数值是0.11,也就是说去年球季,大联盟平均大概每9个打席会有1分产生,1个打席平均制造0.11分。

接下来,什么是球场校正数值?这个在Fangraphs可以查的到,以1为基准,超过1越多就是越有利于打者的球场,低于1越多则有利于投手。2008年水手球场的校正值为0.96,该年联盟平均每打席能制造0.12分,把所有元素丢下去算算,经过校正之后,Adrian Beltre从原本的3.9 wRAA变为5.9。

所以,可以说Adrian Beltre在2008年球季的时候他比联盟平均打者攻下了5.9分的分数。也就是说WAR里头的攻击端计算到这里告一个段落,拿球员的wRAA去球场校正,得到的数字即是球员比联盟平均打者多攻下(或少攻下)几分。

2.防守

相较于比较麻烦计算的打击,(但其实上数据都可以在FG网站直接查到),防守相对好处理。首先我们可以点进Fangraphs查询球员个人页面,上面都会有守备的成绩,而这里要查的是UZR做为计算守备的方法。

UZR和wRAA的定义一样,只是他是防守端,意义是"比同守备位置的联盟平均选手"多为球队省下或丢掉几分。如果一名游击手的UZR是+5,那么就代表他比联盟防守平均值的游击手多替球队省下了5分的失分。如果一个左外野手,他的UZR为-5 ,那么就代表他比联盟防守平均值的左外野手多让球队丢掉了5分的失分。

如果有一名球员wRAA+UZR等于20,那么就代表这个球员这两项上数据加起来比联盟平均球员多替球队赚了20分。

3.守备位置加权

我们都知道,一个wRAA,UZR甚至其他加总数据差不多的一个游击手,一个一垒手,很明显,游击手比较重要。因为游击手在大联盟的攻击能力较弱,较一垒手难以取得,而且游击防区显然比一垒难守,在游击区拿到UZR+5的难度比一垒还高。也就是说能在一垒达成这件事的人比在游击还多。

所以守备位置加权的用意就是,找出每个位置的守备难度。比如说大联盟在右外野防区可以替球队守下7.5分的人和能在一垒防区省下12.5分的人一样多,然后中外野能守下"-2.5"分的人和在右外野能守下7.5分的人一样多(或难度一样),那么这三个的位置加权便是:1B: -12.5分, RF= -7.5分,CF=2.5分。

照上面的观念,以下是各守备位置的加权。1B=-12.5分, 2B=2.5分,3B=2.5分,SS=7.5分,RF=-7.5分,LF=-7.5分,CF=2.5分,C=12.5分,DH=-17.5分 (每162场比赛)。

假设有一个wRAA+UZR=20分的球员,他在球季守了150场的二垒,那么他能获得的守备位置加权会是2.5÷162×150=2.31分,加上前述的20分,这名二垒手共可以帮球队赚入22.31分。

4.跑垒



当打者同样打一支很浅的一垒安打的时候,如果你一垒上的跑者是

Jacoby Ellsbury,他可能一口气冲上三垒,Prince Fielder可能只能乖乖停在一垒上。

当打者打出很浅的外野高飞球,三垒上是Dee Gordon,Jose Molina,这两个哪一个回来得分的机率比较大一目了然。所以,跑垒能力球员各有不同的能力差异,所以我们不能忽略他。那么跑垒要怎么计算?首先跑垒有两个数据,一个是UBR,一个是wSB先解释UBR.UBR的意思是"球员在垒包间的跑垒可以替球队赚取或失去几分",而UBR不算入盗垒,纯粹是看击球者在四个垒包间的跑垒能力。

解释UBR算法,我可以举个例子。



假设一出局二垒有人,击球者把一个滚地球打向游击防区,在大联盟所有这种情况下,跑者上三垒然后打者出局的机率是20%,然后跑者停在二垒打者出局的机率是70%,跑垒者在三垒被抓到,打者上垒的机率是5%,全部都没抓到的机率也是5%.

然后在这种情况下,大联盟该球季所有发生该种情况(跑者在二垒,一出局,打者击出游击滚地)的局数平均可以得到0.25分。跑者进垒打者出局,该局平均可以得到0.5分.

拿0.5-0.25,这名跑者可以得到的分数是0.25分。如果他停在二垒上,该局平均可以得0.23分,所以他能得到的分数是-0.02分。而这些分数就是跑者会拿到的UBR。



wSB则是把UBR没有看的盗垒独立出来看,UBR只看跑者在垒间的破坏力。wSB怎么算?公式如下:SB×0.2+CS×(-0.384)+lgwSB×(1B+HBP+BB-IBB)。

其中,lgwSB公式如下:(SB×0.2+CS×(-0.384))÷(1B+HBP+BB-IBB)。

wSB带入的是球员个人的跑垒成绩,lgwSB则是带入全mlb的数据成绩。wSB和UBR同样不用自己算,Fangraphs同样查的到。

而UBR+wSB即是一名球员的总跑垒成绩,如果有一个球员的UBR是3.0,wSB则是3.5,那么这名球员一整个球季的跑垒可以为球队带来6.5分。

假设有一个wRAA+UZR=20分的球员,他在球季守了150场的二垒,那么他能获得的守备位置加权会是2.5÷162×150=2.31分,加上前述的20分,这名二垒手共可以帮球队赚入22.31分。如果这名球员的UBR+wSB=6.5,那么他一季可以比"联盟平均球员"多替球队贡献28.81分。

UBR+wSB不用自己算,FG网站已经算出了两个总和起来的BsR,可以查询取得。wSB和UBR单独看,FG网站同样可供查询。



以上,暂时介绍到这里,明天我们来继续讲下半部分。

———————————————————————

独乐乐不如众乐乐,点击右上角分享给其他好友~【关注棒球圈】让我们愉快的一起玩耍吧,长按下面二维码并选“识别”!




    关注 棒球圈


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册