科学的告诉你GMAT 高一分,录取几率高多少

 

LAB | GMAT...



这学期我统计方面学习的是贝叶斯估计,理论性的东西就不介绍了,有一个跟大家相关的小例子分享一下。

首先,很多人说录取这件事情很随机,比如就算你知道十个人的分数和十个人的录取结果,你也很难说多少分能被录,多少分一定筛。你也很难量化的告诉我,GMAT高一分,录取几率高多少,从经验上来说你只会说越高越好,大致多少分以上比较好。统计的好处在于,我们直接把它模型化,给出一个数量估计,虽然这个估计不一定完全准确,但是我估计1000次的准确性达到80%就已经很了不得了,比经验上觉得怎么样怎么样,虽然看起来有用,但是不具体,不精确适用得多。所以,于我而言,统计的好处不在于一定每个估计都精确,而是它抓住了大规律,保持较高正确率,同时可以精确,这种精确可以被复制和应用到其他的情况。

给个我们课上的例子,我们好奇,GMAT分数是怎么影响UCLA的医学院录取的。具体而言,GMAT高一分,录取几率高多少?

我们从UCLA的官网上扒下了医学院的录取数据,其实也有GPA,但是这里我们就用GMAT这个指标试试,一会再加入GPA。

预测录取,是一个0,1变量,所以我们会预测的是概率,然后link到一个二分变量。一共85个学生的录取数据(包括被拒的和wait list的),1表示被录取,0表示是被拒,这个结果挺符合你的直观感受吧,中间有个区域是拒绝和接受都有,大致不能低于500分之类的。但是这当然不够,要是只有这种结果,要统计何用,我们进一步理解一下结果。



回归分析的数据:



这么看gmat贡献的量很小对吧,才0.033,但是这是logistic回归,这个0.033不是概率,我们要把它代回Link function 去算概率,但是另一个解释更有趣。

我们可以算出来,这个GMAT如果高一分,那么录取概率是原来没高这一分的多少倍。这个0.033是E(自然对数的那个数)的指数,所以算出来大约是1.034,意味着GMAT高一分是原来录取概率的1.034倍。你可能觉得还小对吧,但是GMAT的分数段是10分起的,我们看高10分呢,高十分相当于指数变成了0.33,E的0.33次方是1.39,所以高10分是原来录取概率的1.39倍。是不是觉得要好好备考了。

这样模型化之后,就能够对任何一个分数进行模型的预测了,这种预测有多准确呢?毕竟模型预测的是概率,结果是个二分变量,我们来看一下这85个同学光把他们的GMAT分数放进模型,预测一下录取还是拒绝,设定比较基本是50%,预测概率是大于50%就预测接受,预测概率是小于50%的就拒绝。然后比较一下真实的数据。



人家录取了,我们预测也是录取的是25人,人家没录取我们预测是没录取的是48人,这个正确率还是非常可观的,毕竟=(25+48)/85=86%

最后,模型当然不完备,我们加入了GPA,但是GMAT的预测效果没有被GPA吃掉,还可以看看预测不好的那几个有什么特征,可以进一步去改善模型。

但起码你可以知道两件事情:

1. 好好准备考试

2. 好好学统计,学以致用(只能说留学中介要是能大数据了,估计是要起飞了/同理还有老东家,几十万的学员数据,想想都觉得好浪费~)

LAB | 春季GMAT备考群
每天打卡任务,每天讲解
加群方式,微信shong9397,备注GMAT


    关注 HugeGoals


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册

录取 相关文章