科学的告诉你GMAT 高一分,录取几率高多少
LAB | GMAT...
这学期我统计方面学习的是贝叶斯估计,理论性的东西就不介绍了,有一个跟大家相关的小例子分享一下。
首先,很多人说录取这件事情很随机,比如就算你知道十个人的分数和十个人的录取结果,你也很难说多少分能被录,多少分一定筛。你也很难量化的告诉我,GMAT高一分,录取几率高多少,从经验上来说你只会说越高越好,大致多少分以上比较好。统计的好处在于,我们直接把它模型化,给出一个数量估计,虽然这个估计不一定完全准确,但是我估计1000次的准确性达到80%就已经很了不得了,比经验上觉得怎么样怎么样,虽然看起来有用,但是不具体,不精确适用得多。所以,于我而言,统计的好处不在于一定每个估计都精确,而是它抓住了大规律,保持较高正确率,同时可以精确,这种精确可以被复制和应用到其他的情况。
给个我们课上的例子,我们好奇,GMAT分数是怎么影响UCLA的医学院录取的。具体而言,GMAT高一分,录取几率高多少?
我们从UCLA的官网上扒下了医学院的录取数据,其实也有GPA,但是这里我们就用GMAT这个指标试试,一会再加入GPA。
预测录取,是一个0,1变量,所以我们会预测的是概率,然后link到一个二分变量。一共85个学生的录取数据(包括被拒的和wait list的),1表示被录取,0表示是被拒,这个结果挺符合你的直观感受吧,中间有个区域是拒绝和接受都有,大致不能低于500分之类的。但是这当然不够,要是只有这种结果,要统计何用,我们进一步理解一下结果。
回归分析的数据:
这么看gmat贡献的量很小对吧,才0.033,但是这是logistic回归,这个0.033不是概率,我们要把它代回Link function 去算概率,但是另一个解释更有趣。
我们可以算出来,这个GMAT如果高一分,那么录取概率是原来没高这一分的多少倍。这个0.033是E(自然对数的那个数)的指数,所以算出来大约是1.034,意味着GMAT高一分是原来录取概率的1.034倍。你可能觉得还小对吧,但是GMAT的分数段是10分起的,我们看高10分呢,高十分相当于指数变成了0.33,E的0.33次方是1.39,所以高10分是原来录取概率的1.39倍。是不是觉得要好好备考了。
这样模型化之后,就能够对任何一个分数进行模型的预测了,这种预测有多准确呢?毕竟模型预测的是概率,结果是个二分变量,我们来看一下这85个同学光把他们的GMAT分数放进模型,预测一下录取还是拒绝,设定比较基本是50%,预测概率是大于50%就预测接受,预测概率是小于50%的就拒绝。然后比较一下真实的数据。
人家录取了,我们预测也是录取的是25人,人家没录取我们预测是没录取的是48人,这个正确率还是非常可观的,毕竟=(25+48)/85=86%
最后,模型当然不完备,我们加入了GPA,但是GMAT的预测效果没有被GPA吃掉,还可以看看预测不好的那几个有什么特征,可以进一步去改善模型。
但起码你可以知道两件事情:
1. 好好准备考试
2. 好好学统计,学以致用(只能说留学中介要是能大数据了,估计是要起飞了/同理还有老东家,几十万的学员数据,想想都觉得好浪费~)
关注 HugeGoals
微信扫一扫关注公众号