武侠统计之韦小宝与澄观聊统计武学

 

你还对各种统计招式觉得眼花缭乱?不要紧,看统计武学高手澄观是如何给韦小宝解说的。...



话说韦小宝替康熙皇帝出家,到少林寺剃度。某日在少林寺门前遇到绿衣少女阿珂,惊为天人。欲上前调戏,结果反被痛扁一顿。幸亏澄观老和尚出现,折服绿衣女郎。韦小宝见澄观如此厉害,便欲学其功夫。于是说道:“你刚才轻松便将那妞儿折服,这是什么功夫?”

澄观道:“这是‘广义可加模型’,师叔不会吗?”韦小宝道:“我不会。不如你教了我罢。”澄观道:“师叔有命,自当遵从。这‘广义可加模型’功夫,也不难学,只要了解条件,领会思想,也就成了。”韦小宝一听“也不难学”四字,正中下怀,霎间眉花眼笑,心痒难搔。

澄观道:“师叔对‘广义线性模型’,不知了解多少?。”韦小宝摇摇头道:“没听说过。”澄观道:“原来师叔没练过‘广义线性模型’,要练这门内劲,须得先练‘一般线性模型’。待我跟你拆拆‘一般线性模型’,看了师叔学识深浅,再传‘广义线性模型’。”韦小宝道:“‘一般线性模型’我也不会。”澄观道:“那也不妨,咱们来拆logistic回归’。”韦小宝道:“什么logistic回归’,可没听见过。”

澄观脸上微有难色,道:“那么咱们试拆再浅一些的,试‘线性回归’好了。这个也不会?就从‘相关分析’试起好了。也不会?那要试‘方差分析’。是了,师叔年纪小,还没学到。那t检验’‘卡方检验’‘非参数检验’?”他说一路方法,韦小宝便摇一摇头。

澄观见韦小宝什么都不会,也不生气,说道:“咱们少林寺的统计武学循序渐进,入门之后先学‘统计描述指标’,熟习之后,再学‘常见分布’,然后学‘假设检验的基本思想’,此时内功外功有相当根柢了。在此基础上可以学t检验’。如果不学t检验’,那么学‘方差分析’也可以。不论学t检验’‘方差分析’,聪明勤力的,学七八年也差不多了。如果悟性高,可以跟着学‘一般线性模型’和‘广义线性模型’。学到‘广义线性模型’,武林中别派子弟,就不大敌得过了。是否能学‘广义可加模型’,要看各人性子。”

韦小宝倒油了口凉气,说道:“你说那‘广义可加模型’并不难学,可是从t检验’学起,一路路方法学将下来,要几年功夫?”

澄观微笑道:“师侄从十一岁开始学t检验’,总算运气极好,拜晦智禅师座下,学得比同门师兄弟们快得多,到五十三岁,于‘广义可加模型’已略窥门径。”

韦小宝道:“你从十一岁练起,到了五十三岁时略跪什么门闩,那么总共练了四十二年才练成?”澄观甚是得意,道:“以四十二年而练成‘广义可加模型’,本派千余年来,老衲名列第三。”

韦小宝说道:“人家小姑娘只练得一两年,你要练四五十年才胜得过她,实在差劲之至。”澄观老脸通红,十分惶恐,连连点头,道:“师叔指点得是,待师侄回去,翻查般若堂中的武功典籍,看有什么妙法,可以速成。”

澄观回去苦思冥想,几日几夜不吃不喝,不言不动,终于总结出一套统计武学图谱,给韦小宝送去,让他以此为参考练习。该图谱将统计武学分为五个层次:

第一层:基础统计,可处理一些简单的变量关系,此时基本技能是以单打独斗为主,学的都是一些固定招式。这一阶段,严格按统计招式一板一眼照做。

第二层:开始涉及群攻技能,可以同时处理多个因素,这一层次开始把一些简单招式综合运用,学习到一般线性模型。同时学到更多的群攻招式,如logistic回归、Poisson回归、负二项回归等。

第三层:能够将前面学到的各种武学招式融会贯通,掌握广义线性模型。这一层次开始学习应付一些不按套路出招的数据,如异常值、偏态数据、截断数据、小样本数据等。到了这一层次,行走江湖基本就问题不大了。

第四层:能够在广义线性模型的基础上,应付一些更为复杂阴险的招式,如空间层次数据、时间序列数据、无规律可循的非参数、无迹可寻的潜变量。练到这一层,可以步入一流高手境界,江湖上差不多就没什么敌手了。

第五层:掌握一些现代的基于机器学习的技术,也就是所谓的数据挖掘技术。将传统统计方法与现代的机器学习方法融会贯通,以无招胜有招,可以应付各种招式而游刃有余。



韦小宝得到该图谱,欣喜若狂,立刻照练。据说韦小宝根据此图谱,大大简化了练功过程,及时追到了绿衣女郎。

该图谱已珍藏数百年,今天笔者将其免费奉送给各位朋友。以韦小宝之懒惰,尚且可学成,更何况各位朋友呢?

笔者按1:本文所说的学习方法的时间,如“七八年”等,完全借用了小说中的时间,并不是真需要这么久。实际中可能几天就学会,也可能几个月,看个人努力程度。所以大家不要恐慌。

笔者按2:笔者所列的5个层次,含戏谈成分,各位可作为参考,但不要太较真。事实上,统计方法并无高级低级之分,但各种方法学习需按一定阶段循序渐进。因此5个层次虽非严格,但可借鉴。


    关注 实用循证医学


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册