【小白学统计】实验设计之随机——想说爱你不容易

 

来源:小白学统计作者:冯国双任何实验设计,想做好的话,起码要坚持4个原则:随机、对照、均衡、重复,缺一不...



来源:小白学统计  作者:冯国双

任何实验设计,想做好的话,起码要坚持4个原则:随机、对照、均衡、重复,缺一不可。你想发高质量文章吗?你想得到一个可靠结果吗?那就下点苦功,仔细琢磨一下这几个原则吧。后面几篇会针对这4个原则逐一介绍一下,本文先说随机化。

有多少人对“随机”这一名词是又爱又恨,想离开它又怕发不了高质量文章,想接近却又觉得它是如此高冷。随机,不仅仅是一个概念,也是一个技术,是一种思路。也许,原本一个普通的研究,经随机一点,变点石成金,化腐朽为神奇。当然,也有的研究,打着随机的幌子,得出似是而非的结论。借用一位研究生做科研的体会:“论文中写随机,实际中我随意”。

随机大致可分为两类:

一是随机抽样,主要用在流行病学调查中,如横断面调查需要采用随机抽样技术随机选择研究对象。随机抽样的目的是使抽样框中的所有研究对象都有相同的机会被抽取。就像是彩票,理论上我们都有相等的机会中奖(注意说的是理论上)。

二是随机分组,主要用在随机对照试验中,选定研究对象后,需要对研究对象随机分组。随机分组的目的是保证所有研究对象有相等的机会被分配到不同的组别。

我已经在前面有2篇文章专门介绍了如何用Excel进行随机抽样和随机分组,尽管我个人能力有限,但还是希望对部分科研工作者有所帮助,不再出现“论文中随机,实际中随意”的现象。

本文不是专注于如何实现随机,而是从反面说一下实际中一些错误的所谓随机。一定要理解一点:随机不等于随便,既不是由研究者决定,也不是受试者选择,而是通过客观的随机数字决定。任何带有主观因素的抽样都不是随机抽样。

第1个例子:某电视台又开始调查了,从街头抓住几个人就问“你幸福吗?”。最后收集了“大量”一手数据,赶快发表结论:国人幸福感超强,已经赶英超美,直奔宇宙水平。

这个结论你敢相信吗?不管你信不信,反正我相信。我相信他们会这么干。这种美其名曰“随机抽样”的方法,其实只是一种方便抽样。什么是方便抽样呢?就是选择那些最方便找到的人作为调查对象,当然街头上的人很好找了,到各大商场门口一站,满满的都是人,随便找几个太容易了。

你要说你调查的这些人幸福感很强,我没话说。但是你要是据此推论国人幸福感很强,那就值得商榷了。首先我要澄清,我没有说中国人幸福感不好,只是说,从方便抽样中,是得不出这一结论的。为什么?任何统计推论,一定是样本推论到总体,样本要有代表性。那么方便抽样抽到的人,他们代表谁呢?谁也代表不了,只能代表自己。随便用脑子想想就知道,有多少人会没事整天去逛街呢?肯配合你的当然幸福感不错,个别有的说不幸福的,也许就被当做异常值剔除了。

所以,下次你看到报纸说,我们的生活水平又怎么样怎么样,先看看他们调查的是什么人,是怎么选的人,然后再说结论。

第2个例子:某研究生利用小鼠进行动物实验,将小鼠分为两组。该研究生了解随机,然后就开始他的随机分组了:闭着眼睛,首先从笼子中抓住第一只分到试验组,再继续抓住第二只分到对照组,再继续抓第三只分到试验组,再继续抓第四只分到对照组,……。

看起来很公平是不是,没错,抓住哪只小鼠并非由研究者决定的,因为研究者都闭眼了,还能怎么样呢?但这仍然不是随机。虽然不是研究者决定的,却跟小白鼠的体质有关。可想而知,第一只被抓住的小鼠很可能是躲避比较慢的(如体弱、行动缓慢等原因),而后面被抓住的可能是比较灵活的。按照这一办法,试验组中的小鼠肯定体质要弱一些,所以,即使你闭着眼睛,仍然不是随机。

第3个例子:某研究比较两种疗法治疗糖尿病,选择了符合入选标准的80例研究对象,研究者想,我要随机,随机就是不是由我决定分组,所以我让他们自己决定入组。

这一做法现在仍然存在。可惜的是,自愿不等于随机,或者说,任何带有主观意愿的分组都不是随机分组。不用脑子都能想到,研究对象自愿选择组别时,肯定会从自身考虑各种因素,如经济条件、体质状况等等,这也导致两组人群的基线资料不均衡,以致影响结果的可靠性。

总之,对于随机化这一概念,仍有不少科研人员对其理解不足,所以会导致现实中很多似是而非的随机抽样或随机分组。也许本文介绍的这几个例子,正是我们日常生活、科研、工作中自己接触的,希望能够对我们有所启发。


    关注 实用循证医学


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册