率及其95%可信区间的计算
微信订阅号“医学统计分析精粹”授权发布,欢迎扫描文末二维码关注!写论文时,描述一个发生率可是最最常见的了,但...
微信订阅号“医学统计分析精粹”授权发布,欢迎扫描文末二维码关注!写论文时,描述一个发生率可是最最常见的了,但如何计算95可信区间呢?
我们抽样发现,这个样本的率为20%,那用来估计总体,总体的率,就一定是20%吗?会不会是19%或者22%?我们的抽样误差是多少?如何计算?
在这时,我们通常都会与率一起,报告一下率的95%可信区间。
今天,小编给大家介绍一下如何在SPSS中计算可信区间。并且,在文末,给大家提供一个非常小巧的工具,绝对秒杀其他一切软件!
1. SPSS中的数据录入:
与做卡方检验的数据录入格式很相似,如下图,发生情况,发生录为1;未发生录为0。总样本,都录为1。权重那里,才真正的录入样本量,按照亚组的样本量录入。本例中,发生数很高,188例;未发生数,12例。
2. 对样本加权:
与卡方检验一样,首先,要在Data菜单中,选择Weight Cases,将权重项,就是标记样本量的一项纳入权重中。
Weight Cases是这样一个原理:
本来每一行代表一个样本,我们这里,有200个样本,那就应该对应200行数据。但是,这200行数据,只有两种情况。如果我们把每种情况分别放在一行,那每一行就相当于分别有188、12个重复。我们加权,就是用两行数据,代替200行数据,省去了重复录入的麻烦。
3. 菜单中选择Ratio:
要在Analyze菜单中,选择Descriptive Statistics--Ratio,打开率计算的窗口。
4. 选择相应变量:
如图所示,发生情况选为分子,总样本选为分母。
并且,在统计量中,选中均数Mean+置信区间95%CI。点击OK即可。
5. 结果解读:
如下图,Lower Bound和Upper Bound即为95%CI的上下限。
6. 异常情况:
有时,当率过高或者过低,会出现一个非常惨烈的问题!率超过1!这个很悲剧,是因为SPSS使用正态分布的方式来拟合二项分布,难免会溢出。
7. 解决方式:
通常情况下,SPSS的计算都是足够的,受认可的。但如果用户真的对率的区间大于1或者小于0不满意,可以选择我这里的一个小工具。
如下,发生数与上标相同,190例中发生188例,只需填入这两个数字,即可直接产出恰当的95%CI。
技术信息,方便写入文章:
所用方法:The Wilson score method without continuity correction
参考文献:Newcombe RG (1998). Two-sided confidence intervals for the single proportion: Comparison of seven methods. Statistics in Medicine, 17, 857-872.【“一起学SPSS”倾情整理统计学习资源包】
内含《SPSS常用统计分析教程(SPSS 22.0中英文版)(第4版)》配套免费电子书及数据文件;各种统计及数据管理免费软件;各种统计学习素材。(不定期更新)
注:资源包提供部分免费工具和试用版软件下载,但不提供盗版软件。见谅!
【资源包下载方法】
1、分享本文至朋友圈。
2、把分享截图发给微信订阅号“一起学SPSS”。
3、回复关键词“SPSS”即可获取下载地址。
回复“文章”或“art”可获取订阅号文章目录。
邮箱:mchgz@163.com
关注 一起学SPSS
微信扫一扫关注公众号