如何从运营的角度设计产品调查问卷

 

如何有效设计调查问卷内容,如何基于调查结果提取有价值数据?这篇文章通通告诉你!...



使用调研问卷的定量研究中,为了更全面地了解研究内容、更广泛地收集信息,经常会用到多选题,但由于多 选题多指向性的特点,除了频数表和交叉表(只能与单选题做交叉),较少用到其他的分析方法,损失了很多有用 的信息。其实,如果调研时能善用多选题,并在分析时选取适当的方法,就能够充分利用多选题包含的信息,得到 更有价值的结论。

本篇主要探讨带有分类性质的多选题,如何进行深入分析,得出分类相关的结论,也可以对各类别进行排序。

带有分类性质的多选题

一般而言,在设置多选题时,并没有想到分类,只是想了解各种情况的排序情况。其实,某些多选题,已经 隐含了分类的信息,透过这种潜在的分类信息,能够更深入地了解用户的内在想法、心理特征,甚至推测他们的行 为习惯,与其他行为题目相互照应。

带有分类价值的多选题一般具备以下几个特征:

1、题干本身包含分类的含义。如最常遇到的障碍、最亟待解决的问题、最需要的功能、最常用的工具等,或 直接询问:哪些服务最适合划分为一类。

2、选项涵盖内容较分散,如果选项都是集中某一个细节层面,那就没有分类的必要。只有当选项内容包含多 个方面的细节点,且每个方面不止一个细节点,才有分类的必要。此时的方面、细节需根据业务辩证地看,主要取 决于选项是否有分类的意义。

3、选项一般超过 10 个,选项太少没有分类的必要,只有超过一定数量,分类才有价值。分类的目的是为了 通过细节概括出看问题的维度,更深入地解读用户心理或行为。

4、限选,这不是必须的,主要根据经验判断,用户在做选择时,是否会倾向于全选,跟题干的问法有关。无法做出准确判断,且需要对选项做出优先级排序时,通常采用限选的方式,可以根据研究目的,限定全部选项数量 的一半,或 1/3。

5、数据为 0/1 格式,即每个选项一个变量,选中为 1,未选中为 0,多选题转换成此种格式,宜于做深入分析。当有了带有分类价值的多选题,就可以采用下文介绍的方法进行深入分析。

本文中的例子是半年前做过的一次定量调研,带有分类价值的多选题,主要考察:卖家在经营店铺时, 最需要的功能。 聚类分析 首先,采用谱系聚类(Hierarchical cluster)的分析方法,为了使得变量的分类趋于均匀,选择 Ward’s 法, 二分类变量(Binary)欧式平方距离(Squared Euclidean distance)测距方法,查看相应的统计量(略),并结合 业务,找出分类数。谱系聚类的树状图查看分类结果比较清楚,也比较方便,建议多用。 综合分析可知,本例的卖家功能划分五类或七类比较合适,但个别分类不易解释,且出现单个类别中只有一 个功能,后续应用的价值有限。

聚类分析 

首先,采用谱系聚类(Hierarchical cluster)的分析方法,为了使得变量的分类趋于均匀,选择 Ward’s 法, 二分类变量(Binary)欧式平方距离(Squared Euclidean distance)测距方法,查看相应的统计量(略),并结合 业务,找出分类数。谱系聚类的树状图查看分类结果比较清楚,也比较方便,建议多用。 综合分析可知,本例的卖家功能划分五类或七类比较合适,但个别分类不易解释,且出现单个类别中只有一 个功能,后续应用的价值有限。



因子分析

聚类分析结果不理想,也可以采用因子分析的方法。 经多次尝试,17 个变量中去掉“直通车关键字检索”,单独成为一类。剩余变量利用主成分分析法(Principal components),方差最大正交旋转(Varimax)进行运算,得到 KMO 值为 0.545,Bartlett 球形检验的值为 1041.324 (df=120)达到显著,表明可以做因子分析。最终萃取出 7 个公因子,累积方差贡献率为 55.1%(详见下表),解 释效果尚可。 结合业务来看,这些分类能够很好地被解释,从而反映出卖家的心理特征和需求方向。



(注:由于本例是多选题,并非量表打分题,且侧重考查的不是变量间的建构效度,仅借用了因子分析的方法进行分 类,因此 KMO 检验和累积方差贡献率的具体值,并没有真正的因子分析那么重要,但必须要查看,甚至需要做信 度检验,也要查看重构的相关矩阵残差值,做到心中有数,知其然也要知其所以然。本例中,重构的相关矩阵中, 有超过半数残差值大于 0.05,如果按照真正的因子分析模型来判断,拟合效果并不好。)

相关分析 

还有一种简单易行的方法,就是相关分析。经统计学家研究表明,0/1 变量同样适用于皮尔逊相关系数(Pearson Correlation)。 本例将 17 个功能做相关分析,得到简化的相关矩阵如下表:



根据研究目的,此表只需看正向、且相关非常显著的选项即可,但 17*17 个表格中 127 个有关联,如何做深 入分析呢?根据选项间的关系强弱、是否显著等,可以画出图形,如此,就可以清晰地看出各选项之间的关系,进 行分类。 本例中,此种方式的分类结果(如下图),易于解释,且分类数量恰当,便于后续应用。



三种方法所得结果的对比

以上提到的三种方法,所得结果如下表:



可以看出,聚类分析的结果容易出现不易解释的分类,因子分析的结果划分得更细化,相关分析的结果可以 根据需要,在一定范围内进行调节,得出适当的分类数量。

不同的案例,应该多尝试不同方法,即便相关分析的结果最可靠,其他方法的结果也能起到补充的作用,以 获得更加有价值的研究结论。 进一步的应用 得到合理的分类后,还可以结合选项的频率,给每一个类别赋值,得到类别的优先级排序。

如果最终选定了因子分析的分类结果,单个类别中每个选项的权重可以由因子载荷计算而来;当然,也可以跟聚类分析、相关分析的结果一样,采用算数平均、或加权平均的方法,计算每个类别的平均值。

小结 

综上所述,带有分类性质的多选题,分析的流程如下:

1、确定是否有带有分类价值的变量;

2、尝试多种方法进行分析,找出最合理的分类;

3、利用加权平均,或其他方法,计算每个类别的比例,进行排序。

4、使用关键变量(如星级、注册时长等)对样本总体分群,查看各细分群体在多选题分类上的差异,深入分析。


    关注 微文阅读推荐


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册