数据挖掘最后20道单选题

 

61.以下关于人工神经网络(ANN)的描述错误的有(A)A,神经网络对训练数据中的噪声非常鲁棒B,可以处...



61. 以下关于人工神经网络(ANN)的描述错误的有 (A)

A,神经网络对训练数据中的噪声非常鲁棒

B,可以处理冗余特征

C,训练ANN是一个很耗时的过程

D,至少含有一个隐藏层的多层神经网络

62. 通过聚集多个分类器的预测来提高分类准确率的技术称为 (A)

A,组合(ensemble)

B,聚集(aggregate)

C,合并(combination)

D,投票(voting)

63. 简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作( B )

A、层次聚类

B、划分聚类

C、非互斥聚类

D、模糊聚类

64. 在基本K均值算法里,当邻近度函数采用( A )的时候,合适的质心是簇中各点的中位数。

A、曼哈顿距离

B、平方欧几里德距离

C、余弦距离

D、Bregman散度

65.( C )是一个观测值,它与其他观测值的差别如此之大,以至于怀疑它是由不同的机制产生的。

A、边界点

B、质心

C、离群点

D、核心点

66. BIRCH是一种( B )。

A、分类器

B、聚类算法

C、关联分析算法

D、特征选择算法

67. 检测一元正态分布中的离群点,属于异常检测中的基于( A )的离群点检测。

A、统计方法

B、邻近度

C、密度

D、聚类技术

68.( C )将两个簇的邻近度定义为不同簇的所有点对的平均逐对邻近度,它是一种凝聚层次聚类技术。

A、MIN(单链)

B、MAX(全链)

C、组平均

D、Ward方法

69.( D )将两个簇的邻近度定义为两个簇合并时导致的平方误差的增量,它是一种凝聚层次聚类技术。

A、MIN(单链)

B、MAX(全链)

C、组平均

D、Ward方法

70. DBSCAN在最坏情况下的时间复杂度是( B )。

A、O(m)

B、O(m2)

C、O(log m)

D、O(m*log m)

71. 在基于图的簇评估度量表里面,如果簇度量为proximity(Ci , C),簇权值为mi ,那么它的类型是( C )。

A、基于图的凝聚度

B、基于原型的凝聚度

C、基于原型的分离度

D、基于图的凝聚度和分离度

72. 关于K均值和DBSCAN的比较,以下说法不正确的是( A )。

A、K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象。

B、K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念。

C、K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇。

D、K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇。

73. 以下是哪一个聚类算法的算法流程:①构造k-最近邻图。②使用多层图划分算法划分图。③repeat:合并关于相对互连性和相对接近性而言,最好地保持簇的自相似性的簇。④until:不再有可以合并的簇。( C )。

A、MST

B、OPOSSUM

C、Chameleon

D、Jarvis-Patrick(JP)

74. 考虑这么一种情况:一个对象碰巧与另一个对象相对接近,但属于不同的类,因为这两个对象一般不会共享许多近邻,所以应该选择( D )的相似度计算方法。

A、平方欧几里德距离

B、余弦距离

C、直接相似度

D、共享最近邻

75. 以下属于可伸缩聚类算法的是( A )。

A、CURE

B、DENCLUE

C、CLIQUE

D、OPOSSUM

76. 以下哪个聚类算法不是属于基于原型的聚类( D )。

A、模糊c均值

B、EM算法

C、SOM

D、CLIQUE

77. 关于混合模型聚类算法的优缺点,下面说法正确的是( B )。

A、当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能很好地处理。

B、混合模型比K均值或模糊c均值更一般,因为它可以使用各种类型的分布。

C、混合模型很难发现不同大小和椭球形状的簇。

D、混合模型在有噪声和离群点时不会存在问题。

78. 以下哪个聚类算法不属于基于网格的聚类算法( D )。

A、STING

B、WaveCluster

C、MAFIA

D、BIRCH

79. 一个对象的离群点得分是该对象周围密度的逆。这是基于( C )的离群点定义。

A.概率

B、邻近度

C、密度

D、聚类

80. 下面关于Jarvis-Patrick(JP)聚类算法的说法不正确的是( D )。

A、JP聚类擅长处理噪声和离群点,并且能够处理不同大小、形状和密度的簇。

B、JP算法对高维数据效果良好,尤其擅长发现强相关对象的紧致簇。

C、JP聚类是基于SNN相似度的概念。

D、JP聚类的基本时间复杂度为O(m)。

链接:http://www.itongji.cn/cms/article/articledetails?articleid=2549

服务号(24小时为您解决统计问题)


本订阅号(数据小知识分享)


    关注 统计师


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册