数据挖掘最后20道单选题_【统计师】

61.以下关于人工神经网络（ANN）的描述错误的有(A)A，神经网络对训练数据中的噪声非常鲁棒B，可以处...

61. 以下关于人工神经网络（ANN）的描述错误的有 (A)

A，神经网络对训练数据中的噪声非常鲁棒

B，可以处理冗余特征

C，训练ANN是一个很耗时的过程

D，至少含有一个隐藏层的多层神经网络

62. 通过聚集多个分类器的预测来提高分类准确率的技术称为 (A)

A，组合(ensemble)

B，聚集(aggregate)

C，合并(combination)

D，投票(voting)

63. 简单地将数据对象集划分成不重叠的子集，使得每个数据对象恰在一个子集中，这种聚类类型称作（ B ）

A、层次聚类

B、划分聚类

C、非互斥聚类

D、模糊聚类

64. 在基本K均值算法里，当邻近度函数采用（ A ）的时候，合适的质心是簇中各点的中位数。

A、曼哈顿距离

B、平方欧几里德距离

C、余弦距离

D、Bregman散度

65.（ C ）是一个观测值，它与其他观测值的差别如此之大，以至于怀疑它是由不同的机制产生的。

A、边界点

B、质心

C、离群点

D、核心点

66. BIRCH是一种（ B ）。

A、分类器

B、聚类算法

C、关联分析算法

D、特征选择算法

67. 检测一元正态分布中的离群点，属于异常检测中的基于（ A ）的离群点检测。

A、统计方法

B、邻近度

C、密度

D、聚类技术

68.（ C ）将两个簇的邻近度定义为不同簇的所有点对的平均逐对邻近度，它是一种凝聚层次聚类技术。

A、MIN（单链）

B、MAX（全链）

C、组平均

D、Ward方法

69.（ D ）将两个簇的邻近度定义为两个簇合并时导致的平方误差的增量，它是一种凝聚层次聚类技术。

A、MIN（单链）

B、MAX（全链）

C、组平均

D、Ward方法

70. DBSCAN在最坏情况下的时间复杂度是（ B ）。

A、O(m)

B、O(m2)

C、O(log m)

D、O(m*log m)

71. 在基于图的簇评估度量表里面，如果簇度量为proximity(Ci ， C)，簇权值为mi ，那么它的类型是（ C ）。

A、基于图的凝聚度

B、基于原型的凝聚度

C、基于原型的分离度

D、基于图的凝聚度和分离度

72. 关于K均值和DBSCAN的比较，以下说法不正确的是（ A ）。

A、K均值丢弃被它识别为噪声的对象，而DBSCAN一般聚类所有对象。

B、K均值使用簇的基于原型的概念，而DBSCAN使用基于密度的概念。

C、K均值很难处理非球形的簇和不同大小的簇，DBSCAN可以处理不同大小和不同形状的簇。

D、K均值可以发现不是明显分离的簇，即便簇有重叠也可以发现，但是DBSCAN会合并有重叠的簇。

73. 以下是哪一个聚类算法的算法流程：①构造k－最近邻图。②使用多层图划分算法划分图。③repeat：合并关于相对互连性和相对接近性而言，最好地保持簇的自相似性的簇。④until：不再有可以合并的簇。（ C ）。

A、MST

B、OPOSSUM

C、Chameleon

D、Jarvis－Patrick（JP）

74. 考虑这么一种情况：一个对象碰巧与另一个对象相对接近，但属于不同的类，因为这两个对象一般不会共享许多近邻，所以应该选择（ D ）的相似度计算方法。

A、平方欧几里德距离

B、余弦距离

C、直接相似度

D、共享最近邻

75. 以下属于可伸缩聚类算法的是（ A ）。

A、CURE

B、DENCLUE

C、CLIQUE

D、OPOSSUM

76. 以下哪个聚类算法不是属于基于原型的聚类（ D ）。

A、模糊c均值

B、EM算法

C、SOM

D、CLIQUE

77. 关于混合模型聚类算法的优缺点，下面说法正确的是（ B ）。

A、当簇只包含少量数据点，或者数据点近似协线性时，混合模型也能很好地处理。

B、混合模型比K均值或模糊c均值更一般，因为它可以使用各种类型的分布。

C、混合模型很难发现不同大小和椭球形状的簇。

D、混合模型在有噪声和离群点时不会存在问题。

78. 以下哪个聚类算法不属于基于网格的聚类算法（ D ）。

A、STING

B、WaveCluster

C、MAFIA

D、BIRCH

79. 一个对象的离群点得分是该对象周围密度的逆。这是基于（ C ）的离群点定义。

A．概率

B、邻近度

C、密度

D、聚类

80. 下面关于Jarvis－Patrick（JP）聚类算法的说法不正确的是（ D ）。

A、JP聚类擅长处理噪声和离群点，并且能够处理不同大小、形状和密度的簇。

B、JP算法对高维数据效果良好，尤其擅长发现强相关对象的紧致簇。

C、JP聚类是基于SNN相似度的概念。

D、JP聚类的基本时间复杂度为O(m)。

链接：http://www.itongji.cn/cms/article/articledetails?articleid=2549