数据挖掘80道单选题题,敢不敢来自测!(3)

 

41.频繁项集、频繁闭项集、最大频繁项集之间的关系是:(C)A、频繁项集频繁闭项集=最大频繁项集B、...



41. 频繁项集、频繁闭项集、最大频繁项集之间的关系是: (C)

A、频繁项集 频繁闭项集 =最大频繁项集

B、频繁项集 = 频繁闭项集 最大频繁项集

C、频繁项集 频繁闭项集 最大频繁项集

D、频繁项集 = 频繁闭项集 = 最大频繁项集

42. 考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用 合并策略,由候选产生过程得到4-项集不包含(C)

A、1,2,3,4

B、1,2,3,5

C、1,2,4,5

D、1,3,4,5

43.下面选项中t不是s的子序列的是 ( C )

A、s= t=

B、s= t=

C、s= t=

D、s= t=

44. 在图集合中发现一组公共子结构,这样的任务称为 ( B )

A、频繁子集挖掘

B、频繁子图挖掘

C、频繁数据项挖掘

D、频繁模式挖掘

45. 下列度量不具有反演性的是 (D)

A、系数

B、几率

C、Cohen度量

D、兴趣因子

46. 下列__(A)__不是将主观信息加入到模式发现任务中的方法。

A、与同一时期其他数据对比

B、可视化

C、基于模板的方法

D、主观兴趣度量

47. 下面购物篮能够提取的3-项集的最大数量是多少(C)

ID 购买项

1 牛奶,啤酒,尿布

2 面包,黄油,牛奶

3 牛奶,尿布,饼干

4 面包,黄油,饼干

5 啤酒,饼干,尿布

6 牛奶,尿布,面包,黄油

7 面包,黄油,尿布

8 啤酒,尿布

9 牛奶,尿布,面包,黄油

10 啤酒,饼干

A、1

B、2

C、3

D、4

48. 以下哪些算法是分类算法,(B)

A,DBSCAN

B,C4.5

C,K-Mean

D,EM

49. 以下哪些分类方法可以较好地避免样本的不平衡问题(A)

A,KNN

B,SVM

C,Bayes

D,神经网络

50. 决策树中不包含一下哪种结点(C)

A,根结点(root node)

B,内部结点(internal node)

C,外部结点(external node)

D,叶结点(leaf node)

53. 以下哪项关于决策树的说法是错误的 (C)

A. 冗余属性不会对决策树的准确率造成不利的影响

B. 子树可能在决策树中重复多次

C. 决策树算法对于噪声的干扰非常敏感

D. 寻找最佳决策树是NP完全问题

54. 在基于规则分类器的中,依据规则质量的某种度量对规则排序,保证每一个测试记录都是由覆盖它的“最好的”规格来分类,这种方案称为 (B)

A. 基于类的排序方案

B. 基于规则的排序方案

C. 基于度量的排序方案

D. 基于规格的排序方案。

55. 以下哪些算法是基于规则的分类器 (A)

A. C4.5

B. KNN

C. Na?ve Bayes

D. ANN

56. 如果规则集R中不存在两条规则被同一条记录触发,则称规则集R中的规则为(C);

A, 无序规则

B,穷举规则

C, 互斥规则

D,有序规则

57. 如果对属性值的任一组合,R中都存在一条规则加以覆盖,则称规则集R中的规则为(B)

A, 无序规则

B,穷举规则

C, 互斥规则

D,有序规则

58. 如果规则集中的规则按照优先级降序排列,则称规则集是 (D)

A, 无序规则

B,穷举规则

C, 互斥规则

D,有序规则

59. 如果允许一条记录触发多条分类规则,把每条被触发规则的后件看作是对相应类的一次投票,然后计票确定测试记录的类标号,称为(A)

A, 无序规则

B,穷举规则

C, 互斥规则

D,有序规则

60. 考虑两队之间的足球比赛:队0和队1。假设65%的比赛队0胜出,剩余的比赛队1获胜。队0获胜的比赛中只有30%是在队1的主场,而队1取胜的比赛中75%是主场获胜。如果下一场比赛在队1的主场进行队1获胜的概率为 (C)

A,0.75

B,0.35

C,0.4678

D, 0.5738

链接:http://www.itongji.cn/cms/article/articledetails?articleid=2549

服务号(24小时为您解决统计问题)


本订阅号(数据小知识分享)


    关注 统计师


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册