下列关于k均值聚类算法的说法中错误的是?A.k均值算法采用误差和准则函数,其聚类目标是使准则函数值最小B.理论上可以证明,k均值聚类算法是收敛的C.k均值算法的聚类结果虽然收敛但不确定D.初始聚类中心和样本的分布情况影响

题目

下列关于k均值聚类算法的说法中错误的是?

A.k均值算法采用误差和准则函数,其聚类目标是使准则函数值最小

B.理论上可以证明,k均值聚类算法是收敛的

C.k均值算法的聚类结果虽然收敛但不确定

D.初始聚类中心和样本的分布情况影响


相似考题
更多“下列关于k均值聚类算法的说法中错误的是?”相关问题
  • 第1题:

    聚类的典型应用不包括( ),(请作答此空)是一个典型的聚类算法。

    A.决策树
    B.Apriori
    C.k-means
    D.SVM

    答案:C
    解析:
    本题考査数据挖掘的基础知识。本题的选项中,A和D是典型的分类算法,B是频繁模式挖掘算法,而C是聚类算法。该题考核数据挖掘的基本概念,随着大数据时代的到来,数据挖掘是其中一个核心的技术,要求考对数据挖掘的基本功能以及基本的算法有一定的了解和掌握。

  • 第2题:

    简述k-means算法,层次聚类算法的优缺点。


    正确答案:(1)k-means算法:
    优点:算法描述容易,实现简单快速
    不足:
    簇的个数要预先给定
    对初始值的依赖极大
    不适合大量数据的处理
    对噪声点和离群点很敏感
    很难检测到“自然的”簇
    (2)层次聚类算法:
    BIRCH算法:
    优点:利用聚类特征树概括了聚类的有用信息,节省内存空间;具有对象数目呈线性关系,可伸缩性和较好的聚类质量。
    不足:每个节点只能包含有限数目的条目,工作效率受簇的形状的影响大。
    C.URE算法:
    优点:对孤立点的处理能力强;适用于大规模数据处理,伸缩性好,没有牺牲聚类质量。
    缺点:算法在处理大量数据时必须基于抽样,划分等技术。
    R.OCK算法:
    优点:分类恰当,可采用随机抽样处理数据。
    缺点:最坏的情况下时间复杂度级数大。
    基于密度的聚类算法:可识别具有任意形状不同大小的簇,自动确定簇的数目,分离簇和环境噪声,一次扫描即可完成聚类,使用空间索引时间复杂度为O(NlbN)。

  • 第3题:

    K-means算法叙述正确的是()

    • A、在K-means算法中K是事先给定的,这个K值的选定是非常难以估计的
    • B、在K-means算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化
    • C、对于一个类中的每个对象,在其给定半径的领域中包含的对象不能少于某一给定的最小数目
    • D、从K-means算法框架可以看出,该算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,算法的时间开销是非常大的

    正确答案:A,B,D

  • 第4题:

    可用作数据挖掘分析中的关联规则算法有()。

    • A、决策树、对数回归、关联模式
    • B、K均值法、SOM神经网络
    • C、Apriori算法、FP-Tree算法
    • D、RBF神经网络、K均值法、决策树

    正确答案:C

  • 第5题:

    关于混合模型聚类算法的优缺点,下面说法正确的是()

    • A、当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能很好地处理
    • B、混合模型比K均值或模糊C均值更一般,因为它可以使用各种类型的分布
    • C、混合模型很难发现不同大小和椭球形状的簇
    • D、混合模型在有噪声和离群点时不会存在问题

    正确答案:B

  • 第6题:

    以下属于聚类算法的是()

    • A、K均值
    • B、DBSCAN
    • C、Apriori
    • D、Jarvis-Patrick(JP)

    正确答案:A,B,D

  • 第7题:

    ISODATA算法与K-均值算法有什么不同。


    正确答案: 第一,它不是每调整一个样本的类别就重新计算一次各类样本的均值,而是在把所有样本都调整完毕之后才重新计算,前者称为逐个样本修正法,后者称为成批样本修正法;第二,ISODATA算法不仅可以通过调整样本所属类别完成样本的聚类分析,而且可以自动地进行类别“合并”和“分裂”,从而得到类数比较合理的聚类结果。

  • 第8题:

    问答题
    写出K-均值聚类算法的计算步骤。

    正确答案: 首先根据最终分类的个数k随机地选取k个初始的聚类中心,不断地迭代,知道达到目标函数的最小值,即得到最终的聚类结果。即:
    1、为中心向量{C1,C2,……,CK}初始化K个种子;
    2、分组:
    1)将样本分配给距离其最近的中心向量;
    2)由这些样本构造不相交的聚类;
    3、确定中心:用各个聚类的中心向量作为新的中心;
    4、重复分组和确定中心的步骤,直至算法收敛。
    解析: 暂无解析

  • 第9题:

    单选题
    下面关于Jarvis-Patrick(JP)聚类算法的说法不正确的是()。
    A

    JP聚类擅长处理噪声和离群点,并且能够处理不同大小、形状和密度的簇

    B

    JP算法对高维数据效果良好,尤其擅长发现强相关对象的紧致簇

    C

    JP聚类是基于SNN相似度的概念

    D

    JP聚类的基本时间复杂度为O(m)


    正确答案: C
    解析: 暂无解析

  • 第10题:

    单选题
    以下哪个聚类算法不是属于基于原型的聚类()。
    A

    模糊c均值

    B

    EM算法

    C

    SOM

    D

    CLIQUE


    正确答案: C
    解析: 暂无解析

  • 第11题:

    问答题
    试述K均值法与系统聚类法的异同。

    正确答案: 相同:K—均值法和系统聚类法一样,都是以距离的远近亲疏为标准进行聚类的。
    不同:系统聚类对不同的类数产生一系列的聚类结果,而K—均值法只能产生指定类数的聚类结果。
    具体类数的确定,离不开实践经验的积累;有时也可以借助系统聚类法以一部分样品为对象进行聚类,其结果作为K—均值法确定类数的参考。
    解析: 暂无解析

  • 第12题:

    判断题
    K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第13题:

    下列关于CASS7.0软件所对应的简码说法中,错误的是()。

    • A、F表示房屋类地物
    • B、K表示控制点
    • C、X表示线类地物
    • D、G管线类地物

    正确答案:B

  • 第14题:

    关于K均值和DBSCAN的比较,以下说法不正确的是()。

    • A、K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象
    • B、K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念
    • C、K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇
    • D、K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇

    正确答案:A

  • 第15题:

    K-means算法的叙述正确的是()

    • A、在K-means算法中K是事先给定的,这个K值的选定是非常难以估计的
    • B、在K-means算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化
    • C、对于一个类中的每个对象,在其给定半径的领域中包含的对象不能少于某一给定的最小数目的新的聚类心,因此当数据量非常大时,算法的时间开销是非常大的

    正确答案:A,B,D

  • 第16题:

    K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。


    正确答案:错误

  • 第17题:

    ()都属于分裂的层次聚类算法。

    • A、二分K均值
    • B、MST
    • C、Chameleon
    • D、组平均

    正确答案:A,B

  • 第18题:

    以下哪些是监督分类的分类方法()

    • A、K-均值算法
    • B、多级切割分类法
    • C、最大似然比法
    • D、动态聚类法

    正确答案:B,C

  • 第19题:

    下列哪种算法属于聚类算法的范畴().

    • A、Apriori算法
    • B、k-means算法
    • C、kNN算法
    • D、C4.5算法

    正确答案:B

  • 第20题:

    问答题
    快速聚类法(K—均值法)的基本思想是怎样的?

    正确答案: 如果待分类样品比较多,应先给出一个大概的分类,然后不断对其进行修正,一直到分类结果比较合理为止。
    解析: 暂无解析

  • 第21题:

    多选题
    K-means算法叙述正确的是()
    A

    在K-means算法中K是事先给定的,这个K值的选定是非常难以估计的

    B

    在K-means算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化

    C

    对于一个类中的每个对象,在其给定半径的领域中包含的对象不能少于某一给定的最小数目

    D

    从K-means算法框架可以看出,该算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,算法的时间开销是非常大的


    正确答案: A,B,D
    解析: 暂无解析

  • 第22题:

    多选题
    ()都属于分裂的层次聚类算法。
    A

    二分K均值

    B

    MST

    C

    Chameleon

    D

    组平均


    正确答案: D,B
    解析: 暂无解析

  • 第23题:

    多选题
    以下属于聚类算法的是()
    A

    K均值

    B

    DBSCAN

    C

    Apriori

    D

    Jarvis-Patrick(JP)


    正确答案: D,C
    解析: 暂无解析

  • 第24题:

    单选题
    关于混合模型聚类算法的优缺点,下面说法正确的是()
    A

    当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能很好地处理

    B

    混合模型比K均值或模糊C均值更一般,因为它可以使用各种类型的分布

    C

    混合模型很难发现不同大小和椭球形状的簇

    D

    混合模型在有噪声和离群点时不会存在问题


    正确答案: C
    解析: 暂无解析