关于k-Means算法,正确的是()。A.k表示算法生成的簇的数目,需要用户事先指定B.Means的含义是簇中样本的平均值C.在k-Means中,每一个簇用一个中心(质心)向量表示D.算法的初始化阶段需要给定k个初始的簇中心

题目

关于k-Means算法,正确的是()。

A.k表示算法生成的簇的数目,需要用户事先指定

B.Means的含义是簇中样本的平均值

C.在k-Means中,每一个簇用一个中心(质心)向量表示

D.算法的初始化阶段需要给定k个初始的簇中心


相似考题
参考答案和解析
在确定样本集是否可以使用kmeans算法时,可以先对数据集进行可视化观察样本集的大致分布。;初始聚类中心的选择会影响kmeans算法的收敛速度。;kmeans需要多次迭代,因此对于大的样本集速度求解比较慢。
更多“关于k-Means算法,正确的是()。”相关问题
  • 第1题:

    以下哪种算法不是监督学习()

    A、决策树

    B、随机森林

    C、神经网络

    D、k-means


    答案:D

  • 第2题:

    简述k-means算法,层次聚类算法的优缺点。


    正确答案:(1)k-means算法:
    优点:算法描述容易,实现简单快速
    不足:
    簇的个数要预先给定
    对初始值的依赖极大
    不适合大量数据的处理
    对噪声点和离群点很敏感
    很难检测到“自然的”簇
    (2)层次聚类算法:
    BIRCH算法:
    优点:利用聚类特征树概括了聚类的有用信息,节省内存空间;具有对象数目呈线性关系,可伸缩性和较好的聚类质量。
    不足:每个节点只能包含有限数目的条目,工作效率受簇的形状的影响大。
    C.URE算法:
    优点:对孤立点的处理能力强;适用于大规模数据处理,伸缩性好,没有牺牲聚类质量。
    缺点:算法在处理大量数据时必须基于抽样,划分等技术。
    R.OCK算法:
    优点:分类恰当,可采用随机抽样处理数据。
    缺点:最坏的情况下时间复杂度级数大。
    基于密度的聚类算法:可识别具有任意形状不同大小的簇,自动确定簇的数目,分离簇和环境噪声,一次扫描即可完成聚类,使用空间索引时间复杂度为O(NlbN)。

  • 第3题:

    算法设计是编写程序的基础,下列关于算法的叙述中正确的是()

    • A、任何问题都有算法
    • B、算法必须具有确定性
    • C、算法可以没有输出
    • D、算法的表示计算机必须能理解

    正确答案:B

  • 第4题:

    K-means算法叙述正确的是()

    • A、在K-means算法中K是事先给定的,这个K值的选定是非常难以估计的
    • B、在K-means算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化
    • C、对于一个类中的每个对象,在其给定半径的领域中包含的对象不能少于某一给定的最小数目
    • D、从K-means算法框架可以看出,该算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,算法的时间开销是非常大的

    正确答案:A,B,D

  • 第5题:

    关于算法与程序的关系,叙述正确的是()。

    • A、算法是对程序的描述
    • B、算法就是流程图
    • C、算法是程序设计的核心
    • D、程序决定算法

    正确答案:C

  • 第6题:

    关联规则发现是数据挖掘中最为重要和典型的一种方法。最常用的关联规则发现算法是().

    • A、Apriori算法
    • B、k-means算法
    • C、kNN算法
    • D、C4.5算法

    正确答案:A

  • 第7题:

    下面关于算法的认识正确的是()。

    • A、算法就是求解“鸡兔同笼问题”
    • B、算法一定没有输出
    • C、算法就是计算机程序
    • D、算法的步骤必须是有限的

    正确答案:D

  • 第8题:

    下列算法中,属于关联规则算法的是()。

    • A、Apriori算法
    • B、K-means算法
    • C、C4.5算法
    • D、Page Rank算法

    正确答案:A

  • 第9题:

    以下算法中,不属于分类预测的典型算法的是()

    • A、Logistic回归
    • B、决策树
    • C、K-means算法
    • D、神经网络

    正确答案:C

  • 第10题:

    关于算法,以下说法正确的是()。

    • A、算法可以是不确定的
    • B、算法是人们解决问题的想法
    • C、算法的步骤多少可以不受限制
    • D、算法的步骤是有限的

    正确答案:D

  • 第11题:

    单选题
    关于算法,以下说法正确的是()。
    A

    算法可以是不确定的

    B

    算法是人们解决问题的想法

    C

    算法的步骤多少可以不受限制

    D

    算法的步骤是有限的


    正确答案: A
    解析: 算法的步骤是有限的,算法具有有穷性。

  • 第12题:

    单选题
    算法设计是编写程序的基础。下列关于算法的叙述正确的是()。
    A

    算法必须产生正确的结果

    B

    算法可以没有输出

    C

    算法必须具有确定性

    D

    算法的表示必须使计算机能理解


    正确答案: B
    解析: 暂无解析

  • 第13题:

    关于聚类算法K-Means和DBSCAN的叙述中,不正确的是( )。

    A.K-Means和DBSCAN的聚类结果与输入参数有很大的关系
    B.K-Means基于距离的概念而DBSCAN基于密度的概念进行聚类分析
    C.K-Means很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇
    D.当簇的密度变化较大时,DBSCAN不能很好的处理,而K-Means则可以

    答案:D
    解析:
    本题考查数据挖掘的基础知识。K-Means和DBSCAN是两个经典的聚类算法,将相似的数据对象归类一组,不相似的数据对象分开。K-means算法基于对象之间的聚类进行聚类,需要输入聚类的个数。DBSCAN算法基于密度进行聚类,需要确定阈值,两者的聚类结果均与输入参数关系很大。DBSCAN可以处理不同大小和不同形状的簇,而K-means算法则不适合。若数据分布密度变化大,则这两种算法都不适用。

  • 第14题:

    算法设计是编写程序的基础。下列关于算法的叙述正确的是()。

    • A、算法必须产生正确的结果
    • B、算法可以没有输出
    • C、算法必须具有确定性
    • D、算法的表示必须使计算机能理解

    正确答案:C

  • 第15题:

    K-means算法的缺点不包括()

    • A、K必须是事先给定的
    • B、选择初始聚类中心
    • C、对于“噪声”和孤立点数据是敏感的
    • D、可伸缩、高效

    正确答案:D

  • 第16题:

    K-means算法的叙述正确的是()

    • A、在K-means算法中K是事先给定的,这个K值的选定是非常难以估计的
    • B、在K-means算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化
    • C、对于一个类中的每个对象,在其给定半径的领域中包含的对象不能少于某一给定的最小数目的新的聚类心,因此当数据量非常大时,算法的时间开销是非常大的

    正确答案:A,B,D

  • 第17题:

    下列关于算法的描述,正确的是()

    • A、解题的步骤可以是无穷的
    • B、算法是解决问题的步骤
    • C、算法就是解题的算式
    • D、算法是可以被表述但无法实现

    正确答案:B

  • 第18题:

    关于算法和程序,下面说法正确的是()。

    • A、算法+数据结构=程序
    • B、算法就是程序
    • C、数据结构就是程序
    • D、算法包括数据结构

    正确答案:A

  • 第19题:

    下列哪种算法属于分类算法的范畴().

    • A、Apriori算法
    • B、k-means算法
    • C、kNN算法
    • D、FP-Growth算法

    正确答案:C

  • 第20题:

    下列哪种算法属于聚类算法的范畴().

    • A、Apriori算法
    • B、k-means算法
    • C、kNN算法
    • D、C4.5算法

    正确答案:B

  • 第21题:

    关于算法,正确的说法是()。

    • A、算法就是程序
    • B、算法就是流程图
    • C、算法就是计算方法
    • D、算法就是对于一个特定问题确定的有限的求解步骤

    正确答案:D

  • 第22题:

    多选题
    K-means算法叙述正确的是()
    A

    在K-means算法中K是事先给定的,这个K值的选定是非常难以估计的

    B

    在K-means算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化

    C

    对于一个类中的每个对象,在其给定半径的领域中包含的对象不能少于某一给定的最小数目

    D

    从K-means算法框架可以看出,该算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,算法的时间开销是非常大的


    正确答案: A,B,D
    解析: 暂无解析

  • 第23题:

    单选题
    关于算法与程序的关系,叙述正确的是()。
    A

    算法是对程序的描述

    B

    算法就是流程图

    C

    算法是程序设计的核心

    D

    程序决定算法


    正确答案: D
    解析: 暂无解析

  • 第24题:

    单选题
    K-means算法的缺点不包括()
    A

    K必须是事先给定的

    B

    选择初始聚类中心

    C

    对于“噪声”和孤立点数据是敏感的

    D

    可伸缩、高效


    正确答案: A
    解析: 暂无解析