spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理()数据集A、单机B、集中式C、分布式D、NOSQL

题目

spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理()数据集

  • A、单机
  • B、集中式
  • C、分布式
  • D、NOSQL

相似考题
更多“spark为分布式数据集的处理提供了一个有效框架,并以高效的方式”相关问题
  • 第1题:

    以下关于sparkstreaming说法正确的是()

    • A、spark streaming分布式微批架构
    • B、spark streaming实时存储架构
    • C、spark streaming是普通存储架构
    • D、spark streaming分布式实时计算架构

    正确答案:A

  • 第2题:

    spark中的rdd是一个()数据集

    • A、弹性分布式
    • B、弹性计算
    • C、运送数据
    • D、心跳

    正确答案:A

  • 第3题:

    spark支持的分布式部署方式中哪个是错误的()

    • A、standalone
    • B、spark on mesos
    • C、spark on YARN
    • D、spark on local

    正确答案:D

  • 第4题:

    spark可以编写sql脚本的框架是()

    • A、spark core
    • B、spark streaming
    • C、mlbase
    • D、spark sql

    正确答案:D

  • 第5题:

    spark框架中,整合机器学习库,并对外提供接口的框架是()

    • A、spark core
    • B、spark streaming
    • C、mlbase
    • D、spark sql

    正确答案:C

  • 第6题:

    Spark提供了统一的解决方案。Spark可以用于批处理、交互式查询(SparkSQL)、实时流处理(SparkStreaming)、机器学习(SparkMLlib)和图计算(GraphX)


    正确答案:正确

  • 第7题:

    RDD(ResilientDistributedDataset)叫做分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合


    正确答案:正确

  • 第8题:

    SparkSQL是一个用来处理结构化数据的spark组件。它提供了一个叫做()的可编程抽象数据模型

    • A、DataFrames
    • B、Table
    • C、DataSet
    • D、RDD

    正确答案:A

  • 第9题:

    对传统的分布式程序设计相比,Mapreduce封装了()等细节,还提供了一个简单而强大的接口。

    • A、并行处理
    • B、容错处理
    • C、数据分布
    • D、负载均衡

    正确答案:C

  • 第10题:

    Hadoop是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。


    正确答案:正确

  • 第11题:

    填空题
    Agent的()、互操作性、反应性、移动性为分布式应用提供方便、高效和鲁棒的执行框架。

    正确答案: 自治性
    解析: 暂无解析

  • 第12题:

    单选题
    云计算是()。
    A

    为解决气象数据处理服务的

    B

    用于移动通讯服务的

    C

    只为一个集团提供通讯服务的

    D

    将网络资源集中管理和调度,并以虚拟化方式为用户提供服务的


    正确答案: D
    解析: 暂无解析

  • 第13题:

    spark中弹性分布式数据集指的是哪个()

    • A、RDD
    • B、Driver
    • C、Master
    • D、Map

    正确答案:A

  • 第14题:

    spark中的弹性分布式数据集相当于java中的()概念

    • A、类
    • B、接口
    • C、方法
    • D、内部类

    正确答案:A

  • 第15题:

    spark的源码是由哪几种语言编写完成的()

    • A、acheSpark是一种快速、通用、可扩展的大数据分析引擎
    • B、spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理分布式数据集
    • C、spark强调一站式解决方案,集批处理、实时流处理、交互式查询与图计算于一体,避免了多种运算场景下需要部署不同集群带来的资源浪费
    • D、spark可以将数据分析过程的中间输出保存在内存中,从而不需要从外部持久化存储中反复读写数据,相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景

    正确答案:A,B

  • 第16题:

    spark中可以整合机器学习库,并可以对外提供接口的框架是()

    • A、spark core
    • B、spark streaming
    • C、mlbase
    • D、spark sql

    正确答案:C

  • 第17题:

    spark的核心框架是()

    • A、spark core
    • B、spark streaming
    • C、mlbase
    • D、Grophx

    正确答案:A

  • 第18题:

    下面对于spark的特点描述正确的是()

    • A、良好的容错性:在分布式数据集计算时通过checkpoint来实现容错,当某个运算环节失败时,不需要从头开始重新计算
    • B、开发便捷性:spark通过scala,java,pythonapi及交互式shell提供丰富的使用方式
    • C、不适合细粒度更新操作:Spark的运算是面向集合的,不适用于需要异步细粒度更新状态的应用,例如web服务的DAO层或web爬虫等
    • D、以上答案都不符合其特性

    正确答案:A,B,C,D

  • 第19题:

    SparkSQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用


    正确答案:正确

  • 第20题:

    云计算是()。

    • A、为解决气象数据处理服务的
    • B、用于移动通讯服务的
    • C、只为一个集团提供通讯服务的
    • D、将网络资源集中管理和调度,并以虚拟化方式为用户提供服务的

    正确答案:D

  • 第21题:

    大数据处理框架-Spark诞生于()

    • A、伯克利大学AMPLab
    • B、Apache孵化器项目
    • C、Apache顶级项目
    • D、开源项目

    正确答案:A

  • 第22题:

    判断题
    Hadoop是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第23题:

    判断题
    Spark是一个类似于MapReduce的分布式计算框架,其核心是弹性分布式数据集
    A

    B


    正确答案:
    解析: 暂无解析