更多“Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性”相关问题
  • 第1题:

    以下关于sparkstreaming说法正确的是()

    • A、spark streaming分布式微批架构
    • B、spark streaming实时存储架构
    • C、spark streaming是普通存储架构
    • D、spark streaming分布式实时计算架构

    正确答案:A

  • 第2题:

    以下选项中属于spark架构中的图计算框架的是()

    • A、spark core
    • B、spark streaming
    • C、mlbase
    • D、Grophx

    正确答案:D

  • 第3题:

    spark生态圈没有能够实时计算的框架


    正确答案:错误

  • 第4题:

    spark是基于()运行的计算框架

    • A、内存
    • B、磁盘
    • C、内存加磁盘
    • D、网络

    正确答案:A

  • 第5题:

    与spark基于内存相比,mapreduce是基于()运行的计算框架

    • A、内存
    • B、磁盘
    • C、内存加磁盘
    • D、网络

    正确答案:B

  • 第6题:

    云计算使用超大计算机集群协同运算,采用大型企业级数据库存储数据,只要保证网络通信线路的畅通,就可利用其高性能海量数据处理能力、容错能力、弹性易伸缩能力提高业务数据的()。

    • A、高可靠性
    • B、高安全性
    • C、高可用性
    • D、高透明性

    正确答案:C

  • 第7题:

    hadoop中的mapreduce是基于什么运行的计算框架()

    • A、内存
    • B、磁盘
    • C、内存加磁盘
    • D、网络

    正确答案:B

  • 第8题:

    下面对于spark的特点描述正确的是()

    • A、良好的容错性:在分布式数据集计算时通过checkpoint来实现容错,当某个运算环节失败时,不需要从头开始重新计算
    • B、开发便捷性:spark通过scala,java,pythonapi及交互式shell提供丰富的使用方式
    • C、不适合细粒度更新操作:Spark的运算是面向集合的,不适用于需要异步细粒度更新状态的应用,例如web服务的DAO层或web爬虫等
    • D、以上答案都不符合其特性

    正确答案:A,B,C,D

  • 第9题:

    内存计算下,Spark?比?Hadoop?快10倍


    正确答案:错误

  • 第10题:

    华为全内存桌面的IOTailor去重压缩技术,针对VDI和内存介质进行专门优化,去重压缩的同时,还保证了数据交互实时性和一致性


    正确答案:正确

  • 第11题:

    判断题
    Spark是基于内存的计算,所有的Spark程序运行过程中的数据只能存储在内存中。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第12题:

    多选题
    关于Spark和Mapreduce,下列说法正确的是()。
    A

    性能上提升高于100倍(全内存计算)

    B

    Spark的中间数据放在内存中,对于迭代运算、批处理计算的效率更高,延迟更低。

    C

    提供更多的数据集操作类型,编程模型更灵活,开发效率更高。

    D

    更低的容错能力(血统机制)。

    E

    Spark用十分之一的资源,获得10倍与Mapreduce的性能。


    正确答案: E,B
    解析: 暂无解析

  • 第13题:

    spark计算速度比mapreduce计算速度快,不仅仅是因为内存


    正确答案:正确

  • 第14题:

    与Hadoop的MapReduce相比,Spark基于内存的运算要快100倍以上,基于硬盘的运算也要快10倍以上


    正确答案:正确

  • 第15题:

    spark的源码是由哪几种语言编写完成的()

    • A、acheSpark是一种快速、通用、可扩展的大数据分析引擎
    • B、spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理分布式数据集
    • C、spark强调一站式解决方案,集批处理、实时流处理、交互式查询与图计算于一体,避免了多种运算场景下需要部署不同集群带来的资源浪费
    • D、spark可以将数据分析过程的中间输出保存在内存中,从而不需要从外部持久化存储中反复读写数据,相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景

    正确答案:A,B

  • 第16题:

    Spark Streaming有高吞吐量和容错能力强等特点


    正确答案:正确

  • 第17题:

    spark中的实时计算系统是哪个()

    • A、spark?core
    • B、spark?streaming
    • C、mlbase
    • D、Grophx

    正确答案:B

  • 第18题:

    Spark提供了统一的解决方案。Spark可以用于批处理、交互式查询(SparkSQL)、实时流处理(SparkStreaming)、机器学习(SparkMLlib)和图计算(GraphX)


    正确答案:正确

  • 第19题:

    mapreduce是基于()运行的计算框架

    • A、内存
    • B、磁盘
    • C、内存加磁盘
    • D、网络

    正确答案:B

  • 第20题:

    RDD(ResilientDistributedDataset)叫做分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合


    正确答案:正确

  • 第21题:

    spark中的图计算框架是()

    • A、spark core
    • B、spark streaming
    • C、mlbase
    • D、Grophx

    正确答案:D

  • 第22题:

    问答题
    Spark是基于内存计算的大数据计算平台,试述Spark的主要特点。

    正确答案: S.park具有如下4个主要特点:
    ①运行速度快;②容易使用;③通用性;④运行模式多样。
    解析: 暂无解析

  • 第23题:

    判断题
    华为全内存桌面的IOTailor去重压缩技术,针对VDI和内存介质进行专门优化,去重压缩的同时,还保证了数据交互实时性和一致性
    A

    B


    正确答案:
    解析: 暂无解析