Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算，提高了在大数据环境下数据处理的实时性，同时保证了高容错性和高可伸缩性

题目

相似考题

1.在Client/server系统中，服务器主要做数据库的管理，按数据请求进行数据处理并回送结果。根据服务器的上述特点，Client/server系统对服务器的要求是______。A．处理速度高、大内存、大容量磁盘、高可靠、较高的带宽B．网络管理方便、处理速度高、大内存、大容量磁盘、高带宽C．大内存、大容量磁盘、高可靠、较高的带宽、处理速度可以偏低D．大容量磁盘、高可靠、高带宽、处理速度较高

2.MapReduce与传统并行计算框架的对比中,说法正确的是()。A.MapReduce属于共享式集群架构，容错性好B.传统并行计算框架比MapReduce硬件更加便宜C.传统并行计算框架适用于实时、细粒度计算D.MapReduce适用于数据密集型，传统并行计算框架适用于计算密集型

3.spark架构计算速度比mapreduce计算速度快单纯因为内存

4.Spark是一个()计算框架。A.快速B.容错C.可扩展D.分布式

更多“Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算，提高了在大数据环境下数据处理的实时性，同时保证了高容错性和高可伸缩性”相关问题

第1题：

以下关于sparkstreaming说法正确的是（）
- A、spark streaming分布式微批架构
- B、spark streaming实时存储架构
- C、spark streaming是普通存储架构
- D、spark streaming分布式实时计算架构
正确答案:A
第2题：

以下选项中属于spark架构中的图计算框架的是（）
- A、spark core
- B、spark streaming
- C、mlbase
- D、Grophx
正确答案:D
第3题：

spark生态圈没有能够实时计算的框架

正确答案:错误
第4题：

spark是基于（）运行的计算框架
- A、内存
- B、磁盘
- C、内存加磁盘
- D、网络
正确答案:A
第5题：

与spark基于内存相比，mapreduce是基于（）运行的计算框架
- A、内存
- B、磁盘
- C、内存加磁盘
- D、网络
正确答案:B
第6题：

云计算使用超大计算机集群协同运算，采用大型企业级数据库存储数据，只要保证网络通信线路的畅通，就可利用其高性能海量数据处理能力、容错能力、弹性易伸缩能力提高业务数据的（）。
- A、高可靠性
- B、高安全性
- C、高可用性
- D、高透明性
正确答案:C
第7题：

hadoop中的mapreduce是基于什么运行的计算框架（）
- A、内存
- B、磁盘
- C、内存加磁盘
- D、网络
正确答案:B
第8题：

下面对于spark的特点描述正确的是（）
- A、良好的容错性：在分布式数据集计算时通过checkpoint来实现容错，当某个运算环节失败时，不需要从头开始重新计算
- B、开发便捷性：spark通过scala，java，pythonapi及交互式shell提供丰富的使用方式
- C、不适合细粒度更新操作：Spark的运算是面向集合的，不适用于需要异步细粒度更新状态的应用，例如web服务的DAO层或web爬虫等
- D、以上答案都不符合其特性
正确答案:A,B,C,D
第9题：

内存计算下，Spark？比？Hadoop？快10倍

正确答案:错误
第10题：

华为全内存桌面的IOTailor去重压缩技术，针对VDI和内存介质进行专门优化，去重压缩的同时，还保证了数据交互实时性和一致性

正确答案:正确
第11题：

判断题
Spark是基于内存的计算，所有的Spark程序运行过程中的数据只能存储在内存中。
A
对
B
错

正确答案：对
解析：暂无解析
第12题：

多选题
关于Spark和Mapreduce，下列说法正确的是（）。
A
性能上提升高于100倍（全内存计算）
B
Spark的中间数据放在内存中，对于迭代运算、批处理计算的效率更高，延迟更低。
C
提供更多的数据集操作类型，编程模型更灵活，开发效率更高。
D
更低的容错能力（血统机制）。
E
Spark用十分之一的资源，获得10倍与Mapreduce的性能。

正确答案： E,B
解析：暂无解析
第13题：

spark计算速度比mapreduce计算速度快，不仅仅是因为内存

正确答案:正确
第14题：

与Hadoop的MapReduce相比，Spark基于内存的运算要快100倍以上，基于硬盘的运算也要快10倍以上

正确答案:正确
第15题：

spark的源码是由哪几种语言编写完成的（）
- A、acheSpark是一种快速、通用、可扩展的大数据分析引擎
- B、spark为分布式数据集的处理提供了一个有效框架，并以高效的方式处理分布式数据集
- C、spark强调一站式解决方案，集批处理、实时流处理、交互式查询与图计算于一体，避免了多种运算场景下需要部署不同集群带来的资源浪费
- D、spark可以将数据分析过程的中间输出保存在内存中，从而不需要从外部持久化存储中反复读写数据，相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景
正确答案:A,B
第16题：

Spark Streaming有高吞吐量和容错能力强等特点

正确答案:正确
第17题：

spark中的实时计算系统是哪个（）
- A、spark？core
- B、spark？streaming
- C、mlbase
- D、Grophx
正确答案:B
第18题：

Spark提供了统一的解决方案。Spark可以用于批处理、交互式查询（SparkSQL）、实时流处理（SparkStreaming）、机器学习（SparkMLlib）和图计算（GraphX）

正确答案:正确
第19题：

mapreduce是基于（）运行的计算框架
- A、内存
- B、磁盘
- C、内存加磁盘
- D、网络
正确答案:B
第20题：

RDD（ResilientDistributedDataset）叫做分布式数据集，是Spark中最基本的数据抽象，它代表一个不可变、可分区、里面的元素可并行计算的集合

正确答案:正确
第21题：

spark中的图计算框架是（）
- A、spark core
- B、spark streaming
- C、mlbase
- D、Grophx
正确答案:D
第22题：

问答题
Spark是基于内存计算的大数据计算平台，试述Spark的主要特点。

正确答案： S.park具有如下4个主要特点：
①运行速度快；②容易使用；③通用性；④运行模式多样。
解析：暂无解析
第23题：

判断题
华为全内存桌面的IOTailor去重压缩技术，针对VDI和内存介质进行专门优化，去重压缩的同时，还保证了数据交互实时性和一致性
A
对
B
错

正确答案：错
解析：暂无解析

Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算，提高了在大数据环境下数据处理的实时性，同时保证了高容错性和高可伸缩性

题目

相似考题

更多“Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算，提高了在大数据环境下数据处理的实时性，同时保证了高容错性和高可伸缩性”相关问题

相关内容