spark为分布式数据集的处理提供了一个有效框架，并以高效的方式处理（）数据集A、单机B、集中式C、分布式D、NOSQL

题目

spark为分布式数据集的处理提供了一个有效框架，并以高效的方式处理（）数据集

A、单机
B、集中式
C、分布式
D、NOSQL

相似考题

1.目前,()等分布式处理方式已经成为大数据处理各环节的通用处理方法。A、NameNodeB、HadoopC、MapReduceD、Spark

2.Spark是一个()计算框架。A.快速B.容错C.可扩展D.分布式

3.Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算，提高了在大数据环境下数据处理的实时性，同时保证了高容错性和高可伸缩性

4.Spark可以从()分布式文件系统中读取数据。A.TachyonB.HiveC.HbaseD.HDFS

更多“spark为分布式数据集的处理提供了一个有效框架，并以高效的方式”相关问题

第1题：

以下关于sparkstreaming说法正确的是（）
- A、spark streaming分布式微批架构
- B、spark streaming实时存储架构
- C、spark streaming是普通存储架构
- D、spark streaming分布式实时计算架构
正确答案:A
第2题：

spark中的rdd是一个（）数据集
- A、弹性分布式
- B、弹性计算
- C、运送数据
- D、心跳
正确答案:A
第3题：

spark支持的分布式部署方式中哪个是错误的（）
- A、standalone
- B、spark on mesos
- C、spark on YARN
- D、spark on local
正确答案:D
第4题：

spark可以编写sql脚本的框架是（）
- A、spark core
- B、spark streaming
- C、mlbase
- D、spark sql
正确答案:D
第5题：

spark框架中，整合机器学习库，并对外提供接口的框架是（）
- A、spark core
- B、spark streaming
- C、mlbase
- D、spark sql
正确答案:C
第6题：

Spark提供了统一的解决方案。Spark可以用于批处理、交互式查询（SparkSQL）、实时流处理（SparkStreaming）、机器学习（SparkMLlib）和图计算（GraphX）

正确答案:正确
第7题：

RDD（ResilientDistributedDataset）叫做分布式数据集，是Spark中最基本的数据抽象，它代表一个不可变、可分区、里面的元素可并行计算的集合

正确答案:正确
第8题：

SparkSQL是一个用来处理结构化数据的spark组件。它提供了一个叫做（）的可编程抽象数据模型
- A、DataFrames
- B、Table
- C、DataSet
- D、RDD
正确答案:A
第9题：

对传统的分布式程序设计相比，Mapreduce封装了（）等细节，还提供了一个简单而强大的接口。
- A、并行处理
- B、容错处理
- C、数据分布
- D、负载均衡
正确答案:C
第10题：

Hadoop是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。

正确答案:正确
第11题：

填空题
Agent的（）、互操作性、反应性、移动性为分布式应用提供方便、高效和鲁棒的执行框架。

正确答案：自治性
解析：暂无解析
第12题：

单选题
云计算是（）。
A
为解决气象数据处理服务的
B
用于移动通讯服务的
C
只为一个集团提供通讯服务的
D
将网络资源集中管理和调度，并以虚拟化方式为用户提供服务的

正确答案： D
解析：暂无解析
第13题：

spark中弹性分布式数据集指的是哪个（）
- A、RDD
- B、Driver
- C、Master
- D、Map
正确答案:A
第14题：

spark中的弹性分布式数据集相当于java中的（）概念
- A、类
- B、接口
- C、方法
- D、内部类
正确答案:A
第15题：

spark的源码是由哪几种语言编写完成的（）
- A、acheSpark是一种快速、通用、可扩展的大数据分析引擎
- B、spark为分布式数据集的处理提供了一个有效框架，并以高效的方式处理分布式数据集
- C、spark强调一站式解决方案，集批处理、实时流处理、交互式查询与图计算于一体，避免了多种运算场景下需要部署不同集群带来的资源浪费
- D、spark可以将数据分析过程的中间输出保存在内存中，从而不需要从外部持久化存储中反复读写数据，相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景
正确答案:A,B
第16题：

spark中可以整合机器学习库，并可以对外提供接口的框架是（）
- A、spark core
- B、spark streaming
- C、mlbase
- D、spark sql
正确答案:C
第17题：

spark的核心框架是（）
- A、spark core
- B、spark streaming
- C、mlbase
- D、Grophx
正确答案:A
第18题：

下面对于spark的特点描述正确的是（）
- A、良好的容错性：在分布式数据集计算时通过checkpoint来实现容错，当某个运算环节失败时，不需要从头开始重新计算
- B、开发便捷性：spark通过scala，java，pythonapi及交互式shell提供丰富的使用方式
- C、不适合细粒度更新操作：Spark的运算是面向集合的，不适用于需要异步细粒度更新状态的应用，例如web服务的DAO层或web爬虫等
- D、以上答案都不符合其特性
正确答案:A,B,C,D
第19题：

SparkSQL是Spark用来处理结构化数据的一个模块，它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用

正确答案:正确
第20题：

云计算是（）。
- A、为解决气象数据处理服务的
- B、用于移动通讯服务的
- C、只为一个集团提供通讯服务的
- D、将网络资源集中管理和调度，并以虚拟化方式为用户提供服务的
正确答案:D
第21题：

大数据处理框架-Spark诞生于（）
- A、伯克利大学AMPLab
- B、Apache孵化器项目
- C、Apache顶级项目
- D、开源项目
正确答案:A
第22题：

判断题
Hadoop是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。
A
对
B
错

正确答案：对
解析：暂无解析
第23题：

判断题
Spark是一个类似于MapReduce的分布式计算框架，其核心是弹性分布式数据集
A
对
B
错

正确答案：错
解析：暂无解析

spark为分布式数据集的处理提供了一个有效框架，并以高效的方式处理（）数据集A、单机B、集中式C、分布式D、NOSQL

题目

相似考题

更多“spark为分布式数据集的处理提供了一个有效框架，并以高效的方式”相关问题

相关内容