-
下列关于spark中的RDD描述正确的有()。
-
Spark可以通过哪些外部存储创建RDD()。
-
如果numPartitions是分区个数 那么Spark每个RDD的分区ID范围是()。
-
Spark的RDD持久化操作有()方式。
-
Spark中每一个RDD都可以用不同的存储级别进行保存 从而允许持久化数据集在硬盘或者在内存作为序列化的______对象。
-
请简述如何获取Spark的RDD分区方式。
-
Spark根据RDD的依赖关系来划分Stage 调度器从DAG图末端出发 逆向遍历整个依赖关系链 遇到窄依赖就断开 遇到宽依赖就将其加入当前Stage。()