失效链接处理 |
Apache Spark RDD面试题 PDF 下载
相关截图:
主要内容:
1. SparkContext哪⼀端创建的的?
Driver端
2. DAG是在哪⼀端被构建的?
Driver端
3. RDD是在哪⼀端⽣成的?
Driver端
4. 调⽤RDD的算⼦(Transformation和Action)是在哪⼀端调⽤的
Driver端
5. RDD在调⽤Transformation和Action时需要传⼊函数,函数是在哪⼀端声明【定义】和
传⼊的?
Driver端
6. RDD在调⽤Transformation和Action时需要传⼊函数,请问传⼊的函数是在哪⼀端执⾏
了函数的业务逻辑?
Executor
7. Task是在哪⼀端⽣成的呢?
Driver端
8. DAG是在哪⼀端构建好的并被切分成⼀到多个Stage的
Driver端
9. DAG是哪个类完成的切分Stage的功能?
DAGScheduler
10. DAGScheduler将切分好的Task以什么样的形式给TaskScheduler
TaskSet
11. ⾃定义的分区器这个类是在哪⼀端实例化的?
Driver端
12. 分区器中的getParitition⽅法在哪⼀端调⽤的呢?
Executor
|