Spark基于内存运算, 是MapReduce的下一代替换计算框架, 主要包含Spark-Core、Spark-SQL、Spark-Streaming、Spark-ML.
本系列只介绍Spark-Core和Spark-SQL的内核机制.
本系列分以下几篇文章.
1、Spark的任务提交流程(Spark-Core和Spark-SQL通用)
2、Spark-Core的阶段划分, 以及任务执行
3、Spark-SQL的Shuffle介绍
本文深入探讨Spark-Core和Spark-SQL的内核机制,包括任务提交流程、阶段划分及任务执行,以及Spark-SQL的Shuffle过程。为读者提供全面理解Spark计算框架的基础。
Spark基于内存运算, 是MapReduce的下一代替换计算框架, 主要包含Spark-Core、Spark-SQL、Spark-Streaming、Spark-ML.
本系列只介绍Spark-Core和Spark-SQL的内核机制.
本系列分以下几篇文章.
1、Spark的任务提交流程(Spark-Core和Spark-SQL通用)
2、Spark-Core的阶段划分, 以及任务执行
3、Spark-SQL的Shuffle介绍
3312

被折叠的 条评论
为什么被折叠?
