spark作业运行集群有俩种部署模式,一种是spark Standalone集群,还有一种是YARN集群+Spark客户端
所以我们认为提交spark作业的俩种主要方式就是,就是Spark StandAlone和YARN,这俩种方式,分别还分为俩种模式,分别是client mode和cluster mode
local模式的基本原理
local模式,没有所谓的master+worker这种概念
local模式,相当于,启动一个本地进程,然后在一个进程内,模拟spark集群中作业的运行
一个spark作业,就对应了进程中的一个或多个executor线程
就开始执行,包括作业的调度,task分配
在实际工作中,local模式主要用于测试,在开发环境中,直接运行spark程序,便于看到打印日志
本文介绍了Spark作业的两种主要部署方式:SparkStandalone集群和YARN集群。每种部署方式又分为clientmode和clustermode两种模式。此外,还详细解释了local模式的基本原理及应用场景,通常用于开发环境中的测试。

4万+

被折叠的 条评论
为什么被折叠?



