spark中excutor的个数、内存大小、core的个数、task的个数、分区的个数、集群的资源情况等的关系

最新推荐文章于 2026-05-09 06:53:33 发布

原创

最新推荐文章于 2026-05-09 06:53:33 发布 · 5.6k 阅读

·

6

·

标签

#spark #集群资源 #调优

本文详细介绍了Spark性能调优的三个方面：资源分配、分区与Task个数的关系以及并行度设置。通过合理分配executor、core和memory资源，以及调整Task数量，可以显著提升Spark应用的执行效率。并行度的设置应与资源匹配，以充分利用集群资源，减少Task处理数据量，加快运行速度。

一、Spark性能调优之资源分配大体上这两个方面：core memory

（1）、分配哪些资源？

executor、core per executor、memory per executor、driver memory

（2）、在哪里分配这些资源？

在我们在生产环境中，提交spark作业时，用的spark-submit shell脚本，里面调整对应的参数

/usr/local/spark/bin/spark-submit \

--class cn.spark.sparktest.core.WordCountCluster \

--num-executors 3 \ 配置executor的数量

--executor-memory 100m \ 配置每个executor的内存大小

--executor-cores 3 \ 配置每个executor的cpu core数量

--driver-memory 100m \ 配置driver的内存（影响很大）

/usr/local/SparkTest-0.0.1-SNAPSHOT-jar-with-dependencies.jar

（3）、调节到多大，算是最大呢？

第一种，Spark Standalone，公司集群上，搭建了一套Spark集群，你心里应该清楚每台机器还能够给你使用的，大概有多少内存，多少cpu core；那么，设置的时候，就根据这个实际的情况，去调节每个spark作业的资源分配。比如说你的每台机器能够给你使用4G内存，2个cpu core；20台机器；executor，20；平均每个executor：4G内存，2个cpu core。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。