每个task处理一个partition,一个文件的大小/128M就是task的数量
Task的最大并发数
当task被提交到executor之后,会根据executor可用的cpu核数,决定一个executor中最多同时运行多少个task。
默认情况下一个task对应cpu的一个核。如果一个executor可用cpu核数为8,那么一个executor中最多同是并发执行8个task;
本文详细介绍了在并行计算环境中,任务(task)如何根据文件大小和executor的CPU核数进行调度与执行。每个task处理一个分区,文件大小决定了task的数量,而executor的CPU核数则限制了task的最大并发数。

1万+

被折叠的 条评论
为什么被折叠?



