记录一下错误,在windows上面运行spark报错
words = sc.parallelize(['scala','java','hadoop','spark','scala','hadoop','spark','scala'])
words.distinct().count()

最然能够运行出结果,但是会报错
Please install psutil to have better support with spilling
解决办法:
直接在cmd上面pip install psutil就行
本文介绍了一个在Windows环境下使用Spark时遇到的问题,即提示安装psutil以获得更好的溢出支持。通过简单的步骤指导用户如何使用pip命令安装psutil来解决此问题。

1806

被折叠的 条评论
为什么被折叠?



