spark使用java lambada表达式的问题

博客提及运行存在正常和报错两种情况,介绍了报错信息。还提到两种表达式,一种是正常的Lambda表达式,另一种是Method Reference,并对第二种进行反编译,发现变量需序列化到executor端,但PrintStream未实现Serialize接口。

正常运行

运行报错

报错信息

java.io.NotSerializableException: java.io.PrintStream

第一种是正常的lambada表达式,第二种是method reference

反编译第二种方法

SparkSession ss = SparkSession.builder().config("spark.sql.catalogImplementation", "hive").master("local[4]").getOrCreate();
        JavaRDD var10000 = ss.sql("select * from cs").javaRDD().flatMap((row) -> {
            return Lists.newArrayList(new Row[]{row, row}).iterator();
        });
        PrintStream var10001 = System.out;
        var10000.foreach(var10001::println);
        ss.stop();

通过反编译可以发现var10000该变量需要序列化到executor端,但是PrintStream并没有实现Serialize接口

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值