大数据开发工程师_小北-CSDN博客

大数据开发工程师_小北

码龄9年

求更新

关注

2,753

总访问量
1

原创
6

粉丝
55

关注

IP 属地：北京市

加入CSDN时间： 2017-11-18

个人简介：身体上经历磨难，身心上获得愉悦

查看详细资料

个人成就

获得3次点赞
内容获得2次评论
获得4次收藏
博客总排名2,373,706名

TA关注的专栏 0

TA关注的收藏夹 0

TA关注的社区 2

TA参与的活动 0

兴趣领域设置

大数据

hadoopspark大数据数据仓库

创作活动更多

「谁说嵌入式只是调包和焊板子？」—— 2026嵌入式全栈技术征锋令

谁说嵌入式只会“Ctrl+C 调包”和“拿电烙铁焊板子”？2026嵌入式全栈技术征锋令正式启幕！本次活动专为硬核硬件/软件开发者打造，无论你是刚玩转裸机外设的萌新，还是精通RTOS调度、死磕底层驱动的行业老手，亦或是执掌系统架构的大神，这里都是你证明实力的舞台！拒绝表面功夫，每一行代码，都有撬动硬件的力量！晒出你的硬核工程实战，为嵌入式开发者的全栈硬实力正名！

212人参与去参加

sparksql优化之浅谈mapjoin和broacast广播变量

在等待期间，突然就有个疑问，这个broadcast不是广播变量吗，为什么这里会出现这个问题。2.所以这里的内存应该指的就是executor了，每个executor保存一份小表副本，再由executor下的task进行拉取，这里基本就是广播变量的原理了。2022年10月10日，在大数据集群跑任务，爆出超时错误，在同事建议下，增大broadcast join时长重跑程序。中表数据做匹配，由于在map端是进行了join操作，省去了reduce运行的时间，算是hive中的一种优化。

weixin_41099552的博客

sparksql优化之浅谈mapjoin和broacast广播变量