大数据开发工程师_小北
码龄9年
求更新 关注
提问 私信
  • 博客:2,753
    2,753
    总访问量
  • 1
    原创
  • 6
    粉丝
  • 55
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
加入CSDN时间: 2017-11-18

个人简介:身体上经历磨难,身心上获得愉悦

博客简介:

weixin_41099552的博客

查看详细资料
个人成就
  • 获得3次点赞
  • 内容获得2次评论
  • 获得4次收藏
  • 博客总排名2,373,706名
创作历程
  • 1篇
    2022年
成就勋章

TA关注的专栏 0

TA关注的收藏夹 0

TA关注的社区 2

TA参与的活动 0

兴趣领域 设置
  • 大数据
    hadoopspark大数据数据仓库
创作活动更多

「谁说嵌入式只是调包和焊板子?」—— 2026嵌入式全栈技术征锋令

谁说嵌入式只会“Ctrl+C 调包”和“拿电烙铁焊板子”?2026嵌入式全栈技术征锋令正式启幕! 本次活动专为硬核硬件/软件开发者打造,无论你是刚玩转裸机外设的萌新,还是精通RTOS调度、死磕底层驱动的行业老手,亦或是执掌系统架构的大神,这里都是你证明实力的舞台! 拒绝表面功夫,每一行代码,都有撬动硬件的力量!晒出你的硬核工程实战,为嵌入式开发者的全栈硬实力正名!

212人参与 去参加
  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

sparksql优化之浅谈mapjoin和broacast广播变量

在等待期间,突然就有个疑问,这个broadcast不是广播变量吗,为什么这里会出现这个问题。2.所以这里的内存应该指的就是executor了,每个executor保存一份小表副本,再由executor下的task进行拉取,这里基本就是广播变量的原理了。2022年10月10日,在大数据集群跑任务,爆出超时错误,在同事建议下,增大broadcast join时长重跑程序。中表数据做匹配,由于在map端是进行了join操作,省去了reduce运行的时间,算是hive中的一种优化。
原创
博文更新于 2022.10.10 ·
2753 阅读 ·
3 点赞 ·
2 评论 ·
5 收藏