ambai中tez任务占用yarn内存过多

本文主要探讨了在Ambari + HDP平台上,使用Hive和Tez处理千万级数据时遇到的内存资源满载问题。首先,从yarn、hive、tez的内存配置入手进行了一系列调整,但问题依然存在。随后,作者转向了YARN调度器配置,通过调整用户可申请资源比例,解决了内存计算资源被占满的问题。最终,通过将单个计算任务的最大内存申请限制在30%,确保了集群资源的有效利用。

问题描述

**平台: **ambari+hdp
**计算引擎: **hive+tez
**数据量: **7张表,单表千万级数据
**遇到问题: **提交一个计算任务将集群中memory沾满(不存在笛卡尔积,就最后指标字段只有7个左右)

解决方案

解决方案一

最开始解决问题思路是从三点出发:yarn、hive、tez的内存配置

  1. yarn的“yarn.scheduler.minimum-allocation-mb”和“yarn.scheduler.maximum-allocation-mb”这两参数,在HDP上对应下图
    在这里插入图片描述

  2. hive的“hive.tez.container.size”、“hive_server2_heapsize”这里两个参数,在HDP上对应下图
    在这里插入图片描述

  3. tez的“tez.am.resource.memory.mb”、“tez.task.resource.memory.mb”这两个参数,在HDP上对应下图
    在这里插入图片描述
    以上述的三个组件的内存配置为出发点经过一系列的调整,经查阅很多资料(这里就不对过程进行详细介绍了),经过各种尝试,在执行查询sql的时候还是会沾满yarn的内存计算资源。

<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值