环境:
CDH:6.3.1
FLINK: 1.14.4
CentOS: 7.18
简介:
明·凌濛初在《初刻拍案惊奇》中写到:“今日不期而遇,天使然也!”。以前在路上碰到心动的女孩,也不敢上去对她说这句话。后来上班后才知道,原来,有很多问题总是不期而遇,让人心跳啊!
恰逢发版,cdh集群突然出问题了,scm server 已经连不进去了,重启后也进不了系统,无奈之下,只好重装了该节点系统,然后开始恢复集群,当时还想着顺便把flink由1.14.0升级到1.14.4,期间遇到了各种问题,以下记一个花了比较长时间的错误排查过程。
在恢复集群后,重新集成flink1.14.4到cdh,添加flink服务后,启动flink时报错内容如下:
ERROR StatusLogger Reconfiguration failed: No configuration found for '66d3c617' at 'null' in 'null'
11:54:46.244 [main] ERROR org.apache.flink.yarn.cli.FlinkYarnSessionCli - Error while running the Flink session.
org.apache.flink.client.deployment.ClusterDeploymentException: Couldn't deploy Yarn session cluster
at org.ap
本文记录了一次在CDH 6.3.1环境中,升级Flink从1.14.0到1.14.4过程中遇到的YARN部署失败的问题。启动Flink时遇到'No configuration found for '66d3c617' at 'null' in 'null'的错误,经过多次日志检查和权限调整,最终发现是/flink/checkpoints目录权限问题导致。解决方案是使用hdfs dfs -chmod -R 777 /data/flink/checkpoints命令为该目录赋予权限,从而成功启动Flink。
订阅专栏 解锁全文

3580

被折叠的 条评论
为什么被折叠?



