版本:hadoop3.2.1
namenode数量:5
1. 问题描述
hadoop-nn01节点的namenode服务无法启动,报错如下
Exiting with status 1: org.apache.hadoop.hdfs.server.namenode.EditLogInputException: Error replaying edit log at offset 0. Expected transaction ID was 4095226791
No edit log found starting at txid 4096131237


# 检查当前的namenode服务状态
hdfs haadmin -getAllServiceState

2. 集群调研
2.1 检查HDFS组件的NN元数据存放位置
# 查询hadoop元数据存放位置,找到dfs.namenode.name.dir对应的值
vim /opt/hadoop/etc/hadoop/hdfs-site.xml
<property>
<name>dfs.namenode.name.dir</name>
<value>/ssd_meta/hadoop/nn</value>
</property>


# 查询元数据信息
[root@hadoop-nn01 hadoop]# ls -lrt /ssd_meta/hadoop/nn/current/
总用量 26546268
-rw-r--r-- 1 hdfs hdfs 214 2月 11 09:58 VERSION
-rw-r--r-- 1 hdfs hdfs 5184102 2月 14 08:27 edits_0000000004094093273-0000000004094114049
-rw-r--r-- 1 hdfs hdfs 2880546 2月 14 08:28 edits_0000000004094114050-0000000004094124857
-rw-r--r-- 1 hdfs hdfs 7178030 2月 14 08:29 edits_0000000004094124858-0000000004094152964
-rw-r--r-- 1 hdfs hdfs 11077320 2月 14 08:29 edits_0000000004094152965-0000000004094206457
-rw-r--r-- 1 hdfs hdfs 4781543 2月 14 08:30 edits_0000000004094206458-0000000004094225527
-rw-r--r-- 1 hdfs hdfs 8080725 2月 14 08:30 edits_0000000004094225528-0000000004094257113
-rw-r--r-- 1 hdfs hdfs 1253867 2月 14 08:31 edits_0000000004094257114-0000000004094262444
-rw-r--r-- 1 hdfs hdfs 10961234 2月 14 08:31 edits_0000000004094262445-0000000004094311550
-rw-r--r-- 1 hdfs hdfs 16516595 2月 14 08:32 edits_0000000004094311551-0000000004094373135
-rw-r--r--

在hadoop3.2.1集群中,当NameNode无法启动并报告editlog加载问题时,通过备份元数据、删除现有数据、从活动主节点恢复并处理意外切换,以及修改元数据目录权限来恢复服务。在处理过程中,可能需要多次尝试以确保正确拷贝,并在完成后启动并监控NameNode服务。

2817

被折叠的 条评论
为什么被折叠?



