Hadoop安装与启动指南-CSDN博客

本文档详细介绍了在Linux环境下安装和启动Hadoop的步骤，包括解压Hadoop压缩包，配置Hadoop环境变量，修改相关配置文件如core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml，初始化HDFS，启动Hadoop服务，以及验证Hadoop是否成功启动的方法。

1. 在lunix系统下解压hadoop压缩包到指定文件夹：

#tar -zxvf hadoop-2.6.5.tar.gz -C /usr/Hadoop/

2. 配置hadoop的配置文件：

（1）配置Hadoop的环境变量

#vim hadoop-env.sh

将修改
在这里插入图片描述
修改为JDK的路径

（2）修改#vim core-site.xml

<configuration>
<!—用来指定HDFS中主节点的地址-->
          <property>
                 <name>fs.defaultFS</name>
                 <value>hdfs://172.19.156.58:9000</value>
          </property>
<!—用来指定hadoop运行时产生文件的存放目录-->
          <property>
                 <name>hadoop.tmp.dir </name>
                 <value>/usr/Hadoop/hadoop-2.6.5/tmp</value>
          </property>
</configuration>

（3）配置hdfs-site.xml

<!—用来指定HDFS保存数据副本的数量，有几个节点就保存几份数据-->
      <configuration>
        <property> 
                <name>dfs.replication</name>
                <value>1</value>
        </property>
</configuration>

（4）重命名mapred-site.xml.template

#mv mapred-site.xml.template mapred-site.xml

（5）编辑该文件# vim mapred-site.xml

<!—告知Hadoop，mapreduce将运行在YARN上-->
	<configuration>
        <property>
                <name>mapreduce.framework.name</name>
                <value>yarn</value>
        </property>
</configuration>

（6）编辑该文件# vim yarn-site.xml

<configuration>
		<!—使得NodeManager获取数据的方式是shuffle 的方式-->
		<property>
			<name>yarn.nodemanager.aux-services</name>
			<value>mapreduce_shuffle</value>
		</property>
		<!—这个是用来指定YARN中最主要文件resourcemanager 的地址，value值是主机名-->
		<property>
              	  <name>yarn.resourcemanager.hostname</name>
              	  <value>izuf6hjthe58i89mrrz8vnz</value>
       	 </property>
</configuration>