Hadoop有三种模式,单机模式、伪分布模式和完全分布模式。
这里先简单介绍单机模式,默认情况下,Hadoop被配置成一个非分布模式,独立运行Java进程,适合开始做调试工作。
一、安装前确定java已经安装
二、下载Hadoop,本案例中使用的Hadoop版本为hadoop-2.7.1
三、解压Hadoop压缩包
四、修改配置文件hadoop-env.sh
Hadoop的配置文件都在/hadooplearn/hadoop-2.7.1/etc/hadoop下,由于默认情况下是单机模式,一般不用做修改就可以直接做第五步测试实例,下面只是安装实际情况修改。
1、在hadoop中配置JAVA_HOME
默认是export JAVA_HOME = ${JAVA_HOME},如果原来在环境变量中配置过,就可用使用默认的,不需修改。
export JAVA_HOME = /usr/local/jdk
/usr/local/jdk也就是jdk安装的路径
2、修改java虚拟机的内存
原来启动JVM时配置的最大内存是128m,当运行hadoop的一些自带的实例会报内存溢出,其实这里是可以修改内存大小,如果不需要也不必修改。
export HADOOP_CLIENT_OPTS="-Xmx128m $HADOOP_CLIENT_OPTS"
export HADOOP_CLIENT_OPTS="-Xmx512m $HADOOP_CLIENT_OPTS"
五、运行实例hello hadoop
切换到该安装目录下,建立要上传到hadoop的两个文件test1.txt、test2.txt
运行hadoop自带的wordcount实例可以统计一批文本文件中单词出现的次数
/hadooplearn/hadoop-2.7.1/bin
jar /hadooplearn/hadoop-2.7.1/share/hadoop/mapreduce wordcount input output
查看结果
[root@localhost output]# cat *
hadoop 1
hello 2
world 1
OK,Hadoop单机模式就OK了
本文介绍了Hadoop单机模式的安装步骤与配置方法,并通过运行WordCount实例验证了安装的成功。从安装Java环境到配置Hadoop,再到测试运行,提供了详细的指导。

1967

被折叠的 条评论
为什么被折叠?



