1.grep案例
1)在hadoop-2.7.2文件下新建一个input文件夹
mkdir input

2)将/etc/hadoop目录下所有的配置文件拷贝到input文件夹下面
cp etc/hadoop/*.xml input/

3)运行grep命令筛选出符合规则的结果
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar grep input/ output 'dfs[a-z.]+'
将input文件夹内容作为输入,根据examples里面的程序将结果以dfs开头存到output文件夹中

4)查看结果
cd output/
此时文件夹中多了两个文件

cat part-r-00000
查看第一个文件,答案在里面

本文介绍了在Hadoop本地模式下,如何执行官方的grep和wordcount示例。首先,通过创建input文件夹并复制配置文件进行grep案例,筛选出匹配规则的结果,并将输出保存至output。接着,创建wcinput文件夹,编写数据并运行wordcount例子,结果输出到wcoutput。读者可以借此了解Hadoop基本操作及其实战应用。

5291

被折叠的 条评论
为什么被折叠?



