【Hadoop学习】本地模式下的官方grep和wordcount案例

最新推荐文章于 2023-06-01 08:13:09 发布

原创

最新推荐文章于 2023-06-01 08:13:09 发布 · 1.4k 阅读

·

1

·

标签

#Hadoop #本地模式

本文介绍了在Hadoop本地模式下，如何执行官方的grep和wordcount示例。首先，通过创建input文件夹并复制配置文件进行grep案例，筛选出匹配规则的结果，并将输出保存至output。接着，创建wcinput文件夹，编写数据并运行wordcount例子，结果输出到wcoutput。读者可以借此了解Hadoop基本操作及其实战应用。

1.grep案例
1）在hadoop-2.7.2文件下新建一个input文件夹

mkdir input

在这里插入图片描述
2)将/etc/hadoop目录下所有的配置文件拷贝到input文件夹下面
cp etc/hadoop/*.xml input/

3)运行grep命令筛选出符合规则的结果
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar grep input/ output 'dfs[a-z.]+'
将input文件夹内容作为输入，根据examples里面的程序将结果以dfs开头存到output文件夹中
在这里插入图片描述
4）查看结果
cd output/
此时文件夹中多了两个文件

cat part-r-00000
查看第一个文件，答案在里面

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。