利用MapReduce求海量数据中最大的K个数
package jtlyuan.csdn;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.conf.Configured;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapredu

该博客介绍了如何使用MapReduce处理海量数据,通过Map和Reduce阶段找出前K个最大数值。Map阶段实现了将输入数据转换为K个最大数的数组,并在Reduce阶段进行合并和更新,最终输出Top K数值。

4966

被折叠的 条评论
为什么被折叠?



