select word ,count(*) word_cnt from word lateral view explode(split(line," ")) r1 as word group by word;))
从名为word的表中,使用LATERAL VIEW explode(split(line," "))将每行的line字段按照空格分割后展开成多个单词,然后对展开后的单词进行分组计数,统计每个单词出现的次数,结果包含两列:word(单词)和word_cnt(单词出现次数)。
具体分析如下:
split(line," "):将line字段按照空格进行分割,返回一个数组。
LATERAL VIEW explode(split(line," ")) r1 as word:对分割后的数组进行展开,为每个元素创建一行新记录,并将展开后的元素命名为word。
group by word:按照word字段进行分组。
count(*):统计每个分组中的记录数,即每个单词的出现次数。
 r1 as word 。。。&spm=1001.2101.3001.5002&articleId=142968929&d=1&t=3&u=8cc80a4560a045eb8f4d804766ce066a)
6138

被折叠的 条评论
为什么被折叠?



