Hive SparkSql rank() over,dense_rank() over,row_number() over的使用与区别

本文详细介绍如何使用SQL中的rank(), dense_rank() 和 row_number()函数进行数据排名,通过具体实例展示了不同函数在处理相同成绩时的排名差异,适用于大数据场景下的成绩排名需求。

一、建表语句

create table student(
   name string,
   course string,
   score int
)ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE

二、测试数据

li shi,Chinese,96
wang er,English,71
zhang san,Chinese,92
zhang san,Math,86
wang wu,English,72
li shi,Math,88
wang er,Chinese,91
zhang san,English,72
wang er,Math,85
wang wu,Chinese,92
li shi,English,76
wang wu,Math,88

三、使用方法

1、rank() over

--成绩相同的,并列名次,下一个名次空出被占用的名次
select name
,course
,score
,rank() over (partition by course order by score desc) rank
from student ;

   

2、dense_rank()

--成绩相同的,并列名次,下一个名次不空出被占用的名次
select name
,course
,score
,dense_rank() over (partition by course order by score desc) rank
from student ;

 

3、row_number over

--不管是否并列,都进行连续排名
select name
,course
,score
,row_number() over(partition by course order by score desc) rank
from student ;

   

 

 

注意: 使用rank() over的时候,空值是最大的,如果排序字段为null,可能造成null字段排在最前面,影响排序结果。可以这样:

rank() over(partition by course order by score desc nulls last)来规避这个问题。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值