上次有幸和小Lee子同学,讨论到一个分组求最大值的问题,然后就没管了,今天突然有个同学问到这个问题,那么我就给他做了个简单的介绍,下面也在这里分享一下,有错误的地方,请大家改正,比较粗糙,我都只是介绍:
---------------------------------------------------------------------
- SQL code
create table Test( 部门 char(6), 姓名 varchar(6), 薪资 money)goinsert into Test values('市场部','张三',6000)insert into Test values('市场部','李四',6000)insert into Test values('市场部','王五',5000)insert into Test values('工程部','赵柳',3400)insert into Test values('工程部','立白',24000)insert into Test values('工程部','雕牌',10000)insert into Test values('策划部','海丝',2000)insert into Test values('策划部','李波',12000)go--题目:找出各部门薪资最高的人--1.常规做法:相关子查询实现select 部门,姓名,薪资 from Test awhere 薪资=(select max(薪资) from test b where a.部门=b.部门)/***************=========查询结果===========部门 姓名 薪资------ ------ ---------------------策划部 李波 12000.00工程部 赵柳 24000.00市场部 张三 6000.00(3 行受影响)****************/--以上结果无法满足薪资相同的情况--------------------------------------2.常规做法:找出每个部门的最大薪资,然后子查询匹配select test.部门,test.姓名,test.薪资 from Test, (select 部门,max(薪资)薪资 from test group by 部门)t where Test.部门=t.部门 and test.薪资=t.薪资/*********=========查询结果===========部门 姓名 薪资------ ------ ----------------市场部 张三 6000.00市场部 李四 6000.00工程部 立白 24000.00策划部 李波 12000.00(4 行受影响)*/--以上结果正确---------------------------------------------------------/**以下的分组函数,相对Group by与 compute更好用,用得也比较多,大家可以根据实际情况,自由选择。*下面我只是做简单介绍,有兴趣的可以看看帮助文档,或者上网查询一下。*/--row_number()/**row_number()中的partition by就是按那个字段进行分组,并对分组后的数据进行编号*如果没有当前字段,那么就是按排序从1开始编号。*/--实验select rowid=row_number() over(order by 薪资 desc),* from Testselect rowid=row_number() over(partition by 部门 order by 薪资 desc),* from Test/* 以上两条语句查询结果rowid 部门 姓名 薪资-------------------- ------ ------ ---------------------1 工程部 立白 24000.002 策划部 李波 12000.003 工程部 雕牌 10000.004 市场部 张三 6000.005 市场部 李四 6000.006 市场部 王五 5000.007 工程部 赵柳 3400.008 策划部 海丝 2000.00(8 行受影响)rowid 部门 姓名 薪资-------------------- ------ ------ ---------------------1 策划部 李波 12000.002 策划部 海丝 2000.001 工程部 立白 24000.002 工程部 雕牌 10000.003 工程部 赵柳 3400.001 市场部 张三 6000.002 市场部 李四 6000.003 市场部 王五 5000.00(8 行受影响)*/--通过以上结果我们可以通过rowid来查询,但同样无法解决薪资相同的情况with t as(select rowid=row_number() over(partition by 部门 order by 薪资 desc),* from Test)select * from t where t.rowid=1/*结果如下:rowid 部门 姓名 薪资-------------------- ------ ------ ---------------------1 策划部 李波 12000.001 工程部 立白 24000.001 市场部 张三 6000.00(3 行受影响)*/--以上结果也未解决同部门同薪资的情况-----------------------------------------rank()用法与row_unmber()相同--注意下面两个查询的区别select rankId=rank()over(order by 薪资 desc),* from Testselect rankId=rank()over(order by 部门 desc),* from Test/* 重点看第2个结果rankId 部门 姓名 薪资-------------------- ------ ------ ---------------------1 工程部 立白 24000.002 策划部 李波 12000.003 工程部 雕牌 10000.004 市场部 张三 6000.004 市场部 李四 6000.006 市场部 王五 5000.007 工程部 赵柳 3400.008 策划部 海丝 2000.00(8 行受影响)rankId 部门 姓名 薪资-------------------- ------ ------ ---------------------1 市场部 张三 6000.001 市场部 李四 6000.001 市场部 王五 5000.004 工程部 赵柳 3400.004 工程部 立白 24000.004 工程部 雕牌 10000.007 策划部 海丝 2000.007 策划部 李波 12000.00(8 行受影响)*/--rank() 即是不连续编号的分组函数select rankId=rank() over(partition by 部门 order by 薪资 desc),* from Test/* 查询结果rankId 部门 姓名 薪资-------------------- ------ ------ ---------------------1 策划部 李波 12000.002 策划部 海丝 2000.001 工程部 立白 24000.002 工程部 雕牌 10000.003 工程部 赵柳 3400.001 市场部 张三 6000.001 市场部 李四 6000.003 市场部 王五 5000.00(8 行受影响)--此处需要注意的是,如果同部门同薪资,他们的编号相同,--比如这里两个薪资为6000的行他们的编号都是“1”,而5000的这一行是“3”而不是“2”。*/--通过以上结果很明确的可以知道我们的结果就出来了(能够完美解决相同问题)with t as( select rankId=rank() over(partition by 部门 order by 薪资 desc),* from Test)select * from t where t.rankid=1/* 查询结果rankId 部门 姓名 薪资-------------------- ------ ------ ---------------------1 策划部 李波 12000.001 工程部 立白 24000.001 市场部 张三 6000.001 市场部 李四 6000.00(4 行受影响)*/--dense_rank()与rank()相反,即他的编号是连续的,可以自己对比一下他们的区别select drankId=dense_rank()over(order by 薪资),* from Testselect drankId=dense_rank()over(order by 部门),* from Test/*drankId 部门 姓名 薪资-------------------- ------ ------ ---------------------1 策划部 海丝 2000.002 工程部 赵柳 3400.003 市场部 王五 5000.004 市场部 张三 6000.004 市场部 李四 6000.005 工程部 雕牌 10000.006 策划部 李波 12000.007 工程部 立白 24000.00(8 行受影响)drankId 部门 姓名 薪资-------------------- ------ ------ ---------------------1 策划部 海丝 2000.001 策划部 李波 12000.002 工程部 赵柳 3400.002 工程部 立白 24000.002 工程部 雕牌 10000.003 市场部 张三 6000.003 市场部 李四 6000.003 市场部 王五 5000.00(8 行受影响)*/select drankId=dense_rank() over(partition by 部门 order by 薪资 desc),* from Testwith t as( select drankId=dense_rank() over(partition by 部门 order by 薪资 desc),* from Test)select * from t where drankid=1/*drankId 部门 姓名 薪资-------------------- ------ ------ ---------------------1 策划部 李波 12000.001 工程部 立白 24000.001 市场部 张三 6000.001 市场部 李四 6000.00(4 行受影响)*/--顺便介绍一下ntile() 分组函数,平均分配--ntile()select tileid=ntile(3) over(order by 部门),* from Test