，分享几个常用的分组函数，配简单事例_Sql Server

【分享】，分享几个常用的分组函数，配简单事例。
上次有幸和小Lee子同学，讨论到一个分组求最大值的问题，然后就没管了，今天突然有个同学问到这个问题，那么我就给他做了个简单的介绍，下面也在这里分享一下,有错误的地方，请大家改正，比较粗糙，我都只是介绍：

---------------------------------------------------------------------
SQL code
create table Test(    部门 char(6),    姓名 varchar(6),    薪资 money)goinsert into Test values('市场部','张三',6000)insert into Test values('市场部','李四',6000)insert into Test values('市场部','王五',5000)insert into Test values('工程部','赵柳',3400)insert into Test values('工程部','立白',24000)insert into Test values('工程部','雕牌',10000)insert into Test values('策划部','海丝',2000)insert into Test values('策划部','李波',12000)go--题目：找出各部门薪资最高的人--1.常规做法：相关子查询实现select 部门,姓名,薪资 from Test awhere 薪资=(select max(薪资) from test b where a.部门=b.部门)/***************=========查询结果===========部门     姓名     薪资------ ------ ---------------------策划部    李波     12000.00工程部    赵柳     24000.00市场部    张三     6000.00(3 行受影响)****************/--以上结果无法满足薪资相同的情况--------------------------------------2.常规做法：找出每个部门的最大薪资，然后子查询匹配select test.部门,test.姓名,test.薪资 from Test,    (select 部门,max(薪资)薪资 from test group by 部门)t where Test.部门=t.部门 and test.薪资=t.薪资/*********=========查询结果===========部门     姓名     薪资------ ------ ----------------市场部    张三     6000.00市场部    李四     6000.00工程部    立白     24000.00策划部    李波     12000.00(4 行受影响)*/--以上结果正确---------------------------------------------------------/**以下的分组函数，相对Group by与 compute更好用，用得也比较多，大家可以根据实际情况，自由选择。*下面我只是做简单介绍，有兴趣的可以看看帮助文档，或者上网查询一下。*/--row_number()/**row_number()中的partition by就是按那个字段进行分组,并对分组后的数据进行编号*如果没有当前字段，那么就是按排序从1开始编号。*/--实验select rowid=row_number() over(order by 薪资 desc),* from Testselect rowid=row_number() over(partition by 部门 order by 薪资 desc),* from Test/* 以上两条语句查询结果rowid                部门     姓名     薪资-------------------- ------ ------ ---------------------1                    工程部    立白     24000.002                    策划部    李波     12000.003                    工程部    雕牌     10000.004                    市场部    张三     6000.005                    市场部    李四     6000.006                    市场部    王五     5000.007                    工程部    赵柳     3400.008                    策划部    海丝     2000.00(8 行受影响)rowid                部门     姓名     薪资-------------------- ------ ------ ---------------------1                    策划部    李波     12000.002                    策划部    海丝     2000.001                    工程部    立白     24000.002                    工程部    雕牌     10000.003                    工程部    赵柳     3400.001                    市场部    张三     6000.002                    市场部    李四     6000.003                    市场部    王五     5000.00(8 行受影响)*/--通过以上结果我们可以通过rowid来查询，但同样无法解决薪资相同的情况with t as(select rowid=row_number() over(partition by 部门 order by 薪资 desc),* from Test)select * from t where t.rowid=1/*结果如下：rowid                部门     姓名     薪资-------------------- ------ ------ ---------------------1                    策划部    李波     12000.001                    工程部    立白     24000.001                    市场部    张三     6000.00(3 行受影响)*/--以上结果也未解决同部门同薪资的情况-----------------------------------------rank()用法与row_unmber()相同--注意下面两个查询的区别select rankId=rank()over(order by 薪资 desc),* from Testselect rankId=rank()over(order by 部门 desc),* from Test/* 重点看第2个结果rankId               部门     姓名     薪资-------------------- ------ ------ ---------------------1                    工程部    立白     24000.002                    策划部    李波     12000.003                    工程部    雕牌     10000.004                    市场部    张三     6000.004                    市场部    李四     6000.006                    市场部    王五     5000.007                    工程部    赵柳     3400.008                    策划部    海丝     2000.00(8 行受影响)rankId               部门     姓名     薪资-------------------- ------ ------ ---------------------1                    市场部    张三     6000.001                    市场部    李四     6000.001                    市场部    王五     5000.004                    工程部    赵柳     3400.004                    工程部    立白     24000.004                    工程部    雕牌     10000.007                    策划部    海丝     2000.007                    策划部    李波     12000.00(8 行受影响)*/--rank() 即是不连续编号的分组函数select rankId=rank() over(partition by 部门 order by 薪资 desc),* from Test/* 查询结果rankId               部门     姓名     薪资-------------------- ------ ------ ---------------------1                    策划部    李波     12000.002                    策划部    海丝     2000.001                    工程部    立白     24000.002                    工程部    雕牌     10000.003                    工程部    赵柳     3400.001                    市场部    张三     6000.001                    市场部    李四     6000.003                    市场部    王五     5000.00(8 行受影响)--此处需要注意的是，如果同部门同薪资，他们的编号相同，--比如这里两个薪资为6000的行他们的编号都是“1”，而5000的这一行是“3”而不是“2”。*/--通过以上结果很明确的可以知道我们的结果就出来了(能够完美解决相同问题)with t as(    select rankId=rank() over(partition by 部门 order by 薪资 desc),* from Test)select * from t where t.rankid=1/* 查询结果rankId               部门     姓名     薪资-------------------- ------ ------ ---------------------1                    策划部    李波     12000.001                    工程部    立白     24000.001                    市场部    张三     6000.001                    市场部    李四     6000.00(4 行受影响)*/--dense_rank()与rank()相反,即他的编号是连续的，可以自己对比一下他们的区别select drankId=dense_rank()over(order by 薪资),* from Testselect drankId=dense_rank()over(order by 部门),* from Test/*drankId              部门     姓名     薪资-------------------- ------ ------ ---------------------1                    策划部    海丝     2000.002                    工程部    赵柳     3400.003                    市场部    王五     5000.004                    市场部    张三     6000.004                    市场部    李四     6000.005                    工程部    雕牌     10000.006                    策划部    李波     12000.007                    工程部    立白     24000.00(8 行受影响)drankId              部门     姓名     薪资-------------------- ------ ------ ---------------------1                    策划部    海丝     2000.001                    策划部    李波     12000.002                    工程部    赵柳     3400.002                    工程部    立白     24000.002                    工程部    雕牌     10000.003                    市场部    张三     6000.003                    市场部    李四     6000.003                    市场部    王五     5000.00(8 行受影响)*/select drankId=dense_rank() over(partition by 部门 order by 薪资 desc),* from Testwith t as(    select drankId=dense_rank() over(partition by 部门 order by 薪资 desc),* from Test)select * from t where drankid=1/*drankId              部门     姓名     薪资-------------------- ------ ------ ---------------------1                    策划部    李波     12000.001                    工程部    立白     24000.001                    市场部    张三     6000.001                    市场部    李四     6000.00(4 行受影响)*/--顺便介绍一下ntile() 分组函数，平均分配--ntile()select tileid=ntile(3) over(order by 部门),* from Test