ITPub博客

首页 > Linux操作系统 > Linux操作系统 > SQL之常用聚合函数

SQL之常用聚合函数

原创 Linux操作系统 作者:chyinzi 时间:2011-04-20 17:02:39 0 删除 编辑
1)COUNT
语法:COUNT(e1)
参数:e1为一个表达式,可以是任意的数据类型
返回:返回数值型数据
作用:返回e1指定列不为空的记录总数

2)SUM,
语法:SUM(e1)
参数:e1为类型为数值型的表达式
返回:返回数值型数据
作用:对e1指定的列进行求和计算

3)MIN, MAX
语法:MIN(e1)、MAX(e1)
参数:e1为一个字符型、日期型或数值类型的表达式。
若e1为字符型,则根据ASCII码来判断最大值与最小值。
返回:根据e1参数的类型,返回对应类型的数据。
作用:MIN(e1)返回e1表达式指定的列中最小值;
     MAX(e1)返回e1表达式指定的列中最大值;

4)AVG
语法:AVG(e1)
参数:e1为一个数值类型的表达式
返回:返回一个数值类型数据
作用:对e1表达式指定的列,求平均值。

5)MEDIAN
语法:MEDIAN(e1)
参数:e1为一个数值或日期类型的表达式
返回:返回一个数值或日期类型的数据
作用:首先,根据e1表达式指定的列,对值进行排序;
若排序后,总记录为奇数,则返回排序队列中,位于中间的值;
若排序后,总记录为偶数,则对位于排序队列中,中间两个值进行求平均,返回这个平均值;
6)RANK
1)用法1:RANK OVER
  语法: RANK( )  OVER ([ PARTITION BY column1 ] ORDER BY column2 [ASC|DESC])
为分析函数,为每条记录产生一个序列号,并返回。
  参数: column1为列名,指定按照哪一列进行分类(分组)
  column2为列名,指定根据哪列排序,默认为升序;
  若指定了分类子句(PARTITION BY),则对每类进行排序(每个分类单独排序)
  返回:返回一个数值类型数据,作为该记录的序号!
  作用:为分析函数,对记录先按column1分类,再对每个分类进行排序,并为每条记录分配一个序号(每个分类单独排序)
  注意:排序字段值相同的记录,分配相同的序号。存在序号不连续的情况
  实例:student表记录了学生每科的成绩,要求按学科排序,并获取每科分数前两名的记录
student表如下:
SQL> select * from student order by kemu;
  NAME       ID                KEMU      FENSHU
---------- -------------- -------------- ----------------
Li            0113101     物理               80
Luo         0113011     物理               80
Wang     0113077     物理               70
Zhang     0113098    物理               90
Luo         0113011     高数               80
Wang      0113077    高数               70
Zhang     0113098    高数               80
Li             0113101    高数               90
  8 rows selected
按学科分类,按成绩排序(降序)
SQL> select rank() over(partition by KEMU order by FENSHU desc) as sort,student.* from student;
       SORT    NAME        ID              KEMU      FENSHU
---------- ---------- ---------------- ------------ ----------
         1            Zhang      0113098    物理               90
         2            Li              0113101    物理               80
         2            Luo           0113011    物理               80
         4            Wang       0113077    物理               70
         1            Li              0113101    高数               90
         2            Luo           0113011    高数               80
         2            Zhang      0113098    高数               80
         4            Wang       0113077    高数               70
由返回记录可了解,对排序列的值相同的记录,rank为其分配了相同的序号(SORT NAME列)。
并且之后的记录的序号是不连续的。
若获取每科前两名,只需对排序后的结果增加二次查询即可
select * from 
(select rank() over(partition by KEMU order by FENSHU desc) as sort_id,student.* from student) st 
where st.sort_id<=2;
2)用法2:RANK WITHIN GROUP
语法: RANK( expr1 ) WITHIN GROUP ( ORDER BY expr2 )
为聚合函数,返回一个值。
参数:expr1为1个或多个常量表达式;
        expr2为如下格式的表达式:
              expr2的格式为'expr3 [ DESC | ASC ] [ NULLS { FIRST | LAST } ]'
其中,expr1需要与expr2相匹配,
即:expr1的常量表达式的类型、数量必须与ORDER BY子句后的expr2表达式的类型、数量相同
实际是expr1需要与expr3相匹配
如:RANK(a) WITHIN GROUP (ORDER BY b ASC NULLS FIRST);
   其中,a为常量,b需要是与相同类型的表达式
   RANK(a,b) WITHIN GROUP (ORDER BY c DESC NULLS LAST, d DESC NULLS LAST);
   其中,a与b都为常量;c是与a类型相同的表达式、d是与b类型相同的表达式;
返回:返回数值型数据,该值为假定记录在表中的序号。
作用:确定一条假定的记录,在表中排序后的序号。
  如:假定一条记录(假设为r1)的expr2指定字段值为常量expr1,则将r1插入表中后,
与原表中的记录,按照ORDER BY expr2排序后,该记录r1在表中的序号为多少,返回该序号。
注释: NULLS FIRST指定,将ORDER BY指定的排序字段为空值的记录放在前边;
NULLS LAST指定,将ORDER BY指定的排序字段为空值的记录放在后边;
实例:假设一个员工的薪水为1500,求该员工的薪水在员工表中的排名为多少?
已知员工表如下:
SQL> select * from employees;
EMP_ID     EMP_NAME     SALARY
---------- -------------------- ---------------
10001      ZhangSan             500
10002      LiSi                         1000
10003      WangWu               1500
10004      MaLiu                     2000
10005      NiuQi                      2500

SQL> select rank(1500) within group (order by salary) as "rank number" from employees;
rank number
-----------
           3
由结果可知,薪水为1500的员工,在表中按升序排序,序号为3
7)FIRST、LAST
语法: agg_function(e1) KEEP (DENSE_RANK FIRST ORDER BY e2 [NULLS {FIRST|LAST}]) [OVER PARTITION BY e3 ]
agg_function(e1) KEEP (DENSE_RANK LAST  ORDER BY e2 [NULLS {FIRST|LAST}]) [OVER PARTITION BY e3 ]       
参数: agg_function为一个聚合函数,可以为 MIN、MAX、SUM、AVG、COUNT、VARIANCE或STDDEV
e2指定以哪个字段为依据,进行排序;
e3指定以哪个字段为依据,进行分类(分组);
当指定OVER PARTITION BY子句后,针对分类后的每个类单独排序;
DENSE_RANK为排序后的记录分配序号,并且序号为连续的。
NULLS {FIRST|LAST}指定排序字段e1的值若为空,则拍在序列前边(NULLS FIRST)或者后边(NULLS LAST)
DENSE_RANK后的FIRST/LAST确定选取通过DENSE_RANK排好序后的序列中,序号最小/最大的记录。序号相同时,返回多条记录
当序号相同,返回多条记录时,agg_function(e1)聚合函数继续对这多条记录的e1字段做聚合操作。
作用: 如果agg_function为min(e1),获取排序后的FIRST或LAST的多条记录中,某字段e1的最小值
该字段不是排序关键字段e2
实例:
已知员工表有薪水字段,奖金字段。要求获取薪水最低的员工中,奖金最高的员工的记录。
已知表内容如下:
SQL> select * from employees order by salary;
  EMP_ID     EMP_NAME           SALARY  COMMISSION
---------- ---------------------------- ------------  ------------
10001      ZhangSan                    500        200
10002      LiSi                                500        300
10003      WangWu                      500        100
10004      MaLiu                           2000       500
10005      NiuQi                            2500       200
10006      ShangDuo                   2500       300
10007      BaiQi                             2500       400
SQL> select max(commission) keep(dense_rank first order by salary asc) as commission from employees;
COMMISSION
----------
       300
首先,按salary排序后,获取薪水最低的记录,分别为员工10001、10002、10003三条记录。
聚合函数max(commission)对3条记录获取奖金最高的为员工10002,奖金为300。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/25264937/viewspace-692980/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论

注册时间:2011-01-18

  • 博文量
    26
  • 访问量
    169048