ITPub博客

首页 > Linux操作系统 > Linux操作系统 > ORACLE函数介绍(4)-聚合函数-ZT

ORACLE函数介绍(4)-聚合函数-ZT

原创 Linux操作系统 作者:spritesong 时间:2009-03-29 22:24:40 0 删除 编辑
Normal 0 7.8 磅 0 2 false false false MicrosoftInternetExplorer4  

ORACLE函数介绍

第四篇 非著名函数之聚合函数   2007.8.23

 

 

注:N表示数字型,C表示字符型,D表示日期型,[]表示内中参数可被忽略,fmt表示格式。

 

  聚合函数可被用于select,order by以及having子句中。其运算可以基于group by的结果,也可以直接对所有记录进行运算。当然,这种类型语句相信大家平常也用的比较多,概念性的就不多介绍了,有一点需要注意的是,除了countgrouping之后,其它的统计运算均会忽略值为null的列。

 

  注意,多数聚合函数都支持DISTINCT子句(distinct是什么?过滤记录集中重复记录用的),如果不指定则默认针对所有计录,举个最简单的例子:select count(col),count(distinct col) from tmp1

  本类函数中部分函数同时也属于分析函数。其做为分析函数时的具体用法将会在后面章节介绍,本节不做描述。

 

1、CUME_DIST(expr[,expr]...) WITHIN GROUP

  (ORDER BY

    expr [DESC | ASC] [NULLS {FIRST | LAST}]

      [,expr [DESC | ASC] [NULLS {FIRST | LAST}]]...)非常有意思的一个函数。查询指定数值在指定分组序列中的相对位置,返回值是介于 0 1 之间的小数值。我们后面还会再讲几个相关的函数,均是实现类型功能,只是值的表现形式不同。

例如:SELECT CUME_DIST(120) WITHIN GROUP (ORDER BY value) FROM TMP1

 

2、GROUP_ID() 该函数必须配合group by子句使用。主要是用来区分group by 生成的记录集中是否是被重复生成的记录,如果该条记录是则返回1,否则返回0

例如:SELECT t.col, group_id() FROM TMP1 t GROUP BY col, ROLLUP(col)

 

3、PERCENT_RANK ( expr [, expr]... ) WITHIN GROUP

( ORDER BY

  expr [ DESC | ASC ] [NULLS { FIRST | LAST }]

  [, expr [ DESC | ASC ] [NULLS { FIRST | LAST }]]...)本函数语法及形式与cume_dist非常相似,也是返回指定数据在指定分组序列中所占的相对位置,不过与cume_dist不同的是。不管指定值与分组序列中某值是否重复,均将此值视为序列一部分,而cume_dist则不同。如果指定值与分组序列中某值重复,则将二值视为一个值处理(上帝保佑,但愿俺讲明白了,废话不说,大家通过示例来理解吧)

例如:SELECT PERCENT_RANK(120) WITHIN GROUP( ORDER BY value) FROM TMP1

 

4、PERCENTILE_CONT(n) WITHIN GROUP (ORDER BY col [DESC|ASC]) 根据输入值返回该值对应的分组序列中数值。输入值应该是介于01之间。原因请参照前面的PERCENT_RANK函数。

如果分组序列中没有存在对应值的话,会根据如下规则来计算返回值:

  if (CRN = FRN = RN) then

    (value of expression from row at RN)

  else

    (CRN - RN) * (value of expression for row at FRN) +

    (RN - FRN) * (value of expression for row at CRN)

 

例如:

SELECT col, max(value), min(value), sum(value),

 PERCENTILE_CONT(0.5) WITHIN GROUP(ORDER BY value) a,

 PERCENTILE_CONT(0.8) WITHIN GROUP(ORDER BY value) b

  FROM TMP1

 group by col;

 

5、PERCENTILE_DISC(n) WITHIN GROUP (ORDER BY col [DESC|ASC]) 语法与形式与上例相同,不过在计算方法上略有差异。如果分组序列中没有对应值的话,那么将会返回该序列中最近最大的一个值。

 

相对而言,我认为某些情况下本函数被应用的机率还是相当大地,起码比上述几个函数的应用范围会广。

 

例如:

SELECT col, max(value), min(value),

 PERCENTILE_DISC(0.5) WITHIN GROUP(ORDER BY value) a,

 PERCENTILE_DISC(0.8) WITHIN GROUP(ORDER BY value) b

  FROM TMP1

 group by col;

 

6、STDDEV([DISTINCT|ALL] n) 该函数返回样本的标准偏差。

例如:SELECT col, STDDEV(value) FROM TMP1 GROUP BY col;

 

7、STDDEV_SAMP(n) 语法与形式与上同,其与STDDEV函数最大的区别是,如果该分组序列只有一行的话,则STDDEV_SAMP函数返回空值,而STDDEV则返回0

例如:SELECT col, STDDEV(value),STDDEV_SAMP(value) FROM TMP1 GROUP BY col;

 

8、STDDEV_POP(n) 返回该分组序列总体标准偏差。

例如:SELECT col, STDDEV_POP(value) FROM TMP1 GROUP BY col;

 

9、VAR_POP(n) 该函数返回分组序列的总体方差,VAR_POP进行如下计算:(SUM(expr2) - SUM(expr)2 / COUNT(expr)) / COUNT(expr)

例如:SELECT col, VAR_POP(value) FROM TMP1 GROUP BY col;

 

10、VAR_SAMP(n) 与上类似,该函数返回分组序列的样本方差,,其计算公式为:(SUM(expr2) - SUM(expr)2 / COUNT(expr)) / (COUNT(expr) - 1)

例如:SELECT col, VAR_POP(value),VAR_SAMP(value) FROM TMP1 GROUP BY col;

 

11、VARIANCE(n) 该函数返回分组序列方差,Oracle计算该变量如下:

如果表达式中行数为1,则返回0,如果表达式中行数大于1,则返回VAR_SAMP

例如:SELECT col, VAR_SAMP(value),VARIANCE(value) FROM TMP1 GROUP BY col;

 

 

 

 

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/293106/viewspace-580558/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论

注册时间:2009-03-28

  • 博文量
    62
  • 访问量
    23784