分析函数用法及窗口子句 range/rows差别
发布时间:2020-12-12 14:14:50 所属栏目:百科 来源:网络整理
导读:分析函数用法及窗口子句 range/rows差别 分析函数的语法结构一般是:分析函数名(参数)OVER(PARTITIONBY子句ORDERBY子句ROWS/RANGE子句)。 即由以下三部分组成: 分析函数名:如sum、max、min、count、avg等聚集函数以及lead、lag行比较函数等; over: 关键字
分析函数用法及窗口子句 range/rows差别
分析函数的语法结构一般是:分析函数名(参数)OVER(PARTITIONBY子句ORDERBY子句ROWS/RANGE子句)。
即由以下三部分组成: 分析函数名:如sum、max、min、count、avg等聚集函数以及lead、lag行比较函数等; over: 关键字,表示前面的函数是分析函数,不是普通的集合函数; 分析子句:over关键字后面挂号内的内容; 分析子句又由下面三部分组成: partition by :分组子句,表示分析函数的计算范围,不同的组互不相干; ORDERBY:排序子句,表示分组后,组内的排序方式; ROWS/RANGE:窗口子句,是在分组(PARTITIONBY)后,组内的子分组(也称窗口),此时分析函数的 计算范围窗口,而不是PARTITON。窗口有两种,ROWS和RANGE; 下面分析rows与range窗口子句的用法,先看下面例子: 点击(此处)折叠或打开
从上面的例子可知: 1、窗口子句必须和order by 子句同时使用,且如果指定了order by 子句未指定窗口子句,则默认为RANGE BETWEEN unbounded preceding AND CURRENT ROW,如上例结果集中的defult_sum等于range_unbound_sum ; 2、如果分析函数没有指定ORDERBY子句,也就不存在ROWS/RANGE窗口的计算; 3、range是逻辑窗口,是指定当前行对应值的范围取值,列数不固定,只要行值在范围内,对应列都包含在内, 如上例中range_sum(即range 1 preceing and 2 following)例的分析结果: 当id=1时,是sum为1-1<=id<=1+2 的和,即sum=1+1+3=5(取id为1,1,3); 当id=3时,是sum为3-1<=id<=3+2 的和,即sum=3(取id为3); 当id=6时,是sum为6-1<=id<=6+2 的和,即sum=6+6+6+7+8=33(取id为6,6,6,7,8); 以此类推下去,结果如上例中所示。 4、rows是物理窗口,即根据order by 子句排序后,取的前N行及后N行的数据计算(与当前行的值无关,只与排序后的行号相关),如上例中rows_sum例结果,是取前1行和后2行数据的求和,分析上例rows_sum的结果: 当id=1(第一个1时)时,前一行没数,后二行分别是1和3,sum=1+1+3=5; 当id=3时,前一行id=1,后二行id都为6,则sum=1+3+6+6=16; 以此类推下去,结果如上例所示。 注:行比较分析函数lead和lag无window(窗口)子句。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |