row_number()over(partition by col1 order by col2) 表示根据col1 分组,在分组内部根据col2 排序,而此函数计算的值就表示每组内部排序后的顺序编号(组内连续的唯一的)。 与rownum 的区别在于:使用rownum 进行排序的时候是先对结果集加入伪劣rownum 然后再进行排序,而row_number() 在包含排序从句后是先排序再计算行号码。
一、oracle中rownum
用于从查询返回的行的编号,返回的第一行分配的是1,第二行是2,依此类推,这个伪字段可以用于限制查询返回的总行数,而且rownum 不能以任何表的名称作为前缀。
1、rownum 对于等于某值的查询条件
如果希望找到学生表中第一条学生的信息,可以使用rownum=1 作为条件。但是想找到学生表中第二条学生的信息,使用rownum=2 结果查不到数据。因为rownum 都是从1开始,但是1以上的自然数在rownum 做等于判断是时认为都是false 条件,所以无法查到rownum = n (n>1的自然数)。
SQL> select rownum,id,name from student where rownum=1;
SQL> select rownum,name from student where rownum =2;
2、rownum 对于大于某值的查询条件
如果想找到从第二行记录以后的记录,当使用rownum>2 是查不出记录的,可以使用以下的子查询方法来解决。注意子查询中的rownum 必须要有别名,否则还是不会查出记录来,这是因为rownum 不是某个表的列,如果不起别名的话,无法知道rownum 是子查询的列还是主查询的列。
SQL>select * from(select rownum no,name from student) where no>2;
SQL> select * from(select rownum,name from student)where rownum>2;
3、rownum对于小于某值的查询条件
如果想找到第三条记录以前的记录,当使用rownum<3 是能得到两条记录的。显然rownum 对于rownum<n ((n>1的自然数)的条件认为是成立的,所以可以找到记录。
SQL> select rownum,name from student where rownum <3;
4、rownum和排序
Oracle中的rownum 的是在取数据的时候产生的序号,所以想对指定排序的数据去指定的rowmun 行数据就必须注意了。
SQL> select rownum,name from student order by name;
---------- ------ ---------------------------------------------------
可以看出,rownum 并不是按照name 列来生成的序号。系统是按照记录插入时的顺序给记录排的号,rowid 也是顺序分配的。为了解决这个问题,必须使用子查询
SQL> select rownum,id,name from (select * from student order by name);
---------- ------ ---------------------------------------------------
二、oracle中row_number()
1、row_number() over (order by col_1[,col_2 ...]) 按照col_1[,col_2 ...] 排序,返回排序后的结果集,并且为每一行返回一个不相同的值。
2、row_number() over (partition by col_n[,col_m ...] order by col_1[,col_2 ...]) 先按照col_n[,col_m ... 进行分组,再在每个分组中按照col_1[,col_2 ...] 进行排序(升序),最后返回排好序后的结果集
oracle 中row_number() 实例
1.使用row_number() 函数进行编号,如
select email,customerID,ROW_NUMBER() over(order by psd) as rows from QT_Customer
原理:先按psd进行排序,排序完后,给每条数据进行编号。
2.在订单中按价格的升序进行排序,并给每条记录进行排序代码如下:
select DID,totalPrice,ROW_NUMBER() over(order by totalPrice) as rows from OP_Order
3、统计每一个客户最近下的订单是第几次下的订单。
with tabs as
(
select ROW_NUMBER() over(partition by customerID order by totalPrice) as rows,DID from OP_Order
)
select MAX(rows) as '下单次数',customerID from tabs group by customerID
4、在使用over 等开窗函数时,over 里头的分组及排序的执行晚于“where,group by,order by”的执行。
select ROW_NUMBER() over(partition by customerID order by insDT) as rows,DID from OP_Order where insDT>'2011-07-22'
以上代码是先执行where 子句,执行完后,再给每一条记录进行编号。
三、row_number() 与rownum 的区别
使用rownum 进行排序的时候是先对结果集加入伪劣rownum 然后再进行排序,而row_number() 在包含排序从句后是先排序再计算行号码。
If opportunity doesn’t knock,build a door
rownum,rowid,row_number()及oracle分页查询
1.rownum 和rowid 都是伪列,但两者的根本是不同的,rownum 是根据sql 查询出来的结果给每行分配一个逻辑编号,不同的sql 也就会导致rownum 不同,但是rowid 是物理结构上的,在每条记录Insert 到数据库时,就会有一个唯一的物理记录。rowid 可以说是物理存在的,表示记录在表空间中的一个唯一位置ID,在DB 中唯一。只要记录没被搬动过,rowid 是不变的。rowid 相对于表来说相当于一般列。
rownum 常用语分页查询,rowid 则常用语去除重复记录。
2.rownum 是对结果集加的一个伪列,即先查到结果集之后再加上去的一个列(先有结果集)。简单的说,rownum 是对符合条件结果的序列号。总是从1开始排起,所以选出的结果中不能没有1而有其他大于1 的值。
也可以理解为rownum 是oracle 数据库从数据文件或缓冲区中读取数据的顺序。它取得第一条记录则rownum 为1,
第2条为2。如果使用>,>=,=,between...and 这些条件,因为从缓冲区或数据文件中得到的第一条记录的rownum
为1,则被删除,接着取下条,可是rownum 依旧为1 ,有被删除,便没有了数据。
case1:
>
----- ---------- --------- ----- ----------- --------- --------- ------
case2:
> <>
----- ---------- --------- ----- ----------- --------- --------- ------
.
. .
case3:
> >
----- ---------- --------- ----- ----------- --------- --------- ------
.
. .
. .
.
. .
.
.
.
.
. .
.
.
.
.
case4:
>
----- ---------- --------- ----- ----------- --------- --------- ------
.
. .
. .
3.rownum 和row_numbe() over :
使用rownum 进行排序的时候是先对结果集加入伪列rownum 然后再进行排序,而row_number() 在包含排序从句后是先排序再计算行号码
case:
order by:
> ., .
----- ---------- --------- ----- ----------- --------- --------- ------ ----------
.
. .
.
.
.
.
.
.
. .
.
.
.
. .
. .
row_number() over(order by )
> ., .
.
----- ---------- --------- ----- ----------- --------- --------- ------ ------------------------------
.
. .
.
.
.
.
.
.
. .
.
.
.
. .
. .
4.
case1:在最外层控制分页的最小值和最大值
SELECT * FROM (SELECT A.*,ROWNUM RN FROM GAS_CA.A_CARD_METER_PAY A WHERE A.PURCH_GAS_TIME BETWEEN TO_DATE('2015/1/1','YYYY/MM/DD') AND TO_DATE('2016/1/1','YYYY/MM/DD') AND A.ORG_NO LIKE '1009%') WHERE RN BETWEEN 10 AND 20;
case2:
SELECT * FROM (SELECT ROWNUM RN,A.* FROM GAS_CA.A_CARD_METER_PAY A WHERE A.PURCH_GAS_TIME BETWEEN TO_DATE('2015/1/1','YYYY/MM/DD') AND A.ORG_NO LIKE '1009%' AND ROWNUM <= 20) WHERE RN >= 10;
对于case1 和case2 ,绝大多数情况下,case2 要比第一个查询效率高得多。
因为在CBO 优化模式下,oracle 可以将外层的查询条件推到内层查询中,以提高内层查询的执行效率。对于第二份语句,第二层的查询条件where rownum<=40 就可以被oracle推入到内层查询中,这样oracle查询的结果一旦查过rownum 限制的条件,就终止查询将结果返回。而第一个语句,oracle 无法将第三层的条件推到最内层(即使推到最内层也没有意义,因为不知道RN代表什么)。
case3:有order by 的写法(较高效率)
SELECT T1.*,RN FROM (SELECT ROWNUM RN,T.* FROM (SELECT * FROM GAS_CA.A_CARD_METER_PAY A WHERE A.PURCH_GAS_TIME BETWEEN TO_DATE('2015/1/1','YYYY/MM/DD') AND A.ORG_NO LIKE '1009%' ORDER BY A.PURCH_GAS_TIME) T WHERE ROWNUM <= 20) T1 WHERE RN >= 10;
case4:将查询条件放置最外层
SELECT * FROM (SELECT T.*,ROWNUM RN FROM (SELECT * FROM GAS_CA.A_CARD_METER_PAY A WHERE A.PURCH_GAS_TIME BETWEEN TO_DATE('2015/1/1','YYYY/MM/DD') AND A.ORG_NO LIKE '1009%' ORDER BY A.PURCH_GAS_TIME) T) T1 WHERE T1.RN BETWEEN 10 AND 20;
ORACLE中的rownum排序及row_number()排序的区别
ORACLE 中常用的是通过rownum 来分页,下面来讨论下rownum 分页的原理,rownum 分页排序和row_number() 函数分页排序的区别。
菜鸟第一次用rownum 容易犯的错:
select * from emp where rownum>=5 and rownum<=10
执行后返回的结果集是空的。因为rownum 是oracle 预处理字段,默认标序是1,只有记录集已经满足条件后才会进行后续编号。这样你查询emp表时遍历第一条数据时rownum 是1 ,不符合条件,继续遍历到第二条数据rownum 仍为1 ,仍不符合条件,直至遍历完所有数据,都无数据返回。所以正确的写法是:
select * from (select rownum r,emp.* from emp where rownum<=10)e where e.r>=5
来简单解释下,首先此语句中select rownum r,emp.* from emp where rownum<=10 被执行后当做一个视图(这里说下什么时候查询是一个视图什么时候叫子查询,在from 后面的嵌套查询是视图,在where后的嵌套查询是子查询),这个视图中的数据:包括emp 表中rownum 从1到10的数据,和一个真实列r列(可理解为此时rownum 伪列已插入到视图中被当做真实列),然后e.r表示查询这个视图中列r数字大于5的记录。若你不写e.r而是写rownum>=5 依旧没有数据返回,是因为此时再写rownum 是查询视图时重新生成伪列rownum 了,而未用那个真实列r。就会犯上面的第一个错误。
下面继续说通过rownum 分页和row_number() 函数的区别。
我们如果想查得通过empno 排序后的分页数据,看几条sql:
sql1:
select * from (select rownum rr,emp.* from emp where rownum<=10 order by empno)v where v.rr>=5
sql2:
select * from (select rownum rr,e.* from (select * from emp order by empno)e where rownum<=10)v where v.rr>=5
sql3:
select * from (select row_number() over(order by empno) rr,emp.ename from emp)v where rr between 5 and 10
执行后发现都能返回结果集,但是sql1返回的结果集却不是我们想要的。
将sql1中的子查询提出来看:
select rownum rr,emp.* from emp where rownum<=10 order by empno
这条语句parse 的顺序是先执行from 语句,再执行where 再执行order by 。where rownum<=10 执行完后会随机取出10条数据,这10条数据的rownum 是1到10,再对这10条数据根据进行排序。这样就不是我们想得到的。
sql2,sql3执行后返回的结果都是我们想要的。sql2 是现在子查询中排完序再进行rownum 的筛选。
总结下,rownum 排序和row_number() 的区别:使用rownum 进行排序的时候是先对结果集加入伪列rownum 后再进行排序(如sql1的结果),而row_number() 在通过over() 里的排序过后再对每列加上一个数字,从以上三条sql可看出,rownum 排序用到了起码三层嵌套执行效率上不如row_number() . (编辑:李大同)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
|