ITPub博客

首页 > Linux操作系统 > Linux操作系统 > 巧用rowid来删除重复记录

巧用rowid来删除重复记录

原创 Linux操作系统 作者:0x0x0x 时间:2012-06-28 13:50:06 0 删除 编辑

巧用rowid来删除重复记录

第一:当重复的记录只有1条时:
在oracle中,每一条记录都有一个rowid,rowid在整个数据库中是唯一的,
rowid确定了每条记录是oracle中的哪一个数据文件、块、行上。在重复的记录中,
可能所有列的内容都相同,但rowid不会相同。

SQL> select * from tt;

NAME              AGE ID
---------- ---------- ----
赵                 33 1003
王                 44 1004
张三               20 1000
李四               26 1001
张三               20 1002

SQL> insert into tt values('赵',33,'1003');

已创建 1 行。

SQL> commit;

提交完成。

SQL> select rowid,tt.* from tt;

ROWID              NAME              AGE ID
------------------ ---------- ---------- ----
AAAR7MAAEAAAACzAAA 赵                 33 1003
AAAR7MAAEAAAAC1AAA 赵                 33 1003
AAAR7MAAEAAAAC1AAD 王                 44 1004
AAAR7MAAEAAAAC2AAA 张三               20 1000
AAAR7MAAEAAAAC2AAB 李四               26 1001
AAAR7MAAEAAAAC2AAC 张三               20 1002

已选择6行。

SQL> select t1.rowid,t2.rowid,t1.* from tt t1,tt t2 where t1.rowid>t2.rowid and t1.id=t2.id
  2  /

ROWID              ROWID              NAME              AGE ID
------------------ ------------------ ---------- ---------- ----
AAAR7MAAEAAAAC1AAA AAAR7MAAEAAAACzAAA 赵                 33 1003

SQL> delete from tt t where exists (select t1.rowid from tt t1,tt t2
  2  where t1.rowid>t2.rowid and t1.id=t2.id and t.rowid=t1.rowid)
  3  /

已删除 1 行。

SQL> select rowid,tt.* from tt;

ROWID              NAME              AGE ID
------------------ ---------- ---------- ----
AAAR7MAAEAAAACzAAA 赵                 33 1003
AAAR7MAAEAAAAC1AAD 王                 44 1004
AAAR7MAAEAAAAC2AAA 张三               20 1000
AAAR7MAAEAAAAC2AAB 李四               26 1001
AAAR7MAAEAAAAC2AAC 张三               20 1002

SQL>

当重复记录有N条时:
可以使用max或者min聚合函数

SQL> select * from tt;

NAME              AGE ID
---------- ---------- ----
赵                 33 1003
赵                 33 1003
赵                 33 1003
王                 44 1004
张三               20 1000
李四               26 1001
张三               20 1002

已选择7行。

SQL> delete from tt where rowid not in (select max(rowid) from tt t1 group by id);

已删除2行。

SQL> select * from tt;

NAME              AGE ID
---------- ---------- ----
赵                 33 1003
王                 44 1004
张三               20 1000
李四               26 1001
张三               20 1002

SQL>


另外也可以这样:delete from tt t where rowid>(select min(rowid) from tt where t.id=tt.id)

 

点评:这个技巧能大大地提高删除重复行的效率!

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/26977915/viewspace-734054/,如需转载,请注明出处,否则将追究法律责任。

上一篇: merge into 的用法
请登录后发表评论 登录
全部评论

注册时间:2012-06-26

  • 博文量
    35
  • 访问量
    91905