ITPub博客

首页 > Linux操作系统 > Linux操作系统 > 选用 IN 还是 EXISTS

选用 IN 还是 EXISTS

原创 Linux操作系统 作者:tolywang 时间:2007-05-16 00:00:00 0 删除 编辑
有时候会将一列和一系列值相比较。最简单的办法就是在where子句中使用子查询。在where子句中可以使用两种格式的子查询。
第一种格式是使用IN操作符:
... where column in(select * from ... where ...);
第二种格式是使用EXIST操作符:
... where exists (select 'X' from ...where ...);

我相信绝大多数人会使用第一种格式,因为它比较容易编写,而实际上第二种格式要远比第一种格式的效率高。可以几乎将所有的IN操作符子查询改写为使用EXISTS的子查询。
第二种格式中,子查询以‘select 'X'开始。运用EXISTS子句不管子查询从表中抽取什么数据它只查看where子句。这样优化器就不必遍历整个表而仅根据索引就可完成工作(这里假定在where语句中使用的列存在索引)。相对于IN子句来说,EXISTS使用相连子查询,构造起来要比IN子查询困难一些。
通过使用 EXISTS,系统会首先检查主查询,然后运行子查询直到它找到第一个匹配项,这就节省了时间。系统在执行IN子查询时,首先执行子查询,并将获得的结果列表存放在在一个加了索引的临时表中。在执行子查询之前,系统先将主查询挂起,待子查询执行完毕,存放在临时表中以后再执行主查询。这也就是使用 EXISTS比使用IN通常查询速度快的原因。
同时应尽可能使用NOT EXISTS来代替NOT IN,尽管二者都使用了NOT(不能使用索引而降低速度),NOT EXISTS要比NOT IN查询效率更高。

但是:

一、EXISTS 并非总比IN 快,究竟应该选用 IN 还是 EXISTS ,可参考以下分析:
1、Select * from t1 where x in ( select y from t2 )
相当于
select *
from t1, ( select distinct y from t2 ) t2
where t1.x = t2.y;

2、select * from t1 where exists ( select null from t2 where y = x )
相当于
for x in ( select * from t1 )
loop
if ( exists ( select null from t2 where y = x.x )
then
OUTPUT THE RECORD
end if
end loop

如果t2的记录很多而t1的记录相对较少的话,建议采用第二种写法;相反,如果t1的记录很多而t2的记录相对较少,则建议采用第一种写法。
其它情况,则需要仔细分析再决定是选择IN还是选择EXISTS

二、NOT IN 并不等价于NOT EXISTS

例如下面这两个句子,只有在t1.c1不为NULL的时候,两者返回的记录才是相同的,大家在用NOT EXISTS来替换NOT IN 时可能会忽略掉这一点
select t1.*
from table1 t1
where not exists
(select t2.c1 from table2 t2 where t2.c1 = t1.c1)

select t1.*
from table1 t1
where t1.c1 not in (select t2.c1 from table2 t2)

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/35489/viewspace-84636/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论
Oracle , MySQL, SAP IQ, SAP HANA, PostgreSQL, Tableau 技术讨论,希望在这里一起分享知识,讨论技术,畅谈人生 。

注册时间:2007-12-10

  • 博文量
    5595
  • 访问量
    13385068