ITPub博客

首页 > 数据库 > Oracle > oracle全文索引之STOPLIST_1_BASIC_STOPLIST

oracle全文索引之STOPLIST_1_BASIC_STOPLIST

原创 Oracle 作者:jolly10 时间:2009-05-25 15:41:12 0 删除 编辑
这篇文章开始介绍Oracle全文索引的STOPLIST属性。首先介绍的是BASIC_STOPLIST。[@more@]Oracle的全文索引允许用户建立停用词,来屏蔽那些包含信息量比较小且出现概率比较高的词语。

比如英文中的a、this、are、the等词语,几乎每篇文章中都会包含这些常用词,因此对这些词语进行索引的意义不大。

SQL> CREATE TABLE T (ID NUMBER, DOCS VARCHAR2(1000));

表已创建。

SQL> CREATE TABLE T (ID NUMBER, DOCS VARCHAR2(1000));

Table created.

SQL> INSERT INTO T VALUES (1, 'THIS IS A STOPLIST EXAMPLE.');

1 row created.

SQL> COMMIT;

Commit complete.


SQL> exec CTX_DDL.CREATE_STOPLIST('TEST_BASIC', 'BASIC_STOPLIST');

PL/SQL procedure successfully completed.

SQL> CREATE INDEX IND_T_DOCS ON T(DOCS) INDEXTYPE IS CTXSYS.CONTEXT
2 PARAMETERS ('STOPLIST TEST_BASIC');

Index created.

SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'EXAMPLE') > 0;


ID DOCS
---------- ------------------------------
1 THIS IS A STOPLIST EXAMPLE.


SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'A') > 0;

ID DOCS
---------- ------------------------------
1 THIS IS A STOPLIST EXAMPLE.

建立了一个BASIC_STOPLIST后,由于并没有添加停用词,这个BASIC_STOPLIST停用词表是空的。这个时候不会屏蔽任何词语。

SQL> exec CTX_DDL.ADD_STOPWORD('TEST_BASIC', 'A');

PL/SQL procedure successfully completed.

SQL> drop index IND_T_DOCS
2 ;

Index dropped.

SQL> CREATE INDEX IND_T_DOCS ON T(DOCS) INDEXTYPE IS CTXSYS.CONTEXT
2 PARAMETERS ('STOPLIST TEST_BASIC');

Index created.

SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'EXAMPLE') > 0;
ID DOCS
---------- ------------------------------
1 THIS IS A STOPLIST EXAMPLE.


SQL> SELECT * FROM T WHERE CONTAINS(DOCS, 'A') > 0;

no rows selected


在上面的例子中,将单词’a’添加到了停用词表中,重新建立索引后,发现停用词已经生效。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/271283/viewspace-1022468/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论

注册时间:2008-02-20

  • 博文量
    263
  • 访问量
    769073