当前位置 : 主页 > 网络推广 > seo >

全文搜索 – 在哪里可以找到Oracle全文搜索的“停止”单词列表?

来源:互联网 收集:自由互联 发布时间:2021-06-16
我有一个客户端测试全新的Oracle UCM站点上的全文(例子如下). 他们选择测试的随机文本字符串是“仅测试”.失败了;从我的测试来看,似乎’only’是一个保留字,因为它永远不会从全文搜索
我有一个客户端测试全新的Oracle UCM站点上的全文(例子如下).
他们选择测试的随机文本字符串是“仅测试”.失败了;从我的测试来看,似乎’only’是一个保留字,因为它永远不会从全文搜索返回(它从元数据搜索返回).

我花了一个上午搜索oracle.com,发现this看起来相当全面,但没有’只’.

因此,我的问题是,“只是”一个保留的词.在哪里可以找到Oracle全文搜索(10g)的完整保留字列表?

全文搜索字符串示例;

(<ftx>test only</ftx>)

更新.
我做了一些测试.似乎它忽略了指示地点或时间的单词;
只有,一些,直到,何时,何时,哪里,哪里,这里,附近,那,谁,约,这,他们.

谁能证实这一点?我无法在任何地方找到这个.

更新2.发布答案
我应该一直在寻找“停止”的词而不是“保留”.
更新了问题标题和标签以反映.

我打赌系统试图自动忽略经常出现的单词.这可以解释为什么你找不到’只’但是’onnly’可以找到.你能搜索’a’,’an’,……

你给出的不起作用的单词列表看起来像一些非常常见的单词,通常不是句子中的主要单词.鉴于此,它们不太可能是您在全文搜索中搜索的单词.

您正在寻找包含“那个”这个词的文章的几率是多少,并且包含该词是您在文章中唯一的事实?

我想我找到了你的清单……具有讽刺意味的是,我开始上一家公司的维基页面……:http://www.sugarcrm.com/wiki/index.php?title=Overview_of_Full_Text_Stop_Words#Default_Stop_Words_.28for_English.29

2.10.3 Modifying the Default Stoplist The default stoplist is always named CTXSYS.DEFAULT_STOPLIST. You can use the following procedures to modify this stoplist:
 • CTX_DDL.ADD_STOPWORD
 • CTX_DDL.REMOVE_STOPWORD
 • CTX_DDL.ADD_STOPTHEME
 • CTX_DDL.ADD_STOPCLASS
 When you modify CTXSYS.DEFAULT_STOPLIST with the CTX_DDL package, you must re-create your index for the changes to take effect.

默认禁用词列表:

a he out up
be more their at
had one  will  from
it than and is
only when corp not
she also in  says
was by ms to
about her  over  
because  most  there  
has or  with  
its that are  
of which could  
some an inc  
we can mz  
after  his s  
been mr they  
have other  would  
last the as  
on who for  
such any into  
were co  no  
all if so  
but mrs this

更新 – 来自Oracle的一份很好的白皮书,其中包括全文搜索的工作方式,可以从以下网址下载:http://www.oracle.com/technology/products/text/pdf/text_techwp.pdf.他们提到了停用词和存在默认列表的事实,但是没有提到单词本身.

网友评论