我有一个客户端测试全新的Oracle UCM站点上的全文(例子如下). 他们选择测试的随机文本字符串是“仅测试”.失败了;从我的测试来看,似乎’only’是一个保留字,因为它永远不会从全文搜索
他们选择测试的随机文本字符串是“仅测试”.失败了;从我的测试来看,似乎’only’是一个保留字,因为它永远不会从全文搜索返回(它从元数据搜索返回).
我花了一个上午搜索oracle.com,发现this看起来相当全面,但没有’只’.
因此,我的问题是,“只是”一个保留的词.在哪里可以找到Oracle全文搜索(10g)的完整保留字列表?
全文搜索字符串示例;
(<ftx>test only</ftx>)
更新.
我做了一些测试.似乎它忽略了指示地点或时间的单词;
只有,一些,直到,何时,何时,哪里,哪里,这里,附近,那,谁,约,这,他们.
谁能证实这一点?我无法在任何地方找到这个.
更新2.发布答案
我应该一直在寻找“停止”的词而不是“保留”.
更新了问题标题和标签以反映.
你给出的不起作用的单词列表看起来像一些非常常见的单词,通常不是句子中的主要单词.鉴于此,它们不太可能是您在全文搜索中搜索的单词.
您正在寻找包含“那个”这个词的文章的几率是多少,并且包含该词是您在文章中唯一的事实?
我想我找到了你的清单……具有讽刺意味的是,我开始上一家公司的维基页面……:http://www.sugarcrm.com/wiki/index.php?title=Overview_of_Full_Text_Stop_Words#Default_Stop_Words_.28for_English.29
2.10.3 Modifying the Default Stoplist The default stoplist is always named CTXSYS.DEFAULT_STOPLIST. You can use the following procedures to modify this stoplist: • CTX_DDL.ADD_STOPWORD • CTX_DDL.REMOVE_STOPWORD • CTX_DDL.ADD_STOPTHEME • CTX_DDL.ADD_STOPCLASS When you modify CTXSYS.DEFAULT_STOPLIST with the CTX_DDL package, you must re-create your index for the changes to take effect.
默认禁用词列表:
a he out up be more their at had one will from it than and is only when corp not she also in says was by ms to about her over because most there has or with its that are of which could some an inc we can mz after his s been mr they have other would last the as on who for such any into were co no all if so but mrs this
更新 – 来自Oracle的一份很好的白皮书,其中包括全文搜索的工作方式,可以从以下网址下载:http://www.oracle.com/technology/products/text/pdf/text_techwp.pdf.他们提到了停用词和存在默认列表的事实,但是没有提到单词本身.