特色栏目： python 批处理 net编程 Javascript Php Asp Css Html5 Android seo centos

我们如何使用Lucene,Solr或Nutch创建一个简单的搜索引擎？

来源：互联网收集：自由互联发布时间：2021-06-16

我们公司有数千个PDF文档.我们如何使用Lucene,Solr或Nutch创建一个简单的搜索引擎？我们将提供一个基本的 Java / JSP网页,人们可以输入单词并执行基本和/或查询,然后向他们显示所有匹配

我们公司有数千个PDF文档.我们如何使用Lucene,Solr或Nutch创建一个简单的搜索引擎？我们将提供一个基本的 Java / JSP网页,人们可以输入单词并执行基本和/或查询,然后向他们显示所有匹配PDF的文档链接. Lucene系列中的所有项目都不能原生地处理PDF,但是您可以使用实用程序,并编写有关如何自行编写的实例.

不管你需要做什么,Lucene都会做很多事情,但就你的时间而言,就像Tony上面所说的那样.成千上万的文件真的不是那么多,所以你可以用更轻的替代品来逃避.

也就是说,我仍然建议看看Solr – 它比Lucene更容易设置,支持备份,复制等,以及一个非常适合您的用例的漂亮JSON接口：http://wiki.apache.org/solr/SolJSON

上一篇：【索引】信息检索导航
下一篇：在werkzeug请求中检索url锚点

我们如何使用Lucene,Solr或Nutch创建一个简单的搜索引擎？

相关文章