当前位置 : 主页 > 网络推广 > seo >

我们如何使用Lucene,Solr或Nutch创建一个简单的搜索引擎?

来源:互联网 收集:自由互联 发布时间:2021-06-16
我们公司有数千个PDF文档.我们如何使用Lucene,Solr或Nutch创建一个简单的搜索引擎?我们将提供一个基本的 Java / JSP网页,人们可以输入单词并执行基本和/或查询,然后向他们显示所有匹配
我们公司有数千个PDF文档.我们如何使用Lucene,Solr或Nutch创建一个简单的搜索引擎?我们将提供一个基本的 Java / JSP网页,人们可以输入单词并执行基本和/或查询,然后向他们显示所有匹配PDF的文档链接. Lucene系列中的所有项目都不能原生地处理PDF,但是您可以使用实用程序,并编写有关如何自行编写的实例.

不管你需要做什么,Lucene都会做很多事情,但就你的时间而言,就像Tony上面所说的那样.成千上万的文件真的不是那么多,所以你可以用更轻的替代品来逃避.

也就是说,我仍然建议看看Solr – 它比Lucene更容易设置,支持备份,复制等,以及一个非常适合您的用例的漂亮JSON接口:http://wiki.apache.org/solr/SolJSON

网友评论