我们公司有数千个PDF文档.我们如何使用Lucene,Solr或Nutch创建一个简单的搜索引擎?我们将提供一个基本的 Java / JSP网页,人们可以输入单词并执行基本和/或查询,然后向他们显示所有匹配
不管你需要做什么,Lucene都会做很多事情,但就你的时间而言,就像Tony上面所说的那样.成千上万的文件真的不是那么多,所以你可以用更轻的替代品来逃避.
也就是说,我仍然建议看看Solr – 它比Lucene更容易设置,支持备份,复制等,以及一个非常适合您的用例的漂亮JSON接口:http://wiki.apache.org/solr/SolJSON