我希望介绍Solr为搜索商业列表网站提供支持.该网站有大约200万条记录. 有一个搜索结果页面,它将显示每个结果的一些关键数据.我相信这个摘要信息所需的数据大约是每个结果1KB. 我可
有一个搜索结果页面,它将显示每个结果的一些关键数据.我相信这个摘要信息所需的数据大约是每个结果1KB.
我可以简单地索引Solr中搜索所需的字段 – 但这意味着每个结果都有一个单独的数据库调用来填充摘要信息.如果Solr可以返回所有这些数据,我预计它会产生比~40个数据库往返更高的性能.
关注的是Solr的内存使用量太大(我怎么计算这个呢?)并且索引可能需要太长时间才能获得额外的数据.
与40分贝的往返行程相比,将这些字段存储在Solr中将大大受益.只需确保在模式配置中将字段标记为“未编入索引”(indexed = false),也可以压缩(compressed = true)(但是在索引和检索时,这当然会使用一些CPU).将字段标记为“未编入索引”时,分析程序在索引时不会处理该字段,使其存储速度比索引字段快得多.