我试图以嵌套的方式执行几个字段的搜索结果聚合(计数和求和)分组. 例如,使用本文末尾显示的模式,我希望能够得到“大小”的总和按“类别”分组,并进一步按“子类别”进行分组,得
例如,使用本文末尾显示的模式,我希望能够得到“大小”的总和按“类别”分组,并进一步按“子类别”进行分组,得到如下内容:
<category name="X"> <subcategory name="X_A"> <size sum="..." /> </subcategory> <subcategory name="X_B"> <size sum="..." /> </subcategory> </category> ....
我一直在寻找Solr的Stats组件,据我所知,它不允许嵌套聚合.
如果有人知道某种方式来实现这一点,无论是否有Stats组件,我都会感激不尽.
以下是目标模式的简化版本:
<types> <fieldType name="string" class="solr.StrField" /> <fieldType name="text" class="solr.TextField"> <analyzer><tokenizer class="solr.StandardTokenizerFactory" /></analyzer> </fieldType> <fieldType name="date" class="solr.DateField" /> <fieldType name="int" class="solr.TrieIntField" precisionStep="0" omitNorms="true" positionIncrementGap="0" /> </types> <fields> <field name="id" type="string" indexed="true" stored="true" /> <field name="category" type="text" indexed="true" stored="true" /> <field name="subcategory" type="text" indexed="true" stored="true" /> <field name="pdate" type="date" indexed="true" stored="true" /> <field name="size" type="int" indexed="true" stored="true" /> </fields>Solr 5.1中的新分面模块可以执行此操作,它在 https://issues.apache.org/jira/browse/SOLR-7214中添加
以下是如何将sum(size)添加到每个facet bucket,并按该统计信息降序排序.
json.facet={ categories:{terms:{ field:category, sort:"total_size desc", // this will sort the facet buckets by your stat facet:{ total_size:"sum(size)" // this calculates the stat per bucket } }} }
这就是你要在子类别的子面上添加的方法:
json.facet={ categories:{terms:{ field:category, sort:"total_size desc", facet:{ total_size:"sum(size)", subcat:{terms:{ // this will facet on the subcategory field for each bucket field:subcategory, facet:{ sz:"sum(size)" // this calculates the sum per sub-cat bucket }} } }} }
因此,上面将给出类别和子类别级别的总和(大小).新facet模块的文档目前为http://yonik.com/json-facet-api/