Aggregations: added pagination support to `top_hits` aggregation by adding `from` option.

Closes #6299
2014-05-26 17:56:07 +02:00 · 2014-05-26 17:56:07 +02:00 · aab38fb2e6
parent 35755cd8a4
commit aab38fb2e6
8 changed files with 76 additions and 8 deletions
--- a/docs/reference/search/aggregations/bucket/tophits-aggregation.asciidoc
+++ b/docs/reference/search/aggregations/bucket/tophits-aggregation.asciidoc
@ -13,6 +13,7 @@ This aggregator can't hold any sub-aggregators and therefor can only be used as
 ==== Options
 * `from` - The offset from the first result you want to fetch.
 * `size` - The maximum number of top matching hits to return per bucket. By default the top three matching hits are returned.
 * `sort` - How the top matching hits should be sorted. By default the hits are sorted by the score of the main query.
--- a/src/main/java/org/elasticsearch/search/aggregations/bucket/tophits/InternalTopHits.java
+++ b/src/main/java/org/elasticsearch/search/aggregations/bucket/tophits/InternalTopHits.java
@ -54,6 +54,7 @@ public class InternalTopHits extends InternalAggregation implements TopHits, ToX
        AggregationStreams.registerStream(STREAM, TYPE.stream());
    }
    private int from;
    private int size;
    private Sort sort;
    private TopDocs topDocs;
@ -62,8 +63,9 @@ public class InternalTopHits extends InternalAggregation implements TopHits, ToX
    InternalTopHits() {
    }
-    public InternalTopHits(String name, int size, Sort sort, TopDocs topDocs, InternalSearchHits searchHits) {
+    public InternalTopHits(String name, int from, int size, Sort sort, TopDocs topDocs, InternalSearchHits searchHits) {
        this.name = name;
        this.from = from;
        this.size = size;
        this.sort = sort;
        this.topDocs = topDocs;
@ -104,7 +106,7 @@ public class InternalTopHits extends InternalAggregation implements TopHits, ToX
        try {
            int[] tracker = new int[shardHits.length];
-            TopDocs reducedTopDocs = TopDocs.merge(sort, size, shardDocs);
+            TopDocs reducedTopDocs = TopDocs.merge(sort, from, size, shardDocs);
            InternalSearchHit[] hits = new InternalSearchHit[reducedTopDocs.scoreDocs.length];
            for (int i = 0; i < reducedTopDocs.scoreDocs.length; i++) {
                ScoreDoc scoreDoc = reducedTopDocs.scoreDocs[i];
@ -119,6 +121,7 @@ public class InternalTopHits extends InternalAggregation implements TopHits, ToX
    @Override
    public void readFrom(StreamInput in) throws IOException {
        name = in.readString();
        from = in.readVInt();
        size = in.readVInt();
        topDocs = Lucene.readTopDocs(in);
        if (topDocs instanceof TopFieldDocs) {
@ -130,6 +133,7 @@ public class InternalTopHits extends InternalAggregation implements TopHits, ToX
    @Override
    public void writeTo(StreamOutput out) throws IOException {
        out.writeString(name);
        out.writeVInt(from);
        out.writeVInt(size);
        Lucene.writeTopDocs(out, topDocs, 0);
        searchHits.writeTo(out);
--- a/src/main/java/org/elasticsearch/search/aggregations/bucket/tophits/TopHits.java
+++ b/src/main/java/org/elasticsearch/search/aggregations/bucket/tophits/TopHits.java
@ -22,9 +22,13 @@ import org.elasticsearch.search.SearchHits;
 import org.elasticsearch.search.aggregations.Aggregation;
 /**
 * Accumulation of the most relevant hits for a bucket this aggregation falls into.
 */
 public interface TopHits extends Aggregation {
    /**
     * @return The top matching hits for the bucket
     */
    SearchHits getHits();
 }
--- a/src/main/java/org/elasticsearch/search/aggregations/bucket/tophits/TopHitsAggregator.java
+++ b/src/main/java/org/elasticsearch/search/aggregations/bucket/tophits/TopHitsAggregator.java
@ -90,7 +90,7 @@ public class TopHitsAggregator extends BucketsAggregator implements ScorerAware
                    searchHitFields.sortValues(fieldDoc.fields);
                }
            }
-            return new InternalTopHits(name, topHitsContext.size(), topHitsContext.sort(), topDocs, fetchResult.hits());
+            return new InternalTopHits(name, topHitsContext.from(), topHitsContext.size(), topHitsContext.sort(), topDocs, fetchResult.hits());
        }
    }
@ -104,10 +104,10 @@ public class TopHitsAggregator extends BucketsAggregator implements ScorerAware
        TopDocsCollector topDocsCollector = topDocsCollectors.get(bucketOrdinal);
        if (topDocsCollector == null) {
            Sort sort = topHitsContext.sort();
-            int size = topHitsContext.size();
+            int topN = topHitsContext.from() + topHitsContext.size();
            topDocsCollectors.put(
                    bucketOrdinal,
-                    topDocsCollector = sort != null ? TopFieldCollector.create(sort, size, true, topHitsContext.trackScores(), true, false) : TopScoreDocCollector.create(size, false)
+                    topDocsCollector = sort != null ? TopFieldCollector.create(sort, topN, true, topHitsContext.trackScores(), true, false) : TopScoreDocCollector.create(topN, false)
            );
            topDocsCollector.setNextReader(currentContext);
            topDocsCollector.setScorer(currentScorer);
--- a/src/main/java/org/elasticsearch/search/aggregations/bucket/tophits/TopHitsBuilder.java
+++ b/src/main/java/org/elasticsearch/search/aggregations/bucket/tophits/TopHitsBuilder.java
@ -40,6 +40,15 @@ public class TopHitsBuilder extends AbstractAggregationBuilder {
        super(name, InternalTopHits.TYPE.name());
    }
    /**
     * The index to start to return hits from. Defaults to <tt>0</tt>.
     */
    public TopHitsBuilder setFrom(int from) {
        sourceBuilder().from(from);
        return this;
    }
    /**
     * The number of search hits to return. Defaults to <tt>10</tt>.
     */
--- a/src/main/java/org/elasticsearch/search/aggregations/bucket/tophits/TopHitsContext.java
+++ b/src/main/java/org/elasticsearch/search/aggregations/bucket/tophits/TopHitsContext.java
@ -71,6 +71,7 @@ public class TopHitsContext extends SearchContext {
    // the to hits are returned per bucket.
    private final static int DEFAULT_SIZE = 3;
    private int from;
    private int size = DEFAULT_SIZE;
    private Sort sort;
@ -440,12 +441,13 @@ public class TopHitsContext extends SearchContext {
    @Override
    public int from() {
-        return context.from();
+        return from;
    }
    @Override
    public SearchContext from(int from) {
-        throw new UnsupportedOperationException("Not supported");
+        this.from = from;
        return this;
    }
    @Override
--- a/src/main/java/org/elasticsearch/search/aggregations/bucket/tophits/TopHitsParser.java
+++ b/src/main/java/org/elasticsearch/search/aggregations/bucket/tophits/TopHitsParser.java
@ -72,6 +72,9 @@ public class TopHitsParser implements Aggregator.Parser {
                    currentFieldName = parser.currentName();
                } else if (token.isValue()) {
                    switch (currentFieldName) {
                        case "from":
                            topHitsContext.from(parser.intValue());
                            break;
                        case "size":
                            topHitsContext.size(parser.intValue());
                            break;
--- a/src/test/java/org/elasticsearch/search/aggregations/bucket/TopHitsTests.java
+++ b/src/test/java/org/elasticsearch/search/aggregations/bucket/TopHitsTests.java
@ -23,6 +23,7 @@ import org.elasticsearch.action.index.IndexRequestBuilder;
 import org.elasticsearch.action.search.SearchPhaseExecutionException;
 import org.elasticsearch.action.search.SearchResponse;
 import org.elasticsearch.action.search.SearchType;
 import org.elasticsearch.index.query.FilterBuilders;
 import org.elasticsearch.search.SearchHit;
 import org.elasticsearch.search.SearchHitField;
 import org.elasticsearch.search.SearchHits;
@ -76,7 +77,6 @@ public class TopHitsTests extends ElasticsearchIntegrationTest {
                    .endObject()));
        }
        // Use routing to make sure all docs are in the same shard for consistent scoring
        builders.add(client().prepareIndex("idx", "field-collapsing", "1").setSource(jsonBuilder()
                .startObject()
                .field("group", "a")
@ -169,6 +169,51 @@ public class TopHitsTests extends ElasticsearchIntegrationTest {
        }
    }
    @Test
    public void testPagination() throws Exception {
        int size = randomIntBetween(0, 10);
        int from = randomIntBetween(0, 10);
        SearchResponse response = client().prepareSearch("idx").setTypes("type")
                .addAggregation(terms("terms")
                                .executionHint(randomExecutionHint())
                                .field(TERMS_AGGS_FIELD)
                                .subAggregation(
                                        topHits("hits").addSort(SortBuilders.fieldSort(SORT_FIELD).order(SortOrder.DESC))
                                                .setFrom(from)
                                                .setSize(size)
                                )
                )
                .get();
        assertSearchResponse(response);
        SearchResponse control = client().prepareSearch("idx")
                .setTypes("type")
                .setFrom(from)
                .setSize(size)
                .setPostFilter(FilterBuilders.termFilter(TERMS_AGGS_FIELD, "val0"))
                .addSort(SORT_FIELD, SortOrder.DESC)
                .get();
        assertSearchResponse(control);
        SearchHits controlHits = control.getHits();
        Terms terms = response.getAggregations().get("terms");
        assertThat(terms, notNullValue());
        assertThat(terms.getName(), equalTo("terms"));
        assertThat(terms.getBuckets().size(), equalTo(5));
        Terms.Bucket bucket = terms.getBucketByKey("val0");
        assertThat(bucket, notNullValue());
        assertThat(bucket.getDocCount(), equalTo(10l));
        TopHits topHits = bucket.getAggregations().get("hits");
        SearchHits hits = topHits.getHits();
        assertThat(hits.totalHits(), equalTo(controlHits.totalHits()));
        assertThat(hits.getHits().length, equalTo(controlHits.getHits().length));
        for (int i = 0; i < hits.getHits().length; i++) {
            assertThat(hits.getAt(i).id(), equalTo(controlHits.getAt(i).id()));
            assertThat(hits.getAt(i).sortValues()[0], equalTo(controlHits.getAt(i).sortValues()[0]));
        }
    }
    @Test
    public void testSortByBucket() throws Exception {
        SearchResponse response = client().prepareSearch("idx").setTypes("type")