Also make use of the thread local memory reuse for a document being percolated with nested objects.

The memory index will only be reused for the root doc, since most of the times that will be the biggest document.
2025-03-01 16:39:11 +00:00 · 2014-03-04 14:48:15 +01:00 · 2014-03-04 14:48:15 +01:00 · 502f24d7e4
commit 502f24d7e4
parent 52d099dfae
4 changed files with 57 additions and 42 deletions
--- a/src/main/java/org/elasticsearch/percolator/MultiDocumentPercolatorIndex.java
+++ b/src/main/java/org/elasticsearch/percolator/MultiDocumentPercolatorIndex.java
@ -25,6 +25,7 @@ import org.apache.lucene.analysis.TokenStream;
 import org.apache.lucene.index.*;
 import org.apache.lucene.index.memory.MemoryIndex;
 import org.apache.lucene.search.IndexSearcher;
 import org.apache.lucene.util.CloseableThreadLocal;
 import org.elasticsearch.ElasticsearchException;
 import org.elasticsearch.index.engine.Engine;
 import org.elasticsearch.index.mapper.ParseContext;
@ -32,34 +33,51 @@ import org.elasticsearch.index.mapper.ParsedDocument;
 import org.elasticsearch.index.mapper.internal.UidFieldMapper;
 import java.io.IOException;
 import java.util.List;
-
+/**
 * Implementation of {@link PercolatorIndex} that can hold multiple Lucene documents by
 * opening multiple {@link MemoryIndex} based IndexReaders and wrapping them via a single top level reader.
 */
 class MultiDocumentPercolatorIndex implements PercolatorIndex {
-    public MultiDocumentPercolatorIndex() {
+    private final CloseableThreadLocal<MemoryIndex> cache;
    MultiDocumentPercolatorIndex(CloseableThreadLocal<MemoryIndex> cache) {
        this.cache = cache;
    }
    @Override
    public void prepare(PercolateContext context, ParsedDocument parsedDocument) {
        int docCounter = 0;
        IndexReader[] memoryIndices = new IndexReader[parsedDocument.docs().size()];
-        for (ParseContext.Document d : parsedDocument.docs()) {
+        List<ParseContext.Document> docs = parsedDocument.docs();
-            memoryIndices[docCounter] = indexDoc(d, parsedDocument.analyzer()).createSearcher().getIndexReader();
+        int rootDocIndex = docs.size() - 1;
-            docCounter++;
+        assert rootDocIndex > 0;
        MemoryIndex rootDocMemoryIndex = null;
        for (int i = 0; i < docs.size(); i++) {
            ParseContext.Document d = docs.get(i);
            MemoryIndex memoryIndex;
            if (rootDocIndex == i) {
                // the last doc is always the rootDoc, since that is usually the biggest document it make sense
                // to reuse the MemoryIndex it uses
                memoryIndex = rootDocMemoryIndex = cache.get();
            } else {
                memoryIndex = new MemoryIndex(true);
            }
            memoryIndices[i] = indexDoc(d, parsedDocument.analyzer(), memoryIndex).createSearcher().getIndexReader();
        }
        MultiReader mReader = new MultiReader(memoryIndices, true);
        try {
            AtomicReader slowReader = SlowCompositeReaderWrapper.wrap(mReader);
-            DocSearcher docSearcher = new DocSearcher(new IndexSearcher(slowReader));
+            DocSearcher docSearcher = new DocSearcher(new IndexSearcher(slowReader), rootDocMemoryIndex);
            context.initialize(docSearcher, parsedDocument);
        } catch (IOException e) {
            throw new ElasticsearchException("Failed to create index for percolator with nested document ", e);
        }
    }
-    MemoryIndex indexDoc(ParseContext.Document d, Analyzer analyzer) {
+    MemoryIndex indexDoc(ParseContext.Document d, Analyzer analyzer, MemoryIndex memoryIndex) {
        MemoryIndex memoryIndex = new MemoryIndex(true);
        for (IndexableField field : d.getFields()) {
            if (!field.fieldType().indexed() && field.name().equals(UidFieldMapper.NAME)) {
                continue;
@ -76,17 +94,14 @@ class MultiDocumentPercolatorIndex implements PercolatorIndex {
        return memoryIndex;
    }
    @Override
    public void clean() {
        // noop
    }
    private class DocSearcher implements Engine.Searcher {
        private final IndexSearcher searcher;
        private final MemoryIndex rootDocMemoryIndex;
-        private DocSearcher(IndexSearcher searcher) {
+        private DocSearcher(IndexSearcher searcher, MemoryIndex rootDocMemoryIndex) {
            this.searcher = searcher;
            this.rootDocMemoryIndex = rootDocMemoryIndex;
        }
        @Override
@ -108,6 +123,7 @@ class MultiDocumentPercolatorIndex implements PercolatorIndex {
        public boolean release() throws ElasticsearchException {
            try {
                searcher.getIndexReader().close();
                rootDocMemoryIndex.reset();
            } catch (IOException e) {
                throw new ElasticsearchException("failed to close IndexReader in percolator with nested doc", e);
            }
--- a/src/main/java/org/elasticsearch/percolator/PercolatorIndex.java
+++ b/src/main/java/org/elasticsearch/percolator/PercolatorIndex.java
@ -21,7 +21,9 @@ package org.elasticsearch.percolator;
 import org.elasticsearch.index.mapper.ParsedDocument;
-
+/**
 * Abstraction on how to index the percolator document.
 */
 interface PercolatorIndex {
    /**
@ -32,9 +34,4 @@ interface PercolatorIndex {
     * */
    void prepare(PercolateContext context, ParsedDocument document);
    /**
     * Release resources
     * */
    void clean();
 }
--- a/src/main/java/org/elasticsearch/percolator/PercolatorService.java
+++ b/src/main/java/org/elasticsearch/percolator/PercolatorService.java
@ -23,8 +23,11 @@ import com.google.common.collect.ImmutableMap;
 import com.google.common.collect.Lists;
 import org.apache.lucene.index.AtomicReaderContext;
 import org.apache.lucene.index.ReaderUtil;
 import org.apache.lucene.index.memory.ExtendedMemoryIndex;
 import org.apache.lucene.index.memory.MemoryIndex;
 import org.apache.lucene.search.*;
 import org.apache.lucene.util.BytesRef;
 import org.apache.lucene.util.CloseableThreadLocal;
 import org.elasticsearch.ElasticsearchException;
 import org.elasticsearch.ElasticsearchIllegalArgumentException;
 import org.elasticsearch.ElasticsearchParseException;
@ -47,6 +50,8 @@ import org.elasticsearch.common.settings.Settings;
 import org.elasticsearch.common.text.BytesText;
 import org.elasticsearch.common.text.StringText;
 import org.elasticsearch.common.text.Text;
 import org.elasticsearch.common.unit.ByteSizeUnit;
 import org.elasticsearch.common.unit.ByteSizeValue;
 import org.elasticsearch.common.util.BigArrays;
 import org.elasticsearch.common.xcontent.XContentBuilder;
 import org.elasticsearch.common.xcontent.XContentFactory;
@ -114,6 +119,8 @@ public class PercolatorService extends AbstractComponent {
    private final SortParseElement sortParseElement;
    private final ScriptService scriptService;
    private final CloseableThreadLocal<MemoryIndex> cache;
    @Inject
    public PercolatorService(Settings settings, IndicesService indicesService, CacheRecycler cacheRecycler,
                             PageCacheRecycler pageCacheRecycler, BigArrays bigArrays,
@ -131,8 +138,15 @@ public class PercolatorService extends AbstractComponent {
        this.scriptService = scriptService;
        this.sortParseElement = new SortParseElement();
-        single = new SingleDocumentPercolatorIndex(settings);
+        final long maxReuseBytes = settings.getAsBytesSize("indices.memory.memory_index.size_per_thread", new ByteSizeValue(1, ByteSizeUnit.MB)).bytes();
-        multi = new MultiDocumentPercolatorIndex();
+        cache = new CloseableThreadLocal<MemoryIndex>() {
            @Override
            protected MemoryIndex initialValue() {
                return new ExtendedMemoryIndex(true, maxReuseBytes);
            }
        };
        single = new SingleDocumentPercolatorIndex(cache);
        multi = new MultiDocumentPercolatorIndex(cache);
        percolatorTypes = new ByteObjectOpenHashMap<PercolatorType>(6);
        percolatorTypes.put(countPercolator.id(), countPercolator);
@ -385,8 +399,7 @@ public class PercolatorService extends AbstractComponent {
    }
    public void close() {
-        single.clean();
+        cache.close();;
        multi.clean();
    }
    interface PercolatorType {
--- a/src/main/java/org/elasticsearch/percolator/SingleDocumentPercolatorIndex.java
+++ b/src/main/java/org/elasticsearch/percolator/SingleDocumentPercolatorIndex.java
@ -23,32 +23,26 @@ package org.elasticsearch.percolator;
 import org.apache.lucene.analysis.TokenStream;
 import org.apache.lucene.index.IndexReader;
 import org.apache.lucene.index.IndexableField;
 import org.apache.lucene.index.memory.ExtendedMemoryIndex;
 import org.apache.lucene.index.memory.MemoryIndex;
 import org.apache.lucene.search.IndexSearcher;
 import org.apache.lucene.util.CloseableThreadLocal;
 import org.elasticsearch.ElasticsearchException;
 import org.elasticsearch.common.settings.Settings;
 import org.elasticsearch.common.unit.ByteSizeUnit;
 import org.elasticsearch.common.unit.ByteSizeValue;
 import org.elasticsearch.index.engine.Engine;
 import org.elasticsearch.index.mapper.ParsedDocument;
 import org.elasticsearch.index.mapper.internal.UidFieldMapper;
 import java.io.IOException;
 /**
 * Implementation of {@link PercolatorIndex} that can only hold a single Lucene document
 * and is optimized for that
 */
 class SingleDocumentPercolatorIndex implements PercolatorIndex {
    private final CloseableThreadLocal<MemoryIndex> cache;
-    public SingleDocumentPercolatorIndex(Settings settings) {
+    SingleDocumentPercolatorIndex(CloseableThreadLocal<MemoryIndex> cache) {
-        final long maxReuseBytes = settings.getAsBytesSize("indices.memory.memory_index.size_per_thread", new ByteSizeValue(1, ByteSizeUnit.MB)).bytes();
+        this.cache = cache;
        cache = new CloseableThreadLocal<MemoryIndex>() {
            @Override
            protected MemoryIndex initialValue() {
                return new ExtendedMemoryIndex(true, maxReuseBytes);
            }
        };
    }
    @Override
@ -70,11 +64,6 @@ class SingleDocumentPercolatorIndex implements PercolatorIndex {
        context.initialize(new DocEngineSearcher(memoryIndex), parsedDocument);
    }
    @Override
    public void clean() {
        cache.close();
    }
    private class DocEngineSearcher implements Engine.Searcher {
        private final IndexSearcher searcher;