[ML] Removes direct dependency on Jackson Parser (elastic/x-pack-elasticsearch#810)

* [ML] Removes direct dependency on Jackson Parser The classes that read data from the post data action ready to write to the autodetect process had a direct dependency on Jackson’s `Parser` class. This changes makes those classes depend on XContent instead making them consistent with the way we parse requests and data across Elasticsearch and X-Pack. * Simplify json record reader This commit removes the unnecessary `AbstractJsonRecordReader` and `JsonRecordReader` interfaces/classes. These are not required as we do and should only have one implementation of reading json records. Original commit: elastic/x-pack-elasticsearch@366b8af943
2017-03-23 13:56:32 +00:00 · 2017-03-23 13:56:32 +00:00 · dde0570296
parent 7756067e5d
commit dde0570296
13 changed files with 183 additions and 206 deletions
--- a/plugin/src/main/java/org/elasticsearch/xpack/ml/MachineLearning.java
+++ b/plugin/src/main/java/org/elasticsearch/xpack/ml/MachineLearning.java
@ -123,12 +123,12 @@ import org.elasticsearch.xpack.ml.rest.validate.RestValidateDetectorAction;
 import org.elasticsearch.xpack.ml.rest.validate.RestValidateJobConfigAction;
 import org.elasticsearch.xpack.persistent.CompletionPersistentTaskAction;
 import org.elasticsearch.xpack.persistent.CreatePersistentTaskAction;
 import org.elasticsearch.xpack.persistent.PersistentTasksClusterService;
 import org.elasticsearch.xpack.persistent.PersistentTasksNodeService;
 import org.elasticsearch.xpack.persistent.PersistentTasksExecutorRegistry;
 import org.elasticsearch.xpack.persistent.PersistentTaskRequest;
-import org.elasticsearch.xpack.persistent.PersistentTasksService;
+import org.elasticsearch.xpack.persistent.PersistentTasksClusterService;
 import org.elasticsearch.xpack.persistent.PersistentTasksCustomMetaData;
 import org.elasticsearch.xpack.persistent.PersistentTasksExecutorRegistry;
 import org.elasticsearch.xpack.persistent.PersistentTasksNodeService;
 import org.elasticsearch.xpack.persistent.PersistentTasksService;
 import org.elasticsearch.xpack.persistent.RemovePersistentTaskAction;
 import org.elasticsearch.xpack.persistent.StartPersistentTaskAction;
 import org.elasticsearch.xpack.persistent.UpdatePersistentTaskStatusAction;
@ -295,7 +295,7 @@ public class MachineLearning implements ActionPlugin {
        PersistentTasksService persistentTasksService = new PersistentTasksService(Settings.EMPTY, clusterService, internalClient);
        AutodetectProcessManager autodetectProcessManager = new AutodetectProcessManager(settings, internalClient, threadPool,
                jobManager, jobProvider, jobResultsPersister, jobDataCountsPersister, autodetectProcessFactory,
-                normalizerFactory, persistentTasksService);
+                normalizerFactory, persistentTasksService, xContentRegistry);
        DatafeedJobRunner datafeedJobRunner = new DatafeedJobRunner(threadPool, internalClient, clusterService, jobProvider,
                System::currentTimeMillis, persistentTasksService, auditor);
        InvalidLicenseEnforcer invalidLicenseEnforcer =
--- a/plugin/src/main/java/org/elasticsearch/xpack/ml/job/process/autodetect/AutodetectCommunicator.java
+++ b/plugin/src/main/java/org/elasticsearch/xpack/ml/job/process/autodetect/AutodetectCommunicator.java
@ -11,6 +11,7 @@ import org.elasticsearch.ElasticsearchException;
 import org.elasticsearch.ElasticsearchStatusException;
 import org.elasticsearch.common.CheckedSupplier;
 import org.elasticsearch.common.logging.Loggers;
 import org.elasticsearch.common.xcontent.NamedXContentRegistry;
 import org.elasticsearch.rest.RestStatus;
 import org.elasticsearch.xpack.ml.job.config.DataDescription;
 import org.elasticsearch.xpack.ml.job.config.DetectionRule;
@ -53,15 +54,19 @@ public class AutodetectCommunicator implements Closeable {
    private final Consumer<Exception> handler;
    final AtomicReference<CountDownLatch> inUse = new AtomicReference<>();
    private NamedXContentRegistry xContentRegistry;
-    public AutodetectCommunicator(long taskId, Job job, AutodetectProcess process, DataCountsReporter dataCountsReporter,
+    public AutodetectCommunicator(long taskId, Job job, AutodetectProcess process,
-                                  AutoDetectResultProcessor autoDetectResultProcessor, Consumer<Exception> handler) {
+            DataCountsReporter dataCountsReporter,
            AutoDetectResultProcessor autoDetectResultProcessor, Consumer<Exception> handler,
            NamedXContentRegistry xContentRegistry) {
        this.taskId = taskId;
        this.job = job;
        this.autodetectProcess = process;
        this.dataCountsReporter = dataCountsReporter;
        this.autoDetectResultProcessor = autoDetectResultProcessor;
        this.handler = handler;
        this.xContentRegistry = xContentRegistry;
    }
    public void writeJobInputHeader() throws IOException {
@ -69,8 +74,9 @@ public class AutodetectCommunicator implements Closeable {
    }
    private DataToProcessWriter createProcessWriter(Optional<DataDescription> dataDescription) {
-        return DataToProcessWriterFactory.create(true, autodetectProcess, dataDescription.orElse(job.getDataDescription()),
+        return DataToProcessWriterFactory.create(true, autodetectProcess,
-                job.getAnalysisConfig(), dataCountsReporter);
+                dataDescription.orElse(job.getDataDescription()), job.getAnalysisConfig(),
                dataCountsReporter, xContentRegistry);
    }
    public DataCounts writeToJob(InputStream inputStream, DataLoadParams params) throws IOException {
--- a/plugin/src/main/java/org/elasticsearch/xpack/ml/job/process/autodetect/AutodetectProcessManager.java
+++ b/plugin/src/main/java/org/elasticsearch/xpack/ml/job/process/autodetect/AutodetectProcessManager.java
@ -14,6 +14,7 @@ import org.elasticsearch.common.component.AbstractComponent;
 import org.elasticsearch.common.settings.Setting;
 import org.elasticsearch.common.settings.Settings;
 import org.elasticsearch.common.util.concurrent.EsRejectedExecutionException;
 import org.elasticsearch.common.xcontent.NamedXContentRegistry;
 import org.elasticsearch.rest.RestStatus;
 import org.elasticsearch.threadpool.ThreadPool;
 import org.elasticsearch.xpack.ml.MachineLearning;
@ -80,14 +81,17 @@ public class AutodetectProcessManager extends AbstractComponent {
    private final int maxAllowedRunningJobs;
-    public AutodetectProcessManager(Settings settings, Client client, ThreadPool threadPool, JobManager jobManager,
+    private NamedXContentRegistry xContentRegistry;
-                                    JobProvider jobProvider, JobResultsPersister jobResultsPersister,
+
-                                    JobDataCountsPersister jobDataCountsPersister,
+    public AutodetectProcessManager(Settings settings, Client client, ThreadPool threadPool,
-                                    AutodetectProcessFactory autodetectProcessFactory, NormalizerFactory normalizerFactory,
+            JobManager jobManager, JobProvider jobProvider, JobResultsPersister jobResultsPersister,
-                                    PersistentTasksService persistentTasksService) {
+            JobDataCountsPersister jobDataCountsPersister,
            AutodetectProcessFactory autodetectProcessFactory, NormalizerFactory normalizerFactory,
            PersistentTasksService persistentTasksService, NamedXContentRegistry xContentRegistry) {
        super(settings);
        this.client = client;
        this.threadPool = threadPool;
        this.xContentRegistry = xContentRegistry;
        this.maxAllowedRunningJobs = MAX_RUNNING_JOBS_PER_NODE.get(settings);
        this.autodetectProcessFactory = autodetectProcessFactory;
        this.normalizerFactory = normalizerFactory;
@ -275,7 +279,8 @@ public class AutodetectProcessManager extends AbstractComponent {
                }
                throw e;
            }
-            return new AutodetectCommunicator(taskId, job, process, dataCountsReporter, processor, handler);
+            return new AutodetectCommunicator(taskId, job, process, dataCountsReporter, processor,
                    handler, xContentRegistry);
        }
    }
--- a/plugin/src/main/java/org/elasticsearch/xpack/ml/job/process/autodetect/writer/AbstractJsonRecordReader.java
+++ b/plugin/src/main/java/org/elasticsearch/xpack/ml/job/process/autodetect/writer/AbstractJsonRecordReader.java
@ -1,90 +0,0 @@
 /*
 * Copyright Elasticsearch B.V. and/or licensed to Elasticsearch B.V. under one
 * or more contributor license agreements. Licensed under the Elastic License;
 * you may not use this file except in compliance with the Elastic License.
 */
 package org.elasticsearch.xpack.ml.job.process.autodetect.writer;
 import com.fasterxml.jackson.core.JsonParseException;
 import com.fasterxml.jackson.core.JsonParser;
 import com.fasterxml.jackson.core.JsonToken;
 import org.apache.logging.log4j.Logger;
 import org.elasticsearch.ElasticsearchParseException;
 import java.io.IOException;
 import java.util.Arrays;
 import java.util.Map;
 import java.util.Objects;
 abstract class AbstractJsonRecordReader implements JsonRecordReader {
    static final int PARSE_ERRORS_LIMIT = 100;
    // NORELEASE - Remove direct dependency on Jackson
    protected final JsonParser parser;
    protected final Map<String, Integer> fieldMap;
    protected final Logger logger;
    protected int nestedLevel;
    protected long fieldCount;
    protected int errorCounter;
    /**
     * Create a reader that parses the mapped fields from JSON.
     *
     * @param parser
     *            The JSON parser
     * @param fieldMap
     *            Map to field name to record array index position
     * @param logger
     *            the logger
     */
    AbstractJsonRecordReader(JsonParser parser, Map<String, Integer> fieldMap, Logger logger) {
        this.parser = Objects.requireNonNull(parser);
        this.fieldMap = Objects.requireNonNull(fieldMap);
        this.logger = Objects.requireNonNull(logger);
    }
    protected void initArrays(String[] record, boolean[] gotFields) {
        Arrays.fill(gotFields, false);
        Arrays.fill(record, "");
    }
    /**
     * Returns null at the EOF or the next token
     */
    protected JsonToken tryNextTokenOrReadToEndOnError() throws IOException {
        try {
            return parser.nextToken();
        } catch (JsonParseException e) {
            logger.warn("Attempting to recover from malformed JSON data.", e);
            for (int i = 0; i <= nestedLevel; ++i) {
                readToEndOfObject();
            }
            clearNestedLevel();
        }
        return parser.getCurrentToken();
    }
    protected abstract void clearNestedLevel();
    /**
     * In some cases the parser doesn't recognise the '}' of a badly formed
     * JSON document and so may skip to the end of the second document. In this
     * case we lose an extra record.
     */
    protected void readToEndOfObject() throws IOException {
        JsonToken token = null;
        do {
            try {
                token = parser.nextToken();
            } catch (JsonParseException e) {
                ++errorCounter;
                if (errorCounter >= PARSE_ERRORS_LIMIT) {
                    logger.error("Failed to recover from malformed JSON data.", e);
                    throw new ElasticsearchParseException("The input JSON data is malformed.");
                }
            }
        }
        while (token != JsonToken.END_OBJECT);
    }
 }
--- a/plugin/src/main/java/org/elasticsearch/xpack/ml/job/process/autodetect/writer/DataToProcessWriterFactory.java
+++ b/plugin/src/main/java/org/elasticsearch/xpack/ml/job/process/autodetect/writer/DataToProcessWriterFactory.java
@ -5,16 +5,15 @@
 */
 package org.elasticsearch.xpack.ml.job.process.autodetect.writer;
-import org.apache.logging.log4j.Logger;
+import org.elasticsearch.common.xcontent.NamedXContentRegistry;
 import org.elasticsearch.xpack.ml.job.config.AnalysisConfig;
 import org.elasticsearch.xpack.ml.job.config.DataDescription;
 import org.elasticsearch.xpack.ml.job.process.DataCountsReporter;
 import org.elasticsearch.xpack.ml.job.process.autodetect.AutodetectProcess;
 /**
- * Factory for creating the suitable writer depending on
+ * Factory for creating the suitable writer depending on whether the data format
- * whether the data format is JSON or not, and on the kind
+ * is JSON or not, and on the kind of date transformation that should occur.
 * of date transformation that should occur.
 */
 public final class DataToProcessWriterFactory {
@ -23,22 +22,23 @@ public final class DataToProcessWriterFactory {
    }
    /**
-     * Constructs a {@link DataToProcessWriter} depending on
+     * Constructs a {@link DataToProcessWriter} depending on the data format and
-     * the data format and the time transformation.
+     * the time transformation.
     *
-     * @return A {@link JsonDataToProcessWriter} if the data
+     * @return A {@link JsonDataToProcessWriter} if the data format is JSON or
-     * format is JSON or otherwise a {@link CsvDataToProcessWriter}
+     *         otherwise a {@link CsvDataToProcessWriter}
     */
-    public static DataToProcessWriter create(boolean includeControlField, AutodetectProcess autodetectProcess,
+    public static DataToProcessWriter create(boolean includeControlField,
-                                             DataDescription dataDescription, AnalysisConfig analysisConfig,
+            AutodetectProcess autodetectProcess, DataDescription dataDescription,
-                                             DataCountsReporter dataCountsReporter) {
+            AnalysisConfig analysisConfig, DataCountsReporter dataCountsReporter,
            NamedXContentRegistry xContentRegistry) {
        switch (dataDescription.getFormat()) {
        case JSON:
-            return new JsonDataToProcessWriter(includeControlField, autodetectProcess, dataDescription, analysisConfig,
+            return new JsonDataToProcessWriter(includeControlField, autodetectProcess,
-                    dataCountsReporter);
+                    dataDescription, analysisConfig, dataCountsReporter, xContentRegistry);
        case DELIMITED:
-            return new CsvDataToProcessWriter(includeControlField, autodetectProcess, dataDescription, analysisConfig,
+            return new CsvDataToProcessWriter(includeControlField, autodetectProcess,
-                    dataCountsReporter);
+                    dataDescription, analysisConfig, dataCountsReporter);
        default:
            throw new IllegalArgumentException();
        }
--- a/plugin/src/main/java/org/elasticsearch/xpack/ml/job/process/autodetect/writer/JsonDataToProcessWriter.java
+++ b/plugin/src/main/java/org/elasticsearch/xpack/ml/job/process/autodetect/writer/JsonDataToProcessWriter.java
@ -5,15 +5,17 @@
 */
 package org.elasticsearch.xpack.ml.job.process.autodetect.writer;
 import com.fasterxml.jackson.core.JsonFactory;
 import com.fasterxml.jackson.core.JsonParser;
 import org.apache.logging.log4j.Logger;
 import org.elasticsearch.common.logging.Loggers;
 import org.elasticsearch.common.xcontent.NamedXContentRegistry;
 import org.elasticsearch.common.xcontent.XContentFactory;
 import org.elasticsearch.common.xcontent.XContentParser;
 import org.elasticsearch.common.xcontent.XContentType;
 import org.elasticsearch.xpack.ml.job.config.AnalysisConfig;
 import org.elasticsearch.xpack.ml.job.process.autodetect.state.DataCounts;
 import org.elasticsearch.xpack.ml.job.config.DataDescription;
 import org.elasticsearch.xpack.ml.job.process.autodetect.AutodetectProcess;
 import org.elasticsearch.xpack.ml.job.process.DataCountsReporter;
 import org.elasticsearch.xpack.ml.job.process.autodetect.AutodetectProcess;
 import org.elasticsearch.xpack.ml.job.process.autodetect.state.DataCounts;
 import java.io.IOException;
 import java.io.InputStream;
@ -32,10 +34,14 @@ import java.util.Map;
 class JsonDataToProcessWriter extends AbstractDataToProcessWriter {
    private static final Logger LOGGER = Loggers.getLogger(JsonDataToProcessWriter.class);
    private NamedXContentRegistry xContentRegistry;
-    JsonDataToProcessWriter(boolean includeControlField, AutodetectProcess autodetectProcess, DataDescription dataDescription,
+    JsonDataToProcessWriter(boolean includeControlField, AutodetectProcess autodetectProcess,
-                                   AnalysisConfig analysisConfig, DataCountsReporter dataCountsReporter) {
+            DataDescription dataDescription, AnalysisConfig analysisConfig,
-        super(includeControlField, autodetectProcess, dataDescription, analysisConfig, dataCountsReporter, LOGGER);
+            DataCountsReporter dataCountsReporter, NamedXContentRegistry xContentRegistry) {
        super(includeControlField, autodetectProcess, dataDescription, analysisConfig,
                dataCountsReporter, LOGGER);
        this.xContentRegistry = xContentRegistry;
    }
    /**
@ -49,7 +55,8 @@ class JsonDataToProcessWriter extends AbstractDataToProcessWriter {
    public DataCounts write(InputStream inputStream) throws IOException {
        dataCountsReporter.startNewIncrementalCount();
-        try (JsonParser parser = new JsonFactory().createParser(inputStream)) {
+        try (XContentParser parser = XContentFactory.xContent(XContentType.JSON)
                .createParser(xContentRegistry, inputStream)) {
            writeJson(parser);
            // this line can throw and will be propagated
@ -59,7 +66,7 @@ class JsonDataToProcessWriter extends AbstractDataToProcessWriter {
        return dataCountsReporter.incrementalStats();
    }
-    private void writeJson(JsonParser parser) throws IOException {
+    private void writeJson(XContentParser parser) throws IOException {
        Collection<String> analysisFields = inputFields();
        buildFieldIndexMapping(analysisFields.toArray(new String[0]));
@ -71,7 +78,8 @@ class JsonDataToProcessWriter extends AbstractDataToProcessWriter {
        // We never expect to get the control field
        boolean[] gotFields = new boolean[analysisFields.size()];
-        JsonRecordReader recordReader = new SimpleJsonRecordReader(parser, inFieldIndexes, LOGGER);
+        SimpleJsonRecordReader recordReader = new SimpleJsonRecordReader(parser, inFieldIndexes,
                LOGGER);
        long inputFieldCount = recordReader.read(input, gotFields);
        while (inputFieldCount >= 0) {
            Arrays.fill(record, "");
--- a/plugin/src/main/java/org/elasticsearch/xpack/ml/job/process/autodetect/writer/JsonRecordReader.java
+++ b/plugin/src/main/java/org/elasticsearch/xpack/ml/job/process/autodetect/writer/JsonRecordReader.java
@ -1,25 +0,0 @@
 /*
 * Copyright Elasticsearch B.V. and/or licensed to Elasticsearch B.V. under one
 * or more contributor license agreements. Licensed under the Elastic License;
 * you may not use this file except in compliance with the Elastic License.
 */
 package org.elasticsearch.xpack.ml.job.process.autodetect.writer;
 import java.io.IOException;
 /**
 * Interface for classes that read the various styles of JSON inputIndex.
 */
 interface JsonRecordReader {
    /**
     * Read some JSON and write to the record array.
     *
     * @param record    Read fields are written to this array. This array is first filled with empty
     *                  strings and will never contain a <code>null</code>
     * @param gotFields boolean array each element is true if that field
     *                  was read
     * @return The number of fields in the JSON doc or -1 if nothing was read
     * because the end of the stream was reached
     */
    long read(String[] record, boolean[] gotFields) throws IOException;
 }
--- a/plugin/src/main/java/org/elasticsearch/xpack/ml/job/process/autodetect/writer/SimpleJsonRecordReader.java
+++ b/plugin/src/main/java/org/elasticsearch/xpack/ml/job/process/autodetect/writer/SimpleJsonRecordReader.java
@ -5,17 +5,28 @@
 */
 package org.elasticsearch.xpack.ml.job.process.autodetect.writer;
-import java.io.IOException;
+import com.fasterxml.jackson.core.JsonParseException;
 import java.util.ArrayDeque;
 import java.util.Deque;
 import java.util.Map;
 import org.apache.logging.log4j.Logger;
 import org.elasticsearch.ElasticsearchParseException;
 import org.elasticsearch.common.xcontent.XContentParser;
-import com.fasterxml.jackson.core.JsonParser;
+import java.io.IOException;
-import com.fasterxml.jackson.core.JsonToken;
+import java.util.ArrayDeque;
 import java.util.Arrays;
 import java.util.Deque;
 import java.util.Map;
 import java.util.Objects;
-class SimpleJsonRecordReader extends AbstractJsonRecordReader {
+class SimpleJsonRecordReader {
    static final int PARSE_ERRORS_LIMIT = 100;
    protected final XContentParser parser;
    protected final Map<String, Integer> fieldMap;
    protected final Logger logger;
    protected int nestedLevel;
    protected long fieldCount;
    protected int errorCounter;
    private Deque<String> nestedFields;
    private String nestedPrefix;
@ -29,8 +40,10 @@ class SimpleJsonRecordReader extends AbstractJsonRecordReader {
     * @param logger
     *            logger
     */
-    SimpleJsonRecordReader(JsonParser parser, Map<String, Integer> fieldMap, Logger logger) {
+    SimpleJsonRecordReader(XContentParser parser, Map<String, Integer> fieldMap, Logger logger) {
-        super(parser, fieldMap, logger);
+        this.parser = Objects.requireNonNull(parser);
        this.fieldMap = Objects.requireNonNull(fieldMap);
        this.logger = Objects.requireNonNull(logger);
    }
    /**
@ -50,25 +63,24 @@ class SimpleJsonRecordReader extends AbstractJsonRecordReader {
     * @return The number of fields in the JSON doc or -1 if nothing was read
     * because the end of the stream was reached
     */
    @Override
    public long read(String[] record, boolean[] gotFields) throws IOException {
        initArrays(record, gotFields);
        fieldCount = 0;
        clearNestedLevel();
-        JsonToken token = tryNextTokenOrReadToEndOnError();
+        XContentParser.Token token = tryNextTokenOrReadToEndOnError();
-        while (!(token == JsonToken.END_OBJECT && nestedLevel == 0)) {
+        while (!(token == XContentParser.Token.END_OBJECT && nestedLevel == 0)) {
            if (token == null) {
                break;
            }
-            if (token == JsonToken.END_OBJECT) {
+            if (token == XContentParser.Token.END_OBJECT) {
                --nestedLevel;
                String objectFieldName = nestedFields.pop();
                int lastIndex = nestedPrefix.length() - objectFieldName.length() - 1;
                nestedPrefix = nestedPrefix.substring(0, lastIndex);
-            } else if (token == JsonToken.FIELD_NAME) {
+            } else if (token == XContentParser.Token.FIELD_NAME) {
                parseFieldValuePair(record, gotFields);
            }
@ -82,7 +94,6 @@ class SimpleJsonRecordReader extends AbstractJsonRecordReader {
        return fieldCount;
    }
    @Override
    protected void clearNestedLevel() {
        nestedLevel = 0;
        nestedFields = new ArrayDeque<String>();
@ -90,19 +101,19 @@ class SimpleJsonRecordReader extends AbstractJsonRecordReader {
    }
    private void parseFieldValuePair(String[] record, boolean[] gotFields) throws IOException {
-        String fieldName = parser.getCurrentName();
+        String fieldName = parser.currentName();
-        JsonToken token = tryNextTokenOrReadToEndOnError();
+        XContentParser.Token token = tryNextTokenOrReadToEndOnError();
        if (token == null) {
            return;
        }
-        if (token == JsonToken.START_OBJECT) {
+        if (token == XContentParser.Token.START_OBJECT) {
            ++nestedLevel;
            nestedFields.push(fieldName);
            nestedPrefix = nestedPrefix + fieldName + ".";
        } else {
-            if (token == JsonToken.START_ARRAY || token.isScalarValue()) {
+            if (token == XContentParser.Token.START_ARRAY || token.isValue()) {
                ++fieldCount;
                // Only do the donkey work of converting the field value to a
@ -118,15 +129,15 @@ class SimpleJsonRecordReader extends AbstractJsonRecordReader {
        }
    }
-    private String parseSingleFieldValue(JsonToken token) throws IOException {
+    private String parseSingleFieldValue(XContentParser.Token token) throws IOException {
-        if (token == JsonToken.START_ARRAY) {
+        if (token == XContentParser.Token.START_ARRAY) {
            // Convert any scalar values in the array to a comma delimited
            // string.  (Arrays of more complex objects are ignored.)
            StringBuilder strBuilder = new StringBuilder();
            boolean needComma = false;
-            while (token != JsonToken.END_ARRAY) {
+            while (token != XContentParser.Token.END_ARRAY) {
                token = tryNextTokenOrReadToEndOnError();
-                if (token.isScalarValue()) {
+                if (token.isValue()) {
                    if (needComma) {
                        strBuilder.append(',');
                    } else {
@ -142,16 +153,16 @@ class SimpleJsonRecordReader extends AbstractJsonRecordReader {
        return tokenToString(token);
    }
-    private void skipSingleFieldValue(JsonToken token) throws IOException {
+    private void skipSingleFieldValue(XContentParser.Token token) throws IOException {
        // Scalar values don't need any extra skip code
-        if (token == JsonToken.START_ARRAY) {
+        if (token == XContentParser.Token.START_ARRAY) {
            // Consume the whole array but do nothing with it
            int arrayDepth = 1;
            do {
                token = tryNextTokenOrReadToEndOnError();
-                if (token == JsonToken.END_ARRAY) {
+                if (token == XContentParser.Token.END_ARRAY) {
                    --arrayDepth;
-                } else if (token == JsonToken.START_ARRAY) {
+                } else if (token == XContentParser.Token.START_ARRAY) {
                    ++arrayDepth;
                }
            }
@ -165,10 +176,52 @@ class SimpleJsonRecordReader extends AbstractJsonRecordReader {
     * product treats them (which in turn is shaped by the fact that CSV
     * cannot distinguish empty string and null).
     */
-    private String tokenToString(JsonToken token) throws IOException {
+    private String tokenToString(XContentParser.Token token) throws IOException {
-        if (token == null || token == JsonToken.VALUE_NULL) {
+        if (token == null || token == XContentParser.Token.VALUE_NULL) {
            return "";
        }
-        return parser.getText();
+        return parser.text();
    }
    protected void initArrays(String[] record, boolean[] gotFields) {
        Arrays.fill(gotFields, false);
        Arrays.fill(record, "");
    }
    /**
     * Returns null at the EOF or the next token
     */
    protected XContentParser.Token tryNextTokenOrReadToEndOnError() throws IOException {
        try {
            return parser.nextToken();
        } catch (JsonParseException e) {
            logger.warn("Attempting to recover from malformed JSON data.", e);
            for (int i = 0; i <= nestedLevel; ++i) {
                readToEndOfObject();
            }
            clearNestedLevel();
        }
        return parser.currentToken();
    }
    /**
     * In some cases the parser doesn't recognise the '}' of a badly formed JSON
     * document and so may skip to the end of the second document. In this case
     * we lose an extra record.
     */
    protected void readToEndOfObject() throws IOException {
        XContentParser.Token token = null;
        do {
            try {
                token = parser.nextToken();
            } catch (JsonParseException e) {
                ++errorCounter;
                if (errorCounter >= PARSE_ERRORS_LIMIT) {
                    logger.error("Failed to recover from malformed JSON data.", e);
                    throw new ElasticsearchParseException("The input JSON data is malformed.");
                }
            }
        } while (token != XContentParser.Token.END_OBJECT);
    }
 }
--- a/plugin/src/test/java/org/elasticsearch/xpack/ml/job/process/autodetect/AutodetectCommunicatorTests.java
+++ b/plugin/src/test/java/org/elasticsearch/xpack/ml/job/process/autodetect/AutodetectCommunicatorTests.java
@ -7,6 +7,7 @@ package org.elasticsearch.xpack.ml.job.process.autodetect;
 import org.elasticsearch.ElasticsearchException;
 import org.elasticsearch.ElasticsearchStatusException;
 import org.elasticsearch.common.xcontent.NamedXContentRegistry;
 import org.elasticsearch.test.ESTestCase;
 import org.elasticsearch.xpack.ml.job.config.AnalysisConfig;
 import org.elasticsearch.xpack.ml.job.config.DataDescription;
@ -148,8 +149,9 @@ public class AutodetectCommunicatorTests extends ESTestCase {
            return null;
        }).when(executorService).execute(any(Runnable.class));
        DataCountsReporter dataCountsReporter = mock(DataCountsReporter.class);
-        return new AutodetectCommunicator(0L, createJobDetails(), autodetectProcess, dataCountsReporter, autoDetectResultProcessor,
+        return new AutodetectCommunicator(0L, createJobDetails(), autodetectProcess,
-                e -> {});
+                dataCountsReporter, autoDetectResultProcessor, e -> {
                }, new NamedXContentRegistry(Collections.emptyList()));
    }
    public void testWriteToJobInUse() throws IOException {
--- a/plugin/src/test/java/org/elasticsearch/xpack/ml/job/process/autodetect/AutodetectProcessManagerTests.java
+++ b/plugin/src/test/java/org/elasticsearch/xpack/ml/job/process/autodetect/AutodetectProcessManagerTests.java
@ -11,6 +11,7 @@ import org.elasticsearch.common.CheckedConsumer;
 import org.elasticsearch.common.settings.Settings;
 import org.elasticsearch.common.util.concurrent.EsExecutors;
 import org.elasticsearch.common.util.concurrent.EsRejectedExecutionException;
 import org.elasticsearch.common.xcontent.NamedXContentRegistry;
 import org.elasticsearch.test.ESTestCase;
 import org.elasticsearch.threadpool.ThreadPool;
 import org.elasticsearch.xpack.ml.MachineLearning;
@ -161,7 +162,9 @@ public class AutodetectProcessManagerTests extends ESTestCase {
        Settings.Builder settings = Settings.builder();
        settings.put(AutodetectProcessManager.MAX_RUNNING_JOBS_PER_NODE.getKey(), 3);
        AutodetectProcessManager manager = spy(new AutodetectProcessManager(settings.build(), client, threadPool, jobManager, jobProvider,
-                jobResultsPersister, jobDataCountsPersister, autodetectProcessFactory, normalizerFactory, persistentTasksService));
+                jobResultsPersister, jobDataCountsPersister, autodetectProcessFactory,
                normalizerFactory, persistentTasksService,
                new NamedXContentRegistry(Collections.emptyList())));
        DataCounts dataCounts = new DataCounts("foo");
        ModelSnapshot modelSnapshot = new ModelSnapshot.Builder("foo").build();
@ -323,7 +326,9 @@ public class AutodetectProcessManagerTests extends ESTestCase {
        AutodetectProcess autodetectProcess = mock(AutodetectProcess.class);
        AutodetectProcessFactory autodetectProcessFactory = (j, modelSnapshot, quantiles, filters, i, e) -> autodetectProcess;
        AutodetectProcessManager manager = new AutodetectProcessManager(Settings.EMPTY, client, threadPool, jobManager, jobProvider,
-                jobResultsPersister, jobDataCountsPersister, autodetectProcessFactory, normalizerFactory, persistentTasksService);
+                jobResultsPersister, jobDataCountsPersister, autodetectProcessFactory,
                normalizerFactory, persistentTasksService,
                new NamedXContentRegistry(Collections.emptyList()));
        expectThrows(EsRejectedExecutionException.class,
                () -> manager.create("my_id", 1L, dataCounts, modelSnapshot, quantiles, filters, false, e -> {}));
@ -340,8 +345,10 @@ public class AutodetectProcessManagerTests extends ESTestCase {
                                                   PersistentTasksService persistentTasksService) {
        ThreadPool threadPool = mock(ThreadPool.class);
        AutodetectProcessFactory autodetectProcessFactory = mock(AutodetectProcessFactory.class);
-        AutodetectProcessManager manager = new AutodetectProcessManager(Settings.EMPTY, client, threadPool, jobManager, jobProvider,
+        AutodetectProcessManager manager = new AutodetectProcessManager(Settings.EMPTY, client,
-                jobResultsPersister, jobDataCountsPersister, autodetectProcessFactory, normalizerFactory, persistentTasksService);
+                threadPool, jobManager, jobProvider, jobResultsPersister, jobDataCountsPersister,
                autodetectProcessFactory, normalizerFactory, persistentTasksService,
                new NamedXContentRegistry(Collections.emptyList()));
        manager = spy(manager);
        doReturn(communicator).when(manager)
                .create(any(), anyLong(), eq(dataCounts), eq(modelSnapshot), eq(quantiles), eq(filters), anyBoolean(), any());
--- a/plugin/src/test/java/org/elasticsearch/xpack/ml/job/process/autodetect/writer/DataToProcessWriterFactoryTests.java
+++ b/plugin/src/test/java/org/elasticsearch/xpack/ml/job/process/autodetect/writer/DataToProcessWriterFactoryTests.java
@ -5,6 +5,7 @@
 */
 package org.elasticsearch.xpack.ml.job.process.autodetect.writer;
 import org.elasticsearch.common.xcontent.NamedXContentRegistry;
 import org.elasticsearch.test.ESTestCase;
 import org.elasticsearch.xpack.ml.job.config.AnalysisConfigTests;
 import org.elasticsearch.xpack.ml.job.config.DataDescription;
@ -12,6 +13,8 @@ import org.elasticsearch.xpack.ml.job.config.DataDescription.DataFormat;
 import org.elasticsearch.xpack.ml.job.process.DataCountsReporter;
 import org.elasticsearch.xpack.ml.job.process.autodetect.AutodetectProcess;
 import java.util.Collections;
 import static org.mockito.Mockito.mock;
 public class DataToProcessWriterFactoryTests extends ESTestCase {
@ -30,7 +33,8 @@ public class DataToProcessWriterFactoryTests extends ESTestCase {
    }
    private static DataToProcessWriter createWriter(DataDescription dataDescription) {
-        return DataToProcessWriterFactory.create(true, mock(AutodetectProcess.class), dataDescription,
+        return DataToProcessWriterFactory.create(true, mock(AutodetectProcess.class),
-                AnalysisConfigTests.createRandomized().build(), mock(DataCountsReporter.class));
+                dataDescription, AnalysisConfigTests.createRandomized().build(),
                mock(DataCountsReporter.class), new NamedXContentRegistry(Collections.emptyList()));
    }
 }
--- a/plugin/src/test/java/org/elasticsearch/xpack/ml/job/process/autodetect/writer/JsonDataToProcessWriterTests.java
+++ b/plugin/src/test/java/org/elasticsearch/xpack/ml/job/process/autodetect/writer/JsonDataToProcessWriterTests.java
@ -7,6 +7,7 @@ package org.elasticsearch.xpack.ml.job.process.autodetect.writer;
 import org.elasticsearch.ElasticsearchParseException;
 import org.elasticsearch.common.unit.TimeValue;
 import org.elasticsearch.common.xcontent.NamedXContentRegistry;
 import org.elasticsearch.test.ESTestCase;
 import org.elasticsearch.xpack.ml.job.config.AnalysisConfig;
 import org.elasticsearch.xpack.ml.job.config.DataDescription;
@ -25,6 +26,7 @@ import java.io.InputStream;
 import java.nio.charset.StandardCharsets;
 import java.util.ArrayList;
 import java.util.Arrays;
 import java.util.Collections;
 import java.util.List;
 import static org.mockito.Matchers.any;
@ -283,7 +285,7 @@ public class JsonDataToProcessWriterTests extends ESTestCase {
    private JsonDataToProcessWriter createWriter() {
        return new JsonDataToProcessWriter(true, autodetectProcess, dataDescription.build(), analysisConfig,
-                dataCountsReporter);
+                dataCountsReporter, new NamedXContentRegistry(Collections.emptyList()));
    }
    private void assertWrittenRecordsEqualTo(List<String[]> expectedRecords) {
--- a/plugin/src/test/java/org/elasticsearch/xpack/ml/job/process/autodetect/writer/SimpleJsonRecordReaderTests.java
+++ b/plugin/src/test/java/org/elasticsearch/xpack/ml/job/process/autodetect/writer/SimpleJsonRecordReaderTests.java
@ -5,11 +5,14 @@
 */
 package org.elasticsearch.xpack.ml.job.process.autodetect.writer;
 import com.fasterxml.jackson.core.JsonFactory;
 import com.fasterxml.jackson.core.JsonParseException;
-import com.fasterxml.jackson.core.JsonParser;
+
 import org.apache.logging.log4j.Logger;
 import org.elasticsearch.ElasticsearchParseException;
 import org.elasticsearch.common.xcontent.NamedXContentRegistry;
 import org.elasticsearch.common.xcontent.XContentFactory;
 import org.elasticsearch.common.xcontent.XContentParser;
 import org.elasticsearch.common.xcontent.XContentType;
 import org.elasticsearch.test.ESTestCase;
 import org.elasticsearch.xpack.ml.job.process.CountingInputStream;
 import org.elasticsearch.xpack.ml.job.process.DataCountsReporter;
@ -18,6 +21,7 @@ import java.io.ByteArrayInputStream;
 import java.io.IOException;
 import java.io.InputStream;
 import java.nio.charset.StandardCharsets;
 import java.util.Collections;
 import java.util.HashMap;
 import java.util.Locale;
 import java.util.Map;
@ -27,7 +31,7 @@ import static org.mockito.Mockito.mock;
 public class SimpleJsonRecordReaderTests extends ESTestCase {
    public void testRead() throws JsonParseException, IOException {
        String data = "{\"a\":10, \"b\":20, \"c\":30}\n{\"b\":21, \"a\":11, \"c\":31}\n";
-        JsonParser parser = createParser(data);
+        XContentParser parser = createParser(data);
        Map<String, Integer> fieldMap = createFieldMap();
        SimpleJsonRecordReader reader = new SimpleJsonRecordReader(parser, fieldMap, mock(Logger.class));
@ -51,7 +55,7 @@ public class SimpleJsonRecordReaderTests extends ESTestCase {
    public void testRead_GivenNestedField() throws JsonParseException, IOException {
        String data = "{\"a\":10, \"b\":20, \"c\":{\"d\":30, \"e\":40}}";
-        JsonParser parser = createParser(data);
+        XContentParser parser = createParser(data);
        Map<String, Integer> fieldMap = new HashMap<>();
        fieldMap.put("a", 0);
        fieldMap.put("b", 1);
@ -73,7 +77,7 @@ public class SimpleJsonRecordReaderTests extends ESTestCase {
    public void testRead_GivenSingleValueArrays() throws JsonParseException, IOException {
        String data = "{\"a\":[10], \"b\":20, \"c\":{\"d\":30, \"e\":[40]}}";
-        JsonParser parser = createParser(data);
+        XContentParser parser = createParser(data);
        Map<String, Integer> fieldMap = new HashMap<>();
        fieldMap.put("a", 0);
        fieldMap.put("b", 1);
@ -95,7 +99,7 @@ public class SimpleJsonRecordReaderTests extends ESTestCase {
    public void testRead_GivenMultiValueArrays() throws JsonParseException, IOException {
        String data = "{\"a\":[10, 11], \"b\":20, \"c\":{\"d\":30, \"e\":[40, 50]}, \"f\":[\"a\", \"a\", \"a\", \"a\"], \"g\":20}";
-        JsonParser parser = createParser(data);
+        XContentParser parser = createParser(data);
        Map<String, Integer> fieldMap = new HashMap<>();
        fieldMap.put("a", 0);
        fieldMap.put("g", 1);
@ -123,7 +127,7 @@ public class SimpleJsonRecordReaderTests extends ESTestCase {
    public void testRead_RecoverFromBadJson() throws JsonParseException, IOException {
        // no opening '{'
        String data = "\"a\":10, \"b\":20, \"c\":30}\n{\"b\":21, \"a\":11, \"c\":31}\n{\"c\":32, \"b\":22, \"a\":12}";
-        JsonParser parser = createParser(data);
+        XContentParser parser = createParser(data);
        Map<String, Integer> fieldMap = createFieldMap();
        SimpleJsonRecordReader reader = new SimpleJsonRecordReader(parser, fieldMap, mock(Logger.class));
@ -145,7 +149,7 @@ public class SimpleJsonRecordReaderTests extends ESTestCase {
        // nested object 'd' is missing a ','
        String data = "{\"a\":10, \"b\":20, \"c\":30}\n" +
                "{\"b\":21, \"d\" : {\"ee\": 1 \"ff\":0}, \"a\":11, \"c\":31}";
-        JsonParser parser = createParser(data);
+        XContentParser parser = createParser(data);
        Map<String, Integer> fieldMap = createFieldMap();
        SimpleJsonRecordReader reader = new SimpleJsonRecordReader(parser, fieldMap, mock(Logger.class));
@ -173,7 +177,7 @@ public class SimpleJsonRecordReaderTests extends ESTestCase {
            builder.append(String.format(Locale.ROOT, format, i));
        }
-        JsonParser parser = createParser(builder.toString());
+        XContentParser parser = createParser(builder.toString());
        Map<String, Integer> fieldMap = createFieldMap();
        SimpleJsonRecordReader reader = new SimpleJsonRecordReader(parser, fieldMap, mock(Logger.class));
@ -197,7 +201,7 @@ public class SimpleJsonRecordReaderTests extends ESTestCase {
                + "\n{\"b\":21, \"a\":11, \"c\":31}"
                + "\n{\"c\":32, \"b\":22, \"a\":12}\n";
-        JsonParser parser = createParser(data);
+        XContentParser parser = createParser(data);
        Map<String, Integer> fieldMap = createFieldMap();
        SimpleJsonRecordReader reader = new SimpleJsonRecordReader(parser, fieldMap, mock(Logger.class));
@ -210,10 +214,11 @@ public class SimpleJsonRecordReaderTests extends ESTestCase {
        assertEquals(3, reader.read(record, gotFields));
    }
-    private JsonParser createParser(String input) throws JsonParseException, IOException {
+    private XContentParser createParser(String input) throws JsonParseException, IOException {
        ByteArrayInputStream inputStream = new ByteArrayInputStream(input.getBytes(StandardCharsets.UTF_8));
        InputStream inputStream2 = new CountingInputStream(inputStream, mock(DataCountsReporter.class));
-        return new JsonFactory().createParser(inputStream2);
+        return XContentFactory.xContent(XContentType.JSON)
                .createParser(new NamedXContentRegistry(Collections.emptyList()), inputStream2);
    }
    private Map<String, Integer> createFieldMap() {