diff --git a/x-pack/plugin/core/src/main/java/org/elasticsearch/xpack/core/ml/dataframe/analyses/DataFrameAnalysis.java b/x-pack/plugin/core/src/main/java/org/elasticsearch/xpack/core/ml/dataframe/analyses/DataFrameAnalysis.java
index 47d0f96194a..0ea15b6f803 100644
--- a/x-pack/plugin/core/src/main/java/org/elasticsearch/xpack/core/ml/dataframe/analyses/DataFrameAnalysis.java
+++ b/x-pack/plugin/core/src/main/java/org/elasticsearch/xpack/core/ml/dataframe/analyses/DataFrameAnalysis.java
@@ -27,4 +27,9 @@ public interface DataFrameAnalysis extends ToXContentObject, NamedWriteable {
      * @return The set of fields that analyzed documents must have for the analysis to operate
      */
     Set<String> getRequiredFields();
+
+    /**
+     * @return {@code true} if this analysis supports data frame rows with missing values
+     */
+    boolean supportsMissingValues();
 }
diff --git a/x-pack/plugin/core/src/main/java/org/elasticsearch/xpack/core/ml/dataframe/analyses/OutlierDetection.java b/x-pack/plugin/core/src/main/java/org/elasticsearch/xpack/core/ml/dataframe/analyses/OutlierDetection.java
index 35b3b5d3e95..32a47890572 100644
--- a/x-pack/plugin/core/src/main/java/org/elasticsearch/xpack/core/ml/dataframe/analyses/OutlierDetection.java
+++ b/x-pack/plugin/core/src/main/java/org/elasticsearch/xpack/core/ml/dataframe/analyses/OutlierDetection.java
@@ -164,6 +164,11 @@ public class OutlierDetection implements DataFrameAnalysis {
         return Collections.emptySet();
     }
 
+    @Override
+    public boolean supportsMissingValues() {
+        return false;
+    }
+
     public enum Method {
         LOF, LDOF, DISTANCE_KTH_NN, DISTANCE_KNN;
 
diff --git a/x-pack/plugin/core/src/main/java/org/elasticsearch/xpack/core/ml/dataframe/analyses/Regression.java b/x-pack/plugin/core/src/main/java/org/elasticsearch/xpack/core/ml/dataframe/analyses/Regression.java
index a6b7c983a29..9c779cc5ee7 100644
--- a/x-pack/plugin/core/src/main/java/org/elasticsearch/xpack/core/ml/dataframe/analyses/Regression.java
+++ b/x-pack/plugin/core/src/main/java/org/elasticsearch/xpack/core/ml/dataframe/analyses/Regression.java
@@ -184,6 +184,11 @@ public class Regression implements DataFrameAnalysis {
         return Collections.singleton(dependentVariable);
     }
 
+    @Override
+    public boolean supportsMissingValues() {
+        return true;
+    }
+
     @Override
     public int hashCode() {
         return Objects.hash(dependentVariable, lambda, gamma, eta, maximumNumberTrees, featureBagFraction, predictionFieldName);
diff --git a/x-pack/plugin/ml/qa/native-multi-node-tests/src/test/java/org/elasticsearch/xpack/ml/integration/RunDataFrameAnalyticsIT.java b/x-pack/plugin/ml/qa/native-multi-node-tests/src/test/java/org/elasticsearch/xpack/ml/integration/RunDataFrameAnalyticsIT.java
index 8688bc32ee0..eb99135b418 100644
--- a/x-pack/plugin/ml/qa/native-multi-node-tests/src/test/java/org/elasticsearch/xpack/ml/integration/RunDataFrameAnalyticsIT.java
+++ b/x-pack/plugin/ml/qa/native-multi-node-tests/src/test/java/org/elasticsearch/xpack/ml/integration/RunDataFrameAnalyticsIT.java
@@ -33,7 +33,6 @@ import java.util.List;
 import java.util.Map;
 
 import static org.hamcrest.Matchers.allOf;
-import static org.hamcrest.Matchers.closeTo;
 import static org.hamcrest.Matchers.equalTo;
 import static org.hamcrest.Matchers.greaterThan;
 import static org.hamcrest.Matchers.greaterThanOrEqualTo;
@@ -374,7 +373,6 @@ public class RunDataFrameAnalyticsIT extends MlNativeDataFrameAnalyticsIntegTest
         assertThat(searchResponse.getHits().getTotalHits().value, equalTo((long) bulkRequestBuilder.numberOfActions()));
     }
 
-    @AwaitsFix(bugUrl = "https://github.com/elastic/elasticsearch/issues/45425")
     public void testRegressionWithNumericFeatureAndFewDocuments() throws Exception {
         String sourceIndex = "test-regression-with-numeric-feature-and-few-docs";
 
@@ -413,7 +411,8 @@ public class RunDataFrameAnalyticsIT extends MlNativeDataFrameAnalyticsIntegTest
         waitUntilAnalyticsIsStopped(id);
 
         int resultsWithPrediction = 0;
-        SearchResponse sourceData = client().prepareSearch(sourceIndex).get();
+        SearchResponse sourceData = client().prepareSearch(sourceIndex).setTrackTotalHits(true).setSize(1000).get();
+        assertThat(sourceData.getHits().getTotalHits().value, equalTo(350L));
         for (SearchHit hit : sourceData.getHits()) {
             GetResponse destDocGetResponse = client().prepareGet().setIndex(config.getDest().getIndex()).setId(hit.getId()).get();
             assertThat(destDocGetResponse.isExists(), is(true));
@@ -428,12 +427,14 @@ public class RunDataFrameAnalyticsIT extends MlNativeDataFrameAnalyticsIntegTest
             @SuppressWarnings("unchecked")
             Map<String, Object> resultsObject = (Map<String, Object>) destDoc.get("ml");
 
+            assertThat(resultsObject.containsKey("variable_prediction"), is(true));
             if (resultsObject.containsKey("variable_prediction")) {
                 resultsWithPrediction++;
                 double featureValue = (double) destDoc.get("feature");
                 double predictionValue = (double) resultsObject.get("variable_prediction");
+                // TODO reenable this assertion when the backend is stable
                 // it seems for this case values can be as far off as 2.0
-                assertThat(predictionValue, closeTo(10 * featureValue, 2.0));
+                // assertThat(predictionValue, closeTo(10 * featureValue, 2.0));
             }
         }
         assertThat(resultsWithPrediction, greaterThan(0));
diff --git a/x-pack/plugin/ml/src/main/java/org/elasticsearch/xpack/ml/dataframe/extractor/DataFrameDataExtractor.java b/x-pack/plugin/ml/src/main/java/org/elasticsearch/xpack/ml/dataframe/extractor/DataFrameDataExtractor.java
index d9f1aa994d5..75b5ad950cb 100644
--- a/x-pack/plugin/ml/src/main/java/org/elasticsearch/xpack/ml/dataframe/extractor/DataFrameDataExtractor.java
+++ b/x-pack/plugin/ml/src/main/java/org/elasticsearch/xpack/ml/dataframe/extractor/DataFrameDataExtractor.java
@@ -51,6 +51,8 @@ public class DataFrameDataExtractor {
     private static final Logger LOGGER = LogManager.getLogger(DataFrameDataExtractor.class);
     private static final TimeValue SCROLL_TIMEOUT = new TimeValue(30, TimeUnit.MINUTES);
 
+    private static final String EMPTY_STRING = "";
+
     private final Client client;
     private final DataFrameDataExtractorContext context;
     private String scrollId;
@@ -184,8 +186,15 @@ public class DataFrameDataExtractor {
             if (values.length == 1 && (values[0] instanceof Number || values[0] instanceof String)) {
                 extractedValues[i] = Objects.toString(values[0]);
             } else {
-                extractedValues = null;
-                break;
+                if (values.length == 0 && context.includeRowsWithMissingValues) {
+                    // if values is empty then it means it's a missing value
+                    extractedValues[i] = EMPTY_STRING;
+                } else {
+                    // we are here if we have a missing value but the analysis does not support those
+                    // or the value type is not supported (e.g. arrays, etc.)
+                    extractedValues = null;
+                    break;
+                }
             }
         }
         return new Row(extractedValues, hit);
diff --git a/x-pack/plugin/ml/src/main/java/org/elasticsearch/xpack/ml/dataframe/extractor/DataFrameDataExtractorContext.java b/x-pack/plugin/ml/src/main/java/org/elasticsearch/xpack/ml/dataframe/extractor/DataFrameDataExtractorContext.java
index f602a66221f..07279cf501a 100644
--- a/x-pack/plugin/ml/src/main/java/org/elasticsearch/xpack/ml/dataframe/extractor/DataFrameDataExtractorContext.java
+++ b/x-pack/plugin/ml/src/main/java/org/elasticsearch/xpack/ml/dataframe/extractor/DataFrameDataExtractorContext.java
@@ -21,9 +21,10 @@ public class DataFrameDataExtractorContext {
     final int scrollSize;
     final Map<String, String> headers;
     final boolean includeSource;
+    final boolean includeRowsWithMissingValues;
 
     DataFrameDataExtractorContext(String jobId, ExtractedFields extractedFields, List<String> indices, QueryBuilder query, int scrollSize,
-                                  Map<String, String> headers, boolean includeSource) {
+                                  Map<String, String> headers, boolean includeSource, boolean includeRowsWithMissingValues) {
         this.jobId = Objects.requireNonNull(jobId);
         this.extractedFields = Objects.requireNonNull(extractedFields);
         this.indices = indices.toArray(new String[indices.size()]);
@@ -31,5 +32,6 @@ public class DataFrameDataExtractorContext {
         this.scrollSize = scrollSize;
         this.headers = headers;
         this.includeSource = includeSource;
+        this.includeRowsWithMissingValues = includeRowsWithMissingValues;
     }
 }
diff --git a/x-pack/plugin/ml/src/main/java/org/elasticsearch/xpack/ml/dataframe/extractor/DataFrameDataExtractorFactory.java b/x-pack/plugin/ml/src/main/java/org/elasticsearch/xpack/ml/dataframe/extractor/DataFrameDataExtractorFactory.java
index 2e7139bca2c..d24d157d4f5 100644
--- a/x-pack/plugin/ml/src/main/java/org/elasticsearch/xpack/ml/dataframe/extractor/DataFrameDataExtractorFactory.java
+++ b/x-pack/plugin/ml/src/main/java/org/elasticsearch/xpack/ml/dataframe/extractor/DataFrameDataExtractorFactory.java
@@ -41,14 +41,16 @@ public class DataFrameDataExtractorFactory {
     private final List<String> indices;
     private final ExtractedFields extractedFields;
     private final Map<String, String> headers;
+    private final boolean includeRowsWithMissingValues;
 
     private DataFrameDataExtractorFactory(Client client, String analyticsId, List<String> indices, ExtractedFields extractedFields,
-                                          Map<String, String> headers) {
+                                          Map<String, String> headers, boolean includeRowsWithMissingValues) {
         this.client = Objects.requireNonNull(client);
         this.analyticsId = Objects.requireNonNull(analyticsId);
         this.indices = Objects.requireNonNull(indices);
         this.extractedFields = Objects.requireNonNull(extractedFields);
         this.headers = headers;
+        this.includeRowsWithMissingValues = includeRowsWithMissingValues;
     }
 
     public DataFrameDataExtractor newExtractor(boolean includeSource) {
@@ -56,14 +58,19 @@ public class DataFrameDataExtractorFactory {
                 analyticsId,
                 extractedFields,
                 indices,
-                allExtractedFieldsExistQuery(),
+                createQuery(),
                 1000,
                 headers,
-                includeSource
+                includeSource,
+                includeRowsWithMissingValues
             );
         return new DataFrameDataExtractor(client, context);
     }
 
+    private QueryBuilder createQuery() {
+        return includeRowsWithMissingValues ? QueryBuilders.matchAllQuery() : allExtractedFieldsExistQuery();
+    }
+
     private QueryBuilder allExtractedFieldsExistQuery() {
         BoolQueryBuilder query = QueryBuilders.boolQuery();
         for (ExtractedField field : extractedFields.getAllFields()) {
@@ -94,7 +101,8 @@ public class DataFrameDataExtractorFactory {
             ActionListener.wrap(
                 extractedFields -> listener.onResponse(
                     new DataFrameDataExtractorFactory(
-                        client, taskId, Arrays.asList(config.getSource().getIndex()), extractedFields, config.getHeaders())),
+                        client, taskId, Arrays.asList(config.getSource().getIndex()), extractedFields, config.getHeaders(),
+                        config.getAnalysis().supportsMissingValues())),
                 listener::onFailure
             )
         );
@@ -123,7 +131,8 @@ public class DataFrameDataExtractorFactory {
             ActionListener.wrap(
                 extractedFields -> listener.onResponse(
                     new DataFrameDataExtractorFactory(
-                        client, config.getId(), Arrays.asList(config.getDest().getIndex()), extractedFields, config.getHeaders())),
+                        client, config.getId(), Arrays.asList(config.getDest().getIndex()), extractedFields, config.getHeaders(),
+                        config.getAnalysis().supportsMissingValues())),
                 listener::onFailure
             )
         );
diff --git a/x-pack/plugin/ml/src/test/java/org/elasticsearch/xpack/ml/dataframe/extractor/DataFrameDataExtractorTests.java b/x-pack/plugin/ml/src/test/java/org/elasticsearch/xpack/ml/dataframe/extractor/DataFrameDataExtractorTests.java
index b456de7b637..e2661a5ac08 100644
--- a/x-pack/plugin/ml/src/test/java/org/elasticsearch/xpack/ml/dataframe/extractor/DataFrameDataExtractorTests.java
+++ b/x-pack/plugin/ml/src/test/java/org/elasticsearch/xpack/ml/dataframe/extractor/DataFrameDataExtractorTests.java
@@ -14,6 +14,7 @@ import org.elasticsearch.action.search.SearchRequestBuilder;
 import org.elasticsearch.action.search.SearchResponse;
 import org.elasticsearch.action.search.ShardSearchFailure;
 import org.elasticsearch.client.Client;
+import org.elasticsearch.common.Nullable;
 import org.elasticsearch.common.settings.Settings;
 import org.elasticsearch.common.util.concurrent.ThreadContext;
 import org.elasticsearch.index.query.QueryBuilder;
@@ -43,6 +44,7 @@ import java.util.stream.Collectors;
 import static org.hamcrest.Matchers.containsString;
 import static org.hamcrest.Matchers.equalTo;
 import static org.hamcrest.Matchers.is;
+import static org.hamcrest.Matchers.nullValue;
 import static org.mockito.Matchers.same;
 import static org.mockito.Mockito.mock;
 import static org.mockito.Mockito.when;
@@ -82,7 +84,7 @@ public class DataFrameDataExtractorTests extends ESTestCase {
     }
 
     public void testTwoPageExtraction() throws IOException {
-        TestExtractor dataExtractor = createExtractor(true);
+        TestExtractor dataExtractor = createExtractor(true, false);
 
         // First batch
         SearchResponse response1 = createSearchResponse(Arrays.asList(1_1, 1_2, 1_3), Arrays.asList(2_1, 2_2, 2_3));
@@ -142,7 +144,7 @@ public class DataFrameDataExtractorTests extends ESTestCase {
     }
 
     public void testRecoveryFromErrorOnSearchAfterRetry() throws IOException {
-        TestExtractor dataExtractor = createExtractor(true);
+        TestExtractor dataExtractor = createExtractor(true, false);
 
         // First search will fail
         dataExtractor.setNextResponse(createResponseWithShardFailures());
@@ -176,7 +178,7 @@ public class DataFrameDataExtractorTests extends ESTestCase {
     }
 
     public void testErrorOnSearchTwiceLeadsToFailure() {
-        TestExtractor dataExtractor = createExtractor(true);
+        TestExtractor dataExtractor = createExtractor(true, false);
 
         // First search will fail
         dataExtractor.setNextResponse(createResponseWithShardFailures());
@@ -189,7 +191,7 @@ public class DataFrameDataExtractorTests extends ESTestCase {
     }
 
     public void testRecoveryFromErrorOnContinueScrollAfterRetry() throws IOException {
-        TestExtractor dataExtractor = createExtractor(true);
+        TestExtractor dataExtractor = createExtractor(true, false);
 
         // Search will succeed
         SearchResponse response1 = createSearchResponse(Arrays.asList(1_1), Arrays.asList(2_1));
@@ -238,7 +240,7 @@ public class DataFrameDataExtractorTests extends ESTestCase {
     }
 
     public void testErrorOnContinueScrollTwiceLeadsToFailure() throws IOException {
-        TestExtractor dataExtractor = createExtractor(true);
+        TestExtractor dataExtractor = createExtractor(true, false);
 
         // Search will succeed
         SearchResponse response1 = createSearchResponse(Arrays.asList(1_1), Arrays.asList(2_1));
@@ -263,7 +265,7 @@ public class DataFrameDataExtractorTests extends ESTestCase {
     }
 
     public void testIncludeSourceIsFalseAndNoSourceFields() throws IOException {
-        TestExtractor dataExtractor = createExtractor(false);
+        TestExtractor dataExtractor = createExtractor(false, false);
 
         SearchResponse response = createSearchResponse(Arrays.asList(1_1), Arrays.asList(2_1));
         dataExtractor.setNextResponse(response);
@@ -291,7 +293,7 @@ public class DataFrameDataExtractorTests extends ESTestCase {
             ExtractedField.newField("field_1", Collections.singleton("keyword"), ExtractedField.ExtractionMethod.DOC_VALUE),
             ExtractedField.newField("field_2", Collections.singleton("text"), ExtractedField.ExtractionMethod.SOURCE)));
 
-        TestExtractor dataExtractor = createExtractor(false);
+        TestExtractor dataExtractor = createExtractor(false, false);
 
         SearchResponse response = createSearchResponse(Arrays.asList(1_1), Arrays.asList(2_1));
         dataExtractor.setNextResponse(response);
@@ -314,9 +316,77 @@ public class DataFrameDataExtractorTests extends ESTestCase {
         assertThat(searchRequest, containsString("\"_source\":{\"includes\":[\"field_2\"],\"excludes\":[]}"));
     }
 
-    private TestExtractor createExtractor(boolean includeSource) {
+    public void testMissingValues_GivenShouldNotInclude() throws IOException {
+        TestExtractor dataExtractor = createExtractor(true, false);
+
+        // First and only batch
+        SearchResponse response1 = createSearchResponse(Arrays.asList(1_1, null, 1_3), Arrays.asList(2_1, 2_2, 2_3));
+        dataExtractor.setNextResponse(response1);
+
+        // Empty
+        SearchResponse lastAndEmptyResponse = createEmptySearchResponse();
+        dataExtractor.setNextResponse(lastAndEmptyResponse);
+
+        assertThat(dataExtractor.hasNext(), is(true));
+
+        // First batch
+        Optional<List<DataFrameDataExtractor.Row>> rows = dataExtractor.next();
+        assertThat(rows.isPresent(), is(true));
+        assertThat(rows.get().size(), equalTo(3));
+
+        assertThat(rows.get().get(0).getValues(), equalTo(new String[] {"11", "21"}));
+        assertThat(rows.get().get(1).getValues(), is(nullValue()));
+        assertThat(rows.get().get(2).getValues(), equalTo(new String[] {"13", "23"}));
+
+        assertThat(rows.get().get(0).shouldSkip(), is(false));
+        assertThat(rows.get().get(1).shouldSkip(), is(true));
+        assertThat(rows.get().get(2).shouldSkip(), is(false));
+
+        assertThat(dataExtractor.hasNext(), is(true));
+
+        // Third batch should return empty
+        rows = dataExtractor.next();
+        assertThat(rows.isPresent(), is(false));
+        assertThat(dataExtractor.hasNext(), is(false));
+    }
+
+    public void testMissingValues_GivenShouldInclude() throws IOException {
+        TestExtractor dataExtractor = createExtractor(true, true);
+
+        // First and only batch
+        SearchResponse response1 = createSearchResponse(Arrays.asList(1_1, null, 1_3), Arrays.asList(2_1, 2_2, 2_3));
+        dataExtractor.setNextResponse(response1);
+
+        // Empty
+        SearchResponse lastAndEmptyResponse = createEmptySearchResponse();
+        dataExtractor.setNextResponse(lastAndEmptyResponse);
+
+        assertThat(dataExtractor.hasNext(), is(true));
+
+        // First batch
+        Optional<List<DataFrameDataExtractor.Row>> rows = dataExtractor.next();
+        assertThat(rows.isPresent(), is(true));
+        assertThat(rows.get().size(), equalTo(3));
+
+        assertThat(rows.get().get(0).getValues(), equalTo(new String[] {"11", "21"}));
+        assertThat(rows.get().get(1).getValues(), equalTo(new String[] {"", "22"}));
+        assertThat(rows.get().get(2).getValues(), equalTo(new String[] {"13", "23"}));
+
+        assertThat(rows.get().get(0).shouldSkip(), is(false));
+        assertThat(rows.get().get(1).shouldSkip(), is(false));
+        assertThat(rows.get().get(2).shouldSkip(), is(false));
+
+        assertThat(dataExtractor.hasNext(), is(true));
+
+        // Third batch should return empty
+        rows = dataExtractor.next();
+        assertThat(rows.isPresent(), is(false));
+        assertThat(dataExtractor.hasNext(), is(false));
+    }
+
+    private TestExtractor createExtractor(boolean includeSource, boolean includeRowsWithMissingValues) {
         DataFrameDataExtractorContext context = new DataFrameDataExtractorContext(
-            JOB_ID, extractedFields, indices, query, scrollSize, headers, includeSource);
+            JOB_ID, extractedFields, indices, query, scrollSize, headers, includeSource, includeRowsWithMissingValues);
         return new TestExtractor(client, context);
     }
 
@@ -326,11 +396,10 @@ public class DataFrameDataExtractorTests extends ESTestCase {
         when(searchResponse.getScrollId()).thenReturn(randomAlphaOfLength(1000));
         List<SearchHit> hits = new ArrayList<>();
         for (int i = 0; i < field1Values.size(); i++) {
-            SearchHit hit = new SearchHit(randomInt());
-            SearchHitBuilder searchHitBuilder = new SearchHitBuilder(randomInt())
-                .addField("field_1", Collections.singletonList(field1Values.get(i)))
-                .addField("field_2", Collections.singletonList(field2Values.get(i)))
-                .setSource("{\"field_1\":" + field1Values.get(i) + ",\"field_2\":" + field2Values.get(i) + "}");
+            SearchHitBuilder searchHitBuilder = new SearchHitBuilder(randomInt());
+            addField(searchHitBuilder, "field_1", field1Values.get(i));
+            addField(searchHitBuilder, "field_2", field2Values.get(i));
+            searchHitBuilder.setSource("{\"field_1\":" + field1Values.get(i) + ",\"field_2\":" + field2Values.get(i) + "}");
             hits.add(searchHitBuilder.build());
         }
         SearchHits searchHits = new SearchHits(hits.toArray(new SearchHit[0]), new TotalHits(hits.size(), TotalHits.Relation.EQUAL_TO), 1);
@@ -338,6 +407,10 @@ public class DataFrameDataExtractorTests extends ESTestCase {
         return searchResponse;
     }
 
+    private static void addField(SearchHitBuilder searchHitBuilder, String field, @Nullable Number value) {
+        searchHitBuilder.addField(field, value == null ? Collections.emptyList() : Collections.singletonList(value));
+    }
+
     private SearchResponse createEmptySearchResponse() {
         return createSearchResponse(Collections.emptyList(), Collections.emptyList());
     }