SQL: Use SegmentId instead of DataSegment as set/map keys. (#7796)

Recently we've been talking about using SegmentIds as map keys rather than DataSegments, because its sense of equality is more well-defined. This is a refactor that does this in the druid-sql module, which mostly involves DruidSchema and some related classes. It should have no user-visible effects.
2019-05-30 12:58:36 -07:00 · 2019-05-30 12:58:36 -07:00 · 58a571ccda
parent 8649b8ab4c
commit 58a571ccda
6 changed files with 134 additions and 105 deletions
--- a/core/src/main/java/org/apache/druid/timeline/DataSegment.java
+++ b/core/src/main/java/org/apache/druid/timeline/DataSegment.java
@ -253,7 +253,7 @@ public class DataSegment implements Comparable<DataSegment>

  public SegmentDescriptor toDescriptor()
  {
-    return new SegmentDescriptor(getInterval(), getVersion(), shardSpec.getPartitionNum());
+    return id.toDescriptor();
  }

  public DataSegment withLoadSpec(Map<String, Object> loadSpec)
--- a/core/src/main/java/org/apache/druid/timeline/SegmentId.java
+++ b/core/src/main/java/org/apache/druid/timeline/SegmentId.java
@ -31,6 +31,7 @@ import org.apache.druid.guice.annotations.PublicApi;
 import org.apache.druid.java.util.common.DateTimes;
 import org.apache.druid.java.util.common.IAE;
 import org.apache.druid.java.util.common.Intervals;
+import org.apache.druid.query.SegmentDescriptor;
 import org.apache.druid.timeline.partition.ShardSpec;
 import org.joda.time.Chronology;
 import org.joda.time.DateTime;
@ -338,6 +339,11 @@ public final class SegmentId implements Comparable<SegmentId>
    return of(dataSource, newInterval, version, partitionNum);
  }

+  public SegmentDescriptor toDescriptor()
+  {
+    return new SegmentDescriptor(Intervals.utc(intervalStartMillis, intervalEndMillis), version, partitionNum);
+  }
+
  @Override
  public boolean equals(Object o)
  {
--- a/sql/src/main/java/org/apache/druid/sql/calcite/schema/AvailableSegmentMetadata.java
+++ b/sql/src/main/java/org/apache/druid/sql/calcite/schema/AvailableSegmentMetadata.java
@ -20,7 +20,7 @@
 package org.apache.druid.sql.calcite.schema;

 import org.apache.druid.sql.calcite.table.RowSignature;
-import org.apache.druid.timeline.SegmentId;
+import org.apache.druid.timeline.DataSegment;

 import javax.annotation.Nullable;
 import java.util.Set;
@ -32,20 +32,20 @@ import java.util.Set;
 public class AvailableSegmentMetadata
 {
  public static Builder builder(
-      SegmentId segmentId,
+      DataSegment segment,
      long isRealtime,
      Set<String> segmentServers,
      RowSignature rowSignature,
      long numRows
  )
  {
-    return new Builder(segmentId, isRealtime, segmentServers, rowSignature, numRows);
+    return new Builder(segment, isRealtime, segmentServers, rowSignature, numRows);
  }

  public static Builder from(AvailableSegmentMetadata h)
  {
    return new Builder(
-        h.getSegmentId(),
+        h.getSegment(),
        h.isRealtime(),
        h.getReplicas(),
        h.getRowSignature(),
@ -53,7 +53,7 @@ public class AvailableSegmentMetadata
    );
  }

-  private final SegmentId segmentId;
+  private final DataSegment segment;
  // Booleans represented as long type, where 1 = true and 0 = false
  // to make it easy to count number of segments which are realtime
  private final long isRealtime;
@ -69,7 +69,7 @@ public class AvailableSegmentMetadata
    this.isRealtime = builder.isRealtime;
    this.segmentServers = builder.segmentServers;
    this.numRows = builder.numRows;
-    this.segmentId = builder.segmentId;
+    this.segment = builder.segment;
  }

  public long isRealtime()
@ -77,9 +77,9 @@ public class AvailableSegmentMetadata
    return isRealtime;
  }

-  public SegmentId getSegmentId()
+  public DataSegment getSegment()
  {
-    return segmentId;
+    return segment;
  }

  public Set<String> getReplicas()
@ -105,7 +105,7 @@ public class AvailableSegmentMetadata

  public static class Builder
  {
-    private final SegmentId segmentId;
+    private final DataSegment segment;
    private final long isRealtime;

    private Set<String> segmentServers;
@ -114,14 +114,14 @@ public class AvailableSegmentMetadata
    private long numRows;

    private Builder(
-        SegmentId segmentId,
+        DataSegment segment,
        long isRealtime,
        Set<String> servers,
-        RowSignature rowSignature,
+        @Nullable RowSignature rowSignature,
        long numRows
    )
    {
-      this.segmentId = segmentId;
+      this.segment = segment;
      this.isRealtime = isRealtime;
      this.segmentServers = servers;
      this.rowSignature = rowSignature;
--- a/sql/src/main/java/org/apache/druid/sql/calcite/schema/DruidSchema.java
+++ b/sql/src/main/java/org/apache/druid/sql/calcite/schema/DruidSchema.java
@ -38,6 +38,7 @@ import org.apache.druid.client.ServerView;
 import org.apache.druid.client.TimelineServerView;
 import org.apache.druid.guice.ManageLifecycle;
 import org.apache.druid.java.util.common.DateTimes;
+import org.apache.druid.java.util.common.ISE;
 import org.apache.druid.java.util.common.StringUtils;
 import org.apache.druid.java.util.common.concurrent.Execs;
 import org.apache.druid.java.util.common.concurrent.ScheduledExecutors;
@ -64,6 +65,7 @@ import org.apache.druid.sql.calcite.table.RowSignature;
 import org.apache.druid.sql.calcite.view.DruidViewMacro;
 import org.apache.druid.sql.calcite.view.ViewManager;
 import org.apache.druid.timeline.DataSegment;
+import org.apache.druid.timeline.SegmentId;

 import java.io.IOException;
 import java.util.Comparator;
@ -86,8 +88,8 @@ import java.util.stream.StreamSupport;
 public class DruidSchema extends AbstractSchema
 {
  // Newest segments first, so they override older ones.
-  private static final Comparator<DataSegment> SEGMENT_ORDER = Comparator
-      .comparing((DataSegment segment) -> segment.getInterval().getStart())
+  private static final Comparator<SegmentId> SEGMENT_ORDER = Comparator
+      .comparing((SegmentId segmentId) -> segmentId.getInterval().getStart())
      .reversed()
      .thenComparing(Function.identity());

@ -112,17 +114,17 @@ public class DruidSchema extends AbstractSchema
  // DataSource -> Segment -> AvailableSegmentMetadata(contains RowSignature) for that segment.
  // Use TreeMap for segments so they are merged in deterministic order, from older to newer.
  @GuardedBy("lock")
-  private final Map<String, TreeMap<DataSegment, AvailableSegmentMetadata>> segmentMetadataInfo = new HashMap<>();
+  private final Map<String, TreeMap<SegmentId, AvailableSegmentMetadata>> segmentMetadataInfo = new HashMap<>();
  private int totalSegments = 0;

  // All mutable segments.
-  private final Set<DataSegment> mutableSegments = new TreeSet<>(SEGMENT_ORDER);
+  private final Set<SegmentId> mutableSegments = new TreeSet<>(SEGMENT_ORDER);

  // All dataSources that need tables regenerated.
  private final Set<String> dataSourcesNeedingRebuild = new HashSet<>();

  // All segments that need to be refreshed.
-  private final TreeSet<DataSegment> segmentsNeedingRefresh = new TreeSet<>(SEGMENT_ORDER);
+  private final TreeSet<SegmentId> segmentsNeedingRefresh = new TreeSet<>(SEGMENT_ORDER);

  // Escalator, so we can attach an authentication result to queries we generate.
  private final Escalator escalator;
@ -202,7 +204,7 @@ public class DruidSchema extends AbstractSchema
          {
            try {
              while (!Thread.currentThread().isInterrupted()) {
-                final Set<DataSegment> segmentsToRefresh = new TreeSet<>();
+                final Set<SegmentId> segmentsToRefresh = new TreeSet<>();
                final Set<String> dataSourcesToRebuild = new TreeSet<>();

                try {
@ -251,7 +253,7 @@ public class DruidSchema extends AbstractSchema
                  }

                  // Refresh the segments.
-                  final Set<DataSegment> refreshed = refreshSegments(segmentsToRefresh);
+                  final Set<SegmentId> refreshed = refreshSegments(segmentsToRefresh);

                  synchronized (lock) {
                    // Add missing segments back to the refresh list.
@ -354,26 +356,26 @@ public class DruidSchema extends AbstractSchema
  void addSegment(final DruidServerMetadata server, final DataSegment segment)
  {
    synchronized (lock) {
-      final Map<DataSegment, AvailableSegmentMetadata> knownSegments = segmentMetadataInfo.get(segment.getDataSource());
-      AvailableSegmentMetadata segmentMetadata = knownSegments != null ? knownSegments.get(segment) : null;
+      final Map<SegmentId, AvailableSegmentMetadata> knownSegments = segmentMetadataInfo.get(segment.getDataSource());
+      AvailableSegmentMetadata segmentMetadata = knownSegments != null ? knownSegments.get(segment.getId()) : null;
      if (segmentMetadata == null) {
        // segmentReplicatable is used to determine if segments are served by realtime servers or not
        final long isRealtime = server.segmentReplicatable() ? 0 : 1;

        final Set<String> servers = ImmutableSet.of(server.getName());
        segmentMetadata = AvailableSegmentMetadata.builder(
-            segment.getId(),
+            segment,
            isRealtime,
            servers,
            null,
            DEFAULT_NUM_ROWS
        ).build();
        // Unknown segment.
-        setAvailableSegmentMetadata(segment, segmentMetadata);
-        segmentsNeedingRefresh.add(segment);
+        setAvailableSegmentMetadata(segment.getId(), segmentMetadata);
+        segmentsNeedingRefresh.add(segment.getId());
        if (!server.segmentReplicatable()) {
          log.debug("Added new mutable segment[%s].", segment.getId());
-          mutableSegments.add(segment);
+          mutableSegments.add(segment.getId());
        } else {
          log.debug("Added new immutable segment[%s].", segment.getId());
        }
@ -387,11 +389,11 @@ public class DruidSchema extends AbstractSchema
            .from(segmentMetadata)
            .withReplicas(servers)
            .build();
-        knownSegments.put(segment, metadataWithNumReplicas);
+        knownSegments.put(segment.getId(), metadataWithNumReplicas);
        if (server.segmentReplicatable()) {
          // If a segment shows up on a replicatable (historical) server at any point, then it must be immutable,
          // even if it's also available on non-replicatable (realtime) servers.
-          mutableSegments.remove(segment);
+          mutableSegments.remove(segment.getId());
          log.debug("Segment[%s] has become immutable.", segment.getId());
        }
      }
@ -410,12 +412,12 @@ public class DruidSchema extends AbstractSchema
      log.debug("Segment[%s] is gone.", segment.getId());

      dataSourcesNeedingRebuild.add(segment.getDataSource());
-      segmentsNeedingRefresh.remove(segment);
-      mutableSegments.remove(segment);
+      segmentsNeedingRefresh.remove(segment.getId());
+      mutableSegments.remove(segment.getId());

-      final Map<DataSegment, AvailableSegmentMetadata> dataSourceSegments =
+      final Map<SegmentId, AvailableSegmentMetadata> dataSourceSegments =
          segmentMetadataInfo.get(segment.getDataSource());
-      if (dataSourceSegments.remove(segment) != null) {
+      if (dataSourceSegments.remove(segment.getId()) != null) {
        totalSegments--;
      }

@ -433,8 +435,8 @@ public class DruidSchema extends AbstractSchema
  {
    synchronized (lock) {
      log.debug("Segment[%s] is gone from server[%s]", segment.getId(), server.getName());
-      final Map<DataSegment, AvailableSegmentMetadata> knownSegments = segmentMetadataInfo.get(segment.getDataSource());
-      final AvailableSegmentMetadata segmentMetadata = knownSegments.get(segment);
+      final Map<SegmentId, AvailableSegmentMetadata> knownSegments = segmentMetadataInfo.get(segment.getDataSource());
+      final AvailableSegmentMetadata segmentMetadata = knownSegments.get(segment.getId());
      final Set<String> segmentServers = segmentMetadata.getReplicas();
      final ImmutableSet<String> servers = FluentIterable.from(segmentServers)
                                                         .filter(Predicates.not(Predicates.equalTo(server.getName())))
@ -443,7 +445,7 @@ public class DruidSchema extends AbstractSchema
          .from(segmentMetadata)
          .withReplicas(servers)
          .build();
-      knownSegments.put(segment, metadataWithNumReplicas);
+      knownSegments.put(segment.getId(), metadataWithNumReplicas);
      lock.notifyAll();
    }
  }
@ -453,19 +455,19 @@ public class DruidSchema extends AbstractSchema
   * which may be a subset of the asked-for set.
   */
  @VisibleForTesting
-  Set<DataSegment> refreshSegments(final Set<DataSegment> segments) throws IOException
+  Set<SegmentId> refreshSegments(final Set<SegmentId> segments) throws IOException
  {
-    final Set<DataSegment> retVal = new HashSet<>();
+    final Set<SegmentId> retVal = new HashSet<>();

    // Organize segments by dataSource.
-    final Map<String, TreeSet<DataSegment>> segmentMap = new TreeMap<>();
+    final Map<String, TreeSet<SegmentId>> segmentMap = new TreeMap<>();

-    for (DataSegment segment : segments) {
-      segmentMap.computeIfAbsent(segment.getDataSource(), x -> new TreeSet<>(SEGMENT_ORDER))
-                .add(segment);
+    for (SegmentId segmentId : segments) {
+      segmentMap.computeIfAbsent(segmentId.getDataSource(), x -> new TreeSet<>(SEGMENT_ORDER))
+                .add(segmentId);
    }

-    for (Map.Entry<String, TreeSet<DataSegment>> entry : segmentMap.entrySet()) {
+    for (Map.Entry<String, TreeSet<SegmentId>> entry : segmentMap.entrySet()) {
      final String dataSource = entry.getKey();
      retVal.addAll(refreshSegmentsForDataSource(dataSource, entry.getValue()));
    }
@ -477,17 +479,22 @@ public class DruidSchema extends AbstractSchema
   * Attempt to refresh "segmentSignatures" for a set of segments for a particular dataSource. Returns the set of
   * segments actually refreshed, which may be a subset of the asked-for set.
   */
-  private Set<DataSegment> refreshSegmentsForDataSource(final String dataSource, final Set<DataSegment> segments)
+  private Set<SegmentId> refreshSegmentsForDataSource(final String dataSource, final Set<SegmentId> segments)
      throws IOException
  {
+    if (!segments.stream().allMatch(segmentId -> segmentId.getDataSource().equals(dataSource))) {
+      // Sanity check. We definitely expect this to pass.
+      throw new ISE("'segments' must all match 'dataSource'!");
+    }
+
    log.debug("Refreshing metadata for dataSource[%s].", dataSource);

    final long startTime = System.currentTimeMillis();

-    // Segment id -> segment object.
-    final Map<String, DataSegment> segmentMap = Maps.uniqueIndex(segments, segment -> segment.getId().toString());
+    // Segment id string -> SegmentId object.
+    final Map<String, SegmentId> segmentIdMap = Maps.uniqueIndex(segments, SegmentId::toString);

-    final Set<DataSegment> retVal = new HashSet<>();
+    final Set<SegmentId> retVal = new HashSet<>();
    final Sequence<SegmentAnalysis> sequence = runSegmentMetadataQuery(
        queryLifecycleFactory,
        Iterables.limit(segments, MAX_SEGMENTS_PER_QUERY),
@ -499,24 +506,28 @@ public class DruidSchema extends AbstractSchema
    try {
      while (!yielder.isDone()) {
        final SegmentAnalysis analysis = yielder.get();
-        final DataSegment segment = segmentMap.get(analysis.getId());
+        final SegmentId segmentId = segmentIdMap.get(analysis.getId());

-        if (segment == null) {
+        if (segmentId == null) {
          log.warn("Got analysis for segment[%s] we didn't ask for, ignoring.", analysis.getId());
        } else {
          synchronized (lock) {
            final RowSignature rowSignature = analysisToRowSignature(analysis);
-            log.debug("Segment[%s] has signature[%s].", segment.getId(), rowSignature);
-            final Map<DataSegment, AvailableSegmentMetadata> dataSourceSegments =
-                segmentMetadataInfo.get(segment.getDataSource());
+            log.debug("Segment[%s] has signature[%s].", segmentId, rowSignature);
+            final Map<SegmentId, AvailableSegmentMetadata> dataSourceSegments = segmentMetadataInfo.get(dataSource);
            if (dataSourceSegments == null) {
-              log.warn("No segment map found with datasource[%s], skipping refresh", segment.getDataSource());
+              // Datasource may have been removed or become unavailable while this refresh was ongoing.
+              log.warn(
+                  "No segment map found with datasource[%s], skipping refresh of segment[%s]",
+                  dataSource,
+                  segmentId
+              );
            } else {
-              final AvailableSegmentMetadata segmentMetadata = dataSourceSegments.get(segment);
+              final AvailableSegmentMetadata segmentMetadata = dataSourceSegments.get(segmentId);
              if (segmentMetadata == null) {
                log.warn(
                    "No segment[%s] found, skipping refresh",
-                    segment.getId()
+                    segmentId
                );
              } else {
                final AvailableSegmentMetadata updatedSegmentMetadata = AvailableSegmentMetadata
@ -524,9 +535,9 @@ public class DruidSchema extends AbstractSchema
                    .withRowSignature(rowSignature)
                    .withNumRows(analysis.getNumRows())
                    .build();
-                dataSourceSegments.put(segment, updatedSegmentMetadata);
-                setAvailableSegmentMetadata(segment, updatedSegmentMetadata);
-                retVal.add(segment);
+                dataSourceSegments.put(segmentId, updatedSegmentMetadata);
+                setAvailableSegmentMetadata(segmentId, updatedSegmentMetadata);
+                retVal.add(segmentId);
              }
            }
          }
@ -551,14 +562,14 @@ public class DruidSchema extends AbstractSchema
  }

  @VisibleForTesting
-  void setAvailableSegmentMetadata(final DataSegment segment, final AvailableSegmentMetadata availableSegmentMetadata)
+  void setAvailableSegmentMetadata(final SegmentId segmentId, final AvailableSegmentMetadata availableSegmentMetadata)
  {
    synchronized (lock) {
-      TreeMap<DataSegment, AvailableSegmentMetadata> dataSourceSegments = segmentMetadataInfo.computeIfAbsent(
-          segment.getDataSource(),
+      TreeMap<SegmentId, AvailableSegmentMetadata> dataSourceSegments = segmentMetadataInfo.computeIfAbsent(
+          segmentId.getDataSource(),
          x -> new TreeMap<>(SEGMENT_ORDER)
      );
-      if (dataSourceSegments.put(segment, availableSegmentMetadata) == null) {
+      if (dataSourceSegments.put(segmentId, availableSegmentMetadata) == null) {
        totalSegments++;
      }
    }
@ -567,7 +578,7 @@ public class DruidSchema extends AbstractSchema
  private DruidTable buildDruidTable(final String dataSource)
  {
    synchronized (lock) {
-      final Map<DataSegment, AvailableSegmentMetadata> segmentMap = segmentMetadataInfo.get(dataSource);
+      final Map<SegmentId, AvailableSegmentMetadata> segmentMap = segmentMetadataInfo.get(dataSource);
      final Map<String, ValueType> columnTypes = new TreeMap<>();

      if (segmentMap != null) {
@ -590,19 +601,19 @@ public class DruidSchema extends AbstractSchema

  private static Sequence<SegmentAnalysis> runSegmentMetadataQuery(
      final QueryLifecycleFactory queryLifecycleFactory,
-      final Iterable<DataSegment> segments,
+      final Iterable<SegmentId> segments,
      final AuthenticationResult authenticationResult
  )
  {
    // Sanity check: getOnlyElement of a set, to ensure all segments have the same dataSource.
    final String dataSource = Iterables.getOnlyElement(
        StreamSupport.stream(segments.spliterator(), false)
-                     .map(DataSegment::getDataSource).collect(Collectors.toSet())
+                     .map(SegmentId::getDataSource).collect(Collectors.toSet())
    );

    final MultipleSpecificSegmentSpec querySegmentSpec = new MultipleSpecificSegmentSpec(
        StreamSupport.stream(segments.spliterator(), false)
-                     .map(DataSegment::toDescriptor).collect(Collectors.toList())
+                     .map(SegmentId::toDescriptor).collect(Collectors.toList())
    );

    final SegmentMetadataQuery segmentMetadataQuery = new SegmentMetadataQuery(
@ -643,11 +654,11 @@ public class DruidSchema extends AbstractSchema
    return rowSignatureBuilder.build();
  }

-  Map<DataSegment, AvailableSegmentMetadata> getSegmentMetadata()
+  Map<SegmentId, AvailableSegmentMetadata> getSegmentMetadataSnapshot()
  {
-    final Map<DataSegment, AvailableSegmentMetadata> segmentMetadata = new HashMap<>();
+    final Map<SegmentId, AvailableSegmentMetadata> segmentMetadata = new HashMap<>();
    synchronized (lock) {
-      for (TreeMap<DataSegment, AvailableSegmentMetadata> val : segmentMetadataInfo.values()) {
+      for (TreeMap<SegmentId, AvailableSegmentMetadata> val : segmentMetadataInfo.values()) {
        segmentMetadata.putAll(val);
      }
    }
--- a/sql/src/main/java/org/apache/druid/sql/calcite/schema/SystemSchema.java
+++ b/sql/src/main/java/org/apache/druid/sql/calcite/schema/SystemSchema.java
@ -255,8 +255,9 @@ public class SystemSchema extends AbstractSchema
    public Enumerable<Object[]> scan(DataContext root)
    {
      //get available segments from druidSchema
-      final Map<DataSegment, AvailableSegmentMetadata> availableSegmentMetadata = druidSchema.getSegmentMetadata();
-      final Iterator<Entry<DataSegment, AvailableSegmentMetadata>> availableSegmentEntries =
+      final Map<SegmentId, AvailableSegmentMetadata> availableSegmentMetadata =
+          druidSchema.getSegmentMetadataSnapshot();
+      final Iterator<Entry<SegmentId, AvailableSegmentMetadata>> availableSegmentEntries =
          availableSegmentMetadata.entrySet().iterator();

      // in memory map to store segment data from available segments
@ -265,10 +266,11 @@ public class SystemSchema extends AbstractSchema
      for (AvailableSegmentMetadata h : availableSegmentMetadata.values()) {
        PartialSegmentData partialSegmentData =
            new PartialSegmentData(IS_AVAILABLE_TRUE, h.isRealtime(), h.getNumReplicas(), h.getNumRows());
-        partialSegmentDataMap.put(h.getSegmentId(), partialSegmentData);
+        partialSegmentDataMap.put(h.getSegment().getId(), partialSegmentData);
      }

-      //get published segments from metadata segment cache (if enabled in sql planner config), else directly from coordinator
+      // get published segments from metadata segment cache (if enabled in sql planner config), else directly from
+      // coordinator
      final Iterator<SegmentWithOvershadowedStatus> metadataStoreSegments = metadataView.getPublishedSegments();

      final Set<SegmentId> segmentsAlreadySeen = new HashSet<>();
@ -319,19 +321,19 @@ public class SystemSchema extends AbstractSchema
          ))
          .transform(val -> {
            try {
-              if (segmentsAlreadySeen.contains(val.getKey().getId())) {
+              if (segmentsAlreadySeen.contains(val.getKey())) {
                return null;
              }
-              final PartialSegmentData partialSegmentData = partialSegmentDataMap.get(val.getKey().getId());
+              final PartialSegmentData partialSegmentData = partialSegmentDataMap.get(val.getKey());
              final long numReplicas = partialSegmentData == null ? 0L : partialSegmentData.getNumReplicas();
              return new Object[]{
-                  val.getKey().getId(),
+                  val.getKey(),
                  val.getKey().getDataSource(),
                  val.getKey().getInterval().getStart().toString(),
                  val.getKey().getInterval().getEnd().toString(),
-                  val.getKey().getSize(),
+                  val.getValue().getSegment().getSize(),
                  val.getKey().getVersion(),
-                  Long.valueOf(val.getKey().getShardSpec().getPartitionNum()),
+                  (long) val.getValue().getSegment().getShardSpec().getPartitionNum(),
                  numReplicas,
                  val.getValue().getNumRows(),
                  IS_PUBLISHED_FALSE, // is_published is false for unpublished segments
@ -342,7 +344,7 @@ public class SystemSchema extends AbstractSchema
              };
            }
            catch (JsonProcessingException e) {
-              throw new RE(e, "Error getting segment payload for segment %s", val.getKey().getId());
+              throw new RE(e, "Error getting segment payload for segment %s", val.getKey());
            }
          });

@ -371,18 +373,18 @@ public class SystemSchema extends AbstractSchema
      return authorizedSegments.iterator();
    }

-    private Iterator<Entry<DataSegment, AvailableSegmentMetadata>> getAuthorizedAvailableSegments(
-        Iterator<Entry<DataSegment, AvailableSegmentMetadata>> availableSegmentEntries,
+    private Iterator<Entry<SegmentId, AvailableSegmentMetadata>> getAuthorizedAvailableSegments(
+        Iterator<Entry<SegmentId, AvailableSegmentMetadata>> availableSegmentEntries,
        DataContext root
    )
    {
      final AuthenticationResult authenticationResult =
          (AuthenticationResult) root.get(PlannerContext.DATA_CTX_AUTHENTICATION_RESULT);

-      Function<Entry<DataSegment, AvailableSegmentMetadata>, Iterable<ResourceAction>> raGenerator = segment -> Collections
+      Function<Entry<SegmentId, AvailableSegmentMetadata>, Iterable<ResourceAction>> raGenerator = segment -> Collections
          .singletonList(AuthorizationUtils.DATASOURCE_READ_RA_GENERATOR.apply(segment.getKey().getDataSource()));

-      final Iterable<Entry<DataSegment, AvailableSegmentMetadata>> authorizedSegments =
+      final Iterable<Entry<SegmentId, AvailableSegmentMetadata>> authorizedSegments =
          AuthorizationUtils.filterAuthorizedResources(
              authenticationResult,
              () -> availableSegmentEntries,
--- a/sql/src/test/java/org/apache/druid/sql/calcite/schema/DruidSchemaTest.java
+++ b/sql/src/test/java/org/apache/druid/sql/calcite/schema/DruidSchemaTest.java
@ -52,6 +52,7 @@ import org.apache.druid.sql.calcite.util.SpecificSegmentsQuerySegmentWalker;
 import org.apache.druid.sql.calcite.util.TestServerInventoryView;
 import org.apache.druid.sql.calcite.view.NoopViewManager;
 import org.apache.druid.timeline.DataSegment;
+import org.apache.druid.timeline.SegmentId;
 import org.apache.druid.timeline.partition.LinearShardSpec;
 import org.junit.After;
 import org.junit.AfterClass;
@ -66,7 +67,7 @@ import java.io.File;
 import java.io.IOException;
 import java.util.List;
 import java.util.Map;
-import java.util.Set;
+import java.util.stream.Collectors;

 public class DruidSchemaTest extends CalciteTestBase
 {
@ -254,8 +255,11 @@ public class DruidSchemaTest extends CalciteTestBase
  @Test
  public void testSegmentMetadataHolderNumRows()
  {
-    Map<DataSegment, AvailableSegmentMetadata> segmentsMetadata = schema.getSegmentMetadata();
-    final Set<DataSegment> segments = segmentsMetadata.keySet();
+    Map<SegmentId, AvailableSegmentMetadata> segmentsMetadata = schema.getSegmentMetadataSnapshot();
+    final List<DataSegment> segments = segmentsMetadata.values()
+                                                       .stream()
+                                                       .map(AvailableSegmentMetadata::getSegment)
+                                                       .collect(Collectors.toList());
    Assert.assertEquals(3, segments.size());
    // find the only segment with datasource "foo2"
    final DataSegment existingSegment = segments.stream()
@ -263,16 +267,16 @@ public class DruidSchemaTest extends CalciteTestBase
                                                .findFirst()
                                                .orElse(null);
    Assert.assertNotNull(existingSegment);
-    final AvailableSegmentMetadata existingMetadata = segmentsMetadata.get(existingSegment);
+    final AvailableSegmentMetadata existingMetadata = segmentsMetadata.get(existingSegment.getId());
    // update AvailableSegmentMetadata of existingSegment with numRows=5
    AvailableSegmentMetadata updatedMetadata = AvailableSegmentMetadata.from(existingMetadata).withNumRows(5).build();
-    schema.setAvailableSegmentMetadata(existingSegment, updatedMetadata);
+    schema.setAvailableSegmentMetadata(existingSegment.getId(), updatedMetadata);
    // find a druidServer holding existingSegment
    final Pair<ImmutableDruidServer, DataSegment> pair = druidServers
        .stream()
        .flatMap(druidServer -> druidServer
            .getLazyAllSegments().stream()
-            .filter(segment -> segment.equals(existingSegment))
+            .filter(segment -> segment.getId().equals(existingSegment.getId()))
            .map(segment -> Pair.of(druidServer, segment))
        )
        .findAny()
@ -283,14 +287,14 @@ public class DruidSchemaTest extends CalciteTestBase
    final DruidServerMetadata druidServerMetadata = server.getMetadata();
    // invoke DruidSchema#addSegment on existingSegment
    schema.addSegment(druidServerMetadata, existingSegment);
-    segmentsMetadata = schema.getSegmentMetadata();
+    segmentsMetadata = schema.getSegmentMetadataSnapshot();
    // get the only segment with datasource "foo2"
    final DataSegment currentSegment = segments.stream()
                                               .filter(segment -> segment.getDataSource().equals("foo2"))
                                               .findFirst()
                                               .orElse(null);
-    final AvailableSegmentMetadata currentMetadata = segmentsMetadata.get(currentSegment);
-    Assert.assertEquals(updatedMetadata.getSegmentId(), currentMetadata.getSegmentId());
+    final AvailableSegmentMetadata currentMetadata = segmentsMetadata.get(currentSegment.getId());
+    Assert.assertEquals(updatedMetadata.getSegment().getId(), currentMetadata.getSegment().getId());
    Assert.assertEquals(updatedMetadata.getNumRows(), currentMetadata.getNumRows());
    // numreplicas do not change here since we addSegment with the same server which was serving existingSegment before
    Assert.assertEquals(updatedMetadata.getNumReplicas(), currentMetadata.getNumReplicas());
@ -299,8 +303,11 @@ public class DruidSchemaTest extends CalciteTestBase
  @Test
  public void testNullDatasource() throws IOException
  {
-    Map<DataSegment, AvailableSegmentMetadata> segmentMetadatas = schema.getSegmentMetadata();
-    Set<DataSegment> segments = segmentMetadatas.keySet();
+    final Map<SegmentId, AvailableSegmentMetadata> segmentMetadatas = schema.getSegmentMetadataSnapshot();
+    final List<DataSegment> segments = segmentMetadatas.values()
+                                                       .stream()
+                                                       .map(AvailableSegmentMetadata::getSegment)
+                                                       .collect(Collectors.toList());
    Assert.assertEquals(segments.size(), 3);
    // segments contains two segments with datasource "foo" and one with datasource "foo2"
    // let's remove the only segment with datasource "foo2"
@ -308,31 +315,34 @@ public class DruidSchemaTest extends CalciteTestBase
                                                .filter(segment -> segment.getDataSource().equals("foo2"))
                                                .findFirst()
                                                .orElse(null);
-    Assert.assertFalse(segmentToRemove == null);
+    Assert.assertNotNull(segmentToRemove);
    schema.removeSegment(segmentToRemove);
-    schema.refreshSegments(segments); // can cause NPE without dataSourceSegments null check in DruidSchema#refreshSegmentsForDataSource
-    segmentMetadatas = schema.getSegmentMetadata();
-    segments = segmentMetadatas.keySet();
-    Assert.assertEquals(segments.size(), 2);
+
+    // The following line can cause NPE without segmentMetadata null check in DruidSchema#refreshSegmentsForDataSource
+    schema.refreshSegments(segments.stream().map(DataSegment::getId).collect(Collectors.toSet()));
+    Assert.assertEquals(schema.getSegmentMetadataSnapshot().size(), 2);
  }

  @Test
  public void testNullAvailableSegmentMetadata() throws IOException
  {
-    Map<DataSegment, AvailableSegmentMetadata> segmentMetadatas = schema.getSegmentMetadata();
-    Set<DataSegment> segments = segmentMetadatas.keySet();
+    final Map<SegmentId, AvailableSegmentMetadata> segmentMetadatas = schema.getSegmentMetadataSnapshot();
+    final List<DataSegment> segments = segmentMetadatas.values()
+                                                       .stream()
+                                                       .map(AvailableSegmentMetadata::getSegment)
+                                                       .collect(Collectors.toList());
    Assert.assertEquals(segments.size(), 3);
    // remove one of the segments with datasource "foo"
    final DataSegment segmentToRemove = segments.stream()
                                                .filter(segment -> segment.getDataSource().equals("foo"))
                                                .findFirst()
                                                .orElse(null);
-    Assert.assertFalse(segmentToRemove == null);
+    Assert.assertNotNull(segmentToRemove);
    schema.removeSegment(segmentToRemove);
-    schema.refreshSegments(segments); // can cause NPE without segmentMetadata null check in DruidSchema#refreshSegmentsForDataSource
-    segmentMetadatas = schema.getSegmentMetadata();
-    segments = segmentMetadatas.keySet();
-    Assert.assertEquals(segments.size(), 2);
+
+    // The following line can cause NPE without segmentMetadata null check in DruidSchema#refreshSegmentsForDataSource
+    schema.refreshSegments(segments.stream().map(DataSegment::getId).collect(Collectors.toSet()));
+    Assert.assertEquals(schema.getSegmentMetadataSnapshot().size(), 2);
  }

 }