mirror of https://github.com/apache/druid.git synced 2025-02-08 02:58:30 +00:00

History

Add sampling factor for DeterminePartitionsJob (#13840 )

There are two type of DeterminePartitionsJob:
-  When the input data is not assume grouped, there may be duplicate rows.
In this case, two MR jobs are launched. The first one do group job to remove duplicate rows.
And a second one to perform global sorting to find lower and upper bound for target segments.
- When the input data is assume grouped, we only need to launch the global sorting
MR job to find lower and upper bound for segments.

Sampling strategy:
- If the input data is assume grouped, sample by random at the mapper side of the global sort mr job.
- If the input data is not assume grouped, sample at the mapper of the group job. Use hash on time
and all dimensions and mod by sampling factor to sample, don't use random method because there
may be duplicate rows.

2023-08-11 10:42:25 +05:30

aliyun-oss-extensions

Prepare master branch for next release, 28.0.0 (#14595 )

2023-07-18 09:22:30 +05:30

ambari-metrics-emitter

Prepare master branch for next release, 28.0.0 (#14595 )

2023-07-18 09:22:30 +05:30

cassandra-storage

Prepare master branch for next release, 28.0.0 (#14595 )

2023-07-18 09:22:30 +05:30

cloudfiles-extensions

Bump jclouds.version from 1.9.1 to 2.0.3 (#14746 )

2023-08-10 06:24:01 -07:00

compressed-bigdecimal

Upgrade jackson-databind to 2.12.7 (#14770 )

2023-08-09 12:22:16 +05:30

distinctcount

Minimize PostAggregator computations (#14708 )

2023-08-04 00:04:31 +05:30

dropwizard-emitter

Prepare master branch for next release, 28.0.0 (#14595 )

2023-07-18 09:22:30 +05:30

druid-iceberg-extensions

Clean up the core API required for Iceberg extension (#14614 )

2023-07-21 13:01:33 +05:30

gce-extensions

Prepare master branch for next release, 28.0.0 (#14595 )

2023-07-18 09:22:30 +05:30

graphite-emitter

Prepare master branch for next release, 28.0.0 (#14595 )

2023-07-18 09:22:30 +05:30

influx-extensions

Prepare master branch for next release, 28.0.0 (#14595 )

2023-07-18 09:22:30 +05:30

influxdb-emitter

Prepare master branch for next release, 28.0.0 (#14595 )

2023-07-18 09:22:30 +05:30

kafka-emitter

Upgrade jackson-databind to 2.12.7 (#14770 )

2023-08-09 12:22:16 +05:30

kubernetes-overlord-extensions

Add lifecycle hooks to KubernetesTaskRunner (#14790 )

2023-08-09 21:16:44 -07:00

materialized-view-maintenance

Add sampling factor for DeterminePartitionsJob (#13840 )

2023-08-11 10:42:25 +05:30

materialized-view-selection

Prepare master branch for next release, 28.0.0 (#14595 )

2023-07-18 09:22:30 +05:30

momentsketch

Prepare master branch for next release, 28.0.0 (#14595 )

2023-07-18 09:22:30 +05:30

moving-average-query

Prepare master branch for next release, 28.0.0 (#14595 )

2023-07-18 09:22:30 +05:30

opentelemetry-emitter

Prepare master branch for next release, 28.0.0 (#14595 )

2023-07-18 09:22:30 +05:30

opentsdb-emitter

Prepare master branch for next release, 28.0.0 (#14595 )

2023-07-18 09:22:30 +05:30

prometheus-emitter

Prepare master branch for next release, 28.0.0 (#14595 )

2023-07-18 09:22:30 +05:30

redis-cache

Prepare master branch for next release, 28.0.0 (#14595 )

2023-07-18 09:22:30 +05:30

sqlserver-metadata-storage

Prepare master branch for next release, 28.0.0 (#14595 )

2023-07-18 09:22:30 +05:30

statsd-emitter

Add stats to KillUnusedSegments coordinator duty (#14782 )

2023-08-10 18:36:53 -04:00

tdigestsketch

add equality, null, and range filter (#14542 )

2023-07-18 12:15:22 -07:00

thrift-extensions

Removes support for Hadoop 2 (#14763 )

2023-08-09 17:47:52 +05:30

time-min-max

Prepare master branch for next release, 28.0.0 (#14595 )

2023-07-18 09:22:30 +05:30

virtual-columns

Minimize PostAggregator computations (#14708 )

2023-08-04 00:04:31 +05:30

README.md

fix broken links (#9537 )

2020-03-22 17:41:18 -07:00

README.md

Community Extensions

Please contribute all community extensions in this directory and include a doc of how your extension can be used under docs/development/extensions-contrib/.

Please note that community extensions are maintained by their original contributors and are not packaged with the core Druid distribution. If you'd like to take on maintenance for a community extension, please post on dev@druid.apache.org to let us know!