2020-04-03 05:19:28 -04:00
|
|
|
|
<!-- toc -->
|
|
|
|
|
|
2021-01-12 22:51:04 -05:00
|
|
|
|
<script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script>
|
|
|
|
|
<ins class="adsbygoogle"
|
|
|
|
|
style="display:block; text-align:center;"
|
|
|
|
|
data-ad-layout="in-article"
|
|
|
|
|
data-ad-format="fluid"
|
|
|
|
|
data-ad-client="ca-pub-8828078415045620"
|
|
|
|
|
data-ad-slot="7586680510"></ins>
|
|
|
|
|
<script>
|
|
|
|
|
(adsbygoogle = window.adsbygoogle || []).push({});
|
|
|
|
|
</script>
|
|
|
|
|
|
2020-04-03 05:19:28 -04:00
|
|
|
|
## 进程和服务
|
|
|
|
|
### 进程类型
|
|
|
|
|
|
|
|
|
|
Druid有以下几种进程类型:
|
2020-04-04 09:08:31 -04:00
|
|
|
|
* [Coordinator](./Coordinator.md)
|
|
|
|
|
* [Overlord](./Overlord.md)
|
|
|
|
|
* [Broker](./Broker.md)
|
|
|
|
|
* [Historical](./Historical.md)
|
|
|
|
|
* [MiddleManager](./MiddleManager.md) 和 [Peons](./Peons.md)
|
|
|
|
|
* [Indexer(可选)](./Indexer.md)
|
2021-07-26 11:37:27 -04:00
|
|
|
|
* [Router(可选)](router.md)
|
2020-04-03 05:19:28 -04:00
|
|
|
|
|
|
|
|
|
### 服务类型
|
|
|
|
|
|
|
|
|
|
Druid进程可以按照您喜欢的任何方式部署,但是为了便于部署,我们建议将它们组织成三种服务器类型:
|
|
|
|
|
* **Master**
|
|
|
|
|
* **Query**
|
|
|
|
|
* **Data**
|
|
|
|
|
|
|
|
|
|
![](img/druid-architecture.png)
|
|
|
|
|
|
|
|
|
|
本节描述Druid进程和建议的Master/Query/Data server组织,如上面的架构图所示。
|
|
|
|
|
|
|
|
|
|
#### Master服务
|
|
|
|
|
|
|
|
|
|
Master服务管理数据的摄取和可用性:它负责启动新的摄取作业并协调下面描述的"Data服务"上数据的可用性。
|
|
|
|
|
|
|
|
|
|
在Master服务中,功能分为两个进程:Coordinator和Overlord。
|
|
|
|
|
|
|
|
|
|
**Coordinator进程**
|
|
|
|
|
|
2020-04-04 09:08:31 -04:00
|
|
|
|
[Coordinator](./Coordinator.md) 监视Data服务中的Historical进程,它们负责将数据段分配给特定的服务器,并确保数据段在各个Historical之间保持良好的平衡。
|
2020-04-03 05:19:28 -04:00
|
|
|
|
|
|
|
|
|
**Overlord进程**
|
|
|
|
|
|
2020-04-04 09:08:31 -04:00
|
|
|
|
[Overlord](./Overlord.md) 监视Data服务中的MiddleManager进程,并且是Druid数据接收的控制器。它们负责将接收任务分配给MiddleManager,并协调数据段的发布。
|
2020-04-03 05:19:28 -04:00
|
|
|
|
|
|
|
|
|
#### Query服务
|
|
|
|
|
|
|
|
|
|
Query服务提供用户和客户端应用程序交互,将查询路由到Data服务或其他Query服务(以及可选的代理Master服务请求)。
|
|
|
|
|
|
|
|
|
|
在Query服务中,功能上分为两个进程:Broker和Router。
|
|
|
|
|
|
|
|
|
|
**Broker进程**
|
|
|
|
|
|
2020-04-04 09:08:31 -04:00
|
|
|
|
[Broker](./Broker.md)从外部客户端接收查询并将这些查询转发到Data服务器, 当Broker接收到子查询的结果时,它们会合并这些结果并将其返回给调用者。用户通常查询Broker,而不是直接查询Data服务中的Historical或MiddleManager进程。
|
2020-04-03 05:19:28 -04:00
|
|
|
|
|
|
|
|
|
**Router进程(可选)**
|
|
|
|
|
|
|
|
|
|
Router进程是*可选*的进程,相当于是为Druid Broker、Overlord和Coordinator提供一个统一的API网关。Router是可选的,因为也可以直接与Druid的Broker、Overlord和Coordinator。
|
|
|
|
|
|
2021-07-26 11:37:27 -04:00
|
|
|
|
Router还运行着[Druid控制台](../operations/manageui.md),一个用于数据源、段、任务、数据进程(Historical和MiddleManager)和Coordinator动态配置的管理UI。用户还可以在控制台中运行SQL和本地Druid查询。
|
2020-04-03 05:19:28 -04:00
|
|
|
|
|
|
|
|
|
#### Data服务
|
2020-04-03 22:57:32 -04:00
|
|
|
|
|
|
|
|
|
Data服务执行摄取作业并存储可查询数据。
|
|
|
|
|
|
|
|
|
|
在Data服务中,根据功能被分为两个进程:Historical和MiddleManager。
|
|
|
|
|
|
2020-04-03 05:19:28 -04:00
|
|
|
|
#### Historical进程
|
2020-04-03 22:57:32 -04:00
|
|
|
|
|
2020-04-04 09:08:31 -04:00
|
|
|
|
[Historical](./Historical.md) 进程是处理存储和查询"Historical"数据(包括系统中已提交足够长时间的任何流数据)的工作程序。Historical进程从深层存储下载段并响应有关这些段的查询,他们不接受写操作。
|
2020-04-03 22:57:32 -04:00
|
|
|
|
|
2020-04-03 05:19:28 -04:00
|
|
|
|
#### MiddleManager进程
|
2020-04-03 22:57:32 -04:00
|
|
|
|
|
2020-04-04 09:08:31 -04:00
|
|
|
|
[MiddleManager](./MiddleManager.md) 进程处理将新数据摄取到集群中的操作, 他们负责读取外部数据源并发布新的Druid段。
|
2020-04-03 22:57:32 -04:00
|
|
|
|
|
|
|
|
|
**Peon进程**
|
|
|
|
|
|
2020-04-04 09:08:31 -04:00
|
|
|
|
[Peon](./Peons.md) 进程是由MiddleManagers生成的任务执行引擎。每个Peon运行一个单独的JVM,负责执行一个任务。Peon总是和孕育它们的MiddleManager在同一个主机上运行。
|
2020-04-03 22:57:32 -04:00
|
|
|
|
|
2020-04-03 05:19:28 -04:00
|
|
|
|
#### Indexer进程(可选)
|
2020-04-03 22:57:32 -04:00
|
|
|
|
|
2020-04-04 09:08:31 -04:00
|
|
|
|
[Indexer](./Indexer.md) 进程是MiddleManager和Peon的替代方法。Indexer在单个JVM进程中作为单个线程运行任务,而不是为每个任务派生单独的JVM进程。
|
2020-04-03 22:57:32 -04:00
|
|
|
|
|
2021-07-19 16:14:08 -04:00
|
|
|
|
与MiddleManager + Peon系统相比,Indexer的设计更易于配置和部署,并且能够更好地实现跨任务的资源共享。Indexer是一种较新的功能,由于其内存管理系统仍在开发中,因此目前被指定为[实验性的特性](../development/experimental.md)。它将在Druid的未来版本中继续成熟。
|
2020-04-03 22:57:32 -04:00
|
|
|
|
|
|
|
|
|
通常,您可以部署MiddleManagers或indexer,但不能同时部署两者。
|
|
|
|
|
|
|
|
|
|
### 服务混合部署的利弊
|
|
|
|
|
|
|
|
|
|
Druid进程可以基于上面描述的Master/Data/Query服务组织进行混合部署,这种部署方式通常会使大多数集群更好地利用硬件资源。
|
|
|
|
|
|
|
|
|
|
但是,对于非常大规模的集群,可以分割Druid进程,使它们在单独的服务器上运行,以避免资源争用。
|
|
|
|
|
|
|
|
|
|
本节介绍与进程混合部署相关的指南和配置参数。
|
|
|
|
|
|
2020-04-03 05:19:28 -04:00
|
|
|
|
#### Coordinator和Overlord
|
2020-04-03 22:57:32 -04:00
|
|
|
|
|
|
|
|
|
Coordinator进程的工作负载往往随着集群中段的数量而增加。Overlord的工作量也会根据集群中的分段数而增加,但程度要比Coordinator小。
|
|
|
|
|
|
|
|
|
|
在具有非常大量的段的集群中,可以将Coordinator进程和Overlord进程分开,以便为Coordinator进程的分段平衡工作负载提供更多资源。
|
|
|
|
|
|
|
|
|
|
**统一进程**
|
|
|
|
|
|
|
|
|
|
通过设置 `druid.Coordinator.asOverlord.enabled` 属性,Coordinator进程和Overlord进程可以作为单个组合进程运行。
|
|
|
|
|
|
2020-04-08 01:44:12 -04:00
|
|
|
|
有关详细信息,请参阅[Coordinator配置](../Configuration/configuration.md#Coordinator)。
|
2020-04-03 22:57:32 -04:00
|
|
|
|
|
|
|
|
|
#### Historical和MiddleManager
|
|
|
|
|
|
|
|
|
|
对于更高级别的数据摄取或查询负载,将Historical进程和MiddleManager进程部署在不同的主机上以避免CPU和内存争用。
|
|
|
|
|
|
|
|
|
|
Historical还受益于为**内存映射段**提供可用内存,这也是分别部署Historical和MiddleManager进程的另一个原因。
|