druid native query

This commit is contained in:
liujianhuan 2020-06-30 16:00:46 +08:00
parent de9d2ace8d
commit 6af455cfea
5 changed files with 104 additions and 1 deletions

View File

@ -0,0 +1 @@
<!-- toc -->

View File

@ -1,4 +1,100 @@
<!-- toc -->
## 原生查询
> [!WARNING]
> Apache Druid支持两种查询语言[Druid SQL](druidsql.md) 和 [原生查询](#)该文档描述原生查询语言。有关Druid SQL如何选择运行SQL查询时要使用的原生查询类型的信息请查看 [SQL文档](druidsql.md)。
Druid中的原生查询是JSON对象通常发送给Broker或Router进程。查询可以这样发布
```bash
curl -X POST '<queryable_host>:<port>/druid/v2/?pretty' -H 'Content-Type:application/json' -H 'Accept:application/json' -d @<query_json_file>
```
Druid的原生查询语言是JSON over HTTP尽管社区的许多成员已经用其他语言提供了不同的 [客户端库](https://druid.apache.org/libraries.html) 来查询Druid。
Content-Type/Accept Header也可以采用"application/x-jackson-smile":
```bash
curl -X POST '<queryable_host>:<port>/druid/v2/?pretty' -H 'Content-Type:application/json' -H 'Accept:application/x-jackson-smile' -d @<query_json_file>
```
注意如果未提供Accept header则默认为"Content Type" header的值。
Druid的原生查询级别相对较低与内部执行计算的方式密切相关。Druid查询被设计成轻量级的并且非常快速地完成。这意味着对于更复杂的分析或者构建更复杂的可视化可能需要多个Druid查询。
即使查询通常是向Broker或Router发出的但是它们也可以被 [Historical进程](../Design/Historical.md) 和运行流摄取任务的 [peon(任务jvm)](../Design/Peons.md) 接受。如果您想查询由特定进程提供服务的特定段的结果,这可能很有价值。
### 可用的查询
Druid有许多不同场景的查询类型。查询由各种JSON属性组成Druid针对不同的场景有不同类型的查询。各种查询类型的文档描述了可以设置的所有JSON属性。
#### 聚合查询
* [Timeseries](timeseriesquery.md)
* [TopN](topn.md)
* [GroupBy](groupby.md)
#### 元数据查询
* [TimeBoundary](timeboundaryquery.md)
* [SegmentMetadata](segmentMetadata.md)
* [DatasourceMetadata](datasourcemetadataquery.md)
#### 其他查询
* [Scan](scan.md)
* [Search](searchquery.md)
### 应该使用哪种类型的查询
对于聚合查询如果有多个查询可以满足您的需求我们通常建议尽可能使用Timeseries或TopN因为Druid针对它们的场景做了专门优化的。如果两者都不适合则应该使用GroupBy查询这是最灵活的。
### 查询取消
可以使用查询的唯一标识符显式地取消查询。如果查询标识符是在查询时设置的或者是已知的那么可以在Broker或Router上使用以下接口来取消查询。
```
DELETE /druid/v2/{queryId}
```
例如如果查询ID是 `abc123`, 查询可以如下取消:
```bash
curl -X DELETE "http://host:port/druid/v2/abc123"
```
### 查询错误
如果查询失败您将得到一个HTTP 500响应其中包含具有以下结构的JSON对象
```json
{
"error" : "Query timeout",
"errorMessage" : "Timeout waiting for task.",
"errorClass" : "java.util.concurrent.TimeoutException",
"host" : "druid1.example.com:8083"
}
```
如果查询请求由于受到 [query scheduler laning configuration](../Configuration/configuration.md#broker) 的限制而失败则为HTTP 429响应该响应具有与错误响应相同的JSON对象架构`errorMessage` 格式为:"Total query capacity exceeded"或"query capacity exceeded for lane 'low'"。
响应中的字段是:
| 字段 | 描述 |
|-|-|
| `error` | 定义明确的错误代码(如下表格)|
| `errorMessage` | 包含有关错误的详细信息的自由格式消息。可能为空。 |
| `errorClass` | 导致此错误的异常的类。可能为空。|
| `host` | 发生此错误的主机。可能为空。 |
可能的错误码字段如下:
| 错误码 | 描述 |
|-|-|
| `Query timeout` | 查询超时 |
| `Query interrupted` | 查询被中断可能是因为JVM关闭 |
| `Query cancelled` | 查询通过"查询取消API"取消 |
| `Resource limit exceeded` | 查询超出了配置的资源限制例如groupBy maxResults |
| `Unauthorized request` | 由于安全策略,查询被拒绝。用户已被识别,但未识别出用户的访问权限。 |
| `Unsupported operation` | 查询试图执行不受支持的操作。当使用未记录的功能或使用未完全实现的扩展时,可能会发生这种情况 |
| `Unknown exception` | 发生了其他异常。请检查errorMessage和errorClass以获取详细信息但请记住这些字段的内容是自由格式的并且可能会随着版本的不同而变化 |

1
Querying/searchquery.md Normal file
View File

@ -0,0 +1 @@
<!-- toc -->

View File

@ -0,0 +1 @@
<!-- toc -->

View File

@ -68,6 +68,10 @@
* [TopN](Querying/topn.md)
* [GroupBy](Querying/groupby.md)
* [Scan](Querying/scan.md)
* [Search](Querying/searchquery.md)
* [TimeBoundary](Querying/timeboundaryquery.md)
* [SegmentMetadata](Querying/segmentMetadata.md)
* [DatasourceMetadata](Querying/datasourcemetadataquery.md)
* [原生查询组件](Querying/filters.md)
* [过滤](Querying/filters.md)
* [聚合](Querying/Aggregations.md)