Apache Drill

来自开放百科 - 灰狐
2018年9月27日 (四) 07:16Allen (讨论 | 贡献)的版本

跳转到: 导航, 搜索

Apache Drill:一个开源(Apache V2)的 Apache HadoopNoSQL SQL 查询引擎。

目录

简介

实际上,Apache Drill 是 Google Dremel 的开源实现,本质是一个分布式的MPP查询层,支持SQL及一些用于NoSQL和Hadoop数据存储系统上的语言,将有助于Hadoop用户实现更快查询海量数据集的目的。

Drill的目的在于支持更广泛的数据源、数据格式及查询语言,可以通过对PB字节数据的快速扫描(大约几秒内)完成相关分析,将是一个专为互动分析大型数据集的分布式系统。

功能

指南

SELECT * FROM dfs.root.`/web/logs`;
SELECT country, count(*)
  FROM mongodb.web.users
  GROUP BY country;
SELECT timestamp
  FROM s3.root.`clicks.json`
  WHERE user_id = 'jdoe';

用户

图集

链接

分享您的观点
个人工具
名字空间

变换
操作
导航
工具箱