Apache Impala

2018年9月27日 (四) 07:23的最后版本

Apache Implal: Real-time Query for Apache Hadoop，是一个基于Hadoop的数据仓库解决方案。

Impala是由Cloudera开发，一个开源的Massively Parallel Processing（MPP）查询引擎。与Apache Hive相同的元数据、SQL语法、ODBC驱动程序和用户接口(Hue Beeswax)，可以直接在HDFS或HBase上提供快速、交互式SQL查询。

Impala是在Google Dremel的启发下开发的。

Impala不再使用缓慢的Hive+MapReduce批处理，而是通过与商用并行关系数据库中类似的分布式查询引擎（由Query Planner、Query Coordinator和Query Exec Engine三部分组成），可以直接从HDFS或者HBase中用SELECT、JOIN和统计函数查询数据，从而大大降低了延迟。

[编辑] 文档

The Impala Cookbook

[编辑] 图集

架构

[编辑] 链接

@@ 第1行： / 第1行： @@
+Apache Implal: Real-time Query for [[Apache Hadoop]]，是一个基于Hadoop的[[data warehouse|数据仓库]]解决方案。
 Impala是由[[Cloudera]]开发，一个开源的Massively Parallel Processing（MPP）查询引擎 。与[[Apache Hive]]相同的元数据、SQL语法、ODBC驱动程序和用户接口(Hue Beeswax)，可以直接在HDFS或HBase上提供快速、交互式SQL查询。
@@ 第4行： / 第6行： @@
 Impala不再使用缓慢的Hive+MapReduce批处理，而是通过与商用并行关系数据库中类似的分布式查询引擎（由Query Planner、Query Coordinator和Query Exec Engine三部分组成），可以直接从HDFS或者HBase中用SELECT、JOIN和统计函数查询数据，从而大大降低了延迟。
+==文档==
+*[http://docs.huihoo.com/cloudera/The-Impala-Cookbook.pdf The Impala Cookbook]
 ==图集==
@@ 第13行： / 第18行： @@
 *[http://impala.io/ Impala官网]
 *[https://github.com/cloudera/impala Impala @ GitHub]
+*[http://blog.cloudera.com/blog/2012/10/cloudera-impala-real-time-queries-in-apache-hadoop-for-real/ Cloudera Impala: Real-Time Queries in Apache Hadoop, For Real]
+*[http://blog.cloudera.com/blog/2016/05/how-to-build-a-prediction-engine-using-spark-kudu-and-impala/ Build a Prediction Engine using Spark, Kudu, and Impala]
 [[category:big data]]
 [[category:hadoop]]
+[[category:data warehouse]]
 [[category:cloudera]]
+[[category:c++]]
+[[category:apache]]

Apache Impala

2018年9月27日 (四) 07:23的最后版本

[编辑] 文档

[编辑] 图集

[编辑] 链接

个人工具

名字空间

变换

查看

操作

搜索

导航

工具箱