【IT168 资讯】近期人气颇高的Cloudera公司在Strata大会上发布了实时SQL查询引擎Impala,一时间引起了业界的广泛关注。Impala将同之前的的MapReduce一起成为Cloudera Hadoop的原生数据处理方式。对此,著名分析师Curt Monash也发表了他的看法,Monash认为Impala将成为Hadoop转向分析型数据库的重要工具,它与Hive之间的异同点包括:
·Impala的查询语言(HQL,相当于SQL)、元数据以及JDBC/ODBC驱动等都与Hive兼容;
·Impala无需通过Hadoop MapReduce使用,这点与Hive有所不同;
·同MapReduce+Hive方式相比,Impala不会将中间结果存储到磁盘,能够显著提升性能。但对于运行时间较长的查询则存在单点故障的风险,一旦出现故障将需要重新运行查询;
·在Impala的第一版中将不包含部分Hive语法,如对UDF的支持。
总体来说,虽然Impala同Hadapt相比还略显不成熟,但是它还是有很多优势:
·它是免费的
·它的可管理性更好
·它针对一些环境的性能是非常好的
Cloudera公司已经开放了Impala的源代码,用户可以通过Github下载。
原文链接:http://www.searchdatabase.com.cn/showcontent_67034.htm