我需要多少数据才能使用Presto?

时间:2013-11-06 18:23:50

标签: bigdata presto

我需要多少数据才能使用Presto?该网站声明它可以查询从千兆字节到千兆字节的数据大小。我理解它是如何用于查询非常大的数据集的,但是有人使用它来获得数百GB的数据集吗?

2 个答案:

答案 0 :(得分:6)

目前,如果您已经安装了Hive,Presto最有用。如果你正在使用Hive,你一定要尝试Presto。如果您的所有数据都适合在一台机器上的PostgreSQL或MySQL等关系数据库中,并且您对性能感到满意,那么继续使用它。

但是,对于分析查询,Presto应该比单个计算机上的任何一个数据库快得多,因为它并行执行查询。这些数据库都没有并行执行单个查询。目前,使用Presto需要设置HDFS和Hive(即使在一台机器上),因此与已有Hive安装相比,入门将会更多。

答案 1 :(得分:0)

或者,您可以查看Impala - 已作为生产就绪软件提供六个月。与Presto一样,Impala是一种分布式SQL查询引擎,用于HDFS中的数据,可以绕过MapReduce。与Presto不同,有一家商业供应商提供支持(Cloudera)。

尽管如此,David对数据大小的评论仍然适用。使用正确的工具完成工作。

相关问题