oracle - 在Hadoop over Oracle上使用表上的索引是否有任何优势？

在Hadoop over Oracle上使用表上的索引是否有任何优势？

时间：2016-12-27 08:53:59

标签： oracle apache hadoop indexing hive

我需要比较Oracle Vs Hadoop（Hive）中的索引。到目前为止，我可以在Hive中找到两种主要的索引技术，即COMPACT INDEXING和BITMAP INDEXING。与Oracle相比，我可以查看Hive中COMPACT INDEXING的性能差异。我需要了解在Hive中使用Bitmap Indexing的更多用例/场景。此外，需要知道Hive是否支持像Oracle这样的反向键索引，升序和降序索引。

2 个答案:

答案 0 :(得分：1)

是他们在HIVE中使用指数的显着优势 oracle，请记住，HIVE适用于大型数据集和然而，他们正在将HIVE作为实时数据的发展仓储工具。
可以使用BITMAP索引的一个用例是table with table 列具有不同的值，显然它应该是一个大的 table（如果表很大，你会得到更好的结果，不要测试小桌子。）
截至目前，HIVE仅支持两种索引技术COMPACT和 BITMAP用于显式创建索引。
不建议使用Hive中的索引（尽管您可以创建为根据您的用例），原因是ORC Format。
ORC格式构建了索引，允许格式跳过块在读取数据时，它们还支持Bloom过滤器索引。一起这几乎复制了Hive Indexes所做的事情并且他们这样做了自动处于数据格式而无需管理外部表（基本上是索引中发生的事情）。
我建议你宁愿花时间正确设置 ORC表。

还阅读了关于hive indexing。

答案 1 :(得分：0)

hive是在hadoop上运行的数据仓库工具。内置它具有用于配置单元查询的mapreduce容量。元数据和actula数据分离并存储在apache derby中。所以数据库的负担非常小。由于分配性，hive很容易处理大表。你也可以比较oracle和hive的内连接性能。蜂巢将永远为您提供更好的表现。