在Hadoop over Oracle上使用表上的索引是否有任何优势?

时间:2016-12-27 08:53:59

标签: oracle apache hadoop indexing hive

我需要比较Oracle Vs Hadoop(Hive)中的索引。到目前为止,我可以在Hive中找到两种主要的索引技术,即COMPACT INDEXING和BITMAP INDEXING。与Oracle相比,我可以查看Hive中COMPACT INDEXING的性能差异。我需要了解在Hive中使用Bitmap Indexing的更多用例/场景。此外,需要知道Hive是否支持像Oracle这样的反向键索引,升序和降序索引。

2 个答案:

答案 0 :(得分:1)

  • 是他们在HIVE中使用指数的显着优势 oracle,请记住,HIVE适用于大型数据集和 然而,他们正在将HIVE作为实时数据的发展 仓储工具。
  • 可以使用BITMAP索引的一个用例是table with table 列具有不同的值,显然它应该是一个大的 table(如果表很大,你会得到更好的结果,不要测试 小桌子。)
  • 截至目前,HIVE仅支持两种索引技术COMPACT和 BITMAP用于显式创建索引。
  • 不建议使用Hive中的索引(尽管您可以创建为 根据您的用例),原因是ORC Format
  • ORC格式构建了索引,允许格式跳过块 在读取数据时,它们还支持Bloom过滤器索引。一起 这几乎复制了Hive Indexes所做的事情并且他们这样做了 自动处于数据格式而无需管理 外部表(基本上是索引中发生的事情)。

  • 我建议你宁愿花时间正确设置 ORC表。

    还阅读了关于hive indexing

  • 的精彩帖子

答案 1 :(得分:0)

hive是在hadoop上运行的数据仓库工具。内置它具有用于配置单元查询的mapreduce容量。元数据和actula数据分离并存储在apache derby中。所以数据库的负担非常小。由于分配性,hive很容易处理大表。你也可以比较oracle和hive的内连接性能。蜂巢将永远为您提供更好的表现。

相关问题