我需要比较Oracle Vs Hadoop(Hive)中的索引。到目前为止,我可以在Hive中找到两种主要的索引技术,即COMPACT INDEXING和BITMAP INDEXING。与Oracle相比,我可以查看Hive中COMPACT INDEXING的性能差异。我需要了解在Hive中使用Bitmap Indexing的更多用例/场景。此外,需要知道Hive是否支持像Oracle这样的反向键索引,升序和降序索引。
答案 0 :(得分:1)
ORC格式构建了索引,允许格式跳过块 在读取数据时,它们还支持Bloom过滤器索引。一起 这几乎复制了Hive Indexes所做的事情并且他们这样做了 自动处于数据格式而无需管理 外部表(基本上是索引中发生的事情)。
我建议你宁愿花时间正确设置 ORC表。
还阅读了关于hive indexing。
答案 1 :(得分:0)
hive是在hadoop上运行的数据仓库工具。内置它具有用于配置单元查询的mapreduce容量。元数据和actula数据分离并存储在apache derby中。所以数据库的负担非常小。由于分配性,hive很容易处理大表。你也可以比较oracle和hive的内连接性能。蜂巢将永远为您提供更好的表现。