Question

例如，如果我有以下情况

如果键的范围是1-4，则选择A.
如果键的范围是5-6，则选择B.

如果有一个请求获取say，key = 2的值，那么我应该返回A，为5，返回B，依此类推。保持这种关联的良好数据结构是什么？我可以通过存储1-A，2-A，3-A，4-A，5-B和6-B来创建哈希映射，但是想要检查是否有更好的方法来实现这一点。

Answer 1

对范围中的每个项目使用哈希映射似乎过于宽泛，如果范围是（1-2 ^ 20）怎么办？如果它是一个双重怎么办？存放这些东西太贵了。

您可以使用普通的跳过列表/树，其中包括每个范围的下限和上限。请注意，当在二叉树中搜索某个值时，如果它不存在，搜索将在搜索之前/之后的下一个值处结束，例如：如果您有范围键1,4，则搜索3 ，当你达到1或4时，搜索将结束。所以我们可以在树中存储范围的上/下界。

现在，我们还需要为这些中的每一个存储真实范围（因此，如果我们有1-4,8-9并且我们搜索7，那么当我们达到4/8时我们就会知道它无效）。因此，如果密钥在合法范围内，我们将在搜索时达到其上限/下限！

总而言之，只需在搜索时添加下限和上限，搜索键，然后查看绑定是否匹配。

ops应该是那样的（伪代码）：

add (lower,upper,value):
   tree.add(lower/*key*/,(lower,upper,value))
   tree.add(upper/*key*/,(lower,upper,value))
search (key):
   node = tree.search(key)
   if node.lower <= key <= node.upper: 
      return node.value
   return KEY_NOT_IN_TREE_ERROR
del(lower,upper):
  tree.del(lower)
  tree.del (upper)

这些操作中的每一个都是O（logn），慢于哈希，但它会占用更少的空间。

Answer 2

您可以创建一对<interval,associated value>并构建segment tree。它可以在重叠间隔下正常工作。

如果间隔从不重叠，它仍然可以正常，因为片段树比基于散列的解决方案需要更少的内存。如果范围很宽，任何普通结构都需要大量内存。

编辑：我意识到，通常的矢量可以比哈希更适合您的目的，以防间隔彼此靠近。

Answer 3

阿米特是对的。对于不重叠的范围，简单的有序数据结构就足够了。更清楚一点：

按照最小边界对范围进行排序。在搜索时，通过树进行闪电检查以查看您是否在您遍历的每个节点的范围内。

Answer 4

使用类的对象作为hashmap的键存储会更好。

在课堂上，你可以将Fields定义为upperbound，lower bound，并且应该覆盖equals和hashCode方法。

在equals中，您可以编写逻辑来比较密钥对象的上限和下限位于this.upperbound和this.lower bound之间。

要获取值，请使用相同的upperbound = lowerbound = key_val;

创建关键对象

基于范围的数据结构的密钥查找

4 个答案: