Question

我有两组多个IP范围。每个IP范围都是一对(startIP, endIP)长。所以我有两套a和b -

a = [(start11, end11), (start12, end12)...]
b = [(start21, end21), (start22, end22)...]

我希望找到a但不在b中的IP。或者换句话说set(ips_a) - set(ips_b)。

我试图在a中针对b检查每个IP，但这个过程需要永远，因为每组中有超过1亿个IP。

想知道最优化的方法是什么。此外，如果任何现有模块执行此操作。

Answer 1

您可以针对地址数量尝试以下O(n log n)算法：

由于排序步骤，此算法的时间复杂度为O(n log n)。