【发布时间】:2019-02-14 09:35:11
【问题描述】:
假设我有一个IPRange 对象,定义如下:
public class IPRange {
public IPAddress Start { get; set; }
public IPAddress End { get; set; }
public string Description { get; set; }
public DateTime ExpireDate { get; set; }
}
然后我有一个IPRange[] 这些对象,其中包含数百或数千个条目,其中范围的开始/结束值具有所有不同(正常)值。
var myArray = new IPRange[...];
现在;如果我有IPAddress,那么确定它是否属于任何范围的最快方法是什么?假设:
- 该数组将专门包含与我们尝试匹配的 IP 具有相同 AddressFamily (IPv4/IPv6) 的项目
- 范围可能或可能不“重叠”
- 一个
IPRangeComparer(实现IComparer<IPRange>,首先按范围开始排序,然后('在'同一个开始内)按范围结束)和IPRangeEqualityComparer(实现IEqualityComparer<IPRange>,对于相同的范围开始和返回true range-end) 和IPAddressComparer一样可用(实现IComparer<IPAddress>,将IP 视为字节数组,按数值对其进行“排序”)
更糟糕的是,IPRange 还有一个ExpireDate (DateTime) 属性。 IPRange[] 中的条目可能随时过期;所以我们也需要考虑到这一点。 IPRange[] 以设定的时间间隔(比如每小时一次)“重新加载”,因此过期的项目会定期从阵列中“清除”。但是从技术上讲,一个范围可能已经过期,但仍然在数组中,直到下一次重新加载。我不认为这本身就是一个大问题,但是当我第一次尝试解决这个问题时,它确实增加了一点复杂性。
我可以简单地迭代提供 O(n) 性能的项目,但我希望它的性能(好得多)。我最初从二进制搜索实现开始,以快速定位数组中的范围,但一旦找到,数组中左/右可能会有更多范围,然后从那里再次给我 O(n)(可能更糟,取决于我们如何从那里开始)。
我想知道什么算法或数据结构(如果有的话)在这方面会有所帮助。您可能会说我正在尝试实施白名单(或黑名单等),并且需要快速判断 IP 是否在该列表中。找到匹配范围后,无需进一步查找。我不介意每隔一段时间“(重新)构建”一个数据结构;我可以在后台任务中执行此操作,因此可能需要一些时间而无需担心。
在我的查看列表中,没有特别的顺序,是:B-Tree、R(*)-Tree、Hilbert R-Tree、Enhanced Interval Trees 和this question I just found 似乎也有一些有趣的信息。
【问题讨论】: