【问题标题】:Elegant way to find keys with given prefix in std::map or elements in std::set在 std::map 中查找具有给定前缀的键或在 std::set 中查找元素的优雅方法
【发布时间】:2017-11-26 19:51:37
【问题描述】:

我有地图,其中的键是 std::string。我想在地图中找到那些以"DUPA/" 前缀开头的元素。找到下限很容易,但上限有点问题。我写了这样一段代码:

const char* prefix = "DUPA/";
const char* firstAfterPrefix = "DUPA0";
auto prefixedBeginIt = myMap.upper_bound(prefix);
auto prefixedEndIt = myMap.lower_bound(firstAfterPrefix);

代码运行良好,但我不认为它很优雅,因为必须知道0 在 ASCII 表中首先位于 / 旁边。第二种方法是复制前缀并增加最后一个符号。你知道更优雅的解决方案吗?

【问题讨论】:

  • 你的 prefixedBeginIt 找不到与前缀相同的键,你应该使用 lower_bound 而不是 upper_bound。
  • @CAF 根本与问题无关。这是找不到前缀本身的预期行为。

标签: c++ prefix stdmap stdset


【解决方案1】:

我认为你提到的解决方案已经是最优雅的了。 KISS方式损失了很多性能,也就是每次都检查key:

while(prefixedBeginIt->first == prefix)
{
 //...
 ++prefixedBeginIt;
}

因此我认为计算下一个字符是最好的方法:

std::string firstAfterPrefix = prefix;
++firstAfterPrefix[firstAfterPrefix.length() - 1];
auto prefixedEndIt = myMap.lower_bound(firstAfterPrefix);

【讨论】:

  • 是的,我认为这可能是最好的解决方案,但在这个特定问题中我会使用 char[] 而不是 std::string。但作为一个通用的解决方案,只要最后一个字符不等于 MAX_CHAR 就最好了;)
  • 看起来当prefix为空字符串时这会崩溃并烧毁?
【解决方案2】:

如果您可以假设CHAR_MAX 在您的字符串中不是有效字符,那么您可以通过附加CHAR_MAX 来创建firstAfterPrefix(如果不是char,则为您的字符类型的最大值)。

std::string prefix = "DUPA/";

constexpr auto char_max = std::numeric_limits<decltype(prefix)::value_type>::max();
std::string firstAfterPrefix = prefix + char_max;

auto prefixedBeginIt = myMap.lower_bound(prefix);
auto prefixedEndIt = myMap.lower_bound(firstAfterPrefix);

注意两个边界都使用lower_bound。和 Gill 一样,我使用std::string 来简化说明。


如果您可以使用 C++14 并指定容器的 Compare 模板参数,那么另一种方法是使用自定义探测对象:

struct PrefixProbe { std::string_view prefix; };
bool operator<(PrefixProbe a, std::string_view b) { return a.prefix < b.substr(0, a.prefix.size()); }
bool operator<(std::string_view a, PrefixProbe b) { return a.substr(0, b.prefix.size()) < b.prefix; }

std::map<std::string, myValue, std::less<>> myMap;
//                             ^~~~~~~~~~~
//                             where the magic happens

auto prefixBegin = myMap.lower_bound(PrefixProbe { prefix });
auto prefixEnd = myMap.upper_bound(PrefixProbe { prefix });

std::string_view 是 C++17,但不是必需的。

equal_range 会将最后两行缩减为一行:

auto [ prefixBegin, prefixEnd ] = myMap.equal_range(PrefixProbe { prefix });

如果您准备使用 STL 算法而不是容器成员函数,那么这可以在不改变容器类型的情况下完成,但效率会降低:

auto prefixBegin = std::lower_bound(cbegin(myMap), cend(myMap), PrefixProbe { prefix }, std::less<>{});
auto prefixEnd = std::upper_bound(cbegin(myMap), cend(myMap), PrefixProbe { prefix }, std::less<>{});

auto [ prefixBegin, prefixEnd ] = std::equal_range(cbegin(myMap), cend(myMap), PrefixProbe { prefix }, std::less<>{});

【讨论】:

  • 探测的想法很棒;我认为这是对这个问题的优雅一般形式的优雅回答(即,搜索一个不能自然地表达为特定键的上限或下限的条件)。相比之下,您附加 CHAR_MAX 的第一个替代想法似乎相当平凡、繁琐和特殊用途;我会考虑删除那部分。
  • 也许为外行添加对异构查找介绍的引用? This 是一个不错的选择。您确实会说“std::less ^魔术发生的地方”,这是真的,但我不确定这对不熟悉异构查找的人是否有帮助。
  • 为什么说 std::equal_range 会比成员函数效率低?两者的实现都在头文件中,对编译器可见,编译器将内联它,所以我希望两者都能编译成相同的东西。没有?
  • a.substr(0, b.prefix.size()) == b.prefix 在性能方面检查前缀性不是一个很好的习惯用法。这里有一个很好的:stackoverflow.com/questions/1878001/…
  • 我认为您的operator&lt; 功能不太正确。在std::set&lt;std::string, std::less&lt;&gt;&gt; myMap = {"","A","AA","AB","AC","B","BA","BB","BC","C","CA","CB","CC"}; 上试一试。您的myMap.equal_range(PrefixProbe("B") 返回{"","A","AA","AB","AC","B"}。正确答案是{"B","BA","BB","BC"}
猜你喜欢
  • 2018-01-11
  • 1970-01-01
  • 1970-01-01
  • 2010-09-10
  • 2010-12-21
  • 1970-01-01
  • 1970-01-01
  • 2018-04-21
  • 1970-01-01
相关资源
最近更新 更多