【问题标题】:Seamlessly know the size of a string containing a null char无缝知道包含空字符的字符串的大小
【发布时间】:2016-07-03 12:07:12
【问题描述】:

一个非常简单和新手问题的长问题,但我需要一些建议。

背景

所以我有一个需要解析的二进制文件。该文件以一些包含空字符 (\0) 的魔术字符串开头。让我们定义为ab\0cd

我正在编写一个方法,如果某个文件以魔术字符串开头,则返回 true。

尝试 1

#define MAGIC_STRING "ab\0cd"

bool IsMagicFile(const wpath& pathFile)
{
    string strData;
    if (!ReadFile(pathFile, strData))
        return false;

    if (strData.size() < 5)
        return false;

    string strPrefix = strData.substr(0, 5);

    if (strcmp(strPrefix.c_str(), MAGIC_STRING) != 0)
        return false;

    return true;
}

问题 1

上面的代码困扰我的是,我“硬编码”假设魔术字符串的大小是5

如果明天魔术字符串发生变化怎么办?说:

#define MAGIC_STRING "abe\0fcd"

字符串宏已更改,代码不再正常工作。

尝试 2

#define MAGIC_STRING "ab\0cd"

bool IsMagicFile(const wpath& pathFile)
{
    string strMagic = MAGIC_STRING;

    string strData;
    if (!ReadFile(pathFile, strData))
        return false;

    if (strData.size() < strMagic.size())
        return false;

    string strPrefix = strData.substr(0, strMagic.size());

    if (strcmp(strPrefix.c_str(), MAGIC_STRING) != 0)
        return false;

    return true;
}

问题 2

我应该摆脱了硬编码的大小问题,但strMagic 的大小实际上不是 5 而是 2。字符串以 \0 结尾

尝试 3

#define MAGIC_STRING        "ab\0cd"    // CAUTION - MAGIC_STRING & MAGIC_STRING_SIZE must be changes together 
#define MAGIC_STRING_SIZE   5           // CAUTION - MAGIC_STRING & MAGIC_STRING_SIZE must be changes together

bool IsMagicFile(const wpath& pathFile)
{
    string strData;
    if (!ReadFile(pathFile, strData))
        return false;

    if (strData.size() < MAGIC_STRING_SIZE)
        return false;

    string strPrefix = strData.substr(0, MAGIC_STRING_SIZE);

    if (strcmp(strPrefix.c_str(), MAGIC_STRING) != 0)
        return false;

    return true;
}

问题 3

这解决了第一个问题,但我仍然没有得到我想要的无缝魔术字符串更改。

问题

尝试 3 是否足够好?你有更好的方法吗?

【问题讨论】:

  • 您的问题中有一个标签C++ => 仅限 std::string,而不是 strcmp => 已解决。 (和const string 而不是#define

标签: c++ string macros null-character


【解决方案1】:

您可以定义一个常量字符数组,而不是使用宏定义。例如

const char MAGIC_STRING[] = "abe\0fcd";

在这种情况下,不包括终止零的字符数等于

sizeof( MAGIC_STRING ) - 1

要比较原始字节,您可以使用标准 C 函数 memcmp 提供与上述表达式相等的比较字节数。

这是一个演示程序

#include <iostream>
#include <string>
#include <cstring>
#include <iterator>

const char MAGIC_STRING[] = "abe\0fcd";

int main() 
{
    std::string s( std::begin( MAGIC_STRING ), std::prev( std::end( MAGIC_STRING ) )  );

    if ( memcmp( s.c_str(), MAGIC_STRING, sizeof( MAGIC_STRING ) - 1 ) == 0 )
    {
        std::cout << "The string starts with the MAGIC_STRING" << std::endl;
    }

    return 0;
}

它的输出是

The string starts with the MAGIC_STRING

【讨论】:

    【解决方案2】:

    如果您知道您的魔术字符串将包含\0,那么您可以编写自己的size(string str)函数,通过在第一个\0之后继续计数来返回正确的长度。

    如果不知道魔术字符串中有多少\0s,我建议您尝试 3。

    如果您需要一些代码来指导您使用 size 方法的正确方向,请告诉我。

    【讨论】:

      【解决方案3】:

      我个人会避免使用 MACROS。此外,我不会使用为空终止字符串设计的函数,如std::strcmp。您可以使用标准 &lt;algorithm&gt; 库中的 std::equal 检查字符串的开头是否包含特定字符序列:

      // create a character array to preserve compile time size
      // but remember string literals add a null-terminator extra character
      const char magic_string[] = "ab\0cd";
      
      bool IsMagicFile(const wpath& pathFile)
      {
          string strData;
          if (!ReadFile(pathFile, strData))
              return false;
      
          // -1 to avoid null terminator from magic_string character array
          return std::equal(magic_string, magic_string + sizeof(magic_string) - 1,
              strData.begin());
      }
      

      【讨论】:

      • 如果搜索到的字符串不是以魔术字符串开头,std::string::find() 会在失败前搜索整个字符串。我建议改用std::string::compare()return strData.compare(0, magic_string.length(), magic_string) == 0;。或者:return strData.compare(0, 5, "ab\0cd", 5) == 0;。此外,magic_string 将是 "ab",因为 \0 将被解释为空终止符。构造时需要指定正确的长度:const std::string magic_string("ab\0cd", 5);
      • @RemyLebeau 你完全正确。我决定使用std::equal 来避免构造std::string,因为它需要从字符数组中构造才能获得正确的大小。
      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-11-16
      • 2016-03-01
      • 2012-08-14
      • 2015-03-15
      相关资源
      最近更新 更多