【发布时间】:2013-07-30 06:01:07
【问题描述】:
std::wstring 的内部结构是什么?包括长度吗?它是否为空终止?两者都有?
【问题讨论】:
标签: c++
std::wstring 的内部结构是什么?包括长度吗?它是否为空终止?两者都有?
【问题讨论】:
标签: c++
是否包括长度
是的。这是 C++11 标准要求的。
§ 21.4.4
size_type size() const noexcept;
1. 返回:字符串中当前类字符对象的数量。
2. 复杂性:恒定的时间。
但是请注意,这不知道 unicode。
是否为空终止
是的。 C++11 标准还要求std::basic_string::c_str 为 [0,size()] 的范围返回一个有效指针,其中my_string[my_string.size()] 将是有效的,因此是一个空字符。
§ 21.4.7.1
const charT* c_str() const noexcept;const charT* data() const noexcept;
1. 返回:一个指针p使得p + i == &operator[](i)用于[0,size()]中的每个i。
2. 复杂性:恒定时间。
3. 要求:程序不得更改任何值 存储在字符数组中。
我们不知道。这完全取决于实施。 (至少在 C++03 之前 - 显然 C++11 要求内部缓冲区以 0 结尾。)如果您使用的是开源的,您可以查看 C++ 标准库实现的源代码。
除此之外,如果它是 NUL 终止的 并且 它也存储了明确的长度,我会发现它是合乎逻辑的。这很好,因为返回长度和一个有效的 C 字符串需要恒定的时间:
size_t length()
{
return m_length;
}
const wchar_t *c_str()
{
return m_cstr;
}
如果它没有存储明确的长度,那么size() 将不得不将字符数直到O(n) 中的NUL,如果可以避免的话,这将是一种浪费。
但是,如果内部缓冲区不是以 NUL 结尾的,而只是存储了长度,那么创建一个适当的以 NUL 结尾的 C 字符串将是乏味的:该字符串必须重新分配其存储空间并追加0(并且重新分配是一项昂贵的操作),或者它必须复制整个缓冲区,这又是一个O(n) 操作。
(警告:无耻的自我推销——在我目前正在从事的一个 C 语言项目中,我正是采用这种方法来实现灵活的字符串对象。)
basic_string(wstring 是 typedef)不需要终结符。
是的,它管理自己的长度。
如果您需要一个以 null 结尾的(也称为 C 字符串)版本的 string/wstring,请调用 c_str()。但它可以在其中包含一个空字符,在这种情况下,几乎每个处理 C 字符串的 C 函数都将无法看到整个字符串。
【讨论】:
.c_str() 成员函数并且知道为什么以及何时使用它。另外,希望大家了解C标准库中的宽字符串处理函数,如wstrlen()。