【问题标题】:double byte character which one of it's bytes is an '<' or '>'双字节字符,其中一个字节是 '<' 或 '>'
【发布时间】:2010-11-17 12:10:45
【问题描述】:

是否有任何双字节编码一个字符,其中一个字节具有与 ASCII 字符 '' 相同的值? 我似乎找不到,但我必须确保没有这种情况,因为这种双字节字符可能会导致 html 解析器出错。

【问题讨论】:

    标签: character-encoding


    【解决方案1】:

    any 编码中?几乎可以肯定是的。事实上,有数百个字符具有 0x3c 或 0x3e(&lt;&gt; 在 ASCII 中的值)作为其 UTF-16 编码的字节之一,例如“☼”,UTF-16le 表示其中看起来像 &lt;&amp; 的 ASCII。

    但是,在不指定带外(例如通过 HTTP 标头)使用什么编码以及可能使用其他信号(例如 BOM)(HTML5 要求) 或 XML 编码说明符(根据 XML 标准的规定,在某些情况下 XHTML 需要该说明符)。

    如果您的编码指定正确,那么应该没有问题,因为 characters &lt;&gt; 在 HTML 中是特殊的,而不是 bytes 0x3c和 0x3e。任何想法不同的“解析器”都会被破坏。

    【讨论】:

    • 好吧,我的意思是在任何编码中,但是,具有 0X3c 的字符应该是某种语言中的有效字符。我的问题是是否有可能看到像这样的 html:“some text ... some character that has 0X3e, but a valid character in some language ”在这种情况下,解析器可能会提升专业问题
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2014-04-29
    • 1970-01-01
    • 1970-01-01
    • 2015-06-13
    • 2023-04-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多