【发布时间】:2009-11-22 19:23:58
【问题描述】:
我正在阅读 url,它们通常有百分比编码的字符。
示例:%C3%A9 实际上是 é
根据http://www.microsystools.com/products/sitemap-generator/faq/character-percentage-url-encoding/ ,8位ASCII(128-255)的上半部分的字符被编码为UTF-8,然后它们的字节被保存为十六进制。现在,当我得到我的 URL 时,%HEX 已被重新编码为 8 位 ascii,我需要将它们转换回它们真正的 8 位 ascii。有没有我可以使用的函数/库,或者,我将如何进行转换?
我正在使用 C/C++。
【问题讨论】:
-
这是今天第二次有人谈论 8 位 ascii .. 那是什么? ASCII 使用 7 位。 Latin1(以及一大堆其他字符集)使用 8 位,并且通常是 ASCII 的超集,但出于这个原因,我不会称它们为“8 位 ASCII”,所以......你所说的“8-”是什么意思位 ASCII"?
-
常规字符。 ascii-code.com
标签: url utf-8 ascii url-encoding