【发布时间】:2011-03-02 23:36:02
【问题描述】:
我有一个下载程序,可以从 Internet 下载页面。
每个页面的编码是不同的,有些是UTF-8,有些是Unicode。
例如:a 显示 'a' 字符;充满这些字符的页面。我们应该将此编码转换为普通文本。
我在 c# 中使用了UnicodeEncoding 类,但它们对我没有帮助。
如何将此编码解码为真实字符?有没有转换这个的类或方法?
谢谢。
【问题讨论】:
-
顺便说一句:没有编码就没有像“普通文本”这样的东西。强烈推荐:joelonsoftware.com/articles/Unicode.html
-
亲爱的,肯尼请做你的功课并纠正你的问题标题 - UTF8 是编码 Unicode 的几种方法之一。这些也不是普通文本——可能你想说的是 ANSI 或 ASCII。在这种情况下,不可能不丢失数据。
标签: c# encoding utf-8 html-entities