【发布时间】:2010-12-22 03:19:18
【问题描述】:
有谁知道我可以用来验证一堆 UTF-8 的 XML 文件的应用程序/服务/方法吗?
基本上,我有大量假定为 UTF-8 的 XML 文件,其中一些恰好包含一些虚假字符,导致它们无法在内容查看器中正确呈现。
我知道我可以使用此答案中的方法一次检查一个:How to check whether a file is valid UTF-8?
...但是一次有数千个 XML 文件怎么样?
【问题讨论】:
-
我猜不可能认真地验证文件是 utf-8,因为即使文本对人类没有任何意义,一切都可能是 utf-8。可能有一个工具会根据统计数据尝试猜测。
-
好吧,当我在 TextWrangler 中打开其中一个 XML 文件时,它给了我一条错误消息,说有一些不符合指定 UTF-8 格式的无效字符,所以显然它知道..
标签: validation utf-8 batch-file