【发布时间】:2011-03-10 11:37:45
【问题描述】:
我正在从文件系统读取文件名,我想将它们作为 JSON 编码数组发送。问题是文件系统上的文件可以以无效的编码存储,我需要处理这种情况,在传递给json.dump之前忽略无效的文件名,否则会失败。
有没有办法检查我的字符串(文件名)是否包含有效的 utf-8 字符?
【问题讨论】:
-
让我震惊。 为什么文件没有有效的 UTF-8 文件名?
-
是不是utf-8编码的文件名还是文件中的数据??我很困惑。
-
不检查编码就根据 ID3 标签创建文件名的错误软件怎么样?或者挂载(使用错误的选项)一个对文件名使用奇数字符编码的旧文件系统?
-
在从旧的(非 utf-8)系统(如具有非美国/英语语言环境的 WinXP)移动数据时,无效编码可能是个大问题,尤其是在 .zip 和 .rar 存档文件中创建的文件这些系统
-
@IgnacioVazquez-Abrams 因为文件名/文件系统可能已损坏。
标签: python json utf-8 invalid-characters