【问题标题】:Why is Wordpress mangling my Tamil titles?为什么 Wordpress 会破坏我的泰米尔语标题?
【发布时间】:2012-12-12 05:32:33
【问题描述】:

我使用 wordpress 3.0.1 来写博客。如果我以其他语言(如泰米尔语)发布文章,则帖子的标题会显示为垃圾字符。相同的字符出现在帖子的链接中。

例如,如果我的标题是“அம்மா அம்மா அம்மா அம்மா”,则链接显示为

e0%ae%85%e0%ae%ae%e0%af%8d%e0%ae%ae%e0%ae%be-%e0%ae%85%e0%ae%ae%e0%af%8d%e0%ae%ae%e0%ae%be-%e0%ae%85%e0%ae%ae%e0%af%8d%e0%ae%ae%e0%ae%be-%e0%ae%85%e0%ae%ae%e0%af%8d%e0%ae%ae%e0%ae%be/

发生了什么,我该如何解决?

【问题讨论】:

  • 那些不是垃圾字符,它们是你的标题......编码错误。
  • 可以说一个正确编码的解决方案
  • 这些是您的标题的 HTMLEntities,因为 URL 不支持这些字符。见RFC-1738
  • 不知道你是如何得到它的。

标签: php unicode character-encoding


【解决方案1】:

【讨论】:

    【解决方案2】:

    chrome 之类的浏览器在悬停时会自动显示链接的 urldecoded 值,但您的浏览器可能不会 (Older firefox, IE..)。无论如何,它工作正常。例如,如果您访问此维基百科页面:

    http://en.wikipedia.org/wiki/%e0%ae%85%e0%ae%ae%e0%af%8d%e0%ae%ae%e0%ae%be-%e0%ae%85%e0%ae%ae%e0%af%8d%e0%ae%ae%e0%ae%be-%e0%ae%85%e0%ae%ae%e0%af%8d%e0%ae%ae%e0%ae%be-%e0%ae%85%e0%ae%ae%e0%af%8d%e0%ae%ae%e0%ae%be/

    您可以看到维基百科将其检测为அம்மா-அம்மா-அம்மா-அம்மா,但您的浏览器可能仍会在 url 中显示百分比编码。

    不清楚,但如果您的意思是您实际上在 html 页面上也看到了百分比编码,那么这是您的代码或 wordpress 代码中的错误处理。

    顺便说一句,如果第一个 % 实际上也被排除在外,我假设您的问题贴错了,并遗漏了第一个 %(它以 e0%ae%85.. 开头,即使它应该是 %e0%ae%85..)那么这可能就是问题所在。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2016-12-03
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-08-06
      • 1970-01-01
      • 2012-07-28
      相关资源
      最近更新 更多