【发布时间】:2020-11-08 12:16:10
【问题描述】:
我有一个网站,用户可以输入重音字符搜索词。 由于用户可能来自不同的国家、不同的操作系统,他们输入的字符集重音字符可能编码为 windows-1252、iso-8859-1,甚至是 iso-8859-X、windows-125X。
我正在使用 Perl,我的索引服务器是 Solr 8,所有数据都是 utf8。 如果源字符集已知,我可以使用 decode+encode 进行转换,但是如何将未知的重音转换为 utf8?如何在 Perl 中检测源重音字符的字符集?
use utf8;
use Encode;
encode("utf8",decode("cp1252",$input));
【问题讨论】:
标签: perl utf-8 character-encoding