最近写了一个抓取脚本,抓取的大部分内容正常,但少部分乱码

 

检测字符编码,得出的结果是CP936

mb_detect_encoding($str, 'GBK, gb2312, GB18030, ISO-8859-1, ASCII, UTF-8', true)

尝试转换此编码,但得出的结果还是乱码

mb_convert_encoding($str, 'UTF-8', 'CP936');
氓聧掳氓潞娄盲赂聙70氓虏聛猫聙聛氓陇麓莽聦楼盲潞碌7氓虏聛氓楼鲁氓颅漏猫聙聦猫垄芦忙聧聲

最后发现,这样可以转码

iconv('utf-8', 'latin1', $str);
iconv('utf-8','latin1//IGNORE', $str);

  

相关文章:

  • 2022-02-11
  • 2022-12-23
  • 2021-12-20
  • 2022-12-23
  • 2021-08-23
  • 2021-11-30
  • 2021-07-22
  • 2022-12-23
猜你喜欢
  • 2022-12-23
  • 2022-01-20
  • 2022-12-23
  • 2022-12-23
相关资源
相似解决方案