【问题标题】:PHP get HTML - missing characters [duplicate]PHP获取HTML - 缺少字符[重复]
【发布时间】:2012-12-03 21:47:56
【问题描述】:

可能重复:
how to convert ISO 8859-1 Characters to UTF-8

我想获取此网址的 HTML 内容:http://www.20minutos.es/noticia/1635461/0/aforo/madrid-arena/vigilantes/

但是缺少字符(例如“ñ”或“á”、“é”...)

获取 HTML 的代码是

$html = file_get_contents_utf8($url);

然后:

$html = mb_convert_encoding($html, 'HTML-ENTITIES', "UTF-8");

我尝试了一些替代方法,但仍然无法正常工作。

有什么想法吗?谢谢

【问题讨论】:

  • 你的内部编码是什么?如果您的编码是 utf8,则可以使用 file_get_contents( $url );

标签: php html encoding entities


【解决方案1】:

我不确定您要转换为哪种编码,但使用 file_get_contents() 应该可以 你想做什么。

如下修改你的代码

<?php
 $url = 'http://www.20minutos.es/noticia/1635461/0/aforo/madrid-arena/vigilantes/';
 $html = file_get_contents($url);
 echo $html;
?>

我对此进行了测试,它显示了您所指的所有字符(如“ñ”或“á”、“é”...)。

【讨论】:

    猜你喜欢
    • 2014-01-21
    • 2018-01-08
    • 2014-04-08
    • 2012-12-16
    • 1970-01-01
    • 1970-01-01
    • 2013-05-16
    • 1970-01-01
    • 2013-03-13
    相关资源
    最近更新 更多