【发布时间】:2012-12-03 21:47:56
【问题描述】:
我想获取此网址的 HTML 内容:http://www.20minutos.es/noticia/1635461/0/aforo/madrid-arena/vigilantes/
但是缺少字符(例如“ñ”或“á”、“é”...)
获取 HTML 的代码是
$html = file_get_contents_utf8($url);
然后:
$html = mb_convert_encoding($html, 'HTML-ENTITIES', "UTF-8");
我尝试了一些替代方法,但仍然无法正常工作。
有什么想法吗?谢谢
【问题讨论】:
-
你的内部编码是什么?如果您的编码是 utf8,则可以使用
file_get_contents( $url );。
标签: php html encoding entities