【发布时间】:2014-12-08 18:52:44
【问题描述】:
我正在使用 file_get_contents() 来获取 HTML 并从网站上抓取一些数据。 源代码并不总是 UTF8,但我正在使用 FORCEUTF8 类来修复它。但它不能正常工作。我做错了什么?
/* Load UTF8 HTML */
require_once('/ForceUTF8/Encoding.php');
use \ForceUTF8\Encoding;
function loadHTMLInUtf8($url){
$utf8_or_latin1_or_mixed_string=file_get_contents($url);
return Encoding::toUTF8($utf8_or_latin1_or_mixed_string);
}
$html=loadHTMLInUtf8('http://www.example.com/');
$dom->loadHTML('<meta http-equiv="content-type" content="text/html; charset=utf-8">'.$html);
有没有其他方法可以做到这一点?
【问题讨论】:
标签: php utf-8 file-get-contents