【问题标题】:PHP CURL isn't processing encoded return data properlyPHP CURL 没有正确处理编码的返回数据
【发布时间】:2013-09-22 18:32:30
【问题描述】:

我有一些小的编码问题。我从这里得到一个 json 数据字符串(自己试试):

http://cdn.content.easports.com/fifa/fltOnlineAssets/C74DDF38-0B11-49b0-B199-2E2A11D1CC13/2014/fut/items/web/179899.json

数据中的名字是这样显示的

Ari Skúlason

我怎样才能以正确的编码获取这些数据,以便它的 Ari Skúlason?

我尝试在 php 中像这样将其切换为 utf-8

echo mb_convert_encoding($r,'ISO-8859-1','utf-8');

这让我更接近,但它仍然不对

Ari Sk�lason

我的 php curl 请求:

$location = 'http://cdn.content.easports.com/fifa/fltOnlineAssets/C74DDF38-0B11-49b0-  B199-2E2A11D1CC13/2014/fut/items/web/179899.json';
$ch = curl_init($location);
curl_setopt($ch, CURLOPT_HEADER, false);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_HTTPHEADER, array(                                                                                                                                                        
'Accept: application/json'));
$r = curl_exec($ch);
curl_close($ch);
echo mb_detect_encoding($r);
$r = mb_convert_encoding($r,'ISO-8859-1','utf-8');

print_r($r);

【问题讨论】:

  • 您是否可以控制您正在使用的网址?您可以在那里更改编码

标签: php http curl encoding utf-8


【解决方案1】:

CURLOPT_ENCODING 设置另一个 curl 选项并将其设置为 "" 以确保它不会返回任何垃圾

   curl_setopt($ch, CURLOPT_ENCODING ,"");

【讨论】:

    【解决方案2】:

    你可以使用标题

       header('Content-type: text/html; charset=UTF-8');
    

    解码后的字符串

     $page = utf8_decode(curl_exec($ch));
    

    它对我有用

    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
    curl_setopt($ch, CURLOPT_ENCODING, 'UTF-8');
    curl_setopt($ch,CURLOPT_USERAGENT,'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.13) Gecko/20080311 Firefox/2.0.0.13');
    

    添加后

    $page = curl_exec($ch);
    $dom = new DOMDocument('1.0', 'utf-8');
    libxml_use_internal_errors(true);
    @$dom->loadHTML(mb_convert_encoding($page, 'HTML-ENTITIES', 'UTF-8'));
    

    【讨论】:

    • 无论它是否有效,UTF-8 都不是 CURLOPT_ENCODING 的有效参数。这指定了Accept-Encoding Field,与字符编码无关。有效参数为:identity、gzip、deflate 和 ""。
    • 当来自 CURL 或浏览器的请求时,我对同一个 URL 有不同的响应。非常感谢您让我了解 CURLOPT_USERAGENT ......现在它在两者中都可以正常工作:)
    【解决方案3】:

    你也可以试试。

    ...

    $results = curl_exec($init);
    curl_close($init);
    return json_decode(utf8_encode($results));
    

    utf8_encode 编码的 ASCII 字符。返回非编码 ASCII 可能会中断或返回错误(以我为例)。

    【讨论】:

      【解决方案4】:

      你可以试试

      $res= curl_exec ( $ch ); 
      $result = iconv("Windows-1251", "UTF-8", $res);
      

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2011-06-22
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2015-10-07
        相关资源
        最近更新 更多