【发布时间】:2015-08-15 04:26:52
【问题描述】:
我想使用“simple html dom parser”使用以下代码解析 HTML 内容(网站):
<!DOCTYPE html>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<title>Parsing</title>
</head>
<body>
<h1>Démonstration parsing </h1>
<?php
require_once 'simple_html_dom.php';
$html = new simple_html_dom();
$html->load_file('http://grafikart.fr/blog/');
// echo $html->find('img',0)->getAttribute('src');
/*foreach ($html->find('img') as $img) {
echo $img->src . '<br/>';
}*/
foreach ($html->find('.posts') as $post){
echo 'ARTICLE : '.$post->find('posts-short>p',0)->plaintext.'<br/>';
echo 'Image de l\'article: '.$post->find('img',0)->src.'<br/>';
}
?>
</body>
</html>
一切正常,但我想将解析后的数据转换为 xml 格式。有人有想法吗? 谢谢!
【问题讨论】:
-
使用 SimpleXML 不是更容易吗?
-
我很困惑,您是否尝试将正在解析的内容转换为 XML?您可以自己构建 XML,因为您已经在循环浏览 HTML 文件中的帖子
-
没错,我想把我正在解析的内容转换成 XML 或 JSON
标签: php html html-parsing