【发布时间】:2012-05-19 07:34:14
【问题描述】:
我正在使用SimpleHTMLDomParser 浏览html 代码并找到各种东西。到目前为止一切正常,但有一个问题:
如何找到没有 ID、没有类和唯一父元素的字符串?
在我的例子中,我从 div 中提取内容开始:
$descrs = $html->find('.show_synopsis');
foreach($descrs as $descr) {
echo($descr->innertext);
}
这看起来像:
<div class="show_synopsis">
Lorem ipsum dolor sit amet, consetetur sadipscing elitr. <b>Source:</b> LORES.
</div>
现在,是否可以从上面的示例中找到并删除LORES?
由于LORES 是一个变量并且可以更改,我想知道是否可以简单地始终找到<b>Source:</b> 旁边的单词?
我尝试了几种不同的方法,但到目前为止都没有奏效。我尝试从 this post 调整解决方案,但无法根据我的需要调整它们。
【问题讨论】:
标签: php html html-parsing simple-html-dom