【发布时间】:2011-12-05 19:03:15
【问题描述】:
我正在寻找从 html 获取纯文本。我应该选择哪一个,phpstrip_tags或simplehtmldom明文提取?
simplehtmldom 的一个优点是支持无效的 html,这本身就足够了吗?
【问题讨论】:
-
条形标签将为您提供所提供文档中的所有文本。如果您想要文档的一小部分,则使用 DOM 提取该部分。
标签: php extract web-scraping text-extraction simple-html-dom