【发布时间】:2011-03-09 20:43:57
【问题描述】:
我有一个从网站源代码中获得的 HTML。我用 post 方法从我的页面向网站发送数据,响应是源代码。我需要源中的一些文本。
文档格式不正确。所以,我不能使用 DOM,也不能用 DOM 分离标签和数据。 如何分离标签和数据,如何获取唯一的数据?
我正在使用 PHP。
谢谢。
【问题讨论】:
-
Which Html Parser is best? 的可能重复项
-
后来我补充说,我用的是PHP。
标签: dom data-mining