【发布时间】:2014-04-21 17:23:02
【问题描述】:
我有这个网站https://gpfo.memberclicks.net//index.php?option=com_community&view=profile&userid=23705974,我正在尝试提取“完整资料”下“查看”后面的 href 链接。
我想知道如何抓取这个。我试过//dl[1]/dd[contains(a/text(),'View')]/@href,但它没有返回任何数据。
我还想就什么是最有效的网站抓取方式征求专家意见:直接从 Google Docs 运行 importXML 更好,还是有更好的方法来使用脚本?
【问题讨论】:
标签: xpath screen-scraping