【发布时间】:2015-03-01 00:03:50
【问题描述】:
我的 html 和 xml 知识有限,我正在尝试使用 Google 电子表格上的 =ImportXML() 抓取一些 URL 以获取文本块。
这里是链接:http://www.worldbank.org/projects/P082167/agricultural-transition?lang=en&tab=overview
<div id="abstractmore" style="">
<h2>ABSTRACT*</h2>
<p>
The project aims to...be responsible for the general management of the project.<a href="javascript:;" id="rdless" class="more"> Read Less»</a>
</p>
</div>
我正在尝试提取完整的摘要。我使用了 Chrome 的检查元素工具并浏览了各种教程......我能够从我所阅读的内容中得出这些 xpath:
//div[@id='abstractmore']/p/text()
//*[@id="abstractmore"]/p/text()
这些返回错误:导入的内容为空。我完全不知道如何找出 xpath!?
【问题讨论】:
标签: xml xpath google-sheets