【发布时间】:2015-11-29 23:10:55
【问题描述】:
我正在抓取一个页面,我必须从这种格式中获取员工数量:
<h5>Number of Employees</h5>
<p>
20
</p>
我需要得到数字“20”问题是这个数字并不总是在同一个标题中,有时在“h4”中并且有更多的“h5”标题,所以我需要找到数据包含在名为“员工人数”的标题中,并提取包含段落中的数字
这是页面的链接
【问题讨论】:
标签: python xpath beautifulsoup scrapy web-scripting