【发布时间】:2018-01-05 16:48:00
【问题描述】:
如何结合使用 python 和 css 选择器访问“电话”和“传真”。我确实选择了“姓名”,但如果是“电话”和“传真”,我就卡住了。对此的任何帮助将不胜感激。提前致谢。
我试过了:
name = div.contact-details p #It works
phone = div.contact-details p #Can't think beyond
fax = div.contact-details p #Can't think beyond
项目所在的元素:
<div class="contact-details block dark">
<h3>Contact Details</h3><p>Company Name: PIMS Group Pty Ltd<br>Phone: +61 7
4969 3900<br>Fax: +61 7 4969 3999<br>Email: <a
href="mailto:admin@pims.net.au">admin@pims.net.au</a><br>Web: <a
target="_blank" href="http://www.pims.net.au">http://www.pims.net.au</a></p>
<h4>Address</h4><p>43 Evans Avenue<br>North Mackay<br>QLD<br>4740</p>
<h4>Contact</h4><p></p>
</div>
【问题讨论】:
-
您的全部数据都在
p标记中,由<br>分隔。您可以获取p标记的内容并使用正则表达式对其进行解析以获取特定信息
标签: python web-scraping css-selectors lxml