【发布时间】:2015-03-30 14:39:39
【问题描述】:
假设我的 HTML 看起来像这样:
<p> May 4 - <a href="http://auburn.craigslist.org/web/2996976345.html">residual income No experience is needed!!!</a> - <font size="-1"> (online)</font> <span class="p"> img</span></p>
我想做的只是选择文本May 4 -....即开头 p 标记之前的文本,以及开头 p 之后的第一个开头 a 标记之前的文本。
我该怎么做?类似的 CSS 选择器会是什么样子?
请注意,我不是在编写此 HTML。我正在抓取一个从中获取此代码的网站。我无法控制 HTML 输出。我只是在使用这种类型的标记,并试图从中提取合理的数据。
【问题讨论】:
-
font标签已弃用,您不应使用它。您可以在该文本周围添加一个span,然后您就可以轻松地对其进行样式设置。
标签: html css-selectors web-scraping