【发布时间】:2016-12-30 13:32:02
【问题描述】:
我在要解析的 HTML 中有这些元素:
<td class="line"> GARBAGE </td>
<td class="line text"> I WANT THAT </td>
<td class="line heading"> I WANT THAT </td>
<td class="line"> GARBAGE </td>
如何制作一个 CSS 选择器来选择具有属性类行和其他类的元素(可能是标题、文本或其他任何东西)但不是仅属性类行?
我试过了:
td[class=line.*]
td.line.*
td[class^=line.]
编辑
我正在使用 Python 和 BeautifulSoup:
url = 'http://www.somewebsite'
res = requests.get(url)
res.raise_for_status()
DicoSoup = bs4.BeautifulSoup(res.text, "lxml")
elems = DicoSoup.select('body div#someid tr td.line')
我正在考虑修改最后一部分,即 td.line 到 td.line.whateverotherclass 之类的东西(但不是单独的 td.line,否则我的选择器已经足够了)
【问题讨论】:
标签: python html css-selectors beautifulsoup html-parsing