【发布时间】:2017-06-20 01:26:06
【问题描述】:
这是我要解析的 HTML 部分:
<div class="syntax-container">
<h2>Official Syntax</h2>
<ul>
<li>
<strong>Syntax: </strong> </p>
<pre>text-align: start | end | left | right | center | justify</pre>
</li>
...and so on.
这是我的 Python 代码:
soup = bs4.BeautifulSoup(res.text, "html.parser")
propSyntax = ''.join(soup.select('.syntax-container pre')[0].findAll(text=True))
propSyntax = propSyntax.strip()
propSyntax = '<h2>Syntax</h2>' + '<p><pre>' + propSyntax + '</pre></p>'
这是我得到的错误:
propSyntax = ''.join(soup.select('.syntax-container pre')[0].findAll(text=True))
IndexError: list index out of range
我知道错误是因为</strong> 之后的额外</p>,但我不知道如何摆脱这个错误并正确解析数据。如有任何帮助,我们将不胜感激。
【问题讨论】:
标签: python python-3.x python-3.5 bs4