【发布时间】:2021-06-15 04:24:57
【问题描述】:
我有一个包含多个 'tr' 的 html 代码,同时每个 'tr' 内部都有多个 'td' .我有兴趣只获取包含带有 ax 字符串的 'td' 的整个 'tr' 并且我希望代码过滤掉所有 'tr' 不包含带有该 x 字符串的 'td' 。 那可能吗?。我是新手,我花了几个小时寻找解决方案,但我做不到。
例如,我想获取包含字符串“acid blob”的'td'的整个'tr'
<tr>
<td>2</td>
<td><b><a href="http://tibia.fandom.com/wiki/abyssal calamaries">abyssal calamaries</a></b></td>
<td><img loading="lazy" src="images/monsters/abyssal_calamaries.gif" alt="abyssal calamaries"></td>
<td>2020-05-28</td>
<td>0</td>
<td>0</td>
<td>47246</td>
<td>0</td>
</tr><tr>
<td>3</td>
<td><b><a href="http://tibia.fandom.com/wiki/acid blobs">acid blobs</a></b></td>
<td><img loading="lazy" src="images/monsters/acid_blobs.gif" alt="acid blobs"></td>
<td>2020-05-28</td>
<td>325</td>
<td>0</td>
<td>93153</td>
<td>1</td>
</tr><tr>
<td>4</td>
<td><b><a href="http://tibia.fandom.com/wiki/acolytes of darkness">acolytes of darkness</a></b></td>
<td><img loading="lazy" src="images/monsters/acolytes_of_darkness.gif" alt="acolytes of darkness"></td>
<td>2020-11-11</td>
<td>0</td>
<td>0</td>
<td>4569</td>
<td>0</td>
【问题讨论】:
标签: python beautifulsoup screen-scraping