【发布时间】:2015-12-23 18:12:36
【问题描述】:
03420 <a href="/kegg-bin/show_pathway?ban03420">Nucleotide excision repair</a><br>
03430 <a href="/kegg-bin/show_pathway?ban03430">Mismatch repair</a><br>
03440 <a href="/kegg-bin/show_pathway?ban03440">Homologous recombination</a><br>
</ul>
</ul>
<!-- -->
<b>Environmental Information Processing</b>
<ul>
Membrane transport
<ul>
02010 <a href="/kegg-bin/show_pathway?ban02010">ABC transporters</a><br>
我需要使用我使用 Beautifulsoup 完成的 python 从网页中提取路径代码(例如 03420、03430 等)。我想在环境信息处理之前停下来,所以我在这里寻找一些可以使用的不同标签。 <!-- --> 处于完美位置,但我不知道如何在这一点上停下来。有人可以告诉我是否/如何使用它来停止在评论之前提取代码。
(我对 python 和 html 很陌生,直接跳到网络解析,所以请多多包涵。)
【问题讨论】:
-
这是一个 HTML 注释。在多种语言中与
//或/* */基本相同。 -
@TimLewis 哦。谢谢。我希望这不是评论。
-
是否有其他方法可以在此时停止提取代码?
-
因为人们似乎对你标题中的问题很迂腐,而不是你似乎想问的问题,所以我就把这个留在这里:How to find the comment tag with Beautiful soup?
标签: python html beautifulsoup