【发布时间】:2012-08-02 06:32:45
【问题描述】:
html = """
...
<tt class="descname">all</tt>
<big>(</big>
<em>iterable</em>
<big>)</big>
<a class="headerlink" href="#all" title="Permalink to this definition">¶</a>
...
"""
我想在第一次出现a 标记之前获取起始标记big 之间的所有文本。这意味着如果我举这个例子,那么我必须得到(iterable) 作为一个字符串。
【问题讨论】:
标签: python html-parsing beautifulsoup