【问题标题】:Obtain title attribute from a tag using BeautifulSoup4使用 BeautifulSoup4 从标签中获取标题属性
【发布时间】:2020-10-04 10:35:42
【问题描述】:

假设如下:

<a href="/wiki/Shanar" title="Shanar">I WANT THIS TEXT</a>

现在,我已经成功地分别找到了表格和各个行:

table = soup.find('table', class_='sortable')
table_buy_rows = table.find_all('tr')
for tr in table_buy_rows:
    td = tr.find('a')
    print(td.text)

通过打印td,我可以看到我找到了正确的行,但我真的不确定如何获取文本内部a 标签。我尝试使用print(td.text),但这样做时出错,所以显然我做错了什么。

任何建议将不胜感激!

【问题讨论】:

    标签: html python-3.x beautifulsoup


    【解决方案1】:

    这个呢:

    import bs4
    
    markup = """
    <a href="/wiki/Shanar" title="Shanar">I WANT THIS TEXT</a>
    """
    soup = bs4.BeautifulSoup(markup=markup)
    a = soup.find('a')
    
    print("inner: %s" % a.text)
    print("title: %s" % a.attrs["title"])
    

    输出:

    inner: I WANT THIS TEXT
    title: Shanar
    

    【讨论】:

      猜你喜欢
      • 2013-01-31
      • 1970-01-01
      • 2021-11-18
      • 2017-12-04
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2022-12-06
      • 1970-01-01
      相关资源
      最近更新 更多