【问题标题】:How to get the 'href' value from a specific name in the HTML code如何从 HTML 代码中的特定名称获取“href”值
【发布时间】:2020-06-17 09:35:38
【问题描述】:

我想创建一个在 HTML 代码中获取特定名称的 href=... 的代码。部分 HTML 代码如下所示:

class="name-link" href="/shop/t-shirts/hcir4dp5z/ntsf95gld">Tupac Hologram Tee</a> == $0

HTML 代码中有更多部分看起来像这样。因为网站上有多个产品(Supreme)。我得到了产品的名称 -> Tupac Hologram Tee。有人知道我如何从该特定行获取 href 值,而不是 html 代码中还包含 href= 的其他行吗?

这是我打印出页面上所有 href 链接的代码。但我只想要产品中以 Tupac 全息图 T 恤为名称的特定链接。

session = HTMLSession()
r = session.get(url)
word = r.html.links
print(word)

【问题讨论】:

  • 所以你想网页抓取?查找BeautifulSoup
  • 您能否发布一个精简的 html 示例,以便我们查看元素和文本的详细信息?
  • 说出要这样做的代码:对于 myfile 中的行,如果行包含(产品),则拆分为空格,对于每个拆分段,如果它包含“href”,则拆分(双引号)抓取拆分[1](拆分的第二部分。)
  • 这是密码吗? :)

标签: python python-requests href


【解决方案1】:

如果您的代码打印了包括 href 在内的所有行的列表,您就不能从它们中搜索您想要的行吗?如果输出和更多代码可见,那么提供帮助会更容易一些。

【讨论】:

  • 是的,但是有很多行,我不知道如何找到我想要的
  • 我的意思是,编写更多代码来过滤掉这些结果,而不是手动搜索它。
猜你喜欢
  • 2016-06-01
  • 2021-05-25
  • 1970-01-01
  • 2022-01-19
  • 2019-10-20
  • 1970-01-01
  • 1970-01-01
  • 2018-02-10
  • 1970-01-01
相关资源
最近更新 更多