【发布时间】:2020-06-17 09:35:38
【问题描述】:
我想创建一个在 HTML 代码中获取特定名称的 href=... 的代码。部分 HTML 代码如下所示:
class="name-link" href="/shop/t-shirts/hcir4dp5z/ntsf95gld">Tupac Hologram Tee</a> == $0
HTML 代码中有更多部分看起来像这样。因为网站上有多个产品(Supreme)。我得到了产品的名称 -> Tupac Hologram Tee。有人知道我如何从该特定行获取 href 值,而不是 html 代码中还包含 href= 的其他行吗?
这是我打印出页面上所有 href 链接的代码。但我只想要产品中以 Tupac 全息图 T 恤为名称的特定链接。
session = HTMLSession()
r = session.get(url)
word = r.html.links
print(word)
【问题讨论】:
-
所以你想网页抓取?查找
BeautifulSoup -
您能否发布一个精简的 html 示例,以便我们查看元素和文本的详细信息?
-
Tupac 全息T恤 == $0
-
说出要这样做的代码:对于 myfile 中的行,如果行包含(产品),则拆分为空格,对于每个拆分段,如果它包含“href”,则拆分(双引号)抓取拆分[1](拆分的第二部分。)
-
这是密码吗? :)
标签: python python-requests href