【发布时间】:2021-03-11 18:13:06
【问题描述】:
如何抓取没有特定类的文本?我已经拉出了过去通过拍卖出售的 eBay 列表。这是标题部分的代码的 sn-p。
<h1 class="it-ttl" id="itemTitle" itemprop="name"><span class="g-hdn">Details about </span>2018 Panini Contenders Josh Allen #105 No Feet RC Ticket Auto PSA 10 GEM
我希望能够只用请求和漂亮的汤刮掉文本“2018 年帕尼尼竞争者乔什·艾伦 #105 No Feet RC Ticket Auto PSA 10 GEM”,但没有分配给该特定文本的类。
这是我目前的代码...
目前正在这条线上工作。
h1 = soup.find('h1', id="itemTitle")
print(h1)
任何帮助将不胜感激。
【问题讨论】:
-
如果只是文字可以使用
h1.text -
@Thymen 将在输出中包含
Details about,这是 OP 不想要的 -
对,你当然可以在之后过滤(python 3.9
removeprefix),但是Mendelg 的答案更简洁。
标签: python-3.x beautifulsoup python-requests