【发布时间】:2018-07-16 12:57:32
【问题描述】:
html 代码如下所示:
<img alt="Papa's Cupcakeria To Go!" src="data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7" data-old-hires="" class="a-dynamic-image a-stretch-vertical" id="landingImage" data-a-dynamic-image="{"https://images-na.ssl-images-amazon.com/images/I/814vdYZK17L.png":[512,512],"https://images-na.ssl-images-amazon.com/images/I/814vdYZK17L._SX425_.png":[425,425],"https://images-na.ssl-images-amazon.com/images/I/814vdYZK17L._SX466_.png":[466,466],"https://images-na.ssl-images-amazon.com/images/I/814vdYZK17L._SY450_.png":[450,450],"https://images-na.ssl-images-amazon.com/images/I/814vdYZK17L._SY355_.png":[355,355]}" style="max-width:512px;max-height:512px;">
我想得到“https://images-na.ssl-images-amazon.com/images/I/814vdYZK17L.png”,现在我正在使用
extract_item(hxs.xpath("//img[@id='landingImage']/@data-a-dynamic-image"))
,我得到的是该标签内的所有内容。 我怎样才能只获得第一个网址?
【问题讨论】:
-
更努力地处理。
-
@IgnacioVazquez-Abrams 你能说得更具体点吗?抱歉,我不熟悉前端的东西。