【发布时间】:2022-01-21 13:00:09
【问题描述】:
html部分:
<div class="team-name" style="white-space: nowrap">
<span>Team A</span>
<span>13</span>
<...>
</div>
选择解析后的数据,我目前使用
response.css("div.team-name span::text").getall()
出[22]:['A队','13',':','3','B队']
这里的输出是:
接下来我需要做的是将字符串输出转换为 int - 在这个例子中是 array[1] 和 array[3]。这里的问题是数组内的数据中有空格。 删除空格并将数字转换为 int 的最快方法是什么? (我认为这里的 nowrap 也造成了麻烦)
我尝试使用 str.replace() / str.split() 在单独的变量中处理数组外部时没有成功。 (或者,xpath 也可以在这里工作)
【问题讨论】:
标签: python html scrapy css-selectors