【发布时间】:2019-10-24 11:29:04
【问题描述】:
<script type="text/javascript">
'sku': 'T3246B5',
'Name': 'TAS BLACKY',
'Price': '111930',
'categories': 'Tas,Wanita,Sling Bags,Di bawah Rp 200.000',
'brand': '',
'visibility': '4',
'instock': "1",
'stock': "73.0000"
</script>
我想刮掉 : 'stock': " and .0000" 之间的文本,所以理想的结果是 73
我以前知道的是做这样的事情:
for url2 in urls2:
req2 = Request(url2, headers={'User-Agent': 'Chrome/39.0.2171.95'})
html2 = uReq(req2).read()
page_soup2 = soup(html2, "html.parser")
# Grab text
stock = page_soup2.findAll("p", {"class": "stock"})
stocks = stock[0].text
我在以前的代码中使用了类似的东西,它在网络更改代码之前就可以工作。
但现在我要抓取的整个页面中有超过 1 个 ("script", {"type": "text/javascript"})。所以我不知道如何找到正确的(“script”,{“type”:“text/javascript”})
我也不知道hot获取具体的文字前后的文字。
我已经用谷歌搜索了一整天,但找不到解决方案。请帮忙。
发现strings = 'stock': "and .0000"在整个页面中是唯一的,只有1个'stock': and only 1 .0000"
所以我认为这可能是我要抓取文本的位置的标志。
请帮忙,谢谢你的好意。
我也为我缺乏英语而道歉,而且我实际上不熟悉编程。我只是想向谷歌学习,但我找不到答案。感谢您的理解。
url = view-source:sophieparis.com/blacky-bag.html
【问题讨论】:
-
如果可以分享网址
-
view-source:sophieparis.com/blacky-bag.html
标签: python python-3.x web-scraping beautifulsoup