【发布时间】:2016-02-04 06:41:41
【问题描述】:
我正在尝试从这个网站上抓取纬度和经度数:
http://www.healthgrades.com/provider-search-directory/search?q=Dentistry&prof.type=provider&search.type=&method=&loc=New+York+City%2C+NY+&pt=40.71455%2C-74.007118&isNeighborhood=&locType=%7Cstate%7Ccity&locIsSolrCity=false
对于每个提供者,如果你看元素,它看起来像
div class="listing" data-lat="40.66862" data-lng="-73.98574" data-listing="22"
如何使用beautifulsoup获取此处的经纬度数?
我尝试在我的脚本中使用正则表达式,
下面是我的脚本 -
Geo = soup.find("div", class_="providerSearchResults")
print Geo.findAll("div", data-lat_= re.compile('[0-9.]'))
但我收到此错误消息:“SyntaxError: 关键字不能是表达式”
此外,对于每个提供者,“div”部分总是会发生变化 可以是:
div class="listing" data-lat="40.66862" data-lng="-73.98574" data-listing="22"
或
div class="listingfirst" data-lat="40.66862" data-lng="-73.98574" data-listing="22"
甚至
div class="listing enhancedlisting" data-lat="40.66862" data-lng="-73.98574" data-listing="22"
【问题讨论】:
-
python 正则表达式包 (
re) 没有属性/方法.find,这就是您收到该错误的原因。
标签: python regex web-scraping beautifulsoup latitude-longitude