【发布时间】:2021-09-05 08:26:24
【问题描述】:
我是网络抓取的新手。我试图获得一些 pub_ratings。另外,我想从 yelp 页面获取尽可能多的数据。
这是我的代码:
pub_ratings = []
pub_reviews = []
pub_names = []
num_reviews = []
#for loop for all pages
for i in range(0,240,10):
url = "https://www.yelp.ie/search?find_desc=Pubs+%26+Bars&find_loc=london&ns=1&start={}".format(i)
r = requests.get(url)
soup_240 = BeautifulSoup(r.content, 'html.parser')
sleep(1)
all_data = soup_240.findAll('div', class_="container__09f24__21w3G hoverable__09f24__2nTf3 margin-t3__09f24__5bM2Z margin-b3__09f24__1DQ9x padding-t3__09f24__-R_5x padding-r3__09f24__1pBFG padding-b3__09f24__1vW6j padding-l3__09f24__1yCJf border--top__09f24__8W8ca border--right__09f24__1u7Gt border--bottom__09f24__xdij8 border--left__09f24__rwKIa border-color--default__09f24__1eOdn")
#filling them with data
for data in all_data:
pub_names.append(data.find('a', class_='css-166la90').get_text(separator=' '))
num_reviews.append(data.find('span',class_='reviewCount__09f24__EUXPN css-e81eai').get_text(separator=' '))
pub_ratings.append(data.find('div', aria_label="").get_text(separator=' '))
这是我的错误
AttributeError: 'NoneType' 对象没有属性 'get_text'
【问题讨论】:
标签: web web-scraping