【发布时间】:2020-09-22 15:42:31
【问题描述】:
我正在运行一个网络抓取程序,该程序从网站中抓取某些数据字段,但是我不能保证所有字段都会出现在给定页面上。如果字段不存在,则应为空白。就目前而言,我的代码如下所示
try:
field1 = scrape_data_field1(field1)
except NotOnPageError:
field1 = ""
try:
field2 = scrape_data_field2(field2)
except NotOnPageError:
field2 = ""
try:
field3= scrape_data_field3(field3)
except NotOnPageError:
field3 = ""
我不能将这些字段组合在同一个 try-except 块中,因为这样即使缺少一个,它们也会全部填写为空白。这个问题有没有比我目前正在做的笨重的更优雅的解决方案?如果相关,我将使用 selenium 从页面中抓取数据。
【问题讨论】: