【发布时间】:2014-08-01 23:44:02
【问题描述】:
我看到了许多类似的帖子,但似乎没有一个适用于我的问题。对不起,如果我错过了。
我正在抓取一个相当大的 HTML 表格,并对其进行格式化,以便将其输入数据库。一条记录有一个空白列,当我尝试时会导致 NoneType 错误
print "|".join(record)
因为记录看起来像
(data, ... , None, data)
在创建记录元组之前,我尝试通过应用以下内容来过滤掉 None:
def null_converter(field):
return field.string if field else "NULL"
但这似乎不起作用。有没有更好的方法来处理这个问题?
【问题讨论】:
标签: python web-scraping beautifulsoup mechanize