【发布时间】:2021-05-08 14:57:41
【问题描述】:
我目前正在研究一个 kaggle 数据集House price prediction
它在纬度和纬度列中有错误,所以我决定使用 geopy 来获取这两列的正确值。
如果我在一个地址上使用它,它工作正常,但如果应用于整个列,则返回 None。
city = []
lat = []
longi = []
for addr in train_df['address']:
geolocator = Nominatim(user_agent="ram")
location = geolocator.geocode(addr), timeout=100, language = 'en')
city.append(location.address.split(',')[-4])
lat.append(location.latitude)
longi.append(location.longitude)
它返回 None,可能是因为多次访问。
请帮我建议一些其他方法来获取我的数据框的“地址”列(或其他一些用于相同工作的库)的纬度和经度。
【问题讨论】:
-
我很困惑,因为我看到您使用“名称”作为每个项目的地址,但在地理编码功能中使用了“地址”。只是这个问题中的变量名错误?
-
对不起,已更正,请查看。
-
我认为问题出在数据集中。让我在下面发布我如何调试,代码示例会更清楚。
标签: python python-3.x data-cleaning geopy