【发布时间】:2020-10-29 09:12:24
【问题描述】:
在下表中,1 行指的是 1 个属性。经纬度是指物业的GPS坐标,价格是物业的价格。 距离是一排和另一排之间的距离,以公里为单位。也就是说,0.1 是 100 米,0.05 是 50 米。
目标是对半径 100 米内的房产进行分组并获得平均价格。
latitude longitude price distance0 distance1 distance2 distance3 distance4 distance5 distance6 distance7 distance8 distance9
0 55.6632 12.6288 2595000 0.000000 0.046580 0.046580 0.031053 0.031053 0.093159 0.046580 0.046580 0.046580 0.093159
1 55.6637 12.6291 2850000 0.046580 0.000000 0.000000 0.015527 0.015527 0.046580 0.000000 0.093159 0.093159 0.046580
2 55.6637 12.6291 2850000 0.046580 0.000000 0.000000 0.015527 0.015527 0.046580 0.000000 0.093159 0.093159 0.046580
3 55.6632 12.6290 3198000 0.031053 0.015527 0.015527 0.000000 0.000000 0.062106 0.015527 0.077633 0.077633 0.062106
4 55.6632 12.6290 2995000 0.031053 0.015527 0.015527 0.000000 0.000000 0.062106 0.015527 0.077633 0.077633 0.062106
5 55.6638 12.6294 2395000 0.093159 0.046580 0.046580 0.062106 0.062106 0.000000 0.046580 0.139739 0.139739 0.000000
6 55.6637 12.6291 2995000 0.046580 0.000000 0.000000 0.015527 0.015527 0.046580 0.000000 0.093159 0.093159 0.046580
7 55.6642 12.6285 4495000 0.046580 0.093159 0.093159 0.077633 0.077633 0.139739 0.093159 0.000000 0.000000 0.139739
8 55.6632 12.6285 3998000 0.046580 0.093159 0.093159 0.077633 0.077633 0.139739 0.093159 0.000000 0.000000 0.139739
9 55.6638 12.6294 3975000 0.093159 0.046580 0.046580 0.062106 0.062106 0.000000 0.046580 0.139739 0.139739 0.000000
生成的数据框将在末尾有一个新列,其中包含 100 米半径内房产的平均价格。
编辑: 想法是,如果我们以列“distance0”为例。遍历低于 0.1 的每个数据点,它应该获取这些数据点的价格,并在名为“avg_price_per_100m_radius”的新列中返回索引 0 中的平均值
【问题讨论】:
-
你说的“半径100米以内”是什么意思?参考系的起源是什么? 100米从哪里来?此外,所有点的位置都使得所有距离列的值都小于 100 m(假设这是测量单位)。请考虑提供符合您标准的数据和一些不符合标准的数据。
-
如果你仔细看,有些点超过了 100 米。 0.1 是 100 米。
-
是的,你是对的。我第一次错过了。
0.1 is 100 meters, and 0.05 is 50 meters. -
没有问题,伙计:)
标签: python-3.x pandas group-by