【发布时间】:2014-07-19 20:12:48
【问题描述】:
我的是对Approaches for spatial geodesic latitude longitude clustering in R with geodesic or great circle distances 中问题和答案的后续跟进。
我想更好地理解:
问题 #1: 如果所有 lat / long 值都在同一个城市内,是否需要先使用fossil 或distHaversine(...) 来计算大圆距离?
- 或者,在一个城市内,是否可以根据纬度/经度值本身运行集群?
问题 #2: jlhoward 建议:
值得注意的是,这些方法要求所有点都必须进入某个集群。如果你只问哪些点靠得很近,并允许一些城市不进入任何集群,你会得到非常不同的结果。
就我而言,我想问的是“哪些点靠得很近”,而不是将每个点都强制成一个集群。我该怎么做?
问题 #3: 要将一个或两个因子变量包含到聚类中(除了 lat/long),是否像在聚类所在的 df 中包含那些因子变量一样简单?运行?
请确认。 谢谢!
【问题讨论】:
-
每个问题一个问题。我会回答第一个,但我认为其他两个取决于您用于进行聚类的确切功能,因此请用这些创建另外两个问题,最好是带有一些数据的小例子......
标签: r geocoding cluster-analysis geospatial