【发布时间】:2016-10-05 01:24:51
【问题描述】:
我正在构建一个机器学习模型,其中一些列是物理地址(我可以将其转换为 X / Y 坐标),但我对 ML 算法如何处理这一点有点困惑。 有没有一种特殊的方法可以将 GEO 位置转换为列以用于 ML(分类和/或回归)?
提前致谢!
【问题讨论】:
-
你能准确地说“列”是什么意思吗?机器学习可以用任何类型的数据来完成……你能准确地说出你的担忧吗? (也许会提供您的数据样本)
-
嗨@Eskapp,为了最大限度地简化它,让我们考虑一下我有一个源邮政编码、一个目的地邮政编码和一个运输时间(从源到目的地)。我想预测从源到目的地的运输时间。我担心的是邮政编码与另一个邮政编码无关(没有数学关系),所以我考虑使用坐标,但这会将数据分成两个不同的列,这些列应该与某些东西相关。最后,我想知道如何为 ML 算法处理这些地理空间数据。
-
我不会将其视为拆分,而只会将其视为多维数据(在您的情况下,维度将为 2)。机器学习算法适用于一维和多维数据。这两个维度可以相关或不相关,具体取决于您在之后选择的模型中如何定义参数。这是否回答了您的问题,还是我错过了什么?
-
“相关”部分是我所缺少的。我需要阅读如何让算法了解 X 和 Y 之间存在的相关性。谢谢您的提示。
-
在大多数情况下不必明确设置相关性。说,如果您通过高斯对数据建模,则在估计此高斯的参数时,协方差矩阵将具有非零的非对角项,这将表示数据相关性。您只需要假设 2 维不相关。如果这回答了您的问题,我将对此主题提交明确的答案。 :)
标签: machine-learning geospatial