【发布时间】:2017-05-27 17:22:44
【问题描述】:
我正在尝试执行一个非常简单的数据完成:我在相距几英里的两个不同位置进行了两列相同的测量。位置 1 比位置 2 更完整,我想通过将系数 (loc1/loc2) 应用于 1 来完成第二个和第一个。
我的问题是天气值会随所考虑的日期而变化,因此将相同的平均系数应用于我的所有值并不理想。我首先通过 loc1 和日期的值得到平均系数,但是对于没有 loc2 值的日子,我想:
- 将 'coef' 值中的 NA 替换为使用相同 loc1 值计算的 coef
- 但有时每个 loc1 值的 coef 不止一个,所以当有多个时,优先选择同一天测量的那个
-
当一个 loc1 值根本没有 coef 值时,coef 将与该 loc1 值相同 +/- 一个间隔(最接近 loc1 值在最接近的日期的 coef 是完全的) 这是它的样子:
loc1 Date Coef loc2 1 12 204 3 4 2 8 147 4 2 3 8 204 NA NA 4 10 147 NA NA 5 10 158 NA NA 6 6 159 3 2 7 6 162 NA NA 8 6 170 2 3 9 .3 175 0.4833333 0.145 10 0.3 204 NA NA 11 0.4 146 NA NA 12 0.4 147 NA NA
我很确定有一种简单的方法可以做到这一点,但由于我对 ifelse 或 ddply 的了解有限,我最终并没有更接近我想要的。我觉得循环可以解决问题,但我不知道如何..
任何想法将不胜感激!非常感谢!
【问题讨论】:
标签: r dataframe conditional-statements plyr completion