【发布时间】:2011-09-30 15:01:25
【问题描述】:
这是一个示例:
> tmp
label value1 value2
1 aa_x_x xx xx
2 bc_x_x xx xx
3 aa_x_x xx xx
4 bc_x_x xx xx
如何计算所有重复标签的中位数(或更多,其他数据框列中的相应值),但只考虑前两个字母(即“aa_1_1”和“aa_s_3”是相同的值) ?标签列表是有限且可用的。
我已经阅读了有关aggregate、%in%、subset 和substr 的信息,但我无法编译任何有用和简单的内容。
这是我希望得到的:
> tmp.result
label median1 some.calculation2
1 aa xx xx
2 bc xx xx
3 aa xx xx
4 bc xx xx
非常感谢。
【问题讨论】:
标签: string r conditional-statements dataframe subset