【发布时间】:2015-03-31 05:21:02
【问题描述】:
我在名为 PeakBoundaries 的数据框中有一列如下:
chrom
chr11:69464719-69502928
chr7:55075808-55093954
chr8:128739772-128762863
chr3:169389459-169490555
chr17:37848534-37877201
chr19:30306758-30316875
chr1:150496857-150678056
chr12:69183279-69260755
chr11:77610143-77641464
chr8:38191804-38260814
chr12:58135797-58156509
我想将列分开,以便数据框中的列如下所示:
chr chrStart chrEnd
chr11 69464719 69502928
chr7 55075808 55093954
chr8 128739772 128762863
chr3 169389459 169490555
等等
我尝试了正则表达式方法,但在让匹配项进入新列方面没有取得任何进展:
PeakBoundaries$chrOnly <- PeakBoundaries[grep("\\w+?=\\:"),PeakBoundaries$chrom]
我遇到了错误:
[.data.frame(PeakBoundaries, grep("\w+?=\:"), PeakBoundaries$chrom) 中的错误:
选择了未定义的列
【问题讨论】:
-
是
PeakBoundaries还是PeakBoudaries? -
峰边界。那是问题中的错字而不是代码;)
-
请更正。 “PeakBoundaries”中的列名称中是否有多余的空格?
-
没有多余的空格
标签: regex r split multiple-columns