【发布时间】:2019-12-27 20:14:45
【问题描述】:
我有 9 个长度的字符串和带有标题的较长字符串列表
示例数据:
String <- "ABCDEFGHI", "ACBDGHIEF"
文本文件中的数据包含“带有标题的较长字符串”,例如
>name
ABCDEFGHIJKLMNOPQRSTUVWXYX
>name1
TUVWXYACBDGHIEFXGHIJKLMIJK
>name2
ABFNOCDEPQRXYXGSTUVWHIMJKL
我使用library(stringr) 来定位每个字符串的位置。
R 中的代码
loc <- str_locate(textfile,pattern = strings)
write.csv(loc, "locate.csv")
预期输出:
字符串 |定位 | 较长字符串的来源
1 | 1-9| 姓名1
2 | 7-15|name2
3 |不适用| 不适用
问题:
我想添加“字符串”所在的较长字符串的名称?如何在 R 中做到这一点?我想要最后一列(在预期结果中用粗体显示)。
感谢您的帮助
文卡塔
【问题讨论】:
-
开始结束 1 1 9 2 7 15 3 NA NA
-
嗨 akrun - 我确实更新了预期的结果。我想知道如何获得最后一列加粗的。感谢您的宝贵时间。
-
是的,但这就是混乱。对于第一个基因,我发现标题是
name,它也与"ABCDEFGHI"匹配。您显示两个 'String' 的长度相同,所以不清楚 'name1' 是如何匹配的 -
这是我的错。你是对的 - 'name' 中的第一个字符串和 'name1' 中的第二个字符串。对不起