【发布时间】:2022-01-02 09:02:57
【问题描述】:
希望能在这个问题上得到一些帮助。所以我有一列包含两种类型的字符串,我需要使用 2 个不同的条件将字符串拆分为多列。我可以弄清楚如何单独拆分它们,但很难在我的代码中添加一个 IF 语句。这是下面的示例数据集:
data = data.frame(string=c("HFUFN-087836_661", "207465-125 - IK_6 Mar 2009.docx_37484956"))
对于第一种类型的变量(带有_)。我想在_之后拆分。所以我为此使用了以下代码
strsplit(data$string, "-")
对于其中包含 .docx 的变量,我想在 docx 之后拆分。我不能根据“_”进行拆分,因为它在这个字符串中多次出现。所以我使用了以下代码:
strsplit(data$string, "x_")
我的问题是这两种类型的字符串都出现在同一列中。有没有办法告诉R“docx”是否在字符串中,然后在x_之后拆分,但如果它没有在_上拆分?
任何帮助将不胜感激 - 谢谢你们!
【问题讨论】:
标签: r string data-manipulation strsplit