【发布时间】:2018-03-17 10:15:36
【问题描述】:
我在数据框列下面有一个数据-
X_ABC_123_DF</n>
A_NJU_678_PP</n>
J_HH_99_LL</n>
II_00_777_PPP</n>
我想提取数据框中每一行的第二个和第三个下划线之间的值,我计划创建一个新列并存储这些值。我在下面提到的 SO 上找到了一种方法,但他们没有提到了如何在 R 中写这个。我不知道如何写它的正则表达式函数。
^(?:[^_]+_){2}([^_ ]+)<br>
extract word between 2nd underscore and 3rd underscore or space
【问题讨论】:
-
使用正则表达式进行如此简单的操作似乎很愚蠢。只需拆分下划线并选择第二个值。在 Python 和 Ruby 中:
"X_ABC_123_DF".split("_")[1].
标签: r