【发布时间】:2021-10-26 15:18:10
【问题描述】:
我正在尝试在两个不同字符/分隔符的位置之后提取字符串。以下是我正在尝试使用的数据框:
PMLBM000DUZ_PMCRZ362RNZ_RNA-Seq.multiqc_original.zip
电流输出
FileName Date
ID1_Joe_RNA.file1.zip 2021-10-29
ID1_Jim_DNA.file2.zip 2021-03-29
ID1_Tim_RNA.file3.zip 2021-05-29
期望的输出
FileName Date ID Name BioType FileNo Extension
ID1_Joe_RNA.file1.zip 2021-10-29 ID1 Joe RNA file1 zip
ID1_Jim_DNA.file2.zip 2021-03-29 ID1 Jim DNA file2 zip
ID1_Tim_RNA.file3.zip 2021-05-29 ID1 Tim RNA file3 zip
我尝试过使用 dplyr 和 tidyverse,但不断收到分离或子集的错误:
DataSplit <- strsplit(file$FileName, "_")
DataSplit2 <-strsplit(DataSplit, ".")
或
gsub("\\_.*","", file$FileName)
不确定我是否必须打电话
DataSplit[[#]] 每列?
【问题讨论】: