【发布时间】:2015-01-05 16:14:54
【问题描述】:
我有一个.txt 文件读入一个名为power 的table,其中对9 个变量进行了超过200 万次观察。我试图将power 子集化为包含“01/02/2007”或“02/02/2007”的两行。创建子集后,RStudio 环境说我最终得到了零观察值,但变量相同。
如何获取仅包含“01/02/2007”和“02/02/2007”行的数据子集?
我看到了类似的帖子,但我的数据集仍然有错误。见链接:Select multiple rows conditioning on ID in R
我的数据:
#load data
> power <- read.table("textfile.txt", stringsAsFactors = FALSE, head = TRUE)
#subsetted first column called Date
> head(power$Date)
#[1] 16/12/2006 16/12/2006 16/12/2006 16/12/2006 16/12/2006 16/12/2006
> str(power$Date)
chr [1:2075259] "16/12/2006" "16/12/2006" "16/12/2006" "16/12/2006" ...
我的代码:
> subpower <- subset(power, Date %in% c("01/02/2007", "02/02/2007"))
子集数据:
> str(powersub$Date)
chr(0)
【问题讨论】:
-
除了这个子集问题,我建议你在继续分析之前将你的字符日期转换为真实的日期格式。
-
另外,16/12/2006 看起来像 dd/mm/yyyy 格式,虽然模棱两可,但您的子集标准可能是 mm/dd/yyyy 格式。