【发布时间】:2015-12-19 08:47:20
【问题描述】:
在拆分数据集时,我最终遇到以下错误,并寻求一些建议来克服它:
dt=read.csv("C:/xx/fData.csv")
testdata = dt[year(dt$date) < 2010,]
valid = dt[year(dt$date) > 2010,]
> training = dt[year(dt$date) < 2010,]
Error in as.POSIXlt.character(as.character(x), ...) :
character string is not in a standard unambiguous format
> testing = dt[year(dt$date) > 2010,]
Error in as.POSIXlt.character(as.character(x), ...) :
ps:fData 看起来像
| date | number
----------------------
1 |1/1/2011| 0
2 |1/2/2011| 0
【问题讨论】:
-
可能是您的 dt$date 字段不属于
date类。你能试试class(dt$date)来检查一下吗? -
这也可能发生,这是哪一年:
03-05-12?是2003还是2012?在这种情况和类似情况下,您应该定义as.POSIXlt的格式。在您的情况下,可能是一天和一个月。 -
@Edwin:
class(dt$date)结果为factor。 -
@Soheil:根据您的示例,
year将是2012,因为日期格式是mm/dd/yyyy -
@Soheil:根据您的建议,您如何为
as.POSIXlt定义format?