【发布时间】:2013-05-05 18:52:02
【问题描述】:
我想创建一个几乎是数据框的类,具有一些增强功能(额外的功能、额外的属性),我想知道最好的方法是什么。该类基本上是一个数据框,但具有一些附加属性,例如该数据框的架构(以下称为“表单”,自动派生,表示为数据框,用于将数据框转换为正确的类型),和其他几件事。当用户在其他无法识别其特殊类型的函数中使用此对象时,我希望他们处理对象的 data.frame 部分。最好的方法是什么?
我发现的两种方法都不能令人满意;我列出了它们以及我仍然看到并试图解决的问题;问题是:做我想做的事情的最佳方法是什么?
方法一,使用“data.frame”作为“base”槽(inspired by this SO post)
setClass("formhubData", representation(form="data.frame"), contains="data.frame")
fd <- new('formhubData', data.frame(x=c(1,2)), form=data.frame(name='x', type='select one', label='X'))
这个方法让我可以做这样的事情:
fd$x >> 1 2
names(fd) >> "x"
[更新:原来“崩溃”是由我的环境引起的,我在其中使用不同的参数反复调用 setClass('formhubData', ...)。在新的 R 会话中,以下所有功能都按预期工作。]
但它很快就会崩溃:
nrow(fd) >> NULL
colnames(fd) >> NULL
与上面链接的帖子不同,即使是简单的is.data.frame 也不适合我
is.data.frame >> FALSE
方法二,使用“数据”槽(受SP启发)
setClass("formhubData", representation(data="data.frame", form="data.frame"))
fd <- new('formhubData', data=data.frame(x=c(1,2)), form=data.frame(name='x', type='select one', label='X'))
我丢失了默认定义:
fd$x >> NULL
names(fd) >> integer(0)
但是,至少我可以重新定义它们中的大多数(仍然需要了解[,[[等):
dim.formhubData <- function(x) dim(x@data)
names.formhubData <- function(x) names(x@data)
nrow(fd) >> 2
names(fd) >> "x"
但是,我似乎无法表达这样一个事实,即对于任何采用 data.frame 的方法,我的类都应该用作其 @data 插槽的传递。我觉得需要像*.formhubData <- function(x, ...) *(x, ...) 这样的东西,而不是试图猜测我班级的客户可能使用的所有功能,并像dim.formhubData、names.formhubData 等那样定义它们。
有没有办法实现这样的目标?
【问题讨论】:
-
对于它的价值,
nrow和colnames在“R 版本 3.0.0 已修补 (2013-04-15 r62590)”下的方法 1“为我工作”中。 -
我在 R 2.15.2 中得到了与 Martin 相同的结果。此外,
is.data.frame(fd)出现了TRUE。但是,方法 2 甚至不会显示fd! -
好的,在你们俩说了同样的话之后,我在一个新的 R 会话中进行了测试,现在我也得到了很好的结果。也许 R 没有处理多次在同一个“formhubData”上调用 setClass,这就是让我搞砸的原因。
-
我还发现,如果我需要使用方法 1 访问数据帧,它会存储在一个名为
.Data的特殊命名槽中,这意味着我几乎使用方法 1。谢谢大家!