【发布时间】:2021-04-16 11:54:07
【问题描述】:
我有一个具有字符类型特征的数据集(并非所有都是二进制的,其中一个代表一个区域)。
为了避免多次使用该函数,我尝试使用管道和 cross() 来识别所有字符类型的列,并使用创建的函数对其进行编码。
encode_ordinal <- function(x, order = unique(x)) {
x <- as.numeric(factor(x, levels = order, exclude = NULL))
x
}
dataset <- dataset %>%
encode_ordinal(across(where(is.character)))
但是,当我收到错误时,我似乎没有正确使用cross():
错误:across() 只能在 dplyr 动词中使用。
我想知道我是否过于复杂,有一种更简单的方法可以实现这一点,即识别字符类型的所有特征并对其进行编码。
【问题讨论】:
标签: r encoding pipeline categorical-data dummy-variable