【发布时间】:2020-02-26 07:02:06
【问题描述】:
我的数据来自 SQL 数据库,并采用表格形式,其中我有多个行用于单个事务。我希望使用数据框中的所有其他列,而不仅仅是使用“产品”字段。
我的数据如下:
transID <- c('1','1','2','3')
state <- c('TX','TX','CA','MA')
product <- c('Oranges','Banana','Fish','Cheese')
Month <- c('January','January','Febuary','March')
Place <- c('A','A','B','C')
transactions <- data.frame(transID,state,product,Month,Place)
transactions
transID state product Month Place
1 1 TX Oranges January A
2 1 TX Banana January A
3 2 CA Fish Febuary B
4 3 MA Cheese March C
理想情况下,我的数据如下所示:
1 (TX,Oranges,Banana,January,A)
2 (CA,Fish,Febuary,B)
3 (MA, Cheese, March,C)
将此类数据转换为事务格式的最佳方法是什么?
我尝试了以下方法,但我只是将第 1 行和第 2 行合并为一个事务:
transactionData <- ddply(transactions,c("transID"),
function(df1) paste(df1$state,
df1$product,
df1$Month,
df1$Place,
collapse = ","))
【问题讨论】:
-
您的问题含糊不清。您应该使用 R 提供预期的输出。
标签: r data-mining apriori