【问题标题】:Computing a matrix out of a 'flat table'从“平表”计算矩阵
【发布时间】:2017-02-06 13:02:36
【问题描述】:

我是 stackoverflow 和数据科学的新手。现在我有一个项目,我想在其中执行关联规则分析。我在制作分析矩阵时遇到了一些麻烦。我的数据如下所示:

第 1 栏:收据编号,第 2 栏:品牌,第 3 栏:购买与否。

我想得到一个矩阵,其中收据编号是行,品牌是列。我不得不说,并不是每个收据号码都隐藏了所有品牌。

【问题讨论】:

标签: r associations sparse-matrix


【解决方案1】:

我认为这个问题的答案就像创建一个表一样简单。我将提供 MWE:

data <- data.frame(receiptnumber = c('1', '1', '2', '3', '4'),
                   brand = c('A', 'A', 'B', 'C', 'D'))

print(data)

#   receiptnumber brand
# 1             1     A
# 2             1     A
# 3             2     B
# 4             3     C
# 5             4     D

tabData <- table(data$receiptnumber, data$brand)

print(tabData)

#   A B C D
# 1 2 0 0 0
# 2 0 1 0 0
# 3 0 0 1 0
# 4 0 0 0 1

普通索引仍然有效

tabData[1,3]

# 0

【讨论】:

  • 嗨霜蛆,我试过你上面提到的东西。当我尝试运行它时,Rstudio 给出了以下错误:“无法分配大小为 1.9 gb 的向量。当我看到这种情况发生时,我尝试制作一个小子集(总共 791 个观察值)并再次运行它。Rstudio 给出了相同的错误,所以我认为还有另一个问题,但我找不到哪个问题。对于 R 来说,用这么少的数据点制作一个矩阵应该相当容易,对吧?你知道我该如何解决这个问题吗?谢谢你的帮助顺便说一句,对于 R 编程的初学者来说,向某些有经验的人询问这些问题是很好的
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2019-09-09
  • 1970-01-01
  • 1970-01-01
  • 2019-11-06
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多