【问题标题】:View large data set on the R console在 R 控制台上查看大数据集
【发布时间】:2012-06-04 15:27:22
【问题描述】:

有什么方法可以查看大型数据集 [1380160 obs. 44 个变量] 在 R 控制台上完整?

我已经使用options(max.print=...) 更改了打印限制,但是,我看不到完整的数据集,即从第一行到最后一行,因为无法滚动数据。

【问题讨论】:

  • 可以保存到 csv 并使用电子表格程序打开吗?这是我通常做的。
  • 保存这么多数据需要我的电脑超过 30 秒,而在 excel 中打开需要 45 秒。我试过View(),打开花了6多分钟。大约一分钟后,它在fix()edit() 中打开。
  • 我的最后评论,如果此时不明显,我不确定您是否想查看整个内容。只需查看数据中的部分或示例。
  • 当您查看此数据集(140 万次观察)时,您将看到什么对 我来说并不明显......? Paul Murrell 编写了一个简洁的“rdataviewer”包(参见stat.auckland.ac.nz/~paul/Talks/viewer.pdf),它似乎对查看大型数据集特别有用,但我不确定它是否仍然有效/可用——我认为它已经过去了很多概念验证阶段...
  • 干杯。我知道查看整个数据集是不可行的,但我想知道是否有办法做到这一点(以防万一)我想查看整个数据。

标签: r dataset


【解决方案1】:

使用View 函数(注意大写字母“V”),它将以电子表格样式格式在新窗口中打开数据框、矩阵或其他类似表格的对象,可以滚动查看数据(但不是编辑)。此窗口独立于控制台,因此您可以继续发出命令而无需关闭查看窗口(但是对数据对象的更改不会在查看窗口中看到,您需要关闭窗口并再次运行View查看更改)。

如果您想在类似窗口的电子表格中编辑数据,请使用editfix(但在关闭编辑窗口之前,您无法运行其他命令)。

一些用于 R 的 GUI 还具有通过滚动查看或编辑数据对象的工具。

【讨论】:

  • 谢谢。我很快就会试试这个:)
【解决方案2】:

两个选择:

df <- data.frame(X = rpois(n = 100, lambda = 3), Y = rnorm(n = 100, mean = 25, sd = 7))
page(x = df, method = "print")
View(x = df , title = "My test data")

【讨论】:

    【解决方案3】:

    这是一个老问题,但是,我遇到了同样的问题。 我发现 Rcmdr 中的View data set 非常适合查看大数据集。它显示所有数据(但在一个窗口中)。

    library(relimp, pos=35)
    showData(Dat, placement='-20+200', font=getRcmdr('logFont'), maxwidth=80,  maxheight=10)
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-10-28
      • 1970-01-01
      • 2011-08-26
      • 1970-01-01
      • 2018-12-03
      • 2014-11-03
      相关资源
      最近更新 更多