【发布时间】:2019-07-28 12:22:05
【问题描述】:
所以我正在使用来自 https://www.kaggle.com/jiashenliu/515k-hotel-reviews-data-in-europe/downloads/515k-hotel-reviews-data-in-europe.zip/1 的数据库,但我不明白为什么我不能通过子集数据集来缩小对象大小
df = read.csv('Hotel_Reviews.csv')
object.size(df)
200503848 字节
object.size(df[sample(1:nrow(df),500),])
157225848 字节
通过提取 0.1% 的数据,我只将数据缩减到 75%。我不明白为什么...
【问题讨论】:
标签: r subset objectsize