【问题标题】:How do I filter .csv file before reading如何在阅读之前过滤 .csv 文件
【发布时间】:2019-10-09 04:08:45
【问题描述】:

我想处理我的数据集的过滤子集。

示例:healthstats.csv

    age   weight   height   gender
A    25      150      65      female
B    24      175      78      male
C    26      130      72      male
D    32      200      69      female
E    28      156      66      male
F    40      112      78      female

我会开始

patients = read.csv("healthstats.csv")

但我如何只导入

的一个子集
patients$gender == "female" 

当我跑步时

patients = read.csv("healthstats.csv")

【问题讨论】:

  • 如果您觉得对您有用,请点击投票按钮旁边的复选标记,随时accept the answer。 :-)

标签: r csv filter import


【解决方案1】:

如果您只想导入一部分行而不读取它们,您可以使用sqldf,它接受查询以过滤数据。

library(sqldf)
read.csv.sql("healthstats.csv", sql = "select * from file where gender == 'female'")

我们也可以从readr使用read_csv_chunked

readr::read_csv_chunked('healthstats.csv', 
  callback = DataFrameCallback$new(function(x, pos) subset(x, gender == "female")))

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-02-22
    • 2018-05-12
    • 2017-09-06
    • 1970-01-01
    • 2018-04-18
    • 2020-06-12
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多