【发布时间】:2021-12-09 17:19:02
【问题描述】:
我已经从 data.table 包中导入了一个带有 fread 函数的 .tsv 文件
dt <- fread( "full_data.tsv", nrows = 1000000)
数据集有 37 列,如下所示:
| ID | DATA | lan | geo_coord |
|---|---|---|---|
| 10002 | 2020-02-01 | eng | [10.2,32.5] |
| 10003 | 2020-02-01 | eng | [12.2,42.5] |
| 10004 | 2020-02-01 | eng | [14.4,22.6] |
| 10005 | eng | [32.6,23.5] | |
| 10004 | 2020-02-01 | eng | [16.2,21.2] |
| 10006 | eng | [16.7,20.2] | |
| 10007 | 2020-02-01 | eng | |
| 10008 | 2020-02-01 | eng | |
| 10009 | 2020-02-01 | eng |
我将仅过滤地理坐标列(字符)以删除获得如下结果的空单元格:
| ID | DATA | lan | geo_coord |
|---|---|---|---|
| 10002 | 2020-02-01 | eng | [10.2,32.5] |
| 10003 | 2020-02-01 | eng | [12.2,42.5] |
| 10004 | 2020-02-01 | eng | [14.4,22.6] |
| 10005 | eng | [32.6,23.5] | |
| 10004 | 2020-02-01 | eng | [16.2,21.2] |
| 10006 | eng | [16.7,20.2] |
我尝试使用来自 dplyr 的过滤器但没有结果。
【问题讨论】:
-
I tried with filter from dplyr without result你使用的代码是什么? -
您能否提供一个使用
dput和选定列的可重现示例,以便清楚您是否有NA值或空字符串?