【发布时间】:2015-10-14 05:47:17
【问题描述】:
我想过滤所有年龄为“NA”的数据。所以我使用了train[train$Age != "NA",],它总是返回完整的数据帧。
[1] 891
> nrow(train)
[1] 891
> nrow(train[train$Age == "NA",])
[1] 177
> nrow(train[train$Age != "NA",])
[1] 891
我正在学习 R,但我对某一点感到震惊。我知道它很基础,但我自己或通过谷歌无法弄清楚。
数据集样本
PassengerId Survived Pclass Name Sex Age SibSp Parch Ticket
1 1 0 3 Braund, Mr. Owen Harris male 22 1 0 A/5 21171
2 2 1 1 Cumings, Mrs. John Bradley (Florence Briggs Thayer) female 38 1 0 PC 17599
3 3 1 3 Heikkinen, Miss. Laina female 26 0 0 STON/O2. 3101282
4 4 1 1 Futrelle, Mrs. Jacques Heath (Lily May Peel) female 35 1 0 113803
5 5 0 3 Allen, Mr. William Henry male 35 0 0 373450
6 6 0 3 Moran, Mr. James male NA 0 0 330877
【问题讨论】:
-
使用
?is.na过滤NA