【发布时间】:2019-12-01 15:33:58
【问题描述】:
我正在尝试计算我的数据集中有多少无关紧要的行。一个无关紧要的行是少于 50% 的列被填充。
count_insignificant_rows=0
for i in range(len(df)):
columns_empty=0
for column in df.columns:
if df[column][i] is np.nan:
columns_empty=columns_empty+1
print(columns_empty)
if columns_empty>=len(df.columns)/2:
count_insignificant_rows=count_insignificant_rows+1
但是,它一直给我一个关键错误:331
怎么办?
【问题讨论】:
-
我会添加一列
insignificant并在该列中计算每一行是否无关紧要。然后,您可以简单地将该列相加得到总数。 -
上面的评论。因为一旦开始在纯 Python 中循环遍历数据帧,就会破坏 Pandas 的性能。
-
看看下面的答案,看看他们是否满足你的问题。