【发布时间】:2021-06-08 23:53:40
【问题描述】:
我对 pandas/numpy 还很陌生,虽然这很容易找到,但我找不到。
我想在我的df中随机选择10%的零值并将它们更改为np.nan,然后返回数据集以使用
这是为了模拟我的否定案例的缺失值,因为我的 df 由二进制变量组成,所以我只对增加 10% 的零感兴趣。
我希望这是有道理的!
index_nan = np.random.choice(df.size, 10, replace=False)
data.ravel()[index_nan] = np.nan
print(df)
我想这样做,但是(10 是我数据的 10%)但我不知道如何只影响我的 df 中的“0”值
【问题讨论】:
-
请从intro tour 重复on topic 和how to ask。 “告诉我如何解决这个编码问题”不是堆栈溢出问题。我们希望您做出诚实的尝试,然后然后就您的算法或技术提出一个具体的问题。 Stack Overflow 并不打算取代现有的文档和教程。你不是简单地“找到”它;你从你已经知道的各个步骤构建它。这就是编程。
标签: python pandas dataframe numpy