【问题标题】:add random noise and random NA in pandas dataframe在熊猫数据框中添加随机噪声和随机 NA
【发布时间】:2021-03-14 20:32:02
【问题描述】:

我有一个 pandas 数据框,我想在数据中添加随机 NA 和随机噪声

    exp_TSPAN6  exp_TNMD    exp_DPM1    exp_SCYL3   exp_C1orf112
0   7.951917    3.524705    12.043700   7.605068    8.214067
1   8.079243    9.545859    5.6445321   8.509788    6.853905
2   11.335783   12.45859    12.254986   6.617365    8.196391

示例输出

    exp_TSPAN6  exp_TNMD    exp_DPM1    exp_SCYL3   exp_C1orf112
0   8.951917    4.524705    11.043700   7.605068    8.214067
1   8.079243    NA          NA          8.509788    6.853905
2   11.335783   NA          12.254986   6.617365    9.196391

我已尝试以下代码添加 NA,但无法添加随机噪声

for col in data.columns:
data.loc[data.sample(frac=0.1).index, col] = pd.np.nan

【问题讨论】:

  • 你想添加什么样的随机噪声?
  • @DaniMesejo 随机高斯噪声

标签: python pandas


【解决方案1】:

你为什么不试试这里的建议:Adding gaussian noise to a dataset of floating points and save it (python)

  1. 将数据加载到 pandas 数据帧 clean_signal = pd.read_csv("data_file_name")
  2. 使用 numpy 生成与数据集相同维度的高斯噪声。
  3. 使用 signal = clean_signal + noise 为干净信号添加高斯噪声

【讨论】:

    猜你喜欢
    • 2019-12-24
    • 1970-01-01
    • 2018-09-06
    • 2016-06-04
    • 2014-01-19
    • 1970-01-01
    • 1970-01-01
    • 2014-09-02
    • 2018-12-09
    相关资源
    最近更新 更多