【问题标题】:How to alter output data format for isolation forest如何更改隔离林的输出数据格式
【发布时间】:2020-10-02 17:42:06
【问题描述】:

我已经建立了一个隔离林来检测我拥有的 csv 文件的异常情况,我想看看如何更改数据的格式。现在,异常数据作为 pandas 数据框输出,但我想将其更改为 json 文件,格式如下:

{seconds: #seconds for that row, size2: size2, pages: #pages for that row}

我已附上代码和数据示例,非常感谢!

model.fit(df[['label']])
df['anomaly']=model.fit_predict(df[['size2','size3','size4']])
#df['anomaly']= model.predict(df[['pages']])
print(model.predict(X_test))
anomaly = df.loc[df['anomaly']==-1]
anomaly_index = list(anomaly.index)
print(anomaly)

输出数据如下所示:

Unnamed:  seconds:    size2: ... size4: pages:  anomaly:
1          40            32       654     1       -1

【问题讨论】:

    标签: scikit-learn isolation


    【解决方案1】:

    我已经找到了一种方法来做到这一点;我制作了多个字典,一个将行的索引映射到该时间戳,一个将行的索引映射到标签。然后,我能够跟踪输出数据中的索引,并访问这些字典中的所有信息。

    【讨论】:

      猜你喜欢
      • 2020-05-24
      • 2019-07-20
      • 2022-01-21
      • 2019-08-19
      • 2019-01-29
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-08-21
      相关资源
      最近更新 更多