【问题标题】:Keras preprocessing trading dataKeras 预处理交易数据
【发布时间】:2021-04-04 16:44:35
【问题描述】:

我在从 .csv 预处理我的交易数据以使其适合 sgd 模型神经网络输入/输出时遇到问题。

我已经使用 pandas lib 导入了数据,但也许有更好的方法来做到这一点?

我需要设置列名,里面的数据需要是double类型,并转换成tf.data.Dataset。

我有 2 个数据集:testingdata.csv 和 trainingdata.csv

每个都有 4 列:打开、最大、最小、关闭

'Open' 列是预测值 Y,而 'max'、'min' 和 'close' 是 X 输入。

inside my .csv file

我也不知道 keras 中的“度量”是什么,我应该在这里使用什么度量

所以我的问题是:最好的方法是什么以及如何做到这一点。

谢谢

【问题讨论】:

    标签: python keras tf.keras


    【解决方案1】:

    使用 pd.read_csv 是导入 .csv 文件的好方法

     import pandas as pd ​
     ​df= pd.read_csv('data.csv')
    

    但您需要将列名更改为自定义名称,以便您可以这样做:

    df = pd.read_csv('data.csv',
                      header=None,
                      names=["open", "max","min","close"],
                      encoding='utf-16')
    

    你可以在dataframe中看到导入的.csv文件头:

    df.head(5)
    

    如果你想从Pandas dataframe 转换为TensorFlow Dataset

    import tensorflow as tf
    target = df.pop('Open')
    dataset = tf.data.Dataset.from_tensor_slices((df.values, target.values))
    

    【讨论】:

    • 感谢您提供宝贵的信息,指标如何?在这种情况下我不知道该选择哪一个。
    • 获得准确性的模型评估指标?
    • 是的,今天我发现了一些关于指标的信息,并从我得到它的 jsut 来显示信息。所以我选择了平均绝对误差来查看输出的差异(Y1 - Y2)
    • 这取决于您的任务。如果您想评估分类模型,您可以使用准确度、精确度或召回指标。如果要评估回归模型,可以评估 MSE 或 MAE 指标。如果您想在数据之间进行分类,我认为最适合您的指标是“准确性”。
    • 由于您的任务是回归,因此最好使用 MSE(或 RMSE)和 MAE 作为指标。您也可以另外使用 R2(确定系数),尽管您可能需要为此使用 sklearn。
    猜你喜欢
    • 2020-03-09
    • 2017-12-19
    • 1970-01-01
    • 1970-01-01
    • 2017-12-21
    • 1970-01-01
    • 1970-01-01
    • 2018-08-07
    • 1970-01-01
    相关资源
    最近更新 更多