Keras 预处理交易数据答案

【问题标题】：Keras preprocessing trading dataKeras 预处理交易数据
【发布时间】：2021-04-04 16:44:35
【问题描述】：

我在从 .csv 预处理我的交易数据以使其适合 sgd 模型神经网络输入/输出时遇到问题。

我已经使用 pandas lib 导入了数据，但也许有更好的方法来做到这一点？

我需要设置列名，里面的数据需要是double类型，并转换成tf.data.Dataset。

我有 2 个数据集：testingdata.csv 和 trainingdata.csv

每个都有 4 列：打开、最大、最小、关闭

'Open' 列是预测值 Y，而 'max'、'min' 和 'close' 是 X 输入。

inside my .csv file

我也不知道 keras 中的“度量”是什么，我应该在这里使用什么度量

所以我的问题是：最好的方法是什么以及如何做到这一点。

谢谢

【问题讨论】：

标签： python keras tf.keras

【解决方案1】：

使用 pd.read_csv 是导入 .csv 文件的好方法

 import pandas as pd 
 df= pd.read_csv('data.csv')

但您需要将列名更改为自定义名称，以便您可以这样做：

df = pd.read_csv('data.csv',
                  header=None,
                  names=["open", "max","min","close"],
                  encoding='utf-16')

你可以在dataframe中看到导入的.csv文件头：

df.head(5)

如果你想从Pandas dataframe 转换为TensorFlow Dataset：

import tensorflow as tf
target = df.pop('Open')
dataset = tf.data.Dataset.from_tensor_slices((df.values, target.values))

【讨论】：

感谢您提供宝贵的信息，指标如何？在这种情况下我不知道该选择哪一个。
获得准确性的模型评估指标？
是的，今天我发现了一些关于指标的信息，并从我得到它的 jsut 来显示信息。所以我选择了平均绝对误差来查看输出的差异（Y1 - Y2）
这取决于您的任务。如果您想评估分类模型，您可以使用准确度、精确度或召回指标。如果要评估回归模型，可以评估 MSE 或 MAE 指标。如果您想在数据之间进行分类，我认为最适合您的指标是“准确性”。
由于您的任务是回归，因此最好使用 MSE（或 RMSE）和 MAE 作为指标。您也可以另外使用 R2（确定系数），尽管您可能需要为此使用 sklearn。