【发布时间】:2018-05-18 01:04:54
【问题描述】:
我正在尝试使用 TensorFlow 编写一个简单的深度机器学习模型。 我正在使用我在 Excel 中制作的玩具数据集,只是为了让模型工作并接受数据。我的代码如下:
import pandas as pd
import numpy as np
import tensorflow as tf
raw_data = np.genfromtxt('ai/mock-data.csv', delimiter=',', dtype=str)
my_data = np.delete(raw_data, (0), axis=0) #deletes the first row, axis=0 indicates row, axis=1 indicates column
my_data = np.delete(my_data, (0), axis=1) #deletes the first column
policy_state = tf.feature_column.categorical_column_with_vocabulary_list('policy_state', [
'AL', 'CA', 'MI'
])
modern_classic_ind = tf.feature_column.categorical_column_with_vocabulary_list('modern_classic_ind', [
'0', '1'
])
h_plus_ind = tf.feature_column.categorical_column_with_vocabulary_list('h_plus_ind', [
'0', '1'
])
retention_ind = tf.feature_column.categorical_column_with_vocabulary_list('retention_ind', [
'0', '1'
])
feature_columns = [
tf.feature_column.indicator_column(policy_state),
tf.feature_column.indicator_column(modern_classic_ind),
tf.feature_column.indicator_column(h_plus_ind)
]
classifier = tf.estimator.DNNClassifier(feature_columns=feature_columns,
hidden_units=[10, 20, 10],
n_classes=3,
model_dir="/tmp/ret_model")
train_input_fn = tf.estimator.inputs.numpy_input_fn(
x={"x": np.array(my_data[:, 0:3], dtype=str)},
y=np.array(np.array(my_data[:, 3], dtype=str)),
num_epochs=None,
shuffle=True)
classifier.train(input_fn=train_input_fn, steps=2000)
不幸的是,我收到以下错误。我尝试从 csv 文件中修剪标签而不是保留它们,将特征列命名为不同的东西,并更改 numpy 数组的类型。错误仍然存在。
ValueError: Feature h_plus_ind is not in features dictionary.
如果我删除 h_plus_ind,它只会在不同的列上抛出错误。
【问题讨论】:
标签: python numpy dictionary tensorflow