【发布时间】:2020-09-02 20:10:50
【问题描述】:
我有一个特点如下:
tf.feature_column.indicator_column(tf.feature_column.categorical_column_with_vocabulary_file(...))
对应的'vocabulary_file'包含整数值如下:
10
20
32
44
5
1212
...
考虑这样的训练示例:
Jack, M, 22, "[10, 20]", 2.33, 1
Sara, F, 24, "[32, 44, 5, 1212]", 5.6, -1
每个训练示例都有一个可变长度的列表数据,例如 [10, 20] 或 [32, 44, 5, 1212]
现在,我想将 csv 文件中的这些数据捕获到 'indicator_column' 功能中,然后将 multi-hot 表示(结果)提供给深度模型。
decode_csv 函数仅支持 float32、float64、int32、int64、string,我对 csv 中的 'list' 类型数据有问题。
系统信息:
操作系统平台:Win8, TensorFlow 安装自:二进制文件, TensorFlow 版本:1.5, Python版本:3.6, Bazel 版本:无, CUDA/cuDNN 版本:无, GPU型号和内存:GPU>无| CPU> AMD(Phenom II x4),
重现的确切命令很清楚。
【问题讨论】:
标签: python tensorflow machine-learning neural-network deep-learning