【问题标题】:creating a one-hot for Fashion-MNIST dataset with tensorFlow使用 tensorFlow 为 Fashion-MNIST 数据集创建 one-hot
【发布时间】:2021-12-30 16:53:06
【问题描述】:

以下情况是否应该为标签创建热一编码?

我也尝试创建一个 hot-one 编码,但一直出错。这是怎么做到的?

注意:我在 googles colab 工作。

谢谢。

import tensorflow as tf
from tensorflow import keras
import numpy as np
import matplotlib.pyplot as plt

fashion = keras.datasets.fashion_mnist
(train_images,train_labels),(test_images,test_labels) = fashion.load_data()

class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress','Coat',
               'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

train_images =  tf.cast(train_images, tf.float32) / 255.0
test_images = tf.cast(test_images, tf.float32) / 255.0

model = keras.Sequential([
    keras.layers.Flatten(input_shape=(28, 28)),
    keras.layers.Dense(128, activation='relu'),
    keras.layers.Dense(10, activation='softmax')
])

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])


model.fit(train_images, train_labels, epochs=10, batch_size=512, shuffle=True, validation_split=0.1)


要添加 one-hot 编码,我尝试将数据更改为:

train_images =  tf.cast(train_images, tf.float32) / 255.0
test_images = tf.cast(test_images, tf.float32) / 255.0

train_labels = tf.one_hot(tf.cast(train_labels, tf.int64), depth=10)
test_labels = tf.one_hot(tf.cast(test_labels, tf.int64), depth=10)

哪个给出了错误:

InvalidArgumentError Traceback(最近一次调用最后一次) 在 () 27 28 ---> 29 model.fit(train_images, train_labels, epochs=10, batch_size=512, shuffle=True, validation_split=0.1) 30

【问题讨论】:

  • 我认为您不需要对 Tensorflow 中的 mnist 数据集进行 one-hot 编码。但如果你真的想要,你可以使用 sklearn 库中的 LabelEncoding。
  • 对不起,我有阅读障碍。是的,它是一个热点。我尝试了几种方法来获得 one-hot 编码,但在 model.fit 中不断出现错误。
  • 你能显示错误信息吗?
  • 谢谢我更新了我尝试过的热门编码。
  • 错误信息不完整,目前我们还不知道您遇到了什么问题。您需要包含完整的回溯。

标签: python tensorflow google-colaboratory


【解决方案1】:

我认为这段代码应该可以工作。它没有 one-hot 编码,但效果很好。

import tensorflow as tf    
from tensorflow import keras    
import numpy as np    
import matplotlib.pyplot as plt 
       
fashion_mnist = keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data() 
   
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot'] 
train_images = train_images / 255.0    
test_images = test_images / 255.0
        
model = keras.Sequential([keras.layers.Flatten(input_shape=(28, 28)),keras.layers.Dense(128, activation=tf.nn.relu),   keras.layers.Dense(10, activation=tf.nn.softmax)])
model.compile(optimizer=tf.train.AdamOptimizer(),    loss='sparse_categorical_crossentropy',metrics=['accuracy'])        
    
model.fit(train_images, train_labels, epochs=20)

【讨论】:

  • 是的,但我认为一次性编码会很好,并试图弄清楚如何让它工作。
  • 但如果它有效,你为什么需要它?只是为了学习?
【解决方案2】:

我找到了答案。请看Sparse_categorical_crossentropy vs categorical_crossentropy (keras, accuracy)

要修复 one-hot 编码的代码,您应该修复代码:

model.compile(optimizer='adam',
          loss='sparse_categorical_crossentropy',
          metrics=['accuracy'])

收件人:

model.fit(train_images, one_hot_train_labels, epochs=10, batch_size=128, shuffle=True, validation_split=0.1)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-10-19
    • 2017-06-07
    • 1970-01-01
    • 2021-10-09
    • 2021-01-30
    • 1970-01-01
    • 1970-01-01
    • 2020-10-10
    相关资源
    最近更新 更多