【问题标题】:How do I build a TensorFlow dataset from a list如何从列表构建 TensorFlow 数据集
【发布时间】:2021-07-23 03:31:30
【问题描述】:

不是工程师,我在遵循关于如何构建数据集的 TF 文档时遇到了麻烦。

我收集了一个带有标签的句子数据集,我想将其转换为类似于 IMDB 数据集的 TF 数据集。

列表如下:

LIST=[('text1',0),('text2',1),('text3',1),('text4',0),...]

列表中有大约 100 000 个元素,以及 2 个可能的标签 0-1。

我的任务是构建一个模型,将给定句子与单个标签 0-1 配对,就像 IMDB 评论的基本 TF 示例一样。

我猜我不需要任何其他东西来构建数据集。我错了吗?

如何将此列表转换为 TF 数据集?

我会很感激任何指导

【问题讨论】:

    标签: python tensorflow tensorflow-datasets


    【解决方案1】:

    工作示例代码

    import tensorflow as tf
    
    LIST=[('text1',0),('text2',1),('text3',1),('text4',0)]
    text = [x[0] for x in LIST]
    label = [x[1] for x in LIST]
    dataset = tf.data.Dataset.from_tensor_slices(text)
    for element in dataset:
      print(element)
    

    输出:

    tf.Tensor(b'text1', shape=(), dtype=string)
    tf.Tensor(b'text2', shape=(), dtype=string)
    tf.Tensor(b'text3', shape=(), dtype=string)
    tf.Tensor(b'text4', shape=(), dtype=string)
    

    【讨论】:

    • 文本分类需要dataset.element_spec like ''' (TensorSpec(shape=(), dtype=tf.string, name=None), TensorSpec(shape=(), dtype=tf.int64, name=None)) ''' 我有类似架构的列表 - 我该如何调整它?
    猜你喜欢
    • 2020-01-17
    • 2019-09-09
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-03-20
    • 1970-01-01
    • 2016-03-25
    • 1970-01-01
    相关资源
    最近更新 更多