【发布时间】:2022-01-17 15:32:47
【问题描述】:
我有一个 Keras 标记器,我想在我的序列中添加一个句子开头标记,但我找不到任何关于它的信息来说明我该怎么做?
tokenizer = Tokenizer(split=' ')
tokenizer.fit_on_texts(data)
tokenizer.word_index['<pad>'] = 0
tokenizer.index_word[0] = '<pad>'
text_tokenized = tokenizer.texts_to_sequences(data)
text_corpus_padded = pad_sequences(text_tokenized, padding='post', maxlen=100, dtype='int32')
【问题讨论】:
标签: python tensorflow keras nlp tokenize