【发布时间】:2021-10-22 22:16:30
【问题描述】:
我正在尝试通过转换器使用 XLNET。但是我不断收到问题“AttributeError:'NoneType'对象没有属性'tokenize'”。我不确定如何进行。如果有人能指出我正确的方向,将不胜感激。
tokenizer = XLNetTokenizer.from_pretrained('xlnet-base-cased', do_lower_case=True)
print(' Original: ', X_train[1])
# Print the tweet split into tokens.
print('Tokenized: ', tokenizer.tokenize(X_train[1]))
# Print the tweet mapped to token ids.
print('Token IDs: ', tokenizer.convert_tokens_to_ids(tokenizer.tokenize(X_train[1])))
Original: hey angel duh sexy really thanks haha
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-67-2b1b432b3e15> in <module>()
2
3 # Print the tweet split into tokens.
----> 4 print('Tokenized: ', tokenizer.tokenize(X_train[2]))
5
6 # Print the tweet mapped to token ids.
AttributeError: 'NoneType' object has no attribute 'tokenize'
【问题讨论】:
-
什么是分词器?似乎你的代码上什么都没有
-
使用
print(tokenizer)查看是否为None -
您的 X_train[2] 返回无。 “tokenize”无法处理 NoneType 值。
标签: python huggingface-transformers