【发布时间】:2020-08-25 16:13:20
【问题描述】:
我使用转换器标记器,并使用 API 创建掩码:get_special_tokens_mask。
My Code
在RoBERTa Doc 中,此 API 的返回是“[0, 1] 范围内的整数列表:0 表示特殊标记,1 表示序列标记”。但我似乎这个 API 返回“0 表示序列标记,1 表示特殊标记”。
没事吧?
【问题讨论】:
-
您使用的是哪个版本的分词器?另外,请附上您的问题的minimal reproducible example,它解释了问题没有任何外部代码源。
标签: tokenize huggingface-transformers