【发布时间】:2018-08-26 01:54:01
【问题描述】:
我正在尝试标记我的pandas 系列的每个句子。
我尝试按照我在文档中看到的那样使用 apply,但没有奏效:
x.apply(nltk.word_tokenize)
如果我只使用nltk.word_tokenize(x) 也不起作用,因为x 不是字符串。有人知道吗?
已编辑:x 是带有句子的pandas 系列:
0 A very, very, very slow-moving, aimless movie ...
1 Not sure who was more lost - the flat characte...
2 Attempting artiness with black & white and cle...
x.apply(nltk.word_tokenize) 返回的结果完全相同:
0 A very, very, very slow-moving, aimless movie ...
1 Not sure who was more lost - the flat characte...
2 Attempting artiness with black & white and cle...
nltk.word_tokenize(x) 的错误是:
TypeError: expected string or bytes-like object
【问题讨论】:
-
当您说它不起作用时,您是否收到错误消息?如果是这样,您可以在此处粘贴错误吗?还有一个非常小的例子说明
x是什么会有帮助 -
你运行
print(x.apply(nltk.word_tokenize)这会返回相同的结果吗? -
如果 nltk.word_tokenize(x) 给你 TypeError: expected string or bytes-like object - 可能是你有空值。
-
type(x)的输出是什么?
标签: python python-3.x pandas nltk