【发布时间】:2017-04-02 04:15:41
【问题描述】:
我正在尝试标记我的字符串数组,并将它们转换为正式的序列。但是,当我尝试运行以下代码时,出现错误。
tokenizer = Tokenizer(num_words=20000)
tokenizer.fit_on_texts(txt)
sequences = tokenizer.texts_to_sequences(txt)
这是我的错误信息:
__init__() got an unexpected keyword argument 'num_words'
谁能告诉我为什么?我应该如何解决它?另外,我的 txt 数组的长度约为 5000,10 个字符串中的第一个看起来像这样:
['话虽如此,我今年将接种流感疫苗,我会鼓励周围的老人或儿童也接种疫苗',“RT @EWJJr:禽流感和猪流感之间的区别:禽流感你会收到推文。对于猪流感,你会收到 oinkment。/这太糟糕了,这很好”,“伊利诺伊州在 4 周内接种了猪流感疫苗”,“RT @EWJJr:禽流感和猪流感之间的区别:对于禽流感,你会收到推文。对于猪流感,你会得到 oinkment。/那太糟糕了,这很好”,“你在开玩笑吧……我周围的每个人都生病了,我开玩笑说生病了,还嘲笑流感疫苗……我现在很痛苦.. Blah”,“为她的身体服用了 Ash,我们都被流感疫苗困住了!!! WTF?'、'RT @WatchBirds 鸟类新闻:米苏拉水禽接受禽流感检测'、'打流感疫苗然后照看孩子。'、'我知道这不是“猪流感”!没有想在泥里大便并在里面打滚的冲动。不是“禽流感”-挡风玻璃或雕像上没有便便。','@thatoneguybob 我知道我很害怕我会感染猪流感']``
【问题讨论】:
标签: python machine-learning keras tokenize