【发布时间】:2021-02-23 16:57:53
【问题描述】:
我有一大堆原始文本文档。
我不确定是使用 keras.text_preprocessing.Tokenizer 还是 sklearn.feature_extraction.text.CountVectorizer。任何想法,建议?哪个更快?他们有什么我可能遗漏的主要区别吗?
谢谢
【问题讨论】:
-
你可以继续
keras.text_preprocessing.Tokenizer。这样你也可以扩展你的结构。
标签: machine-learning nlp