【发布时间】:2021-01-01 11:48:14
【问题描述】:
我正在尝试创建一个列,用于从包含多行推文的数据框中识别英语和西班牙文推文。理想情况下,英文推文将被归类为 1,而西班牙文推文将被标记为 0。
最终目标是能够从我的数据框中过滤掉西班牙语推文,以将英文推文保存在新的 CSV 中。我查看了使用 Textblob、langdetect 和 fastText,但我发现的所有内容都提供了一次仅在 1 个文本字符串上运行代码的说明。
有没有一种简单的方法可以使用 Python 按语言(英语/西班牙语)对整个数据框进行分类?
【问题讨论】: