【发布时间】:2021-08-23 22:59:43
【问题描述】:
我对 R 中的 NLP 有一个问题。我的数据非常大,因此我需要减少数据以进行进一步分析,以便在其上应用 SVM。
我有一个像这样的文档术语矩阵:
Document WordY WordZ WordV WordU WordZZ
1 0 0 0 1 0
2 0 2 1 2 0
3 0 0 1 1 0
所以在这个例子中,我想按列 WordY 和 WordZZ 减少数据帧,因为这些列对于这个数据帧没有特定的含义。这是否可以使用一个特定的顺序删除所有只有零值的列?我的问题是我的数据框太大,无法用一个订单删除每个特定列。它在数据框中大约有 4.0000.0000 列。
提前谢谢你们。 干杯, 汤姆
【问题讨论】:
-
为什么
4.0000.0000中的4个零组?
标签: r dataframe data.table tidyverse