【发布时间】:2015-06-17 19:03:19
【问题描述】:
我已将 CSV 文件导入 R 中的数据框,其中一列包含文本。
我想对文本进行分析。我该怎么做?
我尝试制作一个仅包含文本列的新数据框。
OnlyTXT= Txtanalytics1 %>%
select(problem_note_text)
View(OnlyTXT).
【问题讨论】:
-
你想从文本栏中得到什么?
-
花点心思,数数
table(unlist(strsplit(OnlyTXT[, 1], "")))的字符。 -
我正在尝试提取列中的每一行文本并解析文本以获取单词的频率,并通过删除停用词和词干来清理文本数据。
-
查看
tm和SnowballC包。他们几乎拥有您需要的一切。 -
我使用“DataframeSource(OnlyTXT)”将数据框中的每一行文本作为单独的文档获取。我想对这些词进行分析。
标签: r dataframe text-analysis