【发布时间】:2020-02-25 22:13:02
【问题描述】:
我需要一些帮助来设置 R 中的代码来解决问题:
我想将一些字符串数据作为输入提供给 R,其中包含多个单词(短语、推文、任何你想要的)。字符串也可以有多个 " " 或 "," 作为分隔符。
样本输入数据
我希望 R 为所有输入字符串中的每个唯一单词设置一个变量,并在字符串包含此特定单词时设置为 1(或 TRUE,或其他任何值)。
所以我想要的输出看起来像这样:
样本输出
列中的空格应包含 0,为了便于阅读,我将它们省略了。
老实说,我不是循环方面的专家,我认为使用包可能会有更简单的解决方案。感谢您的网站在此主题上提供的任何支持,因为我有几个不同的项目,解决方案可以为我节省大量时间。
编辑:我想保留原始 ID 和字符串以供进一步处理。
【问题讨论】:
-
你能解释一下如何在 R 中做到这一点吗?你熟悉数据框吗?
-
我一般都熟悉数据框,但不熟悉如何在这里应用简单的数据框。我认为可能有一个两步解决方案。首先识别所有唯一值并使它们成为列,然后通过测试字符串中是否存在单词来填充列第 2 步。但我希望有一个现成的解决方案,也可以节省运行时间。