根据 R 中的搜索词选择推文答案

【问题标题】：Selecting tweets based on searchwords in R根据 R 中的搜索词选择推文
【发布时间】：2014-04-08 10:17:13
【问题描述】：

对于我的论文，我正在使用推文。我试图只选择包含某些单词的推文。由于我在地理上分析推文，因此我将它们作为 SpatialPointDataFrame (SPDF)。结果，我想在地图上看到关于这些词的推文来自哪里，所以我想从 SPDF 中选择它们，作为新的 SPDF。

我认为使用包 tm（文本挖掘）或使用扫描等通用功能应该很容易。但不幸的是，我发现很难找到一个可以让我在推文中扫描某个单词的功能。我的下一步是解决它，将 SPDF 中的推文转换为文本文件，使用我一直在使用 SPDF 尝试的功能之一选择推文，然后将它们链接回 SPDF 以使它们再次成为空间。

在编程语言 R 中，有人告诉我不要开始创建函数，因为您尝试创建的大多数函数已经存在。因此，在我对这种情况大发雷霆之前，我将其发布在这里，希望有人手头有结果。

所以我有一个包含很多推文的 SPDF。我想选择所有包含某个单词的推文。就是这样！这对我来说听起来仍然很容易，我觉得我现在只是没有得到正确的思路。

请帮忙！

编辑！！！！！！

all_tweets_containing_word_test_are_true

？？？选择所有真实数量的空间点数据框???

【问题讨论】：

不熟悉 SPDF，但不能像普通的 data.frame 一样使用 grepl 对其进行子集化吗？
谢谢！我现在很接近了:) 调整我原来的问题，但明天当我再次新鲜时应该能够弄清楚。
一些代码和数据结构会有所帮助。第一印象与@JeremyS 一致，因为您可能只想从常规数据框开始，进行一些tm 分析，然后尝试整合地理信息。
好吧，我怀疑它没有太多代码。一行选择所有为 TRUE 的数字。有了这些数据，我应该能够在使用 grepl 后从原始 SPDF 中选择所有为 TRUE 的数字。也许通过使用匹配或类似的东西。

【解决方案1】：

在常规数据框中，您可以像这样使用 grepl：

Sub.DF <- DF[grepl('test', DF$twt_txt),]

只要 SPDF 像这样工作，那么这应该是您想要的。如果您只想绘制 Sub.DF 对象，您甚至不需要制作它。如果您使用 ggplot2 或 ggmap 或其他东西，那么只需使用 data=DF[grepl('test', DF$twt_txt),]

【讨论】：