【发布时间】:2014-04-08 10:17:13
【问题描述】:
对于我的论文,我正在使用推文。我试图只选择包含某些单词的推文。由于我在地理上分析推文,因此我将它们作为 SpatialPointDataFrame (SPDF)。结果,我想在地图上看到关于这些词的推文来自哪里,所以我想从 SPDF 中选择它们,作为新的 SPDF。
我认为使用包 tm(文本挖掘)或使用扫描等通用功能应该很容易。但不幸的是,我发现很难找到一个可以让我在推文中扫描某个单词的功能。我的下一步是解决它,将 SPDF 中的推文转换为文本文件,使用我一直在使用 SPDF 尝试的功能之一选择推文,然后将它们链接回 SPDF 以使它们再次成为空间。
在编程语言 R 中,有人告诉我不要开始创建函数,因为您尝试创建的大多数函数已经存在。因此,在我对这种情况大发雷霆之前,我将其发布在这里,希望有人手头有结果。
所以我有一个包含很多推文的 SPDF。我想选择所有包含某个单词的推文。就是这样!这对我来说听起来仍然很容易,我觉得我现在只是没有得到正确的思路。
请帮忙!
编辑!!!!!!
all_tweets_containing_word_test_are_true
???选择所有真实数量的空间点数据框???
【问题讨论】:
-
不熟悉 SPDF,但不能像普通的 data.frame 一样使用 grepl 对其进行子集化吗?
-
谢谢!我现在很接近了:) 调整我原来的问题,但明天当我再次新鲜时应该能够弄清楚。
-
一些代码和数据结构会有所帮助。第一印象与@JeremyS 一致,因为您可能只想从常规数据框开始,进行一些
tm分析,然后尝试整合地理信息。 -
好吧,我怀疑它没有太多代码。一行选择所有为 TRUE 的数字。有了这些数据,我应该能够在使用 grepl 后从原始 SPDF 中选择所有为 TRUE 的数字。也许通过使用匹配或类似的东西。