【发布时间】:2015-09-09 22:28:10
【问题描述】:
我是 Spark 和 Scala 的新手。我运行了 Spark 流作业 - twitter 流行的哈希标签。
我为某些词添加了过滤器,并且能够过滤掉推文:
val filter = Array("spark", "Big Data")
val stream = TwitterUtils.createStream(ssc, None, filter)
同样,我想添加一个语言过滤器,以便仅流式传输英语推文。 Twitter4j 有Track() 和Locations。它有语言过滤器吗?如果是这样,它在 Scala 中是如何工作的?
【问题讨论】:
标签: scala twitter apache-spark twitter4j spark-streaming