【问题标题】:Find out from which phrase a tweet is coming from找出推文来自哪个短语
【发布时间】:2015-10-16 01:19:43
【问题描述】:

我有关注流,当我收到一条推文时,我想从以下哪个短语和用户中查找我收到了推文。

stream.filter(track=['python', 'javascript', 'ruby'],follow=['#foo','#bar'])

twitter api 或 tweepy 是否有任何支持。如果不是最好的手动方式是什么?

Here 是一个例子,当收到一条推文时,我想知道这是否是因为 python 短语或 javascript 或 ruby​​ 甚至所有它们的组合

【问题讨论】:

  • 会不会有点不明显?!
  • 不,不是,因为我在一个流中将有 100-500 个短语 + 我将有 50 个流,所以当流来时我不知道它来自哪里从
  • 但我的意思是推文将包含您搜索的任何内容,因为这就是您获得它们的方式,因此只需检查您正在搜索的内容。你到底想达到什么目的?如果您需要更精确,为什么不使用更少的短语来获得更多的信息流?
  • 你能举一些你在做什么的实际例子吗? minimal reproducible example 会很有用。
  • 编辑问题给出一个有用的例子。

标签: python twitter tweepy


【解决方案1】:

我认为困惑在于实际理解 Streaming API。

一旦您根据您的要求打开连接,例如 stream.filter(track=['python', 'javascript', 'ruby'],follow=['#foo','#bar']),Twitter 将向您发送符合该条件的所有推文(在其指定限制内​​)。他们进行任何类型的分离,您会立即收到所有内容。

您可以做的是过滤(标记)每条推文的这些词,这可以在您收集所需的推文数量后完成,或者通过某种类型的流式实时方法完成。

根据您提供的示例,他对推文进行了后处理,并绘制了他在收集期间收到的所有数据的提及频率。

我希望能澄清一些事情。

【讨论】:

  • 谢谢,我想知道是否有本地方法并避免手动/后期处理,但似乎没有办法做到这一点。
猜你喜欢
  • 2015-10-04
  • 1970-01-01
  • 1970-01-01
  • 2011-04-06
  • 1970-01-01
  • 2012-08-10
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多