找出推文来自哪个短语答案

【问题标题】：Find out from which phrase a tweet is coming from找出推文来自哪个短语
【发布时间】：2015-10-16 01:19:43
【问题描述】：

我有关注流，当我收到一条推文时，我想从以下哪个短语和用户中查找我收到了推文。

stream.filter(track=['python', 'javascript', 'ruby'],follow=['#foo','#bar'])

twitter api 或 tweepy 是否有任何支持。如果不是最好的手动方式是什么？

Here 是一个例子，当收到一条推文时，我想知道这是否是因为 python 短语或 javascript 或 ruby 甚至所有它们的组合

【问题讨论】：

会不会有点不明显？！
不，不是，因为我在一个流中将有 100-500 个短语 + 我将有 50 个流，所以当流来时我不知道它来自哪里从
但我的意思是推文将包含您搜索的任何内容，因为这就是您获得它们的方式，因此只需检查您正在搜索的内容。你到底想达到什么目的？如果您需要更精确，为什么不使用更少的短语来获得更多的信息流？
你能举一些你在做什么的实际例子吗？ minimal reproducible example 会很有用。
请编辑问题给出一个有用的例子。

标签： python twitter tweepy

【解决方案1】：

我认为困惑在于实际理解 Streaming API。

一旦您根据您的要求打开连接，例如 stream.filter(track=['python', 'javascript', 'ruby'],follow=['#foo','#bar'])，Twitter 将向您发送符合该条件的所有推文（在其指定限制内）。他们不进行任何类型的分离，您会立即收到所有内容。

您可以做的是过滤（标记）每条推文的这些词，这可以在您收集所需的推文数量后完成，或者通过某种类型的流式实时方法完成。

根据您提供的示例，他对推文进行了后处理，并绘制了他在收集期间收到的所有数据的提及频率。

我希望能澄清一些事情。

【讨论】：

谢谢，我想知道是否有本地方法并避免手动/后期处理，但似乎没有办法做到这一点。