找出推文来自哪个词组

时间:2015-10-15 15:17:46

标签: python twitter tweepy

我有以下流,当我收到推文时,我想找到以下哪个词组和用户,我收到了推文。

stream.filter(track=['python', 'javascript', 'ruby'],follow=['#foo','#bar'])

twitter api或tweepy上是否有任何支持。如果不是最好的手工方式是什么?

Here是一个例子,当收到推文时,我想知道这是因为python短语或javascript或ruby甚至是所有这些的组合

1 个答案:

答案 0 :(得分:0)

我认为混淆在于实际理解Streaming API。

根据{{1}}等要求打开连接后,Twitter会向您发送符合该条件的所有推文(在指定的限制范围内)。他们做任何类型的分离,你马上收到所有东西。

你可以做的是对这些单词的每条推文进行过滤(标记化),这可以在你收集所需的推文数量后,或通过某种类型的流媒体实时方法完成。

从您提供的示例中,他对推文进行了后处理,并根据他在收集期间收到的所有数据绘制了提及的频率。

我希望澄清事情。