使用python抓取流媒体推文和历史推文

时间:2016-08-10 10:43:02

标签: python twitter web-crawler

我想用python抓取用于搜索查询的流式推特数据。这里有一个问题:我收集的数据是否正确,从我运行脚本开始生成?

另外,如何在过去的某一天抓取推文?我可以在那一天访问所有推文吗?

谢谢!

1 个答案:

答案 0 :(得分:2)

这是真的如果您进行流媒体传输,则会从您启动该服务的那一刻起收集

所以你可以做的是通过其他机制获取旧推文,这里是github repo,它会以CSV格式给出结果,你可以指定该搜索的日期范围太

您可以同时运行流媒体服务,从那时起为您提供推文。

相关问题