python - 使用python抓取流媒体推文和历史推文 - Thinbug

使用python抓取流媒体推文和历史推文

时间：2016-08-10 10:43:02

标签： python twitter web-crawler

我想用python抓取用于搜索查询的流式推特数据。这里有一个问题：我收集的数据是否正确，从我运行脚本开始生成？

另外，如何在过去的某一天抓取推文？我可以在那一天访问所有推文吗？

谢谢！

1 个答案:

答案 0 :(得分：2)

是这是真的如果您进行流媒体传输，则会从您启动该服务的那一刻起收集。

所以你可以做的是通过其他机制获取旧推文，这里是github repo，它会以CSV格式给出结果，你可以指定该搜索的日期范围太

您可以同时运行流媒体服务，从那时起为您提供推文。