挖掘Twitter数据的最佳方法是什么?

时间:2015-02-27 11:30:48

标签: php python r twitter data-mining

我需要做一个大规模的数据挖掘。我想知道;

  1. 用户位置
  2. 查看他们的推文,了解过去两天的特定字词
  3. 为每个Twitter用户重复(理想情况下)
  4. 我已经看到R在某个地方推荐,但不知道从哪里开始。

    对CSV,json或SQL端点感到满意。

1 个答案:

答案 0 :(得分:1)

当你在问题中标记“python”时,我会认为你没问题! Twitter允许您通过两个API访问其数据:

  • REST API允许您发出特定的用户请求(个人资料,朋友等),但它每小时只允许一些查询,因此可能不符合您的“海量数据”标准
  • 流媒体API根据实时搜索发送推文。你绝对可以使用这个API获取大量数据,如果我没记错的话,推文会提供有用的信息(当然是推文的用户,但如果启用也可能是位置)。

Tweepy(http://www.tweepy.org/)是一个用户友好的Python库,它实现了两个Twitter API,为从流API中捕获数据提供了特别有用的功能(参见示例:https://github.com/tweepy/examples)。