大图的链接预测

时间:2018-06-07 10:39:23

标签: python graph pyspark bigdata graphframes

我正在努力寻找最有效的计算方法:

  • Jaccard系数
  • Adamic adar index
  • 优惠附件评分

用于大图中的边(约600M边,~30M顶点)。 我可用的工具是pyspark,graphframes和networkx。

Networkx确实拥有我正在寻找的所有功能,但由于内存有限和数据量大,它对我不起作用,所以我试图找到另一种方法来计算这些参数,最好是现有的包。

任何想法?

0 个答案:

没有答案