寻找更有效的方法来执行此计算

时间:2017-06-28 22:04:05

标签: r

我有一个列表,其中包含不同长度的单词向量。我想创建一个数据框,其中包含与其他单词向量相关的每个单词向量之间重叠的信息。

我现在有一个双循环,用于检查每个其他条目中有多少单词的总和(l [i]%in%l [j])如果i不等于j

我目前的方法似乎效率低下,但确实提供了正确的答案。最R的方法是什么?

A' = [[0, 0, 0, 1],[0, 0, 0, 1],[1, 0, 0, 0]]

1 个答案:

答案 0 :(得分:1)

您可以查找intersection

的每个成对组合的l
combn(l, 2, FUN=function(x) length(intersect(x[[1]],x[[2]])) )
#[1] 1 0 2

当(i = 1,j = 2)时1重叠,当(i = 1,j = 3)时为0,当(i = 2,j = 3)时为2。