找到相关性'两个单词列表之间

时间:2014-10-30 07:42:29

标签: algorithm similarity information-retrieval

我有一个单词列表L1,并且有候选列表,如B1,B2 ..,Bn,所有列表的长度相同。但他们没有相同的元素。列表不包含重复元素。 L1最类似于B1,B2 ... Bn中的一个。我可以应用哪种算法来找到与L1最相关的列表?

一些潜在的算法是编辑距离,等级相关性(两个列表上应该具有相同的元素,而不是我的情况),骰子和jaccard。我也不确定“相关”这个词是什么?这个在这种情况下有效吗?

编辑:我有一套文档和2个主题建模算法A1和A2。我通过应用A2将A1应用于文档集以及另外10个主题来获得10个主题。因此,上面的列表定义了这些主题中的单词。所以现在我想找到这两个算法A1和A2创建的类似主题。

1 个答案:

答案 0 :(得分:1)

也许您可以尝试从Levenshtein distance

开始