比较两个有序列表的相似性

时间:2016-03-24 12:00:53

标签: statistics information-theory

假设我有两个列表:

L1: [1,2,3,4]
L2: [1,3,2,4,5]

如何计算这两个列表之间的相似性?

如果这两个列表长度相同,Spearman和Kendall似乎就是答案,但这个原则是否也可以扩展到不同长度的列表?

2 个答案:

答案 0 :(得分:2)

生物信息学和语言分析领域也存在类似的问题。您可以使用各种序列内核(例如,参见Corinna Cortes的论文)和edit distances

答案 1 :(得分:2)

似乎是一种有前途的测量列表相似性的算法,是使用Spearman足球距离http://people.revoledu.com/kardi/tutorial/Similarity/FootruleDistance.html,或更多涉及并考虑顺序,折扣累积增益,DCG,https://www.kaggle.com/wiki/NormalizedDiscountedCumulativeGain

该主题的非常好的资源是

http://arxiv.org/pdf/1107.2691.pdf

http://theory.stanford.edu/~sergei/slides/www10-metrics.pdf