余弦相似性问题

时间:2010-05-16 17:04:04

标签: tf-idf

我已经计算了文档1和文档2的术语的tf-idf值。现在我不知道如何使用这些tf-idf值...基本上我想找到两个文档之间的相似性(在我的例子中是网页)..可以任何身体告诉如何实现余弦相似性,jaccard系数找到相似性... c#代码将不胜感激...请帮助...谢谢

1 个答案:

答案 0 :(得分:0)

我建议访问Apache Mahout。它为此提供了完整的工具包。即使您不想使用它们,也可以通过查看现有实现来获得这些问题的答案。