Objective-C中的文档聚类

时间:2011-02-14 02:30:05

标签: objective-c cluster-analysis data-mining documents

我正在制作一个应用程序,根据每个文档的单词/短语内容,将一组文档(数量从最少约10个文档到最多约2000个)组织成组。每个文档的范围可以从一段文字到大约一页半。

我不是在寻找一个基于初始搜索词聚类结果的文档聚类库,而是一个没有搜索词聚类的库。

是否有任何库可以进行文档聚类,可以轻松地与Objective-C项目集成?

1 个答案:

答案 0 :(得分:0)

我在对象C中读得不是很好,但是如果你可以导入本机C代码,那么你可以使用greedyRSC启发式。我们对路透社和洛杉矶时报的语料库都有很好的结果。

消息说明& C代码可在此处获取:http://research.nii.ac.jp/~meh/greedyRSC/rscpage.html