我正在制作一个应用程序,根据每个文档的单词/短语内容,将一组文档(数量从最少约10个文档到最多约2000个)组织成组。每个文档的范围可以从一段文字到大约一页半。
我不是在寻找一个基于初始搜索词聚类结果的文档聚类库,而是一个没有搜索词聚类的库。
是否有任何库可以进行文档聚类,可以轻松地与Objective-C项目集成?
答案 0 :(得分:0)
我在对象C中读得不是很好,但是如果你可以导入本机C代码,那么你可以使用greedyRSC启发式。我们对路透社和洛杉矶时报的语料库都有很好的结果。
消息说明& C代码可在此处获取:http://research.nii.ac.jp/~meh/greedyRSC/rscpage.html