哪种算法用于文本识别?

时间:2012-04-17 15:10:21

标签: machine-learning

我正在使用朴素贝叶斯实现文本识别算法。 我的数据库中有一个相当大的训练集,算法几乎完成了。 但是有一个问题,在测试过程中,将文本分类为只有2个类的时间大约需要5秒。如果我有60个课程,则需要一分多钟。 我想速度是正确的,因为我把文本中的每个单词都抛到我的算法和计算中。 但... 我想知道Naive Bayes旁边,有什么更快的算法我可以使用吗?有什么建议吗?

1 个答案:

答案 0 :(得分:0)

问题可能不是算法而是你的实现。使用分析器查找修复性能瓶颈所花费的时间或重用现有的文本分类库(例如python中的nltk或java中的opennlp)。