machine-learning - 哪种算法用于文本识别？

哪种算法用于文本识别？

时间：2012-04-17 15:10:21

标签： machine-learning

我正在使用朴素贝叶斯实现文本识别算法。我的数据库中有一个相当大的训练集，算法几乎完成了。但是有一个问题，在测试过程中，将文本分类为只有2个类的时间大约需要5秒。如果我有60个课程，则需要一分多钟。我想速度是正确的，因为我把文本中的每个单词都抛到我的算法和计算中。但... 我想知道Naive Bayes旁边，有什么更快的算法我可以使用吗？有什么建议吗？

1 个答案:

答案 0 :(得分：0)

问题可能不是算法而是你的实现。使用分析器查找修复性能瓶颈所花费的时间或重用现有的文本分类库（例如python中的nltk或java中的opennlp）。

哪种算法用于文本识别？
哪种算法用于一个类别分类？
我应该使用哪种物体识别算法？
使用哪种算法训练/预测Opencv LBPH人脸识别器？
哪种ML算法或模式有助于识别内容的类别和子类别？
在Google的tesseract-OCR中使用哪种算法进行识别？
比较两种算法的复杂性：识别适用于这两种算法的基本操作？
哪种棋盘识别算法（带opencv）？
哪种共识算法本质上是同步的？
如何识别使用的是哪种编码算法？

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？