从文本标记自动发现

时间:2014-08-13 14:43:04

标签: ruby-on-rails ruby solr elasticsearch nlp

我有一个应用程序,用于存储用户的文章。我想提供一种在创建文章时自动对文章正文进行自动分类和/或自动标记的方法。 例如:

我们说我有一篇关于此内容的文章:

  

"他们拒绝允许我们获得拒绝许可证"

在用户创建本文时,我想自动确定并将发现的标签保存到数据库中拒绝许可(它包含文本中最重要的单词;& #34;最重要的"阶段的字集是我想要找到的方法)

我正在寻找一种解决方案,我可以使用ruby库自动标记/自动分类文章中的文本,如果可能的话。 我的问题是:我可以使用什么工具或算法(红宝石或非算法)以有效的方式解决问题?

0 个答案:

没有答案