C / C ++ / Obj-C的词性标注和命名实体识别

时间:2011-06-28 13:53:47

标签: objective-c ios nlp named-entity-recognition part-of-speech

需要一些帮助!

我试图在objective-c中编写一些需要词性标注的代码,理想情况下也称为实体识别。我并没有太多兴趣和我自己的#34;所以我正在寻找一个像样的库来用于此目的。显然越准确越好,但我们并没有在这里说任何关键的东西 - 所以只要它通常非常准确就足够了。

它至少会暂时保持英语,但我不想自己必须接受任何模特训练。因此无论解决方案如何,它都必须已经建立了英语语言模型。

最后,它必须通过商业友好许可证(例如BSD / Berkeley,LGPL)提供。不能做GPL或类似的任何限制,但如果这是唯一的选择,我可以支付少量的商业许可。

C,C ++或Obj-C代码都很好。

所以:任何熟悉某事的人都可以在这里做到这一点吗?谢谢!

2 个答案:

答案 0 :(得分:3)

我建议您查看iOS 5测试版发行说明。

答案 1 :(得分:1)

你可能已经发现大多数免费提供的NLP代码是python,perl或java。但是,快速查看Stanford's NLP tools page可以看出C / C ++中的一些内容。可以在a blog post找到另一个工具列表。

在POS标签中,YamCha是众所周知的,虽然我自己没有使用它(是一个java / python / perl人)。

不幸的是,我无法建议任何NER nlp工具。但是,我敢打赌,你可以使用C / C ++中的maxent或svm实现: 1)创建您的训练数据并对其进行注释 2)定义您的功能 3)使用ml库

抱歉,我无法提供更多帮助,但如果有任何其他想法,我会添加它。

也许一旦我发现Objective-c达到了可观的程度,我就会为它写一个NLP库!