有没有办法删除Mallet中的前缀/后缀和收缩

时间:2016-10-31 18:45:34

标签: mallet

我最近开始使用麻省大学的Mallet。我查看是否有办法用命令删除前缀/后缀和收缩,就像stop-words有一个命令,但是我没有找到任何关于它的信息。如果Mallet可以做到这一点,有人可以指出我正确的方向。如果它不能,但你知道其他的东西可以做到这一点,你能指出我的方向吗?

提前致谢!

1 个答案:

答案 0 :(得分:0)

在对其运行Mallet之前,您可以对语料库进行一些计算语言预处理(例如词干或lemmatising)。

我不知道在Mallet中这样做的方法(并且它依赖于语言)。也许你可以写一个输入过滤器,但我把它保留在Mallet之外。