训练斯坦福定制的NER模型

时间:2016-07-01 05:13:46

标签: java stanford-nlp

我正在为意大利语创建一个定制的ner train模型。我正在使用2015-12-09编译的Stanford 3.6。

运行命令训练模型时出错:

java -cp stanford-ner.jar edu.stanford.nlp.process.PTBTokenizer stanford_al_korpus.txt > jane-austen-emma-ch1.tok

这是错误:

Exception in thread "main" java.lang.NoClassDefFoundError: org/slf4j/LoggerFactory
        at edu.stanford.nlp.io.IOUtils.<clinit>(IOUtils.java:42)
        at edu.stanford.nlp.process.PTBTokenizer.tok(PTBTokenizer.java:424)
        at edu.stanford.nlp.process.PTBTokenizer.main(PTBTokenizer.java:768)
Caused by: java.lang.ClassNotFoundException: org.slf4j.LoggerFactory
        at java.net.URLClassLoader.findClass(Unknown Source)
        at java.lang.ClassLoader.loadClass(Unknown Source)
        at sun.misc.Launcher$AppClassLoader.loadClass(Unknown Source)
        at java.lang.ClassLoader.loadClass(Unknown Source)
        ... 3 more

我可以做什么?

1 个答案:

答案 0 :(得分:0)

如果您已下载stanford-ner,并发现此问题,请运行,

java -cp lib/*:stanford-ner.jar edu.stanford.nlp.process.PTBTokenizer file.txt > file.tok

因为您需要包含依赖项,即Slf4j .jar文件