标签: multithreading nlp text-mining opennlp
我现在已经从Wikipedia/DBPedia挖掘了一些训练数据(大约30MB的文本)。 我想用opennlp训练这个模型,但它需要永远。我的Mac有一个i7 / 4核心,它现在运行超过13小时但仍然是computing the event counts。 问题可能是,它没有使用multithreading。 你对此有什么经验吗?我该如何改进这个过程?
Wikipedia/DBPedia
computing the event counts
multithreading