PyLucene的对数似然比统计量

时间:2012-04-04 15:01:50

标签: python pylucene weighting

目前我正在分析相当多的文字。我想对两个单词列表执行对数似然比,以便识别前景语料库中的术语与规范语料库的频率偏差。我已经在Python中编写了Log-Likelihood,但是在bigrams上运行代码导致计算机速度慢,等待时间长。我刚读过,我可以用PyLucene索引我的语料库,这将加速语料库上的运行任务。有足够的文档如何索引,但我读到了PyLucene中存在的对数似然比函数。有谁知道这个功能吗?提前谢谢。

0 个答案:

没有答案