增加词汇表中特殊词的权重

时间:2018-11-18 22:05:00

标签: nlp cosine-similarity glossary

我有一个程序,通过使用余弦相似度来比较文本。 有一个选项可以上载词汇表文件,其中包含不是标准英语单词的特殊单词。 我想对这些单词给予更大的重视,因此,例如,如果两个不同的文本包含相同的特殊单词,则它们匹配的可能性要大于那些普通英语单词。

我一直在寻找有关的信息,但找不到。 我很乐于解释或参考与此相关的文章。谢谢

0 个答案:

没有答案