矢量空间模型介绍

时间:2015-04-24 18:56:07

标签: nlp tf-idf cosine-similarity vsm

VSM(向量空间模型)有哪些不同类型?

我所知道的(根据维基)是tf-idf(在这种方法中使用余弦相似性,但它不是一个单独的方法)。还有其他方法吗?

在wiki中讨论的文档中的单词的不同维度(频率除外)是什么?

VSM是否有任何层次结构?

P.S。如果我在任何地方都错了,请纠正我......

1 个答案:

答案 0 :(得分:1)

看看论文The Hacker's Handbook: The Strategy Behind Breaking into and Defending Networks - 对语义的向量空间模型的调查。 有关频率的特定问题,请参阅第4.2和4.3节:简而言之,使用tf-idf,PMI,PPM进一步平滑(主要是通过SVD的某些变化)。

但是,由于此调查的日期是2010年,因此没有提及基于深度学习的VSM,请参阅From Frequency to Meaning: Vector Space Models of Semantics