标签: python numpy nlp
我如何构建文档的单词出现矩阵VS一组上下文单词?
例如,我有一份包含以下内容的文件
"密码保护是安全的关键。
我有一组上下文单词,我从上面文档是子集的一组文档中作为关键字派生出来:
"密码,电子邮件,安全,网络...."
问题是,如何为非方形矩阵创建共生矩阵,该矩阵将行作为文档词汇(所有标记)VS列作为上下文单词。
目标是找到上下文单词与文档中其余单词之间的距离。