如何从关键字中找到最佳句子匹配

时间:2018-04-09 18:55:04

标签: machine-learning nlp stanford-nlp

问题

我希望从预定义的与用户关键字匹配的句子列表中找到最佳句子匹配。

常见用例是Instagram主题标签。用户输入一些标签,他得到一个最好的封装那些主题标签的建议句子。

想象一下,用户输入了3个主题标签:

#water #sunny #outdoor。

我们预定的句子:

["今天是美好的一天","草是绿色的","它阳光明媚的外面"]。

最佳匹配:

我认为确定一个最佳匹配是不是微不足道的,但它不一定非常类似于单词或字符,但它应该最好地总结关键字。
在我们的例子中:"阳光明媚的外面"

1 个答案:

答案 0 :(得分:0)

你可以使用nlp模型来获得单词 word2vec 之间的相似性 所以你可以将hastags与每个句子中的每个单词进行比较,找到最佳匹配

你应该使用tf-idf方法对单词进行加权,以便在单词到句子匹配中获得更好的表现

你也可以使用 doc2vec ,但它主要是作为word2vec的特定情况实现的,我也不确定hastags怎么能创造一个合适的句子会表现