如何检测消息是否显示“谢谢”?

时间:2015-01-17 23:47:30

标签: parsing nlp

我有各种各样的消息,我想知道消息的本质是说'谢谢'。这忽略了“谢谢”并包含问题的消息。

1 个答案:

答案 0 :(得分:0)

既然你已经使用了“本质”这个词,那么这是一个非常难以回答的问题。

让我们在这里退一步:在一个称为情绪分析的相关问题上已经做了很多工作。在某些方面,这是该问题的一个有趣的子集,因为它的定义要好得多。

  

Naysayer:定义得更好!?为什么,情绪分析的定义非常明确。这是从文本到某种评论得分的地图。这是某种无耻的......

反对者批评的问题在于,那里给出的情绪概念确实没有明确定义。 “星级评分”是什么意思?这怎么能与语言有关?目前还不是很清楚,现有的方法在某些方面都在努力解决这个问题。

事实上,“表达感谢”比“表达情感”更加清晰。我们可以将感谢视为一种特殊的情感,事实上,这是一种非常具体的感受 - 我怀疑,人类注释者能够可靠地标记出来。如果人类可以可靠地标记出一种现象,那就是计算和语料库语言学家认为某些东西是“真实的”的充分标准。

你可以在这里采取两种方法。一个会更快;一个人会更有启发性。

首先要考虑与你可以提出的感恩相关的所有字符串,并搜索那些。换句话说,这就是@ OMGtechy在那里发表的讽刺评论的扩展版本。显然“谢谢”,但也“谢谢”,“我(真的)欣赏(d)”,“你的善意”,“非常善良”,“我很感激”。您可以快速获得很好的数据覆盖率。

第二个有点困难,但它具有挑战你的直觉的优势。获取消息列表,并标记它们是否“感恩”。在每条消息中,标记显示该人感激的部分。您可以从这部分中获取结果并使用它们来支持第一部分。

我怀疑地感谢这些模式非常规律。在表达感激之情时,我们经常会输入一个特定的语言使用注册表,并根据我的“第一部分”直觉 - 我们使用的一组相当有限的单词。不需要花哨的NLP - 只需在那里进行详尽的模式匹配。如果是这样的话,这里有一些有趣的语言学。