parsing - 如何检测消息是否显示“谢谢”？

既然你已经使用了“本质”这个词，那么这是一个非常难以回答的问题。

让我们在这里退一步：在一个称为情绪分析的相关问题上已经做了很多工作。在某些方面，这是该问题的一个有趣的子集，因为它的定义要好得多。

Naysayer：定义得更好！？为什么，情绪分析的定义非常明确。这是从文本到某种评论得分的地图。这是某种无耻的......

反对者批评的问题在于，那里给出的情绪概念确实没有明确定义。 “星级评分”是什么意思？这怎么能与语言有关？目前还不是很清楚，现有的方法在某些方面都在努力解决这个问题。

事实上，“表达感谢”比“表达情感”更加清晰。我们可以将感谢视为一种特殊的情感，事实上，这是一种非常具体的感受 - 我怀疑，人类注释者能够可靠地标记出来。如果人类可以可靠地标记出一种现象，那就是计算和语料库语言学家认为某些东西是“真实的”的充分标准。

你可以在这里采取两种方法。一个会更快;一个人会更有启发性。

首先要考虑与你可以提出的感恩相关的所有字符串，并搜索那些。换句话说，这就是@ OMGtechy在那里发表的讽刺评论的扩展版本。显然“谢谢”，但也“谢谢”，“我（真的）欣赏（d）”，“你的善意”，“非常善良”，“我很感激”。您可以快速获得很好的数据覆盖率。

第二个有点困难，但它具有挑战你的直觉的优势。获取消息列表，并标记它们是否“感恩”。在每条消息中，标记显示该人感激的部分。您可以从这部分中获取结果并使用它们来支持第一部分。

我怀疑地感谢这些模式非常规律。在表达感激之情时，我们经常会输入一个特定的语言使用注册表，并根据我的“第一部分”直觉 - 我们使用的一组相当有限的单词。不需要花哨的NLP - 只需在那里进行详尽的模式匹配。如果是这样的话，这里有一些有趣的语言学。