用于情绪分析的种子数据

时间:2009-07-28 19:07:35

标签: dictionary sentiment-analysis

我正在玩情绪分析,我正在寻找一些种子数据。周围有免费的字典吗?

它可以非常简单:3组文本/句子,用于“正面”,“负面”,“中立”。它不一定非常庞大。

最终我可能会为我的特定用例生成自己的种子数据,但是在构建该东西的时候,现在可以玩一些东西会很棒。

4 个答案:

答案 0 :(得分:4)

答案 1 :(得分:3)

如果您对情感词典感兴趣,许多作者已经提出了基于手动构建列表的工作,以及其他半自动化方法来获取自以为是的术语列表。一种好的方法是从WordNet数据库中导出它,通过使用像同义词等关系扩展正/负词的核心。

手动构建列表的一个很好的例子是General Inquirer

对于派生列表的半自动方法,请查看Esuli和Sebastiani的SentiWordNet

我相信这些通常可供研究使用,但您可能需要与作者联系,了解这些资源是否用于非研究目的。

答案 2 :(得分:1)

您可以在此处使用AFINN单词列表:

http://www2.imm.dtu.dk/pubdb/views/publication_details.php?id=6010

  

AFINN是一个英文单词列表,其中包含一个整数的valence   在负五(负)和正五(正)之间。这些话有   由FinnÅrupNielsen在2009-2011年手动贴上标签。该文件是   制表符分隔。有两个版本:

     

AFINN-111:最新版本,包含2477个单词和短语。

     

AFINN-96:1480行1468个独特的单词和短语。请注意那里   是1480行,因为有些单词被列出两次。单词列表没有   完全按字母排序。

答案 3 :(得分:1)

我维护一份语料库和单词列表以供情绪分析(我的AFINN就是其中之一):

http://neuro.compute.dtu.dk/wiki/Sentiment_analysis#Corpora

http://neuro.compute.dtu.dk/wiki/Sentiment_analysis#Affective_word_lists