如何分析非结构化文本?

时间:2017-02-22 15:44:15

标签: data-mining sentiment-analysis text-analysis

我使用TF-IDF影响体重,这可以帮助我构建我的字典。但我的模型不够好,因为我有非结构化的文本。

有关TF-IDF类似算法的任何建议吗?

1 个答案:

答案 0 :(得分:1)

当你说,你的模型不够好时,是否意味着你生成的字典不够好?使用TF-IDF权重提取关键术语和构建词典实际上是特征选择步骤。

要为模型提取或选择特征,您可以遵循其他方法,如主成分分析,潜在语义分析等。机器学习中的许多其他特征选择技术也很有用!

但我真的相信情感分类任务,TF-IDF应该是构建字典的一个很好的方法。我建议您在训练时调整模型参数,而不是指责特征选择方法。

还有许多深度学习技巧适用于您的目标任务。

相关问题