寻找文本分类的训练数据

时间:2013-04-14 13:41:06

标签: document classification

我正在寻找文本分类的培训数据,分为体育,金融,政治,音乐等类别。

请参考参考资料。你好。

2 个答案:

答案 0 :(得分:2)

您可以通过Reuters

申请获得路透社语料库

您还可以获取Technion文本存储库TechnionRepo

答案 1 :(得分:1)

如果您要实时构建文本分类系统,那么您将拥有一组文档。任何分类器中的一个假设是,训练数据和训练数据。测试数据类似或来自相同的分布。 如果您只是在这个区域探索或构建样本用例,那么这个链接可能对获取一些列车数据很有帮助。

  1. http://web.ist.utl.pt/acardoso/datasets/
  2. http://disi.unitn.it/moschitti/corpora.htm