标签: machine-learning weka
我在python中编写了自己的分类器,我使用文本语料库使用F1测量来测试它,但现在我想在其他数据挖掘任务中测试它,所以我将分类器输出文件放到给定的语料库中我想要使用Weka测量质量的不同措施,我如何通过Weka输出文件并获得质量?
答案 0 :(得分:0)
我认为正确的程序应该是某种n倍验证:将您的数据集划分为训练和测试集。在训练集上开发模型;计算其平方误差之和SSE(火车)。
获取模型并通过它运行测试数据并使用预测和实际响应值计算SSE(测试)。这将帮助您评估模型的准确性和偏差。
看看Elements of Statistical Learning Using R。