如何将训练数据转换为weka分类器的测试数据?

时间:2014-10-02 08:56:45

标签: classification weka training-data

我有训练数据(.arff),我想转换为测试数据。

这是我的训练数据:

@relation fix_labeled_tweet

@attribute Text string
@attribute class-att {relevant,not_relevant,additional}

@data
'pvj dengan ciwalk masih tetap jadi tempat fav untuk belanja;',additional
'deta di bandung trade centre btc fashion mall;',additional
'promo hotel bandung ibis trans studio enjoy our special price akan your wonderful weekend periode s di 27 desember;',not_relevant
'indri  theressa di cihampelas walk ciwalk;',additional
'beiga we  di jatinangor town square jatos;',additional
'nonton di paris van java my husband;',relevant
'mainya seringnya ke paris van java mall miko mall mana;',not_relevant
'double date yeahhhh  di braga city walk;',relevant
'sinta di jatinangor town square jatos;',additional
'terimakasih tas dompet teguh di cihampelas walk ciwalk;',additional
'malam minggu miko the movie di cinema 21 mall panakukang;',additional
'karaokean sekalian dugem patriot  handrian di inul vista paskal hypersquare;',relevant
'makan di mujigae korean resto ciwalk;',relevant
'just posted a photo bandung trade center;',additional

我尝试过的是从数据中删除标签(添加,相关,not_relevant),然后我保存到不同的名称,但它不起作用。 Weka说火车和测试装置不兼容。

1 个答案:

答案 0 :(得分:1)

它们不兼容,因为训练集和测试集的结构不同。

如果您复制了文档(比如Testing.arff),然后将其作为测试集提供,那么分类器将接受该文件。但是,如果从测试文件中删除已使用的属性,则无法使用该文档,因为缺少某些输入(用于分类)或输出(用于评估)。

我在删除类输出时能够复制您的问题,但在复制文档时,测试集可以按预期正常工作。

希望这有帮助!

相关问题