转换为weka arff格式

时间:2015-03-18 13:51:57

标签: weka arff

我想转换此链接中的文件:http://archive.ics.uci.edu/ml/datasets/Credit+Approval以匹配weka .arff文件并在那里打开。

我知道我们需要定义文件:

@relation

@attribute

@data

我找到了数据,但没有找到属性!关系是文件名吗?

最后一件事如何制作文件扩展名.arff?

请帮忙。 非常感谢你!

2 个答案:

答案 0 :(得分:0)

在数据文件夹的crx.names中说:所有属性名称和值都已更改为无意义的符号,以保护数据的机密性。

但他们会给你他们使用的价值:

  

属性信息:

A1:   b, a.
A2:   continuous.
A3:   continuous.
A4:   u, y, l, t.
A5:   g, p, gg.
A6:   c, d, cc, i, j, k, m, r, q, w, x, e, aa, ff.
A7:   v, h, bb, j, n, z, dd, ff, o.
A8:   continuous.
A9:   t, f.
A10:  t, f.
A11:  continuous.
A12:  t, f.
A13:  g, p, s.
A14:  continuous.
A15:  continuous.
A16: +,-         (class attribute)

您可以向此信息提供您需要的含义。

为了创建这个到arff文件,你可以这样写:

%Test Data set

@relation Credit Approval Data Set 

@attribute attribute_name {a,b}
@attribute ...



@data
b,30.83,0,u,g,w,v,1.25,t,t,01,f,g,00202,0,+

添加读取credit.lisp的下一个属性,您需要16个属性。 保存文件如何:name file.arff。您可以在首选的文本编辑器中创建此文件。

答案 1 :(得分:0)

如果您想要遵循基于GUI的方法,那么

1)在任何编辑器中打开crx.data

2)在第一行添加一个列标题,如:

A1,A2,A3,A4,A5,A6,A7,A8,A9,A10,A11,A12,A13,A14,A15,Class

3)将文件另存为crx.csv

4)打开Weka - > Explorer

5)在preprocess标签中 - >点击Open file

6)更改文件类型csv

7)找到文件' crx.csv`

8)点击Save

9)指定文件名crx.arff

已经完成了。