有什么方法可以导入包含多行的数据?

时间:2018-07-23 04:54:50

标签: rapidminer

在RapidMiner中,我通常看到的数据表是这样的:

Row    Age      Class
1      19       Adult
2      10       Minor
3      15       Teenager

在这句话上方的数据表中,一行代表一个完整的信息。

但是如何将数据表输入到RapidMiner,其中多行引用一个完整的信息?

例如:

Row      Word      Rho       Theta    Phi
1        Hello     0.9384    0.4943   1.2750
2        Hello     1.2819    0.8238   1.3465
3        Hello     1.3963    0.1758   1.4320
4        Eat       1.3918    0.3883   1.1756
5        Eat       1.4742    0.0526   1.2312
6        Eat       0.6698    0.2548   1.4769
7        Eat       0.3074    1.2214   0.2059

在此句上方的数据表中,第1-3行指的是一个完整的信息,其中第1-3行中的rho,theta和phi的组合表示单词hello。第4-7行也是如此,这是一个完整的信息,也意味着吃这个词。要进一步了解我在说的信息,请查看此句子下方的表格。

Row     Rho       Theta      Phi      Word
        ----------------------------
1       |0.9384   0.4943     1.2750|
2       |1.2819   0.8238     1.3465|  HELLO
3       |1.3963   0.1758     1.4320|
        ----------------------------
4       |1.3918    0.3883    1.1756|
5       |1.4742    0.0526    1.2312|
6       |0.6698    0.2548    1.4769|  EAT
7       |0.3074    1.2214    0.2059|
        ----------------------------

同样,我的问题是,如何将这种数据表插入RapidMiner,因为它可以理解多行引用一个完整的信息?有没有像我在这句话下面显示的表格?

Row      Word      Rho      Theta     Phi
1        Hello     0.9384    0.4943   1.2750
.        Hello     1.2819    0.8238   1.3465
1        Hello     1.3963    0.1758   1.4320
2        Eat       1.4742    0.0526   1.2312
.        Eat       0.6698    0.2548   1.4769
.        Eat       0.3074    1.2214   0.2059
2        Eat       0.3074    1.2214   0.2059

1 个答案:

答案 0 :(得分:0)

您可以尝试使用Pivot运算符按字对结果进行分组。

为此,我将 group属性参数设置为“ Word”,将 index 参数设置为“ Row”。它不是完全相同的表示形式,但是足够接近,具体取决于您的用例,因为多种格式表不是RapidMiner设计的一部分。