在RapidMiner中,我通常看到的数据表是这样的:
Row Age Class
1 19 Adult
2 10 Minor
3 15 Teenager
在这句话上方的数据表中,一行代表一个完整的信息。
但是如何将数据表输入到RapidMiner,其中多行引用一个完整的信息?
例如:
Row Word Rho Theta Phi
1 Hello 0.9384 0.4943 1.2750
2 Hello 1.2819 0.8238 1.3465
3 Hello 1.3963 0.1758 1.4320
4 Eat 1.3918 0.3883 1.1756
5 Eat 1.4742 0.0526 1.2312
6 Eat 0.6698 0.2548 1.4769
7 Eat 0.3074 1.2214 0.2059
在此句上方的数据表中,第1-3行指的是一个完整的信息,其中第1-3行中的rho,theta和phi的组合表示单词hello。第4-7行也是如此,这是一个完整的信息,也意味着吃这个词。要进一步了解我在说的信息,请查看此句子下方的表格。
Row Rho Theta Phi Word
----------------------------
1 |0.9384 0.4943 1.2750|
2 |1.2819 0.8238 1.3465| HELLO
3 |1.3963 0.1758 1.4320|
----------------------------
4 |1.3918 0.3883 1.1756|
5 |1.4742 0.0526 1.2312|
6 |0.6698 0.2548 1.4769| EAT
7 |0.3074 1.2214 0.2059|
----------------------------
同样,我的问题是,如何将这种数据表插入RapidMiner,因为它可以理解多行引用一个完整的信息?有没有像我在这句话下面显示的表格?
Row Word Rho Theta Phi
1 Hello 0.9384 0.4943 1.2750
. Hello 1.2819 0.8238 1.3465
1 Hello 1.3963 0.1758 1.4320
2 Eat 1.4742 0.0526 1.2312
. Eat 0.6698 0.2548 1.4769
. Eat 0.3074 1.2214 0.2059
2 Eat 0.3074 1.2214 0.2059
答案 0 :(得分:0)
您可以尝试使用Pivot
运算符按字对结果进行分组。
为此,我将 group属性参数设置为“ Word”,将 index 参数设置为“ Row”。它不是完全相同的表示形式,但是足够接近,具体取决于您的用例,因为多种格式表不是RapidMiner设计的一部分。