我从uci档案中下载了一个名为乳腺肿块质量数据的数据集。我已将文件保存到edexcel中,然后另存为.csv文件。数据集的属性信息是:
属性信息:
BI-RADS评估:1至5(序数)
年龄:患者的年龄(整数)
形状:质量形状:圆形= 1椭圆形= 2小叶= 3不规则= 4(标称)
我在实验环境中打开文件并尝试运行但是我收到以下错误消息:
13:01:56:开始
13:01:56:Class属性不是名义上的!
13:01:56:中断
13:01:56:有1个错误
我尝试在资源管理器中将属性更改为类,但这没有用。任何建议都会很棒:)
答案 0 :(得分:0)
您需要一个Filter,更具体地说是Descritize过滤器,以预处理数据。
例如,假设ins
是存储数据集的实例对象。以下代码显示了如何使用过滤器。
Discretize filter = new Discretize();
filter.setOptions(...); // set options
filter.setInputFormat(ins);
ins = Filter.useFilter(ins, filter);