scikit learn task Managment library

时间:2017-07-14 15:24:52

标签: scikit-learn

更新: 经过一些额外的搜索。我瘦了我过度使用scikit-learn。如果我想要一个生产ML工具。我应该使用基于hadoop的mahout之类的东西。 scikit-learn更像是实验创意的玩具工具。

我是scikit-learn的新手。我尝试使用scikit-learn来训练模型,我想尝试不同的特征组合和数据预处理技术。每个实验都需要几个小时(为了最大限度地减少错误,我会用不同的列车 - 测试分割运行每次实验10次),所以我写了一些python脚本来自动逐个运行实验,当实验完成时,它会传一个电子邮件给我。

效果很好,我发现今天可以运行我的实验的另一台服务器,我应该编写一些可以以分发方式运行实验的脚本。有像hadoop这样的大数据平台,但我发现它不适用于python和scikit-learn(请指出我如果我对hadoop的理解是错误的)。

因为scikit-learn是一个" old"库,所以我认为现有的库应该具有我想要的这些功能。或者我在错误的scikit-learn方向上奔跑?

我尝试google" scikit-learn task Managment",但我想要的不是什么。其他关键词也很受欢迎。

1 个答案:

答案 0 :(得分:0)

请参阅http://scikit-learn.org/dev/related_projects.html

上的“实验框架”