例如:对于培训,您使用的数据用户已填写表单中的所有字段(大约40个字段)以及预期输出。
我们现在建立一个模型(可以是人工神经网络或SVM或逻辑回归等)。
最后,用户现在在表单中输入3个字段并期望进行预测。
在这种情况下,我可以使用的最佳ML算法是什么?
答案 0 :(得分:-1)
我认为这取决于您问题的具体情况。你想根据什么样的输入来预测什么?
例如,像Netflix这样的公司使用recommender systems来预测用户对电影的评分,例如基于非常稀疏的特征向量(用户现有的微小评级)目录中所有电影的百分比。)
另一个选择是从稀疏特征空间开发一些映射算法到一个公共潜在空间,在该空间上使用例如SVM或神经网络进行分类。我相信this paper做了类似的事情。你也可以查看像this one这样的论文来翻译来自两个不同领域的数据的分类器(例如,你的训练与测试集合,两者都包含类似的信息,但是一个有完整的数据而另一个没有)进入一个共同的潜在空间进行分类。实际上有很多与域无关的分类。
要查找的关键字(有一些链接可以帮助您入门):generative adversarial networks (GAN),domain-adversarial training,与域无关的分类,转移学习。