python – XgBoost:y中填充最少的类只有1个成员,这个成员太少
我在sklearn上使用Xgboost实现了一个讨人喜欢的比赛. $python Script1.py 警告:y中填充最少的类只有1个成员,这个成员太少了.任何类的最小标签数不能少于n_folds = 3. 根据stackoverflow的另一个问题: 好吧,我每班至少有3个样本. 所以我的问题是: a)有哪些替代方案? b)为什么我不能使用交叉验证? c)我可以使用什么?
参考文献: One-shot learning with scikit-learn Using a support vector classifier with polynomial kernel in scikit-learn 最佳答案
如果您的目标/类只有一个样本,那对于任何模型来说都太少了.您可以做的是获得另一个数据集,最好尽可能平衡,因为大多数模型在平衡集中表现更好.
如果您不能拥有其他数据集,则必须使用您拥有的数据集.我建议你删除那个有孤独目标的样本.因此,您将拥有一个不涵盖该目标的模型.如果这不符合您的要求,您需要一个新的数据集. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |