python – “得分必须返回一个数字”scikit-learn中的cross_val_
发布时间:2020-12-20 13:48:44 所属栏目:Python 来源:网络整理
导读:也许这是一个愚蠢的问题,但我不明白下面代码中的函数cross_val_score给出的错误.也许答案是X样本的格式,看到这正是崩溃消息中显示的内容,但我不知道如何修复.这是我项目中的一段代码,带有一些随机值. import numpy as npfrom sklearn import mixture,cross_v
也许这是一个愚蠢的问题,但我不明白下面代码中的函数cross_val_score给出的错误.也许答案是X样本的格式,看到这正是崩溃消息中显示的内容,但我不知道如何修复.这是我项目中的一段代码,带有一些随机值.
import numpy as np from sklearn import mixture,cross_validation np.random.seed(0) n_samples = 300 C = np.array([[0.,-0.7],[3.5,.7]]) X = np.r_[np.dot(np.random.randn(n_samples,2),C),np.random.randn(n_samples,2) + np.array([20,20])] clf = mixture.GMM(n_components=2,covariance_type='full') score = cross_validation.cross_val_score(clf,X) 给我错误: ValueError: scoring must return a number,got (<type 'numpy.ndarray'>) instead 解决方法
我认为这可能是scikit中的一个问题. cross_val_score最终调用score函数,无论估计器传递给它.通常,得分(例如在KMeans中)为
returns a float.当KMeans估算器传递给cross_val_score时,一切都很好:
>>> clf = cluster.KMeans() >>> score = cross_validation.cross_val_score(clf,X) # (no error) 注意得分的返回类型: >>> clf = cluster.KMeans() >>> clf.fit(X) >>> type(clf.score(X)) numpy.float64 在GMM和array is returned上调用得分时. >>> clf = mixture.GMM() >>> clf.fit(X) >>> type(clf.score(X)) numpy.ndarray 因为cross_val_score依赖于clf.score()返回一个浮点数,所以你看到的错误信息是有意义的. 解决方法是为您自己的得分手提供cross_val_score.例如,要获取GMM.score()返回的分数的平均值,请创建此评分函数: >>> scorer = lambda est,data: np.mean(est.score(data)) 然后你可以将这个得分手作为参数传递给cross_val_score: >>> score = cross_validation.cross_val_score(clf,X,scoring=scorer) 这可以避免错误,我认为应该或多或少地做你正在寻找的东西.我不确定平均值是否必然是总结得分的最佳方式,尽管它似乎足够合理.但是从这里你可以定义自己的方法. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |