python – “得分必须返回一个数字”scikit-learn中的cross_val_

发布时间：2020-12-20 13:48:44 所属栏目：Python 来源：网络整理

导读：也许这是一个愚蠢的问题,但我不明白下面代码中的函数cross_val_score给出的错误.也许答案是X样本的格式,看到这正是崩溃消息中显示的内容,但我不知道如何修复.这是我项目中的一段代码,带有一些随机值. import numpy as npfrom sklearn import mixture,cross_v

也许这是一个愚蠢的问题,但我不明白下面代码中的函数cross_val_score给出的错误.也许答案是X样本的格式,看到这正是崩溃消息中显示的内容,但我不知道如何修复.这是我项目中的一段代码,带有一些随机值.

import numpy as np
from sklearn import mixture,cross_validation

np.random.seed(0)
n_samples = 300
C = np.array([[0.,-0.7],[3.5,.7]])
X = np.r_[np.dot(np.random.randn(n_samples,2),C),np.random.randn(n_samples,2) + np.array([20,20])]

clf = mixture.GMM(n_components=2,covariance_type='full')
score = cross_validation.cross_val_score(clf,X)

给我错误：

ValueError: scoring must return a number,got (<type 'numpy.ndarray'>) instead

解决方法

我认为这可能是scikit中的一个问题. cross_val_score最终调用score函数,无论估计器传递给它.通常,得分(例如在KMeans中)为 returns a float.当KMeans估算器传递给cross_val_score时,一切都很好：

>>> clf = cluster.KMeans()
>>> score = cross_validation.cross_val_score(clf,X)
# (no error)

注意得分的返回类型：

>>> clf = cluster.KMeans()
>>> clf.fit(X)
>>> type(clf.score(X))
numpy.float64

在GMM和array is returned上调用得分时.

>>> clf = mixture.GMM()
>>> clf.fit(X)
>>> type(clf.score(X))
numpy.ndarray

因为cross_val_score依赖于clf.score()返回一个浮点数,所以你看到的错误信息是有意义的.

解决方法是为您自己的得分手提供cross_val_score.例如,要获取GMM.score()返回的分数的平均值,请创建此评分函数：

>>> scorer = lambda est,data: np.mean(est.score(data))

然后你可以将这个得分手作为参数传递给cross_val_score：

>>> score = cross_validation.cross_val_score(clf,X,scoring=scorer)

这可以避免错误,我认为应该或多或少地做你正在寻找的东西.我不确定平均值是否必然是总结得分的最佳方式,尽管它似乎足够合理.但是从这里你可以定义自己的方法.

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!