python – 仅使用NumPy计算马哈拉诺比斯距离
发布时间:2020-12-16 23:04:20 所属栏目:Python 来源:网络整理
导读:我正在寻找NumPy计算两个numpy数组(x和y)之间的Mahalanobis距离的方法. 以下代码可以使用Scipy的cdist函数正确计算相同的代码.由于此函数在我的情况下计算不必要的matix,我想要更直接的方式使用NumPy计算它. import numpy as npfrom scipy.spatial.distance
我正在寻找NumPy计算两个numpy数组(x和y)之间的Mahalanobis距离的方法.
以下代码可以使用Scipy的cdist函数正确计算相同的代码.由于此函数在我的情况下计算不必要的matix,我想要更直接的方式使用NumPy计算它. import numpy as np from scipy.spatial.distance import cdist x = np.array([[[1,2,3,4,5],[5,6,7,8,5]],[[11,22,23,24,[25,26,27,28,5]]]) i,j,k = x.shape xx = x.reshape(i,j*k).T y = np.array([[[31,32,33,34,[35,36,37,38,[[41,42,43,44,[45,46,47,48,5]]]) yy = y.reshape(i,j*k).T results = cdist(xx,yy,'mahalanobis') results = np.diag(results) print results [ 2.28765854 2.75165028 2.75165028 2.75165028 0. 2.75165028 2.75165028 2.75165028 2.75165028 0. 0. 0. 0. 0. 0. ] 我的试用版: VI = np.linalg.inv(np.cov(xx,yy)) print np.sqrt(np.dot(np.dot((xx-yy),VI),(xx-yy).T)) 任何人都可以纠正这种方法吗? 这是它的公式: http://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.spatial.distance.mahalanobis.html#scipy.spatial.distance.mahalanobis 解决方法
我认为你的问题在于你的协方差矩阵的构建.尝试:
X = np.vstack([xx,yy]) V = np.cov(X.T) VI = np.linalg.inv(V) print np.diag(np.sqrt(np.dot(np.dot((xx-yy),(xx-yy).T))) 输出: [ 2.28765854 2.75165028 2.75165028 2.75165028 0. 2.75165028 2.75165028 2.75165028 2.75165028 0. 0. 0. 0. 0. 0. ] 要在没有在此隐式创建的中间数组的情况下执行此操作,您可能必须牺牲Python循环的C循环: A = np.dot((xx-yy),VI) B = (xx-yy).T n = A.shape[0] D = np.empty(n) for i in range(n): D[i] = np.sqrt(np.sum(A[i] * B[:,i])) 编辑:实际上,使用np.einsum voodoo,你可以删除Python循环并加速它(在我的系统上,从84.3μs到2.9μs): D = np.sqrt(np.einsum('ij,ji->i',A,B)) 编辑:正如@Warren Weckesser指出的那样,einsum也可以用来取消中间A和B数组: delta = xx - yy D = np.sqrt(np.einsum('nj,jk,nk->n',delta,VI,delta)) (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |