numpy排序与集合运算用法示例

发布时间：2020-12-17 07:43:47 所属栏目：Python 来源：网络整理

导读：这里有numpy数组的相关介绍https://www.oudahe.com/p/44528/ 排序 numpy与python列表内置的方法类似，也可通过sort方法进行排序。用法如下： In [1]: import numpy as npIn [2]: x = np.random.randn(9)In [3]: xOut[3]:array([-0.4041504,-0.42198556,0.92

这里有numpy数组的相关介绍https://www.oudahe.com/p/44528/

排序

numpy与python列表内置的方法类似，也可通过sort方法进行排序。

用法如下：

In [1]: import numpy as np
In [2]: x = np.random.randn(9)
In [3]: x
Out[3]:
array([-0.4041504,-0.42198556,0.92807217,-2.66609196,1.50915897,0.38080873,1.05325796,-1.16488798,0.04062064])
In [4]: x.sort()
In [5]: x
Out[5]:
array([-2.66609196,-0.4041504,0.04062064,1.50915897])

可以发现上述的sort方法是直接对x进行了排序而并没有创建一个副本。

但是np.sort()这个顶级的方法，会返回一个副本：

In [6]: x = np.random.randn(6)
In [7]: x
Out[7]:
array([ 0.14240205,0.48903869,0.22528632,1.31659382,0.00352338,0.95574862])
In [8]: np.sort(x)
Out[8]:
array([ 0.00352338,0.14240205,0.95574862,1.31659382])
In [9]: x
Out[9]:
array([ 0.14240205,0.95574862])

传入轴编号，可以实现在某一个轴向上进行排序。

In [34]: x = np.random.randn(5,4)
In [35]: x
Out[35]:
array([[-0.26646799,-0.40714749,-0.76788268,-0.25340467],[ 0.70099086,-0.88716684,0.13461279,2.14412835],[ 0.39718924,-0.14671297,-0.67821163,1.85798273],[-0.29389289,0.0346094,0.25213133,0.87105479],[-0.10797243,1.60188878,0.67829493,0.43291808]])
In [36]: s = x

In [37]: s.sort(0)#按列进行排序
In [38]: s
Out[38]:
array([[-0.29389289,[-0.26646799,0.43291808],2.14412835]])
In [39]: x
Out[39]:
array([[-0.29389289,2.14412835]])
In [40]: x = np.random.randn(5,4)
In [41]: x
Out[41]:
array([[ 0.82309157,-0.56413805,-0.1766557,-0.31924962],[-1.25606694,2.63622922,2.47481377,0.27840961],[ 0.63659583,1.52779004,-0.90582752,0.82325241],[-1.52664294,-0.5285837,-1.96380368,-0.44323125],[ 1.94859294,2.55676806,1.53614848,-0.43366557]])
In [42]: x.sort(1)#按行进行排序
In [43]: x
Out[43]:
array([[-0.56413805,-0.31924962,0.82309157],0.27840961,2.63622922],[-0.90582752,0.63659583,0.82325241,1.52779004],[-1.96380368,-1.52664294,[-0.43366557,1.94859294,2.55676806]])

在这儿，我试图将x赋值给s，结果发现对s排序后，x也变了，这说明，在内存中，实际上，s，x是指向同一组值得。

我也曾试图输入s.sort(2),结果出现了ValueError:axis(=2)outofbounds,这也就和前面的统计函数的axis参数是一致的。

那么也就是说，他的用法和axis一致。

利用排序，我们还能得到分位数（

分位数（英语：Quantile），亦称分位点，是指将一个随机变量的概率分布范围分为几个等份的数值点，常用的有中位数（即二分位数）、四分位数、百分位数等。具体可自行搜索），从而得到特定位置的值。

In [44]: x = np.random.randn(500)
In [45]: x.sort()
In [46]: x[int(0.05 * len(x))] #5%分位数
Out[46]: -1.7657191623368329

还有很多没有深入了解，比如怎么降序排列，待续。

集合运算

unique(x)返回集合中的唯一值，并排序，其实也就是去除重复值。

In [1]: import numpy as np
In [2]: str = np.array(['s','f','r','s','d','w','r'])
In [3]: np.unique(str)
Out[3]:
array(['d','w'],dtype='<U1')
In [4]: i = np.array([2,2,1,3,4,5,5])
In [5]: np.unique(i)
Out[5]: array([1,5])

intersect1d(x,y)返回集合A和B的交集，并排序

In [6]: k = np.arange(8)

In [7]: np.intersect1d(i,k)
Out[7]: array([1,5])

union1d(x,y)返回集合A和B的并集，并排序

In [8]: np.union1d(i,k)
Out[8]: array([0,6,7])

in1d(x,y)返回一个A包含于B的布尔型数组

In [10]: np.in1d(k,i)
Out[10]: array([False,True,False,False],dtype=bool)

setdiff1d(x,y)集合的差，包含于A但不包含于B,相当于A-（A∩B)

In [12]: np.setdiff1d(k,i)
Out[12]: array([0,7])

setxor1d(x,y)存在于A中但不同时存在于B中，也就是对称差，说白了就是A和B交集之外的部分。

就是红色的部分。

In [13]: s = np.arange(4,12)
In [14]: s
Out[14]: array([ 4,7,8,9,10,11])
In [15]: np.setxor1d(s,k)
Out[15]: array([ 0,11])

总结

以上就是本文关于numpy排序与集合运算用法示例的全部内容，希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题，如有不足之处，欢迎留言指出。感谢朋友们对本站的支持！

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!