python – 找到一个数组的哪些元素接近另一个数组中的任何元素的
发布时间:2020-12-16 23:00:49 所属栏目:Python 来源:网络整理
导读:我有两个1维numpy.ndarray对象,并想知道第一个数组中的哪些元素在第二个数组中的任何元素的dx内. 我现在拥有的是什么 # setupnumpy.random.seed(1)a = numpy.random.random(1000) # create one arraynumpy.random.seed(2)b = numpy.random.random(1000) # cr
我有两个1维numpy.ndarray对象,并想知道第一个数组中的哪些元素在第二个数组中的任何元素的dx内.
我现在拥有的是什么 # setup numpy.random.seed(1) a = numpy.random.random(1000) # create one array numpy.random.seed(2) b = numpy.random.random(1000) # create second array dx = 1e-4 # close-ness parameter # function I want to optimise def find_all_close(a,b): # compare one number to all elements of b def _is_coincident(t): return (numpy.abs(b - t) <= dx).any() # vectorize and loop over a is_coincident = numpy.vectorize(_is_coincident) return is_coincident(a).nonzero()[0] 返回timeit结果如下 10 loops,best of 3: 16.5 msec per loop 优化find_all_close函数的最佳方法是什么,特别是如果a和b保证是浮点数组,当它们传递给find_all_close时可能会以升序排序,可能是cython或类似的? 在实践中,我正在使用10,000到100,000个元素(或更大)的数组,并在几百个不同的b数组上运行整个操作. 解决方法
最简单的方法是对第一个数组中的每个元素,对第二个数组进行两次二进制搜索,以找到最多dx以下的元素,最多在第一个数组中的元素上方dx.这是线性时间:
left = np.searchsorted(b,a - dx,'left') right = np.searchsorted(b,a + dx,'right') a[left != right] 线性算法有两个指向第二个数组的指针,它们在迭代第一个数组中的元素时跟踪移动窗口. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |