加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

python – 找到一个数组的哪些元素接近另一个数组中的任何元素的

发布时间:2020-12-16 23:00:49 所属栏目:Python 来源:网络整理
导读:我有两个1维numpy.ndarray对象,并想知道第一个数组中的哪些元素在第二个数组中的任何元素的dx内. 我现在拥有的是什么 # setupnumpy.random.seed(1)a = numpy.random.random(1000) # create one arraynumpy.random.seed(2)b = numpy.random.random(1000) # cr
我有两个1维numpy.ndarray对象,并想知道第一个数组中的哪些元素在第二个数组中的任何元素的dx内.

我现在拥有的是什么

# setup
numpy.random.seed(1)
a = numpy.random.random(1000)  # create one array
numpy.random.seed(2)
b = numpy.random.random(1000)  # create second array
dx = 1e-4  # close-ness parameter

# function I want to optimise
def find_all_close(a,b):
    # compare one number to all elements of b
    def _is_coincident(t):
        return (numpy.abs(b - t) <= dx).any()
    # vectorize and loop over a
    is_coincident = numpy.vectorize(_is_coincident)
    return is_coincident(a).nonzero()[0]

返回timeit结果如下

10 loops,best of 3: 16.5 msec per loop

优化find_all_close函数的最佳方法是什么,特别是如果a和b保证是浮点数组,当它们传递给find_all_close时可能会以升序排序,可能是cython或类似的?

在实践中,我正在使用10,000到100,000个元素(或更大)的数组,并在几百个不同的b数组上运行整个操作.

解决方法

最简单的方法是对第一个数组中的每个元素,对第二个数组进行两次二进制搜索,以找到最多dx以下的元素,最多在第一个数组中的元素上方dx.这是线性时间:
left = np.searchsorted(b,a - dx,'left')
right = np.searchsorted(b,a + dx,'right')
a[left != right]

线性算法有两个指向第二个数组的指针,它们在迭代第一个数组中的元素时跟踪移动窗口.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读