加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

python – 计算1000个数组的统计数据

发布时间:2020-12-16 21:39:20 所属栏目:Python 来源:网络整理
导读:我正在编写一个 python模块,需要计算1000个数组(相同尺寸)的像素值的平均值和标准差. 我正在寻找最快的方法来做到这一点. 目前我循环遍历数组并使用numpy.dstack将1000个数组堆叠成一个相当大的3d数组…然后将计算第3(?)维度的平均值.每个阵列都有形状(5000
我正在编写一个 python模块,需要计算1000个数组(相同尺寸)的像素值的平均值和标准差.

我正在寻找最快的方法来做到这一点.

目前我循环遍历数组并使用numpy.dstack将1000个数组堆叠成一个相当大的3d数组…然后将计算第3(?)维度的平均值.每个阵列都有形状(5000,4000).

这种方法需要相当长的时间!

有人能够建议更有效的方法来解决这个问题吗?

解决方法

也许你可以用累积的方式计算mean和std(未经测试):
im_size = (5000,4000)

cum_sum = np.zeros(im_size)
cum_sum_of_squares = np.zeros(im_size)
n = 0

for filename in filenames:
    image = read_your_image(filename)
    cum_sum += image
    cum_sum_of_squares += image**2
    n += 1

mean_image = cum_sum / n
std_image = np.sqrt(cum_sum_of_squares / n - (mean_image)**2)

这可能受限于您从磁盘读取图像的速度.它不受内存限制,因为您一次只在内存中有一个图像.以这种方式计算std可能会遇到数值问题,因为你可能会减去两个大数.如果这是一个问题,你必须循环文件两次,首先计算均值,然后在第二遍中累积(image – mean_image)** 2.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读