加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

为什么hash()在python3.4和python2.7下比较慢

发布时间:2020-12-16 22:45:22 所属栏目:Python 来源:网络整理
导读:我正在使用timeit进行一些性能评估,并发现python 2.7.10和python 3.4.3之间的性能降级.我把它缩小到hash()函数: python 2.7.10: import timeit timeit.timeit('for x in xrange(100): hash(x)',number=100000)0.4529099464416504 timeit.timeit('hash(1000

我正在使用timeit进行一些性能评估,并发现python 2.7.10和python 3.4.3之间的性能降级.我把它缩小到hash()函数:

python 2.7.10:

>>> import timeit
>>> timeit.timeit('for x in xrange(100): hash(x)',number=100000)
0.4529099464416504
>>> timeit.timeit('hash(1000)')
0.044638872146606445

python 3.4.3:

>>> import timeit
>>> timeit.timeit('for x in range(100): hash(x)',number=100000)
0.6459149940637872
>>> timeit.timeit('hash(1000)')
0.07708719989750534

那是一个约.降低40%!整数,浮点数,字符串(unicodes或bytearrays)等是否被散列似乎并不重要;退化大致相同.在这两种情况下,哈希都返回64位整数.以上是在我的Mac上运行,并在Ubuntu盒子上得到了较小的降级(20%).

我也在python2.7测试中使用PYTHONHASHSEED = random,在某些情况下,为每个“case”重新启动python,我看到hash()性能变得更糟,但从未像python3.4那样慢

谁知道这里发生了什么?是否为python3选择了更安全但更慢的哈希函数?

最佳答案
在Python 2.7和Python 3.4之间的hash()函数有两处变化

>收养SipHash
>默认启用哈希随机化

参考文献:

>从Python 3.4起,它使用SipHash作为散列函数.阅读:Python adopts SipHash
>自从Python 3.3哈希随机化默认启用.参考:object.__hash__(本节最后一行).将值0指定为PYTHONHASHSEED将禁用散列随机化.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读