加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

Ruby兰特的有效种子范围是多少?

发布时间:2020-12-16 19:16:49 所属栏目:百科 来源:网络整理
导读:Ruby将PRNG实现为“经过修改的Mersenne Twister,周期为2 ** 19937-1.” 1 我理解MT的方式是它在2 ^ 32种不同的种子上运行.令我困惑的是Random.new(种子)接受任意大数字,例如Random.new(2 ** 100). 但是,我无法找到(逻辑)碰撞: Random.new(1).rand(10**5) ==
Ruby将PRNG实现为“经过修改的Mersenne Twister,周期为2 ** 19937-1.” 1

我理解MT的方式是它在2 ^ 32种不同的种子上运行.令我困惑的是Random.new(种子)接受任意大数字,例如Random.new(2 ** 100).

但是,我无法找到(逻辑)碰撞:

Random.new(1).rand(10**5) == Random.new(2**32-1).rand(10**5) => false
Random.new(1).rand(10**5) == Random.new(2**32).rand(10**5) => false
Random.new(1).rand(10**5) == Random.new(2**32+1).rand(10**5) => false

鉴于我们希望利用MT的最大种子范围,我们希望尽可能多地使用不同的种子,同时仍避免与两种不同的种子发生碰撞,种子范围是如何实现的?

我尝试了解Ruby随机实现中发生的事情,但没有太过分. https://github.com/ruby/ruby/blob/c5e08b764eb342538884b383f0e6428b6faf214b/random.c#L370

解决方法

Mersenne Twister序列为2 **(624 * 32 – 1) – 1长,种子值用于设置PRNG的内部状态,该状态与该序列中的位置直接相关.

最容易找到的重复似乎是每2 **(624 * 32),并且可以显示为这样工作:

repeat_every =  2 ** ( 624 * 32 )

 start_value = 5024214421  # Try any value

 r1 = Random.new( start_value )

 r2 = Random.new( start_value + repeat_every )

 r17 = Random.new( start_value + 17 * repeat_every )

 r23 = Random.new( start_value + 23 * repeat_every )

 r1.rand == r2.rand  
 # true

 r17.rand == r23.rand  
 # true

或试试这个:

repeat_every =  2 ** ( 624 * 32 )

 start_value = 5024214421  # Try any value

 r1 = Random.new( start_value )

 r2 = Random.new( start_value + repeat_every )

 Array.new(10) { r1.rand(100) }
 # => [84,86,8,58,5,21,79,10,17,50]

 Array.new(10) { r2.rand(100) }
 # => [84,50]

重复值与Mersenne Twister的工作原理有关. MT的内部状态是一个由624个32位无符号整数组成的数组.您链接的Ruby源代码将Ruby Fixnum打包成一个数组 – 神奇的命令是

rb_integer_pack( seed,buf,len,sizeof(uint32_t),INTEGER_PACK_LSWORD_FIRST|INTEGER_PACK_NATIVE_BYTE_ORDER );

但是,这不是一件容易理解的事情,它在internal.h中定义,因此只有在使用Ruby解释器本身时才能真正访问它.您无法在普通的C扩展中访问此功能.

然后通过函数init_by_array将打包的整数加载到MT的内部状态.这是一个非常复杂的函数 – 打包的种子值不是字面上写入状态,而是逐项生成状态,添加提供的数组值,使用各种xors,添加和交叉引用之前的值(此处的Ruby源也添加了打包数组的索引位置,注释为“非线性”,我认为这是对标准MT的引用修改之一)

请注意,MT序列的大小小于2 **(624 * 32) – 我在此处显示的repeat_every值一次跳过2个序列,但它最容易找到重复的种子值,因为它很容易看看它如何设置内部状态完全相同(因为种子的数组表示中的前624个项是相同的,这就是以后使用的所有项).其他种子值也将产生相同的内部状态,但该关系是一个复杂的映射,它将19938位空间中的每个整数与另一个整数配对,从而为MT创建相同的状态.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读