散度与偏度

 

中奖号码的散度分析

    散度的概念叙述和理解起来都有一定的难度。举例来说,有这样两组号码:3、7、12、18、23、28、31和10、11、14、15、17、23、24,很显然,这两组号码的集中程度差别很大,前者非常分散,而后者的号码相当集中,出现了多个号码集中的区间。

    我们可以引入一个新的指标来度量基本号码的集中程度,那就是基本号码的散度。所谓散度,指的是01~32这32个号码(以北京风采为例),如果是北京体彩,那么就是01~36共36个号码与7个基本号码之差(以结果的绝对值为准)的最小值中的最大的一个。这样说理解起来可能有点费劲,我们不妨来看一个例子。
   

    例16 以北京风采32选7为例
     一组中奖号码:3,7,12,18,23,28,31,我们可以看出,01与这7个号码的差分别为2、6、11、17、22、27、30,最小的差为2;同理,02与这7个基本号码的差中最小为1;03为0;……,32与这7个基本号的差的绝对值最小为1。具体计算过程见下表(表3-40)。可以看出,这32个最小的差中一定会有一个最大的值,在本例中该值为3。所以这组号码的散度为3。具体计算过程如下表。
   

   散度计算表
    基本号码 基本号减中奖号码                 绝对值                                    最小值
   01 -2,-6,-11,-17,-22,-27,-30 2,6,11,17,22,27,30    2
   02 -1,-5,-10,-16,-21,-26,-29 1,5,10,16,21,26,29    1
   03 0,-4,-9,-15,-20,-25,-28 0,4,9,15,20,25,28       0
   04 1,-3,-18,-14,-19,-24,-27 1,3,8,14,19,24,27      1
   05 2,-2,-7,-13,-18,-23,-26 2,2,7,13,18,23,26       2
   06 3,-1,-16,-12,-17,-22,-25 3,1,16,12,17,22,25    1
   07 以下类推 以下类推                                         0
   08 以下类推 以下类推                                         1
   09  2
   10 2
   11 1
   12 0
   13 1
   14 2
   15 3
   16 2
   17 1
   18 0
   19 1
   20 2
   21 2
   22 1
   23 0
   24 1
   25 2
   26 2
   27 1
   28 0
   29 1
   30 1
   31 0
   32 1

    再以10,11,14,15,17,23,24为例:01与这7个号码的差分别为9、10、13、14、16、22、23,最小的差为9;同理02与这7个基本号码的差的最小值为8;03为7;……依此类推,32与这7个基本号的差的绝对值最小为8。这32个号码最小的差中的最大值为9,所以这组号码的散度为9。
   注意,散度的值越大,说明号码的集中程度越高;散度的值越小,说明号码越分散。理论上,散度有最大值和最小值。以北京风采32选7型为例,最小的散度为3,最大的散度为25,但这只是理论上存在,只有两号码才具这个散度:01、02、03、04、05、06、07与26、27、28、29、30、31、32。实际上,散度为5或6的号码是最常同见的,散度大于10的号码很少见。
     各种彩票的散度走势是很有规律的。

中奖号码的偏度分析

    有时候,我们很想知道本期中奖号码和上期中奖号码的关联情况。一般情况下,大家都用重号个数这个指标来衡量,也就是说,本期基本号之中有多少个与上一期相同。然而,这是一个相当粗略的指标,我们需要用一个更好的指标衡量本期的基本号码和上期的号码从整体来看究竟偏离多远。
引入了一个新的指标来度量本期基本号码对上期基本号码和上期的基本号码从整体来看究竟偏离程度,可以称之为本期基本号码的偏度。所谓偏度,指的是本期7个号码与上期7个基本号码之差(以计算结果的绝对值为准)的最小值中的最大的一个。具体计算方法见下面的例子。

     比如北京风采第14期的基本号码为02,10,16,24,26,27,28,第15期的基本号码为01,03,05,06,11,12,21。那么如何计算第15期基本号码的差,容易得知第15期的第一个号01与第14期基本号码之差的绝对值分别为1、9、15、23、25、26、27,最小的差为1;同理,可以计算第二个号03与上期7个基本号码的差的绝对值中最小值为1;第三个号05与上期7个基本号码的差中最小值为3;第四个号06与上期7个基本号码的差中最小值为4;第五个号11与上期7个基本号码的差中最小值为1;第六个号12与上期7个基本号码的差中最小值为2;第七个号21与上期7个基本号码的差中最小值为3。可以看出,这7个值之中一定会有一个最大的值,这个例子该值为4,所以北京风采第15期基本号码的偏度为4。

     偏度的值越大,说明该期基本号码对上期基本号码的整体偏离程度越大;偏度的值越小,说明该期基本号码对上期基本号码的整体偏离程度越小。理论上,偏度有最大和最小值,以北京风采为例,最小的偏度为0,也就是说本期所有7个基本号码完全与上期相同,这种情况发生的可能性微乎其微。最大的偏度为25,但这只是理论上存在,只有本期和上期的号码分别是以下两组号码,本期的基本号码偏度才是25。这两组号码是01,02,03,04,05,06,07与26,27,28,29,30,31,32。

     从理论上可以分析,基本号码的偏度和散度有很大的关系。二者的定义有一定的相似之处,而且从理论上可以得出,本期基本号码的散度是下期基本号码的偏 度的上限,也就是说下期基本号码的偏度不会超过本期的基本号码的散度。同时,本期的基本号码的散度越大,下期的偏度就可能越大。比如第15期的基本号码的散度为11,第16期的偏度达到了11。第17期的散度为12,第18期的偏度也达到了11。这很容易理解,因为本期的散度越大,说明号码越分散,而下一期的基本号码就越可能偏离得很远。

     仍以辽宁风采为例。平均的偏度是4和5,偏度小于2和大于12的基本号码还没开出来过。偏度走势的中间区域为4~5,基本上在这个区域上下波动(从第2002005期至2002043期)共39期的偏度值,恰好在中间区域内的有20期,处于中间区域上方的有10期,处于中间区域下方有9期,分布得相当平衡。一般来说,无论在中间区域的上方或者下方,不出4期,总会往反方向调整。可以利用这一点来把握下期号码对本期号码的偏离程度。