神秘的首位数定理

  • 小编 发布于 2019-11-03 20:49:51
  • 栏目:科技
  • 来源:中学数学深度研究
  • 9184 人围观

对于真实世界中的大部分数据集,首位数是1的数字的数量大约是首位数是9的6.6倍,不同首位数出现的频率遵从一个对数分布,被称为首位数定理。这种首位数分布的非对称性与直觉相反,在长达一个世纪的时期作为一个经验性统计规律存在,尚未被很好解释。

神秘的首位数定理

从前,天文学家在进行天文研究时,经常要使用对数表。本世纪初,有一次天文学家西蒙·纽科姆在查对数表时,偶然发现了这样的现象:对数表开始的几页总要比后面几页磨损得厉害。这说明人们在查对数表时,较多地是使用了以1为首的那几页。于是,纽科姆便产生了这样一个疑问:首位数是1的自然数在全体自然数中占有多大的比例?它是不是要比首位数是其它数字的自然数要多?人们后来把这个问题称为"首位数问题"。

大家可能会认为这个问题是显而易见的。因为除0以外,共有九个数字:1,2,3,4,5,6,7,8,9,用其中任何一个数字开头的自然数,在全体自然数中的分布是均匀的,机会应该是均等的。也就是说,首位数是1的自然数应该占全体自然数的1/9,但事实并不这么简单。

1974年,当时还在美国哈佛大学做研究生,后来是美国斯坦福大学统计学家的珀西·迪亚科尼斯,研究了这个问题,所得到的结论出乎人们的意料,首位数是1的自然数约占全体自然数的1/3.准确一点说,这个数值应该是lg2≈0.30103。

神秘的首位数定理

这是怎么一回事呢?事实上,用不同数字做首位数字,这样的自然数的分布并不是很均匀的,也不是很规则的。首位数是1的自然数的分布规律是:

1到20之间,这样的数有11个,它们是1,10,11,12,……,19,所以约占1/2;

1到30之间,这样的数同样有11个,所以约占1/3;

1到100之间,这样的数同样有11个,所以约占1/9;

1到200之间,这样的数有111个,它们是1,10,11,……,19,100,101,……,199,所以约占1/2

注意到首位数是1的自然数在以上各区间的个数与这个区间的所有自然数的个数的比值,总是在1/2与1/9之间来回震荡。迪亚科尼斯经过研究,终于运用高等数学的方法,得出这些比值的合理平均值,它就是上面所讲到的lg2。

首位数定理,与其名称相反,并非是一个严格的"定理",而是一个在绝大部分自然数据集中都存在的经验统计规律。这个规律由Newcomb S.于1881年首次发现,并由Benford F.于1938年再次独立提出,所以也被称为Benford定理。首位数定理是说,十进制中一个数字的首位数是d(d=1,2,..,9)的概率遵从如下的对数分布,越大的数字出现的概率越低。

神秘的首位数定理

简单地说,一堆从实际生活得出的数据中,以1为首位数字的数的出现概率约为总数的三成,接近直觉得出之期望值1/9的3倍。推广来说,越大的数,以它为首几位的数出现的概率就越低。它可用于检查各种数据是否有造假。

首位数定理的"神秘"性在于,虽然绝大部分自然数据集符合首位数定理,人工伪造的数据集大部分却不满足首位数定理,似乎自然界存在某种特殊的数据生产过程。

神秘的首位数定理

迪亚科尼斯当时并不知道这样偶然的发现有什么实际意义。后来,美国西雅图波音航天局数学家梅尔达德·沙沙哈尼在研究用计算机描绘自然景象的问题时,用上了这个结论。美国波音航天局还将这一成果用于飞机模拟器,使飞行员在不离开地面的情况下接受训练,而能得到一种在空中飞行的实感。首位数问题的结论在科学技术上发挥了重大的作用。

另外在研究该定理在粒子物理与天体物理中的表现时发现,粒子物理中的强子宽度与寿命、脉冲星中的功率与运动等多类物理量均符合Benford分布;统计物理中的三大正则统计——玻尔兹曼-吉布斯统计、费米-狄拉克统计和玻色-爱因斯坦统计均解析满足首位数规律。

神秘的首位数定理

近期,北京大学的马伯强教授和丛明舒、李聪乔在Elsevier旗下期刊Physics Letters A上发表了一篇题为"First Digit Law from Laplace Transform"的文章,使用Laplace变换推导并解释了首位数定理,说明首位数定理并非源于自然界某种神秘的数据生产过程,而是人类发明的进位计数系统的内在属性,并建议首位数定理作为一个基础数学知识被科学工作者普遍了解。

转载请说明出处:五号时光网 ©