关注数学发展弘扬科学精神

关注数学发展,弘扬科学精神,专注数学科普

您的位置:主页 > 大学数学 > 正态分布的故事

正态分布的故事

作者:算法与数学之美发布日期:2019-10-29 16:14浏览次数: 来源:微信公众号

正态分布是最重要的一种概率分布。其曲线一般中间高,两边完全对称,并逐渐下降到无限接近横坐标轴,学术称之为钟型图像。

正态分布里有两个划重点级的重要参数决定了曲线图像的具体形态:

对称平均数U,在这里是众数概念,也就是钟型曲线最高点在横坐标上的位置,被最多情况占有的高峰。

标准差σ,决定了整个曲线的胖瘦和概率分布。

关于它的由来,这里有一个故事:

正态分布的故事

图一

正态分布概念是由德国的数学家和天文学家Moivre(棣莫佛)于1733年受次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布。  高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。高斯是一个伟大的数学家,重要的贡献不胜枚举。但现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。  在高斯刚作出这个发现之初,也许人们还只能从其理论的简化上来评价其优越性,其全部影响还不能充分看出来。这要到20世纪正态小样本理论充分发展起来以后。  拉普拉斯很快得知高斯的工作,并马上将其与他发现的中心极限定理联系起来,为此,他在即将发表的一篇文章(发表于1810年)上加上了一点补充,指出如若误差可看成许多量的叠加,根据他的中心极限定理,误差理应有高斯分布。这是历史上第一次提到所谓“元误差学说”——误差是由大量的、由种种原因产生的元误差叠加而成。后来到1837年,海根(G.Hagen)在一篇论文中正式提出了这个学说。其实,他提出的形式有相当大的局限性:海根把误差设想成个数很多的、独立同分布的“元误差” 之和,每只取两值,其概率都是1/2,由此出发,按狄莫佛的中心极限定理,立即就得出误差(近似地)服从正态分布。  拉普拉斯所指出的这一点有重大的意义,在于他给误差的正态理论一个更自然合理、更令人信服的解释。因为,高斯的说法有一点循环论证的气味:由于算术平均是优良的,推出误差必须服从正态分布;反过来,由后一结论又推出算术平均及最小二乘估计的优良性,故必须认定这二者之一(算术平均的优良性,误差的正态性)为出发点。但算术平均到底并没有自行成立的理由,以它作为理论中一个预设的出发点,终觉有其不足之处。拉普拉斯的理把这断裂的一环连接起来,使之成为一个和谐的整体,实有着极重大的意义。

正态分布的故事

图二 1893年人类身高分布图

正态概率分布函数的形式如下:

正态分布的故事

图三

爱情是每一个人都渴并且向往的,但不是人人都能拥有,爱情是一个很随机的变量,那不妨拿正态分布这个工具来对它做一个分析。

据不完全,也不一定准确的网络数据来看,中国男性的性伴侣平均数为13,女性为7,所以假设男女比例1:1的话。那么中国人平均性伴侣数U=10。而因为性伴侣最少也得有0个,所以平均分开来看差不多标准差σ=2。

那么我们就可得到如下性伴侣个数和分布概率的关系:

 有68.28%的人在平均值左右1个标准差σ范围内,即9~11个=挺正常;

 有27.18%的人在2σ和σ之间,即7~8个=够本了和12~13个=挺忙的;

 有4.28%的人在3σ和2σ之间,即5~6个=较传统和14~15个=较开放;

 有0.26%的人在4σ和3σ之间,即3~4个=有点亏和16~17个=有点累;

 除此之外还有0.01%的人,他们有0~2个=白活了和18~+∞个=不枉此生;

换言说就是性伴侣数越往两个极端,其所在人群数量是越来越少的。

正态分布的局限性在于只能解释统计学范畴的分布,比如身高的人群分布或者智商的人群分布,身高和智商从成年开始就不会有什么特别明显的变化了,而性伴侣数量在人成年后才是变化的开始。为了解决这个问题,我们需要在现有的图像上再加一个维度——时间。这样,图像就变成了截面为钟型,前小后大的椎体,且其每一个截面则代表样本在某个年岁的性伴侣数量分布情况。

在我之前你有几个?

How Many?

正态分布的故事

图四

考虑到时间是一条不会回头的向量,性伴侣数量也只能有增无减,他们未必都会老老实实待在曲线内的某个点上,而是会在曲线围成的区域里,向右移动。比如说,有了1个性伴侣的人,在未来是可能有2个性伴侣的,而有了8个性伴侣的人是没有可能再有7个性伴侣了。

现在没达到,就意味着他在今后的漫漫岁月里,有可能,达到这个数字。而且以往的经历越少,之后的可能性越大,那也就是说其实没有性经验的人在未来有性经历的可能性反而要远远高于性经历已经很丰富的男女们。

从此,“你原来交过几个前任”这道千古难题,有了新的求生欲套路,不能再支支吾吾地说没有或者一个了,而要抑制住内心的骄傲,真诚而不失礼貌地尽可能多说几个,因为情史越丰富多彩,未来越平淡无奇。“玩够了的男人才靠谱”这句话终于有了科学的理论和数据支撑。花花公子终于可以从歧视的眼光中翻身。“原来我没得选,现在我想做个情痴”?可以相信他,很可能是真的。

出轨概率猜想

Cheated Probability Hypothesis

正态分布的故事

图五

如果将爱人随机扔到未来任何一个性伴侣人群分布截面上,而他落在哪里的概率完全由U和σ决定,且他只能落在现处位置以右的面积里。

那么,全文精华在此!假设你爱人的性伴侣数(包括你自己)为X,出轨概率为P。

若X≥U+4σ,则P≤0,且因为P≥0,所以P=0

若U+3σ≥X>U+4σ,则P≤0.135%

若U+2σ≥X>U+3σ,则P≤2.275%

若U+σ≥X>U+2σ,则P≤15.865%

若U≥X>U+σ,则P≤50%

若U-σ≥X>U,则P≤84.14%

若U-2σ≥X>U-σ,则P≤97.73%

若U-3σ≥X>U-2σ,则P≤99.87%

若U-4σ≥X>U-3σ,则P≤99.995%

若X≥U-4σ,则P≤100%,但是因为P本来就小于等于1,所以就是必然的意思。

这意味着什么呢?

有些男人有很偏激的处女情结,用先进思想感化这些人也无动于衷。可惜数据证明处女≠玉女,处女=欲女,处女情结不仅没有意义而且可笑至极。

有些女人觉得“嫁一个经历不是很丰富的老实人是才是长久之道”,这种想法也很讽刺,因为过去太老实的代价就是未来不老实的概率很高,人生若无处不初见,你怎么办?

这就是正态分布

我相信他!

I Forgive You

正态分布的故事

图六


(声明:本文仅代表作者观点,不代表本站观点,仅做陈列之用)

[责编:雨滴]

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

欢迎扫描关注我们的微信公众平台!

欢迎扫描关注我们的微信公众平台!