奇趣统计宝|事件域,并事件,帕斯卡分布,轻尾分布

读者: 奇趣统计宝,我们最近学习了一些统计学的概念,可是还有一些概念我们不太理解,比如事件域和帕斯卡分布。您能解释一下吗?

奇趣统计宝:当我们通过统计学的方法研究某个问题时,我们需要考虑所有可能发生的事件。这些事件的集合叫做事件域。举个例子,如果我们想研究掷色子的情况,那么事件域就是{1, 2, 3, 4, 5, 6}。每一个元素代表了可能发生的一个事件,也就是色子落地的数字。

读者:了解了事件域,接下来我们能说一下什么是帕斯卡分布吗?

奇趣统计宝:帕斯卡分布是一种离散概率分布,也被称为负二项分布。它描述了在一定的试验次数内,发生$k$次成功的概率。而每一次试验仅有两个可能的结果,一个是成功,一个是失败。比如,我们制作了一个从0到9的随机数生成器,每次抽取都能够抽中不同的数字。如果我们希望在进行3次试验之后抽到数字5的次数是两次,那么这就是一个帕斯卡分布的问题。

读者:好的,那么帕斯卡分布与轻尾分布有什么关系呢?

奇趣统计宝:轻尾分布和重尾分布意思与它们的形象比喻一样,我们想象一下都是大鱼和小鱼,大鱼的尾巴很重,而小鱼的尾巴轻巧灵动。化用到统计学领域当中,我们称之为峰度(Kurtosis)。轻尾分布一般指的是尾部的数据出现的概率很小,如正态分布。而重尾分布指的是尾部数据出现的概率很大,如果不加区分,二者通常指的是峰度大于零的分布,也就是前文的“大鱼”分布。 帕斯卡分布往往属于轻尾分布,因为这种分布的尾部往往会出现一些小概率的情况,比如某些事件可能会超出我们的预期。当然,在某些情况下,帕斯卡分布也可能将数据分布在中等程度。