中心极限定理: 一场跨越两百年的传奇
摘要
中心极限定理(Central limit theorems, CLT)是概率论和统计学中的一个核心定理。在统计学的实践中,中心极限定理无处不在。中心极限定理表明,在一定条件下,若干随机变量的算术平均值的分布可以用正态分布近似。中心极限定理简洁优美且有普遍适用性。它并不需要明确知道参与求和的随机变量的精确分布,而只要满足一些较弱的条件即可。然而和大数定律 (Law of large numbers) 不同,中心极限定理并不是那么自然。我们很容易理解硬币正面朝上的频率应该逐渐接近于朝上的概率,而不太容易理解为什么即使每个变量是从偏态分布比如指数分布、卡方分布中抽取的,它们的样本均值都会近似服从正态分布。从1733年棣莫弗(Abraham De Moivre)首次得出了一个特殊版本的中心极限定理到1935年费勒和莱维给出中心极限定理的充要条件,无数伟大的数学家和统计学家做出了巨大的贡献,共同谱写了一场跨越两百年的传奇。在开启这段传奇之旅前,我们先通过两个例子简单认识下中心极限定理。