女士品茶:统计学如何变革了科学和生活
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

费希尔的最大似然方法

费希尔在进行数学研究时发现,卡尔·皮尔逊用于计算分布参数的方法得到的统计量并不一定具有一致性,而且常常是有偏的。此外,费希尔还发现了效率更高的统计量。为获得一致而有效的统计量(不一定是无偏的),费希尔提出了一个概念,他称之为“最大似然估计值”(MLE)。

接着,费希尔证明,最大似然估计值总是具有一致性,而且是所有统计量中效率最高的统计量(前提是被称为“正则条件”的几个假设成立)。此外,费希尔还证明,如果最大似然估计值是有偏的,那么这个偏差可以算出来并且可以从最大似然估计值中减掉,从而得到一个一致、高效、无偏的修正统计量

费希尔的似然函数横扫数理统计界,迅速成了参数估计的主要方法。最大似然估计只有一个问题:它的数学解法太难了。我们可以在费希尔的论文中看到一行行数学公式,那是最大似然估计值在不同分布中的表现形式。他的方差分析和协方差分析体系是宏大的数学成就,他在这些体系中用巧妙的代换和多维空间变换得到了一些公式,让使用者获得了他们需要的最大似然估计值。

尽管费希尔做出了创造性工作,但在大多数情况下,想要使用最大似然估计值的人都会被数学上的问题难住。在20世纪后半叶的统计学文献中,许多论文用数学上的简化方法在特定情形中巧妙地获得了最大似然估计值的良好近似值。在我自己的博士论文中(大约在1966年),我对问题的解法只能在拥有大量数据的情况下才能使用。只有根据这个假设,我才能将似然函数简化到某种程度,然后算出最大似然估计值的近似值。

接着,计算机出现了。计算机并不是人脑的竞争者,它只是一个巨大而耐心的数字处理者。它不会感到厌倦,不会犯困,不会犯错误。它会一遍一遍不停地从事繁重的计算工作——重复几百万次都没问题。它可以用所谓的“迭代算法”找出最大似然估计值。