20世纪60年代开始学习数理统计时,K?皮尔逊的名字在课上很少被提到。例如,美国国家标准局(the U.S. National Burean of Standards)的邱吉尔?艾森哈特(Churchill Eisenhart)当时正在伦敦大学学院(University College,London)学习,那是K?皮尔逊人生的最后几年,艾森哈特记忆中的K?皮尔逊不过是一个精神头不足的老头儿。统计研究的步伐已经将他推出局外,他和他的工作被埋进故纸堆中,青年学生神采飞扬,集聚在新的大人物周围学步,其中之一,便是K?皮尔逊自己的儿子,但是没有人去拜见老皮尔逊,他的办公室孤零零地坐落在那里,远离着活跃的、振奋人心的新研究。
当然并不总是如此,在19世纪70年代,年轻的K?皮尔逊离开英国,到德去从事政治科学的研究生学习。在那里,他倾心于卡尔?马克思(Karl Marx)的著作(无神论),为了表达崇拜之情,他把自己名字的拼法从Carl改成Karl。带着政治学博士的学位,他回到了伦敦,并在这个领域写过两本值得重视的著作。在维多利亚时代的英国,伦敦的拘谨之风最甚,K?皮尔逊却大胆地效仿德国和法国上流社会的沙龙,组织了一个青年男女谈话俱乐部(Young Mens and Womens Discussion Club)。
俱乐部的青年男女平等地聚焦在一起(未婚少女并没有人陪伴),讨论世界上重大的政治和哲学问题。K?皮尔逊正是在那种环境下与夫人相遇而结缘的,这个事实使人感到发起这类俱乐部可能另有动机。这个小小的社会冒险对我们进入K?皮尔逊的内心世界提供了帮助,可以见证他对已经建立起来的传统是那样地不以为意。
尽管拿的是政治学博士学位,K?皮尔逊的主要兴趣还是在科学哲学和数学模型的性质上。19世纪80年代,他发表了《科学的法则》(The Grammar of Science),这本书后来再版了多次。在第一次世界大战之前的一段时间里,它被视为关于科学和数学性质最伟大的著作之一,其中充满了闪光的、原创性的、最具洞察力的见解,这使该书成为科学哲学的一本重要著作。同时,它又是以流畅、简单的风格写成,任何人都可以接受,你不必懂得数学就可以理解《科学的法则》。尽管从写作之日算起,这本书已经有100多年的历史了,但其中充满洞察力的见解和思想,对21世纪的数学研究,仍然是适用的。而它所提供的对科学性质的理解,至今也是真实的。
高尔顿用这种方法,发现了他称之为“向平均回归”(regression to the mean)的现象,这表现为:非常高的父亲,其儿子往往要比父亲矮一些;而非常矮的父亲,其儿子往往要比父亲高一些。
似乎是某种神秘的力量,使得人类的身高从高矮两极移向所有人的平均值。不只是人类身高存在着向平均数回归的现象,几乎所有的科学观察都着了魔似的向平均值回归。
事实上,早在1820年,拉普拉斯的数学论文描述了第一个概率分布,即误差分布,那是一个与这些小的、无关紧要的误差相联系的概率的数学公式。这个误差分布以钟形曲线(bell-shaped curve)或正态分布(the normal distribution )的说法进入了大众的词汇(不要总是认为天下只有正态分布,要不你用统计学去搞风险、偏差调查就会死定了)。
众多科学及中,中有一位杰出的人物,他就是达尔文,同期的科学家们致力于探索达尔文富有洞察力的见解,高尔顿、K?皮尔逊和韦尔登便是其中相当热心的骨干。达尔文的进化理论认为,生命形式随着环境压力而变化,他提出,变化的环境会给更适应新环境的随机变化提供些许的优势,渐渐地,伴随着环境改变和生命形式继续发生随机转变,新物种将会出现并且更适于在新的环境中生存和繁殖。这一思想被简称为“适者生存”(survival of the fittest)。当恣意妄行的政治学家将其用于社会生活,宣称那些在经济竞争中取得胜利的富人比身陷贫困的穷人更为适于生存时,这一理论对社会就有不好的影响——适者生存理论成了猖狂的资本主义的辩
K?皮尔逊他们是否证明了达尔文适者生存的进化论理论呢?也许是吧。通过将古墓中头骨的容量分布与现代男女的比较,他们设法证明:经历了几千年深化的人类种群保持了相当的稳定。他们表明:对澳洲原住民的人类学测量与对欧洲人的测量结果有着相同的分布,据此,他们推翻了某些澳洲人关于原住民不是人类的断言。K?皮尔逊从这些工作中发展了一种被称为“拟合优度检验“(goodness of fit test)的基本统计工具,这是现代科学所不可缺少的。它使科学家能够确定一组给定的观测值是否适合于某一特定的数学分布函数。在第10章我们会看到,K?皮尔逊的儿子E?皮尔逊(Eqon Pearson),是如何用这种拟合度检验是否定他父亲所完成的许多项工作的。