蒲公英 - 制药技术的传播者 GMP理论的实践者

搜索
查看: 4099|回复: 20
收起左侧

喝”沁人绿茶“,感悟统计非礼-第一节

[复制链接]
药士
发表于 2013-8-14 16:14:33 | 显示全部楼层 |阅读模式

欢迎您注册蒲公英

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
为了更好地宣传统计学知识,只好喝点 @沁人绿茶


进入19世纪时,科学界奉行着一种固化的哲学观,即机械式宇宙观(clockwork universe)。这种哲学观认为,为数不多的几个数学公式,像牛顿的运动定律(Newton’s laws of motion)和玻意耳的气体定律(Boyle’s laws of gases),可以用来描述现实世界的一切,并能预测未来即将发生的事件。而对这种预测,所需要的不过是一套完整的公式,以及一组具有足够精确度的相关数据。然而,对于一般大众来说,整整花了40年时间,他们的思想才跟上这种科学观念。
这种思想上的落差,典型地体现在19世纪早年拿破仑皇帝(Emperor Napoléon)与皮埃尔?西蒙?拉普拉斯(Pierre Simon Laplace)的一次对话中。拉普拉斯写了一本历史性的权威著作,论述如何根据地球上少数观察数据来计算行星和彗星的未来位置。据说拿破仑问道:“拉普拉斯先生,我发现你的论述中没有提到上帝啊!”拉普拉斯的回答则是:“我不需要这个假设条件。”
机械式宇宙观认为,宇宙如同一个庞大的时钟机器,所有的物体都按照一定的规律运动,宇宙永续运转而不需要神的介入;所有将来发生的事件都决定于过去的事件。许多人对这种无神论的思想感到恐慌,从某种意义上说,19世纪浪漫主义运动的兴起,正是对这种精确应用推理的冷冰冰的哲学观的回应。然而,19世纪40年代出现了对新科学的证明,这叫一般人难以想象:牛顿的数学定律被用来预测另一颗行星的存在,而海王星(the planet Neptune)正是在这些定律所预测的位置被发现的。于是,几乎所有对机械宇宙观的反抗都被粉碎了,这一哲学立场很快成为大众文化的基本部分。
不过,就算拉普拉斯在他的公式中不需要上帝,他还是需要一种被他称为误差函数(error function)的东西。从地球上对行星和彗星的观察,与用公式所预测的位置并不绝对吻合,拉普拉斯和他的科学家同伴将这归结于观察中的误差,有时是由于地球大气层中的扰动,有时则是人为的。拉普拉斯把所有这些误差都放在一个附加项(误差函数)里,从而将之纳入他的数据描述。这个误差函数吸收了所有的误差,剩下的只是用来预测宇宙星体实际位置的绝对运动定律。当时科学家相信,随着越来越精确的测试,对误差函数的需求将逐渐消失。由于有误差函数来表示预测值与观察值之间的微小差异,19世纪早期的科学可以说是受到了哲学上决定论(determinism)的掌控,即相信所发生的任何事情都预先地决定于两点:(1)宇宙的初始条件;(2)描绘其运动的数学公式。
到了19世纪末,误差并没有消失,反倒是增加了。当测试越来越精确,误差也越来越多。机械宇宙观处于动摇之中,试图发现生物学定律和社会学定律的努力也失败了。在物理和化学等传统科学中,牛顿和拉普拉斯所用的那些定律,逐渐地被证明只是粗略的逼近。这样,科学便渐渐开始在新的范式(paradigm)下运作,这新范式就是现实世界的统计模型。到20世纪末期,几乎所有科学都转而运用统计模型了。
大众文化还是没有跟上这种科学革命,尽管一些含混的观念和表述,像相关(correlation)、胜率(odds)和风险(risk)等等,已经渗入了大众的词汇,并且多数人意识到了不确定性问题,这是与诸如医学和经济学等学科领域相联系的。但就已经发生的哲学观的深层转变而言,学界之外没有人能够对此有什么理解。这些统计模型是什么?它们是怎么来的?在现实生活中它们意味着什么?它们是现实的真实描述吗?喝茶,正是试图来回答这些问题,其中我们也想介绍一些先生和女士的生平故事,这些人曾涉身于这场革命之中。
在处理这些问题时,必须把三个数学概念区分开:随机(randomness)、概率(probability)和统计(statistics)。对大多数人而言,随机只是不可预测性(unpredictability)的另一个说法。犹太教法典(Talmud)中的一则格言,传达了这种通常的看法:“不应该去探寻宝藏,因为宝藏的发现是随机的;按照定义,没有人能够寻找只会被随机发现的东西。”但是,对现代科学家来说,随机性有许多不同的类型。概率分布(probability distribution,这将在第2章中讨论)的概念允许我们对随机性加以限制,并赋予我们有限的能力去预测未来的随机事件。因此,对现代科学家而言,随机事件并不是杂乱的、不可预期的和不可预测的,它们有一个可以用数学来描述的结构。
概率是一个非常古老概念的现代用语,它曾出现在亚里士多德(Aristotle)的著作中。这位先哲声称:“不可能事件将会发生,这正是概率的特性。”起初,概率只是涉及到个人对什么事件即将发生的预测,在17和18世纪,一批数学家,其中包括贝努里(Bernoullis)父子、费尔马(Fermat)、棣莫弗(de Moivre)、帕斯卡(Pascal)都在以机会博弈(games of chance)为起点去研究概率的数学理论。他们发明一些非常高级的方法,用来计算等可能事件,棣莫弗设法在这些技术中加进微积分的方法,贝努里则可以领悟出非常基础的定理,叫大数定律(Laws of large numbers)。到了19世纪末期,数理概率主要由一些非常高级的技巧构成,但还缺少坚实的理论基础。
尽管不够完善,还是可以证明概率理论对发展统计分布(statistics distribution)观念的作用。当我们考虑一个特殊的科学问题时,就会产生一个统计分布。例如,在1971年,哈佛公共卫生学院所做的一项研究发表在英国的医学期刊《柳叶刀》(Lancet)上,这项研究旨在检验喝咖啡是否与下泌尿道癌有关。研究的报告以一级病人为对象。其中一些人患有下泌尿道癌,另一些人则患有其它疾病。报告的作者还搜集了这组病人的其它资料,如年龄、性别和家族的癌症病史等。结果证明,并不是每个喝咖啡的人都会得泌尿道癌,也不是每个得泌尿道癌的人都圆角咖啡,所以存在着与他们的假设相矛盾的事件。然而,25%的此类癌症患者习惯每天喝4杯以上咖啡,只有10%的非癌症患者是这种咖啡嗜好者,因而,似乎有一些证据支持这种假设。
这种资料的搜集给研究者提供了一个统计的分布。运用数理概率的工具,他们为这个分布建造了一个理论公式,称之为概率分布函数(probability distribution function),或简称分布函数(distribution function),以此来检验所研究的问题。它与拉普拉斯的误差函数相似,但却复杂许多。运用概率论来建造理论分布函数,而这个函数用来描述从未来数据中所能得到的预期结果,这些数据是以随机方式从同一总体的人群中提取的。

与@沁人绿茶 交谈的,你要小心了,一些概率定理在科学问题上的应用,涉及统计分布和分布函数的世界。概率论本身不足以说明统计方法,有时甚至会出现这样的情形:科学中所用的统计方法违背了概率的定理。读者会发现本书中概率时隐时现,需要时被用到,不需要时则被忽略。


由于现实世界的统计模型都是数学化的,充分理解它们只能用数学公式或符号的方式。本书是一种野心如同@南山月照人 的尝试,我打算描述发生在20世纪科学界的统计革命,而手法是通过介绍一些参加过这场革命的人物(其中不少人至今还健在)。我只是涉猎他们创造性的工作,试图让读者从中体会他们的个别发现是如何适应整个统计革命的。


仅就本书而言,读者并不会学到对科学数据进行统计分析所需要的足够知识,那需要几年的循序渐进的学习。但我希望读者看过本书后,能够对科学的统计观所代表的基本哲学的重大变革有所理解。那么,不懂数学的人要理解这场科学革命,应该从哪里开始呢?我以为,一个不错的选择是与@静夜思雨 一道品茶。


回复

使用道具 举报

药徒
发表于 2013-8-14 16:29:06 | 显示全部楼层
很不错的统计学故事,以后可以用在统计学培训当中啊~收藏收藏~
回复

使用道具 举报

药生
发表于 2013-8-14 16:29:53 | 显示全部楼层
呵呵,很有特色
回复

使用道具 举报

药徒
发表于 2013-8-14 16:30:04 | 显示全部楼层
很不错的统计学
回复

使用道具 举报

药徒
发表于 2013-8-14 16:36:33 | 显示全部楼层
很值得学习了!
回复

使用道具 举报

药徒
发表于 2013-8-14 16:37:22 | 显示全部楼层
好得可以出书了,代替枯板的教材!
回复

使用道具 举报

药士
 楼主| 发表于 2013-8-14 16:39:04 | 显示全部楼层
先声明啊:这个我是改变哦。人家有原著的。{:soso_e154:}
回复

使用道具 举报

药生
发表于 2013-8-14 16:42:17 | 显示全部楼层
加点插图是不是会更像讲故事。
回复

使用道具 举报

药徒
发表于 2013-8-14 16:46:42 | 显示全部楼层
上海会议可以请猿琐叫兽讲讲树立统计,@石头968
估计听的人挺多
回复

使用道具 举报

药生
发表于 2013-8-14 16:48:08 | 显示全部楼层
统计学还是交给年轻人吧,偶老人家看着蚂蚁字就眼晕。{:soso_e125:}
回复

使用道具 举报

药士
 楼主| 发表于 2013-8-14 16:54:38 | 显示全部楼层
雷峰 发表于 2013-8-14 16:42
加点插图是不是会更像讲故事。

收到
回复

使用道具 举报

药徒
发表于 2013-8-14 16:55:46 | 显示全部楼层
@沁人绿茶
什么统计学的帖子发给本卫士看看,
这个真弄不明白
回复

使用道具 举报

药师
发表于 2013-8-14 17:30:26 | 显示全部楼层
湖南卫士 发表于 2013-8-14 16:46
上海会议可以请猿琐叫兽讲讲树立统计,@石头968
估计听的人挺多

可以试试
回复

使用道具 举报

药徒
发表于 2013-8-14 20:11:06 | 显示全部楼层
地区很危险,喝完绿茶,赶紧回火星。
回复

使用道具 举报

药生
发表于 2013-8-14 20:24:51 | 显示全部楼层
统计在验证、风险评估、质量回顾中重要呀,可惜本人不会呀。
回复

使用道具 举报

药徒
发表于 2013-8-14 21:05:40 | 显示全部楼层
朝霞小虾米 发表于 2013-8-14 20:11
地区很危险,喝完绿茶,赶紧回火星。

可以请绿茶老师讲统计分析,
回复

使用道具 举报

药徒
发表于 2013-8-15 12:38:31 | 显示全部楼层
有意思,像连载小说~~~~~~~~~~~
回复

使用道具 举报

药士
 楼主| 发表于 2013-8-15 13:10:46 | 显示全部楼层
jackyang81329 发表于 2013-8-15 12:38
有意思,像连载小说~~~~~~~~~~~

别人有原著吗,我稍稍改动了一下
回复

使用道具 举报

药徒
发表于 2013-8-15 13:25:47 | 显示全部楼层
这项研究旨在检验喝咖啡是否与下泌尿道癌有关。
回复

使用道具 举报

发表于 2013-8-17 16:34:58 | 显示全部楼层

评分

参与人数 1金币 -2 收起 理由
沁人绿茶. -2 被举报,单发表情扣2分

查看全部评分

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

×发帖声明
1、本站为技术交流论坛,发帖的内容具有互动属性。您在本站发布的内容:
①在无人回复的情况下,可以通过自助删帖功能随时删除(自助删帖功能关闭期间,可以联系管理员微信:8542508 处理。)
②在有人回复和讨论的情况下,主题帖和回复内容已构成一个不可分割的整体,您将不能直接删除该帖。
2、禁止发布任何涉政、涉黄赌毒及其他违反国家相关法律、法规、及本站版规的内容,详情请参阅《蒲公英论坛总版规》。
3、您在本站发表、转载的任何作品仅代表您个人观点,不代表本站观点。不要盗用有版权要求的作品,转贴请注明来源,否则文责自负。
4、请认真阅读上述条款,您发帖即代表接受上述条款。

QQ|手机版|蒲公英|ouryao|蒲公英 ( 京ICP备14042168号-1 )  增值电信业务经营许可证编号:京B2-20243455  互联网药品信息服务资格证书编号:(京)-非经营性-2024-0033

GMT+8, 2025-8-14 01:13

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

声明:蒲公英网站所涉及的原创文章、文字内容、视频图片及首发资料,版权归作者及蒲公英网站所有,转载要在显著位置标明来源“蒲公英”;禁止任何形式的商业用途。违反上述声明的,本站及作者将追究法律责任。
快速回复 返回顶部 返回列表