悬臂梁的剪力图怎么画:统计科学及其文化魅力

来源:百度文库 编辑:偶看新闻 时间:2024/04/30 15:42:58

统计科学及其文化魅力

王 庚

    当今世界,统计科学的影响力日益显现。首先,统计数据是经济社会管理的基础依据,统计分析为政府的决策提供重要参考。其次,统计服务于国家科学发展,并引导社会公众信心。最后,统计科学成果已渗透老百姓的生活。

    然而,一般大众对统计科学都有一种艰涩难懂刻板的印象,其实,如果了解统计科学的文化魅力,可使人们对统计科学另眼相看。

    从几个例子谈起

    第一个例子:《今日文摘》2009年第1期有篇文为“一生一世的统计数字!”,文中有以下一段:“一个人赤条条来到世界,离开的时候,也带不走多少东西。但是,一个人的一生给地球留下了什么?又创造了什么?以下是人活一世的一组数据。数据以英国人的生活方式为标准,兼顾了世界各地的人们。这组数据可以给我们一个参照,也可以给我们很多思考。英国人平均寿命78.5岁,共24亿750万秒……一生吃掉的东西:4头牛,15头猪,21只羊,1200只鸡,13000只鸡蛋(未出生的鸡),5000多只苹果,10 000多个胡萝卜,3吨面包,630公斤巧克力,2吨葡萄酒,11吨啤酒(全球随时都有4500万醉鬼),18吨牛奶,75 000杯茶,相当于装满一个浴缸的罐头豆子,一生总共吃下约50吨食物。当然,这是指世界各地人们的平均数。考虑到很多穷人没什么吃的,富人应该吃的更多……一生认识的人(有两年以上的交往)约1700人,长期社交圈约300人……每天说4300个字,一生大约说1亿2千多万个字词,大多都没什么意义……一生读报纸1.5吨,约2500份;一生读500本书,考虑到有40%的人从来不看书,爱读书的人一生读书超过1000本。一个人一生读的书和报纸,至少需要24棵树。你种了几棵? 一生2900多天在看电视(按24小时算),差不多在电视机前不睡觉不说话坐了8年……一生做梦10万次,还不包括白日梦。”

    这个单子上的数据未必都准确,还可以不断增加,但意思已经差不多了。这里既有无法改变的,也有可以改变的;既有真实的生活,也有背后的贫富差距。我们如何看待这些统计数据,其实就是如何看待自己,也是如何看待人类。是增加这些数据,还是减少这些数据,不光对我们自己,对人类都会产生影响,这就是统计科学的文化力量

    第二个例子:“压缩后的地球百人村”,这是美国斯坦福大学医学研究所马特(P.Marter)教授一年前在某论坛上发表的一篇文字,引起许多网友的共鸣,纷纷张贴转载。它的主要内容是:如果我们把全球人口压缩成只有100个人的部落,而且维持人类的各种比率,那么我们会得到如下的结果:(1)57个亚洲人,21个欧洲人,14个美洲人,8个非洲人。(2)52个男人,48个女人。(3)35个白种人,65个非白种人。(4)35个基督徒,65个非基督徒。(5)89个异性恋者,11个同性恋者。(6)6个人将拥有全部财富的59%,而且这6个人全部来自美国。(7)80个人的居家生活不甚理想。(8)70个文盲。(9)50个人营养不良。(10)1个人即将死亡,1个人即将生产。(11)1个人(是的,只有一个人!)拥有大专以上学历。(12)1个人拥有电脑。

    世界是个地球村,当我们从这样压缩的角度来看世界时,会更清楚这个世界需要更多的接纳、谅解和教育。这又是统计科学的文化给我们的震撼

    第三个例子:1944年6月12日,纳粹德国新研制的重达2.2吨的V-1火箭越过英吉利海峡,从法国北部向英国开始发射,数月内共发射了1万余枚。火箭三分之一击中英国本土,其中大部分击中首都伦敦,造成了平民和财产的损失。英国人第一次看到这种发出强烈噪声、威力强大的超视距武器,把它叫做“嗡嗡弹”。

    同年9月6日,威力更大、重达13吨的V-2火箭也开始袭击巴黎,两天后又袭击伦敦,发射4300枚,击中1000枚。

    6月是著名的诺曼底登陆战役发起的关键时期,尤其是6月12日,这一天盟军登陆的各滩头阵地刚刚连成一片,是大量的增援渡海部队在海面上或在英国海岸集结的重要日子。这些部队如果遭受“嗡嗡弹”的袭击,后果不堪设想。问题的关键是这些“嗡嗡弹”是否“长眼睛”,即是否具有现在所说的较精确的制导系统。如果有,那么盟军统帅部就要改变整个作战意图,战役也可能会改变。为此,统帅部绞尽脑汁,最后有人请来了几位统计学家。为了搞清楚这个问题,伦敦被分成576个地区。在每个地区,被炸次数的记录如下:

    被炸次数    0    1    2   3    4   5

    地区数   229 221 93  35  7  1

    上面的表格说明:229个地区没有被炸过,7个地区被炸过4次。利用泊松分布,每个地区被炸的均值是0.93,得到地区期望的被炸次数,如下表:

   被炸次数     0    1      2     3     4    5

   地区数    227.3 221.3  98.3  30.5  7.1   1.6

   因为实际数据非常接近期望值,因此弹着点的分布是泊松分布,即一种随机分布。统计家学们很快得出结论:不要紧,“嗡嗡弹”没“长眼睛”,这就像大炮定向发射一样。丘吉尔心中的一块石头终于落地了。于是,渡海部队继续像潮水一样涌上诺曼底海滩,完全不去理会头顶上呼啸而过的当时最先进的V型火箭。

   靠一种统计模型(统计推断法)来解决战争中的难题,十分精彩。

   为了深度阐述统计科学的文化魅力,需要说明如下几个问题:(1)统计科学是什么,统计学的基本问题(研究对象、研究方法、学科体系)。(2)什么是统计文化与统计科学的文化。(3)统计科学的文化魅力何在?

    什么是统计科学与统计文化

    统计科学是什么?不好回答,答案也有多种。就像“数学科学是什么”一样难以回答,狭义地说统计科学就是统计学。据《大英百科全书》定义,“统计学是一门收集数据、分析数据,并根据数据进行推断的艺术和科学。最初与政府收集的数据有关,现在包括了范围广泛的方法和理论。”该书随后还列举了主要应用领域,并详尽介绍了统计学的各方面内容。而由科茨(S.Kotz)、约翰逊(N. L. Johnson)和里德(C. B. Read)编著的《统计科学百科全书》是迄今最完整的关于统计的权威著作,它给出“统计学”这个术语表示“涉及收集、表示和分析数据的普遍方法和原理的领域”,并列举了四十多个运用统计的领域。

     可以说,统计学是一种为科学方法的需要而发展出来的工具。台湾统计学家谢邦昌打了个比喻,说:“如果一个人要吃罐头,一定要找到开罐头的器具。或许你会说,他可以用摔的方法把罐头摔开来,但难保里头的东西不会洒落满地。也或许会说,可以用牙去咬,的确有人能这样打开罐头,但是一般人是做不到的。拿到统计上头来看,未来的趋势就像是罐头里的食物,资料就是罐头的铁皮,而统计就是那把铁皮掀开取出内容物的工具。你可以用其他方法、任何你想到的方法打开罐头,或许你成功了,但都比不上用正确的工具来得方便迅捷。”这也许很能说明问题。

    从最一般的意义上说,现代统计学是关于总体现象数量特征和数量关系的学科。统计学所研究的现象可以是社会现象,也可以是自然现象;可以是随机现象,也可以是非随机的确定性现象。统计学的研究对象可以表述为:社会经济总体现象的数量特征及其规律性、统计认识活动过程本身和认识方法。

    统计学研究对象的特点有:总体性、数量性、客观性、数据的随机性、范围的广泛性

    统计学的研究方法既包括以概率论随机样本为基础的数理统计方法,也包括各种非概率的统计方法;其中很大一部分对于各种类型的现象是普遍适用的,当然,也有若干方法较为明显地偏重于局部现象领域中的应用。

    统计学研究中使用的最基本方法有:大量观察法、统计分组法、综合指标法、时间数列分析法、指数分析法、相关分析法、抽样推断法、描述性统计法、统计推断法、统计模型法等。

     广义地说,统计科学涉及统计学的学科体系,完整的统计学科体系包括主干学科群、辅助学科群和边缘(交叉)学科群三个子体系。主干学科群内又可划分为若干层次:首先分为横断学科与纵向学科;横断学科又包括前述的描述统计学和推断统计学(数理统计学)两个分支;数理统计学进一步划分为理论数理统计学和应用数理统计学,前者侧重于统计方法的数理基础,后者则侧重于统计方法的应用形式(但并不专门研究具体的自然或社会现象)。纵向统计学包括核算统计学和实验统计学两大门类。核算统计学不仅包括传统的社会、人口和经济统计学,还包括新兴的科学技术统计学和环境生态统计学等。核算统计学与实验统计学的区分基于三个方面的特征:(1)研究领域不同。(2)研究内容不同。实验统计学研究的是自然或技术现象自身及其过程的数量特征和统计规律性,核算统计学则研究与人类活动有关的社会现象或过程的数量特征和统计规律性。(3)研究基础不同。

    人们经常听到的是统计文化,那么何为统计文化与统计科学文化?

    一般地,统计文化是统计部门在长期的统计实践过程中逐步形成和发育的,并为广大统计人员认同和遵守的价值观念、职业道德、规章制度、行为风貌等各方面的总和。统计文化的核心是植根于统计人心中的价值观念和人文精神,对统计文化起主导作用。有什么样的价值取向,就会有什么样的追求目标、工作标准、工作结果。

    而统计科学文化是统计人与统计学科的生存、发展的方式。统计科学文化宏观上包括统计史、统计哲学、统计科学、统计美学等,微观上它包括统计思想(思维)、统计的精神和方法、统计群体中共同的价值观,以及统计与其他各科的交叉等。

     本文所说的统计科学文化魅力中的统计科学文化正是后者,也是人们常常混淆和不在意的。其实它正是统计科学的本质属性。

     统计的文化魅力

    统计科学文化是个大课题,值得认真深入研究,这里选择一些例子来展现它的魅力。

   (1)统计图表的文化魅力

    统计图表既可以节省大量文字叙述,又可便于数据的对比分析与积累,它们能更为集中醒目、条理分明、形象鲜明、直观清晰地显示现象之间的相互关系。如果适当地加入文化元素,它们便具有文化魅力。

    (2)统计科学与数据处理艺术

    也有人把统计学定义为数据处理的一门艺术,如下的事例就是明证。瓦尔德(A. Wald,1902—1950年)是二战时期的统计学家,他发明的一些统计方法在战时被视为军事机密。

     瓦尔德被咨询飞机上什么部位应该加强钢板时,他开始研究从战役中返航的军机上受敌军创伤的弹孔位置。他画了飞机的轮廓,并且标示出弹孔的位置。资料累积一段时间后,几乎把机身各部位都填满了。于是瓦尔德提议,把剩下少数几个没有弹孔的部位补强……因为这些部位被击中的飞机都没有返航。这是一个简单但近乎完美的实例,简单的统计方法一旦融入了统计学家的智慧,便显得生动而唯美!

     创造美的工作,称其为艺术似乎也不为过。

    (3)统计科学与产品销售

     啤酒与尿布是一个广泛流传的故事:全球最大的零售商沃尔玛通过统计分析顾客购物的数据后发现,很多周末购买尿布的顾客同时也购买啤酒。经过深入观察和研究发现一统计规律,美国家庭买尿布的多是爸爸。年轻的父亲们下班后要到超市买尿布,同时“顺手牵羊”带走啤酒,好在周末看棒球赛的同时过把酒瘾。后来沃尔玛就把尿布和啤酒摆放得很近,从而双双促进了尿布和啤酒的销量。这个故事被公认是统计科学中数据挖掘的经典范例

     (4)统计科学与历史

     听说过帝王统计学吗?其实就是从统计学角度看中国67个王朝的446位帝王。统计研究知:从夏商周至元明清,中国一共经历了67个王朝并产生446位帝王,这还不包括春秋战国时期诸侯国的国君和历次农民起义政权的首领。可以说,中国社会几千年的发展与变迁,在很大程度上都与这446位帝王的个人能力与情操息息相关。而在这446位帝王中,对江山社稷贡献最大的四个君王当属秦始皇、汉武帝、李世民和康熙……超过八十岁的只有五位,即最长寿的乾隆皇帝(88岁)、梁武帝萧衍(85岁)、唯一的女皇帝武则天(81岁)、宋高宗赵构(80岁)和五代吴越国君钱镠(80岁)。在位最久的皇帝是康熙(61年)和乾隆(60年)。不满一年有40位,在位最短的皇帝是金末帝完颜承麟,从登基到驾崩仅有半天时间。很多皇帝登基时未满周岁,还在吃奶。作为一代帝王,康熙还创造了多项历史之最:孩子最多,康熙12岁大婚,14岁开始生子一直生到63岁,50年间一共生了35个儿子、20个女儿;在位时间最长,康熙一共在位61年;作为历史上知识最渊博的皇帝,康熙对术数、天文、历法等无一不精……病死的,也就是正常死亡的339人;不得善终的,也就是非正常死亡的272人,其中死于刀剑之下的127人,服“仙丹”死(其实是自己找死)者5人……

     这些数据是不是带给我们点文化启示,正所谓“以铜为镜,可以正衣冠;以史为镜,可以知兴替;以人为镜,可以明得失”。历史也是统计科学最能施展的一个领域

     (5)统计科学与文学

    《红楼梦》作者考证便是范例。众所周知,《红楼梦》一书共120回,自从胡适作《红楼梦考证》以来,一般都认为前80回为曹雪芹所写,后40回为高鹗所续。然而长期以来这种看法一直都饱受争议。能否从统计上做出论证?有多位数学家用统计科学方法作过研究,例如从1985年开始,复旦大学的李贤平教授带领他的学生作了这项很有意义的工作,他们创造性的想法是将120回看成是120个样本,然后确定与情节无关的虚词出现的次数作为变量巧妙运用数理统计分析方法,看看哪些回目出自同一人的手笔。一般认为,每个人使用某些词的习惯是特有的。于是李教授用每个回目中47个虚词“之,其,或,亦……呀,吗,咧,罢……可,便,就……等”出现的次数(频率),作为《红楼梦》各个回目的数字标志。之所以要抛开情节,是因为在一般情况下,同一情节大家描述的都差不多,但由于个人写作特点和习惯的不同,所用的虚词是不会一样的。利用多元分析中的聚类分析法进行聚类,果然将120回分成两类,即前80回为一类,后40回为一类,很形象地证实了不是出自同一人的手笔。之后又进一步分析前80回是否为曹雪芹所写?这时又找了一本曹雪芹的其他著作,做了类似计算,结果证实用词手法完全相同,断定前80回为曹雪芹一人手笔,是他根据《石头记》写成,中间插入《风月宝鉴》,还有一些别的增加成分。而后40回是否为高鹗写的呢?论证结果推翻了后40回是高鹗一个人所写,而是曹雪芹亲友将其草稿整理而成,宝黛故事为一人所写,贾府衰败情景当为另一人所写等等。这个论证在红学界轰动很大,李教授等用多元统计分析方法支持了红学界的观点,使红学界大为赞叹。

     (6)统计科学与经济

     统计科学与经济的联系非常密切,联姻的成果有计量经济学、数理经济学、经济统计等等。

     这里举几个文化魅力凸现的例子。

   综合指标法是统计学中的常用方法,“牛皮纸箱销售量指标”便是美国联邦储备局主席格林斯潘(A. Greenspan)在早年做顾问咨询时偏爱的指标,并把其视为他私人的经济观察指标。他的理由是,纸箱的主要功能是包装各式各样的商品,若纸箱的需求增加,表明经济活动也在加温。

     在美国经济萧条的1940年代,长裙子取代了1920年代的短裙;在经济复苏的1960年代,迷你裙大行其道;1970年代的衰退使女人的裙子也长至脚踝。因而“裙摆指标”诞生了,结论是经济繁荣时代,裙摆会越来越短;经济一旦进入衰退,短裙则随之变成长裙。

     而“垃圾指标”更是有趣了,它的理论是当经济繁荣的时候,人们扔的东西就多了,比如过时的家具、衣服等,同时购买的东西也多了,包装袋也就多了。当经济衰退时,人们无力购买,新的不来,旧的也不去。

     指数分析法也是统计学中的常用方法,例如“书店指数”:书店可以折射出一个民族的文化素养。伦敦、巴黎和纽约的曼哈顿,除了有许多环境舒适、服务周全的大型书店外,还有大量的个性化书店、旧书店、专业书店、特色书店等。非洲国家的书店最可怜,数量少、门面小、顾客稀,里面一般只有一些中小学教材,还兼售文具用品。中国的书店进步很快,大城市都有许多大型书店和特色书店。新兴经济国家书店的共同特征是实用书籍为主,高考试题、电脑技术、股票交易之类的书籍也占了中国书店的半壁江山。这种统计分析大概也反映了新兴经济国家的特点,大部分人都忙于学习技能,都在“充电”以求改变自己的现状。部分国家的书店打分如下:英国、美国、法国5分;瑞士、希腊、阿根廷、以色列4分;中国、俄罗斯、土耳其、巴西3分;越南、埃及、印度2分;肯尼亚1分。

    (7)统计科学与房地产、金融

     关于房价流传最广的就是“牛肉面指标”,它是说如果你准备买房子,你要到房子周边商铺的大排档调查一下,如果大排档上卖的“牛肉面”一碗4块钱,那么这个地方标准的房地产价格就应该是4000元/米2;如果牛肉面卖到6块钱一碗,那么标准的房地产价格就应该是6000元/米2。如果你发现牛肉面是5块钱一碗,而附近的房价只是4200元/米2,那么你可以毫不犹豫地投资;相反的话,房价就有虚高的成分。牛肉面指标意味着级差地租和租赁价格对房地产市场的决定作用。

     本福德定律也许是反映统计科学在金融中文化魅力的好例证。1935年,美国物理学家本福德(F. Benford)在图书馆翻阅对数表时发现,对数表的头几页比后面的页更脏一些,这说明头几页在平时被更多的人翻阅。

     本福德进一步研究后发现了第一数字定律只要数据的样本足够多,第一数字定律描述的是自然数1到9的使用频率,公式为F(d)= lg(1 + 1/d)(d为自然数),数据中以1为开头的数字出现的频率并不是1/9,而是30.1%,而以2为首的数字出现的频率是17.6%,往后出现频率依次减少,9的出现频率最低,只有4.6%。

     本福德开始对其他数字进行调查,发现各种完全不相同的数据,比如人口、物理和化学常数、棒球统计表以及斐波纳契数列中,均有这个定律的身影。

   1961年,一位美国科学家提出,本福德定律其实是数字累加造成的现象,即使没有单位的数字。比如,假设股票市场上的指数一开始是1000点,并以每年10%的程度上升,那么要用7年多时间,这个指数才能从1000点上升到2000点的水平;而由2000点上升到3000点只需要4年多时间;但是,如果要让指数从10 000点上升到20 000点,还需要等7年多的时间。因此我们看到,以1为开头的指数数据比以其他数字打头的指数数据要高很多

    数学家发现,帐本上数据的开头数字出现的频率符合本福德定律,如果做假帐的人更改了真实的数据,就会让帐本上开头数字出现的频率发生变化,偏离本福德定律中的频率。

    非常有趣的是,数学家发现,在那些假帐中,数字5和6居然是最常见的打头数字,而不是符合定律的数字1,如果审核帐本的人掌握了本福德定律,伪造者就很难制造出虚假的数据了。2001年,美国最大的能源交易商安然公司宣布破产,当时传出该公司高层管理人员涉嫌做假帐的丑闻。事后人们发现,安然公司在2001年到2002年所公布的每股盈利数字就不符合本福德定律,这说明了安然的高层领导确实改动过这些数据。

    最近数学家还把本福德定律用于选举投票中。票数的数据也符合这个定律,如果有人修改票数量,就会漏出蛛丝马迹来。数学家依据这一定律发现,在2004年美国总统选票中,佛罗里达州的投票存在欺诈行为;2004年委内瑞拉和2006年墨西哥的总统选举中也有类似现象。

   虽然本福德定律是一统计规律,它的形成原因还没有最终解释,但这并不妨碍人们把它运用到越来越多的生活领域中,帮助人们伸张正义、去伪存真。

    (8)统计科学与幸福

    根据统计规律与心理学,可以构建幸福指数,也可以给出“幸福的人”之统计学定义。

    看看下面的问题,你如果答案都是“是”,那么祝贺你,你是这个世界上非常非常稀有的幸福之人了!

    问题1:如果早上醒来,你发现自己还能自由呼吸,你就比在这一周离开人世的100万人更有福气。

    问题2:如果你从未经历过战争的危险、被囚禁的孤寂、受折磨的痛苦和忍饥挨饿的难受……你已经好过世界上五亿人。

   问题3:如果你的冰箱里有食物,身上有足够的衣服,有屋栖身,你已经比世界上70%的人更富足。

    问题4:如果你银行户头有存款,钱包里有现金,你已经身居世界上最富有的8%的人之列。

   问题5:如果你的双亲仍然在世,并且没有分居或离婚,你已属于稀少的一群。

    问题6:如果你能抬起头,带着笑容,内心充满感恩的心情,你是真的幸福——因为世界上大部分的人都可以这样做,但是他们没有。

    问题7:如果你能握着一个人的手,拥抱他/她,或者只是在他/她的肩膀上拍一下……你的确有福气——因为你所做的,已经等同上帝才能做到的。

    问题8:你可以读这篇文章,那是双重幸运:有人想到你这个朋友(把这篇文章转发给你),有20亿人根本不识字。

    结论与启示

    上述充满创意的统计科学文化种种实例涉及不同领域、不同层次,极尽想象力和创意,闪耀着智慧的光芒,异彩纷呈,引领我们体验统计科学文化之魅力。

    正如一位英国统计学家说的:“统计方法的应用是这样普遍,在我们的生活和习惯中,统计的影响是这样巨大,以致统计的重要性无论怎样强调也不过分。”甚至有的科学家还把我们现在的时代称作“统计时代”。显然,20世纪统计科学的发展及其未来已被赋予了划时代的意义。

    英国著名统计学家威尔斯(H.G.Wells)说:从微观上说,统计的思维方法,就像读和写的能力一样,有一天会成为效率公民的必备能力。”而从宏观上,美国著名统计学家劳(C.R.Rao)说,在终极的分析中,一切知识都是历史。在抽象的意义下,一切科学都是数学。在理性的基础上,所有的判断都是统计学。”

    从文化的角度挖掘统计科学,运用统计科学的方法探索文化,必将使我们畅享统计科学文化之魅力。

  

    (本文作者为南京财经大学经济学院统计系教师。)

  

   [1] 穆尔 D S. 统计学的世界(第五版). 郑惟厚, 译. 北京:中信出版社,2003.

   [2] 萨尔斯伯格. 女士品茶:20世纪统计怎样变革了科学. 邱东, 等,译. 北京:中国统计出版社,2004.

   [3] 劳C R . 统计与真理:怎样运用偶然性. 李竹渝,石坚, 译. 北京:科学出版社,2004.

   [4] 管于华 等. 统计学(第二版). 北京:高等教育出版社,2009.

   [5] 王庚 等. 现代数学建模方法. 北京:科学出版社,2008.