用车牌号能查到车主吗:信息熵的概念

来源:百度文库 编辑:偶看新闻 时间:2024/05/09 09:53:24

附录——信息熵
在申农信息理论中所论对象是符号编码系统。为了给出该系统信息编码能力,申农巧妙地变更视点,引入随机事件不确定性观念以及表征不确定性函数H顺利地处置了这个问题。就通讯工程理论而论,问题得到圆满解决,对问题研究也就该截止到这里了。但是,为什么又把这个意义已然明确的不确定性函数叫做信息熵呢?
如所周知,“熵”是热力学函数,在统计力学中所导出的熵无非是对热力学中提出的熵函数所做出的统计诠释。这就是说,熵函数原本是对物质系统宏观状态演化的数学陈述。可是在信息论中,所论对象不是一个物质系统,而是一个符号编码系统。到底出于什么原因、理由或根据把针对两个性质迥异系统的毫无干系的性状的函数却使用“熵”这个语词做出涵盖呢?我们建立这个附录就是对这一问题做出明确回复的尝试。
我们认为,把这两个相距遥远领域的函数连系在一起的依据就是热力学第二定律。爱因斯坦说过“一种理论前提越为简练,涉及的内容越为纷杂,适用的领域越为广泛,那种理论就越为伟大。经典热力学就是因此给我留下了极其深刻的印象。我相信只有内容广泛而又普遍的热力学理论才能通过其基本概念的运用而永远站稳脚跟。”[1]
我们在本书第三章阐述如何使语言信息编码和信息之间保持单义性的举例中,引述过热力学第二定律。当然,这样的语言形态确实给人一种不食人间烟火的感觉。其实,热力学第二定律的作用早就为人们所知晓,以至达到日用而不知的地步了。在英语中的虚拟语气就是这种观念在信息符号编码关系上的反映。如“ If I were young. ”实际上能再“ young ”一次吗?此外,沸水不再加热,放置在室内最终会凉下来。而不对凉水加热,凉水绝对不会自动升温达到沸腾,同样,不对凉水冷却,凉水也绝对不会自动结冰。上述这些情况都显示出热力学第二定律的作用。倘若有人坚持声称确有上述现象,不但没人相信,甚至会建议此人该接受心理治疗以消除其妄想狂。由此可见,人们对热力学第二定律的认识该有多么深刻了。以我们引述形态显示的热力学第二定律只是出于使陈述满足单义性、普遍性要求才被“加工改造”成这么个形态,其基本精神依然未变。
在我们对熵函数跨越物理系统和信息编码系统之间关系研究中,必然要引用物理学、信息论和数学等研究结果。这些结果都是上述学科中的基础内容,因此,无须在这里重复陈述。涉及热力学和统计物理学内容可以参考苏汝铿编著的《统计物理学教程》,信息熵可参考周炯槃编著的《信息理论基础》,概率论部分可参考复旦大学编写的《概率论》。综合陈述可参考冯端等撰写的《熵》。下面我们先将热力学、统计物理学和信息熵罗列出来,分别明确其内涵,然后再进行横向比照,寻求其相通之处,进而明确把信息编码不确定性叫做信息熵的理由和根据。
1.热力学熵函数
尽管热学或热力学的内容早已突破以获取机械功为目标的热功转化的研究探讨范围,但是从热力学第零、一、二定律以及与其相关的诸如平衡态、准静态过程、状态参量、过程方程等概念体系中依然鲜明地显示出这个历史痕迹。从以获取机械功为目标的热功转化这一研究导向审视热力学概念体系,那么诸如平衡态、准静态过程、状态参量、过程方程等就是落实这一研究导向所必须的步骤,而不是在某些热力学教程中显示出来的,为使概念体系逻辑关系严整而进行的必要的安排。
从当前的视点看,以上述导向研究其阶段性成果就是工程热力学。就其发展进程顺序看,这同时也是热力学进展肇始期间的研究导向。当然,热力学的研究范围不可能局限在这里,必定要拓展开来。但是在拓展中所使用或凭借的概念体系只能是来自工程热力学中的概念体系,即使此后出现的超越乃至变更也只能是相对于工程热力学概念体系的超越和变更。从超越和变更的意义上说,依据上述研究导向来明确工程热力学的概念体系就十分必要了。只有明确了借以超越的基础之后,才能明确在哪里超越,超越了什么以及超越的程度。
以获取机械功为目标的热功转化的研究导向不是物理学自身演化的表现,而是人类社会需求的反映。人类生存需要能量。人类生存最直接的能量需求除去食物之外就是机械功了。机械功就是超越各种具体条件的,对实际功效的一种普适的量度。这种基于生存需求所导致的对机械功的获取,必然表现在对物理上本来平等的各种能量形态选择上介入了人类自己的价值取向。这就是把机械功看作是最有价值的能量,并且成为评价能量“品质”的标准。在热力学中诸如热效率、可用能以及热贬等概念无一不是这种人类价值取向的反映。
回顾热力学进展可以看出,就热功转化而言,这一转化的物理机制在卡诺那里已然完成了。虽然卡诺使用的是热质论,然而这毕竟是一种机制上的解释。这个问题在许多物理教程中趋避犹恐不及,更遑论陈述。只有在王竹溪著的热力学教程中给出用热质论证明卡诺定理。就工程应用看,提出基于热质论热量,冷量并无不可,甚至更便于陈述操作。
就物理学而论,由于热功当量实验否定了热质论。对于热功转换机制及其限度就可以用热力学第二定律予以解释。热力学第二定律的提出标志着对热运动现象研究已经开始从“以获取机械功为目标的热功转化的研究”拓展到物理研究了。不过在这个范围内,熵函数有以下两个意义。首先,从工质的熵改变,即熵差可以计算出在热功转化过程中工质实际获得(或放出)的热量,这个热量或熵差是动力工程中用于评价该动力设施效能的重要指标。其次,熵本身也表示热量的品质,也就是热量的贬值程度。当然,这种品质是以转化机械功多少来评价的。
从物理方面看,包括熵函数在内的热力学第二定律一方面表明各种运动形态之间相互转化尽管可能,但是并不是等量对称转化,功可以完全转化为热,而热只能部分而不能全部转化为功。不过,我认为更重要的方面在于从过程的不可逆性显示出时间的单向性。时间不再是古典力学中的个可正可负的参量,而是一个物理事实。由于宏观过程的不可逆性,即无法彻底消除过程的影响,因此使得过程前和过程后的差异保存下来而显示前后差异。从这种意义上看,时间就是一种无可忽视的 being 。从热力学第二定律可以看出,具体过程形形色色难以计数,但是,就如同机械功量度了各种功效一样,时间也有类似的,超越过程具体形态的普适的度量意义。“如此星辰非昨夜”,是对热力学第二定律具有情感色彩的艺术写照。
熵函数是用数学形式对物理问题的陈述。如果用 S 表示所论系统的熵函数,T该系统温度,dQ表示传入系统的热量,那么它们之间将有这样的数量关系 dS=。由于建立这一数量关系的基础或理由是热力学第二定律,基于这种逻辑关系,可以说熵函数反映了热力学第二定律。
2.统计物理学中的熵函数
确切地说该是统计热力学的熵函数。热力学是宏观规律,其特征是唯象的,也就是不追究其底里。这是一种研究视点。此外,由于所论物理系统都是由分子构成,而且不同分子构成的物质系统的宏观表现也大相径庭,从大量分子运动的视点研究分子运动与其宏观表象之间关系也是一种研究方向。统计热力学就是从这个观点来研究包括从分子运动导出熵函数在内的各种热力学参量。
从由大量分子运动研究所组成系统的宏观现象需要使用统计方法这种数学工具。不过,要使用这种方法必须建构显示分子运动(微观现象)的数学模型,并且在此基础之上建构恰当的数学平台(好象说舞台更准确),通过这种数学模型的在该平台上的“表演”显示出由大量分子运动构成系统的宏观行为。依据数学模型所进行的推演(不完全是数学逻辑演绎)就是实现显示这种“表演”的必要步骤。这里我们只关注“表演”结果,所以,中间的推演就可以暂且略去。推演结果就是第一章给出的结果。
统计热力学中熵函数形式为 S=k ln叫热力学几率,符号 T 表示热力学,不是函数的幂。其中 W=这里 N=;ω =这里是相空间中相格的体积,ω是全体相格的体积。这里的是粒子处于相格中的概率。
3.有关概率问题
在申农处置编码符号系统信息量时使用了随机事件不确定性概念,这是概率论中的概念。为了理解、揭示申农的思想,我们需要对随机事件、随机事件的概率以及随机事件的不确定性取得明确的认识。
概率论是数学的重要分支,有关文献极多。可是从认识论讨论概率的文献却很难查找,至于系统阐述并且回答 What is Probability ?的文献我只见到过意大利罗马大学 Prof. B. De Finitti 在其撰写的《 Probability 》英译本中进行过论述。 Prof. B. De Finitti 是把 uncertainty 当作核心概念,而 uncertainty 则是 the extent of our own knowledge and ignorance ,于是问题就转化为 knowledge 和 ignorance 方面。这就是说,一旦我们把 ignorance 变成 knowledge 就无须概率了。不过,这种认识早就被量子力学所否定,那里的物理量是无法满足 knowledge 要求,只能用 Probability 的平方予以表示。这样, De Finitti 的论述就只好放弃。
需要指出,从认识论角度对 What is Probability ?做出回答对我们是十分必要的。因为信息熵的数学形式就是 H(A 1 , A 2 ,… An)= -这里 A 1 , A 2 ,… An 是 n 个随机事件,是随机事件 A j 的概率。如果不从认识论角度对 What is Probability ?给予正面回答就等于没有把信息熵概念阐述清楚。
就我们面对的情况而言,无论是信息熵还是统计热力学的熵都是对所论系统状态的数学表征。我们的所论系统又不是一个虚构的系统,而是一个确实能为我们自身肌体所觉知的系统。倘若表征这么个实实在在系统的量中还有一个我们尚且语焉不详的成分,就研究而论就相当于只是把问题和困难转移,而没有彻底解决。
数学不是哲学,从认识论角度对What is Probability ?做出回答只能在科学哲学文献中寻找。
概率是对模态命题中那些有资格成为概然判断的可能性差别所做出的数量描述。从哲学上看,“由于我们称为知识的东西是由判断( judgment )构成的,所以知识的对象是由命题表达的事物的状态。”[2] 在数理逻辑中命题种类很多,我们这里所关注的就是有关可能性的模态命题。“必然性和可能性是事物和认识的模态,反映必然性和可能性的命题也具有共同的形式结构。”“模态逻辑的对象是命题的模态形式。”[3] 模态命题原文是 Modal proposition 。从英语词典中 Modal 的释义为 n. verb that is used with other verb (not a modal) to express possibility, permission, obligation, etc. adj. relating to mode or manner, in contrast to substance. 从这一情况可以看出,将 Modal proposition 翻译成模态命题该是音译。在模态逻辑中引入符号◇表示可能。如命题 p 可能真将表示成◇ p 。[4]
这里顺带指出,就我们使用来说,所谓判断就是那些确认为“真”( true )的命题。不过这里的“真”有两重意义。这个命题首先是形式逻辑上的真命题,此外,还要在形式逻辑之外,即从实践上确认该命题为真。只有确认这两个方面为“真”该命题才具有承担思维运动中判断的资格。
从经验可知,命题的可能性有差异,也就是可能性大小不同。对模态命题形式结构关系研究是数理逻辑的工作;对模态命题可能性差异的数量描述是概率论的工作。从表面现象上看,模态命题都有可能性的差异,不过并不是所以模态命题的可能性差异都可以使用概率予以方物。英国数学家、哲学家罗素对这一情况做出了清晰的阐述。他指出“数学上的概率永远由两个命题的组合而产生的,我们可能完全知道其中的一个命题,而对另外一个命题毫无所知。”[5] 至于“……已经变得模糊到不再有把握相信得遥远得记忆,暗淡到让我们怀疑是否真实存在的星体,或者轻微到是我们以为也许只是想象出来的声音”则涉及到“这个命题的不确实性或可信性的程度。这是与数学上的概率完全不同的一个概念,……。”[6] 罗素的论述明确限定了在模态命题中以概率这一数量指标对其可能性差异做出陈述的界限。也可以说,我们确知命题所指对象,即完全知道的第一个命题,但是无法事先确知出现的到底是哪个所论情况,即毫无所知的第二个命题,只有在这种条件下才能够用概率予以陈述。用数学术语陈述就是所论对象必须是可测集( measurable set )。对那些符合上述条件且实践上为“真”的模态命题我们将其称之为概然判断。概率就是对概然判断可能性大小的数量描述。而对那些是否当真有( being )所论对象的命题尽管也可以做出模态命题,但是这类命题就不在概率陈述范围之内。
在明确了这个情况之后,我们可以集中探讨概然判断中可能性的差异问题了。
如上所述,可能性有差异这一认识来自经验。简要地说,就是在所论对象诸多情况中,那些出现次数多的表示可能性大,反之则表示小。这是建立概率概念的至关重要的知觉基础,虽然在陈述上显得粗糙。下面通过一事例对此作出说明,比如,一副扑克牌,它乃是印有 13 × 4 个不同图案的卡片,现从中任抽取一张,我们肯定知道所抽取的一定是这 52 张牌中的一张(这是必然判断,也就是罗素所说的完全知道的第一个命题),但是不能确切地指出到底抽取到哪一张(也就是罗素所说的对到底取哪一张毫无所知),只能说可能抽取到哪一张,也就是说对抽取结果只能作出概然判断,这就是数学概率论所要研究的概然判断,抽取扑克牌的操作就叫做随机试验,抽取的结果叫做随机事件。因此,所谓随机试验,其特征就是我们完全知晓该随机试验有什么样的可能结果和多少(不一定局限于自然数)可能结果,但是对到底出现哪个结果只能作出概然判断。在此范围之外的模态命题都不能使用数学概率予以陈述。至于处置某些具体问题时如何使用概率,我们认为主要根据罗素观念的基本精神,相机行事,灵活处理,决不局限于抽取扑克牌这一种模式。
由于随机试验的特点是不能事先准确地预言它的结果,而且在相同条件下可以重复进行,由此可以提出频率的概念以显示随机试验的情况。
在 N 次随机试验中,随机事件 A 出现 n 次,则称 F N (A)=为随机试验 A 在 N 次试验中出现的频率。在长期实践中发现,虽然个别随机事件在某次试验或观察中可以出现也可以不出现,但是,在大量的试验中该随机事件出现的频率呈现出稳定性。[7] 这一情况可以推动我们设法实践“用一个数字 P(A) 来标志(随机)事件A出现的可能性”这一设想。也正是在这种思想促动(引诱?)下,可以说在逻辑上很粗暴甚至是蛮不讲理地提出了概率。下面先看数学上是如何提出古典型概率,然后再分析这种观念的提出何以说成是蛮不讲理。
王梓坤在《概率论基础及其应用》一书中提出:
设E为一试验,如果不能事先准确地预言它的结果,而且在相同条件下可以重复进行,就称为随机试验。以ω表示它的一个可能的结果,称ω为E的一个基本事件。全体基本事件的集Ω= ( ω ) 称为基本事件空间。
……
当我们多次做某一随机试验E时常常会察觉某些事件出现的可能性要大一些,也就是说,这些事件出现的次数要多些,而另一些事件出现的可能性小一些。…既然各事件出现的可能性有大有小,自然使人想到该用一个数字 P(A) 来标志事件A出现的可能性。较大可能性用较大的数字标志,较小的就用较小的数字。这数字 P(A) 就称为事件A的概率。”[8]
在讲到古典型概率时,王氏指出;
“如果随机试验E具有以下性质:
①只有有限个不同的基本事件
② 一且基本事件都是等可能的。
对古典型的随机试验E,Ω=(),事件A是由K(K≤n)个不同的基本事件组成,我们就定义随机事件A的概率

所谓基本事件等可能地出现又是什么意思呢?对此我们不能下数学定义而只能做一些解释。当从问题的有关的各个方面考虑时,如果它们完全处于平等的地位,谁也不比谁特别些,这时就可把它们看成是等可能的。在目前很难用更简单的概念来定义“等可能”,就象集合论中“集合”的概念没有明确的数学定义一样,我们无需感到惊讶,因为如果概念甲是由较简单的概念乙来定义,那么乙也必须用更简单的概念丙来定义,如此下去,最后势必会遇到一个最基本的概念,我们再不可能,也不必用其它概念定义它。这时只需用一些例子或直观的语言去解说它的含义。“等可能”就是这样一个概念。”[9] 当前数学专业概率论教程中对概率概念阐述大体相似。所以,援引王氏论述具有一般性。
以“等可能”观念为主导还可以推广到数目可以是无限的连续区域。实验的可能结果是某区域Ω中的一个点。这个区域可以是一维的,也可以是二维的,还可以是三维的,甚至可以是 n 维的。在这种情况下,无论是可能结果全体或是我们所感兴趣的结果都是无限大的(连续统)。因而这时等可能性则用以下方式来赋予意义;落在某区域 g 的概率与区域 g 的测度(长度、面积、体积等)成正比并且与其位置和形状无关。
因此,若以 A g 记“在区域Ω中随机地取一点,而该点落在区域 g 中这一事件”,则其概率定义为
P(A g )=这里 g 、Ω分别代表该区域的测度。[10]
在实函数论则更为直截了当地规定了个满足一定解析条件的测度空间就叫做概率测度空间。[11] 这里就好象没道理可讲了。
我在这里说概率的提出是“蛮不讲理”是有原因的。从随机试验频率的稳定性使我们从情绪上觉得这样提出概率是可接受的。但是把这种意向作为根据是不行的。在大量的试验中该随机事件出现的频率稳定性只能推动我们设法实践“用一个数字 P(A) 来标志(随机)事件A出现的可能性”这一设想,但是推动只是推动,不能构成提出“用一个数字 P(A) 来标志(随机)事件A出现的可能性”这一结论的依据。这里面有两重困难。首先,用有限的试验结果作为提出“用一个数字 P(A) 来标志(随机)事件A出现的可能性”这一结论的依据是不充分的。试验不是思辩,而是实际操作,因此,无论做什么随机试验以及做多少次随机试验,我们都将得到一个有限数列,当若要想得出“用一个数字 P(A) 来标志(随机)事件A出现的可能性”这一结论,或者说要从逻辑上确认这一命题为真,那么我们必须从逻辑上证明当 N →∞时,该数列必将收敛到某个确定的数值,最好是收敛到其频率。遗憾的是从随机试验中除去得到一系列频率数值之外不能给我们提供任何一点有助于证明该数列收敛的线索。其次,即使对于古典型概率这种最简单的情况也要求我们证明随机试验的频率将收敛于古典型概率,不幸,随机试验仍然不能提供任何有助于实现证明的线索。但是如果说频率数列不收敛到某个极限也同样没有根据,事实上,“说我们知道频率极限存在是不对的,但是说我们知道频率极限不存在也同样是不对的。我们面对的是一种不确定性,我们不知道频率的极限是否存在。”[12] 在这方面的探索极大地促进了归纳逻辑的进展。在陈克艰著的《上帝怎样掷骰子》一书中,作者用了较大的篇幅讨论过此问题。
此时就把我们这些概率论使用者推到一个困难选择的面前了。从随机事件的频率到概率之间出现了无可回避的逻辑空缺,接受数学概率论就意味着置这一逻辑缺失与不顾,这么做还能算是科学态度吗?不接受,我们还能有其它备选的数学工具来处置概然判断的可能性程度吗?没有。面对这种进退维谷的处境我觉得还是采用中山大学物理系 关洪 先生的观念为宜。在这个问题上对数学持那种“平庸而通俗”的态度。甚至可以说是用频率和概率如此一致的诱惑弥合了两者之间的逻辑缺失,从而确信数学上如此这般规定的概率就是从数量上描述了概然判断可能性程度上的差异。
从表现上看,概率论的公理体系好像是为了摆脱原来那种经验算法的地位向实函数论靠拢的逻辑形态。不过,我认为这一公理化体系的意义不仅仅在使用操作上我们可以放心在概率运算中大胆地使用实函数论所容许的一切数学成果,更为重要的是这一公理体系把罗素对概率论的使用范围用公理化体系方式勾画出来,使其表述更为确切,从而划定了能够适用概率论的范围的界限和条件。
通过这些分析讨论,我们可以对“ What is Probability ?”做出正面回答了。概率是对模态命题中那些有资格成为概然判断的可能性差别所做出的数量描述。因此,概率只是数量陈述,概率论只是对随机事件的陈述性理论,与所论对象运做机制和所论对象的性质无关。更进一步说,对做出概然判断对象到底是有知还是无知,这种导致有知还是无知的原因是什么,都不是概率论关注的问题。虽然在某些情况下这些问题很重要,甚至需要解决,可是再重要也不属于概率论范围,要解决只能在概率论领域之外谋求出路。至于统计问题则是在方法上与概率论相关的另外问题,是概率论的应用。在理念和方法上和概率论不同,不可混在一起研究。把概率论和统计学放在一起只是便于陈述和教学使用,没有其它必然联系。
4.不确定性函数、信息量和信息熵
Shannon 对信息量度问题的处置极富于智慧。他不去正面处置,而是变更视点,把信息的接收看作是面对信息编码符号的随机事件。这就是说,凡是要传递的信息必用符号须加以编码,因此,所谓接收信息必然就是得到代表编码符号的信号。这样看来,就信息运动而言就是代表编码符号的信号在运动。从这种意义上说,我们可以把信息运动看作是一定有代表符号的信号出现,可是事先不知道得到的到底是哪个符号的随机事件。事实上,单就信号出现这一情况而言,我们采用这种看法并无不可。何况,“看作是”也无非是“看作是”而已,实际情况该怎样就怎样,毫不影响实际信息运动。
从这个理路出发,我们对以这一符号编码系统加以承载的信息运动就完全可以看作是能够用概率予以陈述的的随机事件。随机事件的特征就是不确定性( uncertainty )。随机事件之间的差别就表现在这种不确定性方面的差异。在复旦大学编写的《概率论》中陈述了不确定性差异,这里无庸赘述。就信息运动而言,在没有信息运动之前,从信宿看,信源应该具有最大的不确定性。在信宿从信源中获得信息,也就是获得了符号之后,信源由于使用了这些符号从而导致了不确定性的减少,此时信源在通讯前后不确定性的差值就是信宿获得的信息数量。这种对信息度量的理路不但适用于人际间的信息运动,对非人际间信息运动也同样适用。
下面述依据周炯槃编著的《信息理论基础》、复旦大学编写的《概率论》等文献阐述随机试验不确定性及其解析表示。
从经验上可知随机试验的不确定性确有大小差异,能否从数量上显示这种差异就是我们必须研究的问题。因为随机事件总有概率与其对应。这样,对随机事件之不确定性研究就转化为对该随机事件所相应概率情况的总体性研究。下面通过一个事例显示这一情况。
例如,甲乙二人进行射击,以中靶 A 和不中靶 B 作为射击结果。中靶概率为 p(A) ,不中靶概率为 p(B) 。其结果如下
甲 乙
p(A) p(B) p(A) p(B)
0.5 0.5 0.3 0.7
对甲乙射击情况而言都可以看作是随机试验。就这两个随机试验而言都有不确定性,但是虽然都有不确定性,可是这两个不确定性却有差异。甲的不确定性要比乙的不确定性大。
从这个事例中可以看出,不确定性是指随机试验而言。不确定性的差异是从构成这一随机试验的随机事件概率取值的差异而显示出来的。也就是说,从构成随机试验那些随机事件概率分布的差异显示出来的。
在处置这个问题上申农充分展示了作为数学家的想象力和机巧。既然没有现成的数学形式显示这种不确定性他就“制作”出一个能表示这一特点的函数。通过数学推演得到
H(A 1 , A 2 ,… An)= -这里 A 1 , A 2 ,… An 是 n 个随机事件,是随机事件 A j 的概率。
在第一章的阐述中,阐明了信息熵变化标志着信息系统信息运动状态变化,这样在概念上,信息熵和物理中的熵函数就完全相通。这里就无须重复了。
参考文献
[1]里夫金等著 吕明等译 熵:一种新的世界观 上海译文出版社 1987 年 2 月第 1 版 40 页
[2](日)末木刚博等著 孙中原等译 逻辑学——知识的基础 中国人民大学出版社 1984.12 第一版 98 页
[3]王宪钧 数理逻辑引论 北京大学出版社 1982年6月第一版110页
[4]王宪钧 数理逻辑引论 北京大学出版社 1982年6月第一版112页
[5](英)罗素 张金言译 人类的知识 商务印书馆 1983第1版第401页
[6](英)罗素 张金言译 人类的知识 商务印书馆 1983第1版第407页
[7]复旦大学编 概率论 第一册 第8页 高等教育出版社 1979第1版
[8]王梓坤 概率论基础及其应用 第3页 科学出版社 1976第1版
[9]王梓坤 概率论基础及其应用 第4页 科学出版社 1976第1版
[10]复旦大学编 概率论 第一册 第37页 高等教育出版社 1979第1版
[11]夏道行等编著 实变函数论与泛函分析上册 第169页 高等教育出版社 1978.11第一版
[12]陈克艰 上帝怎样掷骰子 四川人民出版社 1987年3月第1版87页