车牌号查询系统:概率论-浙江大学数学系4

来源:百度文库 编辑:偶看新闻 时间:2024/04/29 15:56:19
第四节 条件概率与事件的独立性
§4  条件概率与事件的独立性
一、条件概率
二、全概率公式,贝叶斯(Bayes)公式
三、事件独立性
四、贝努里概型
补充和注记
习       题
一、条件概率
任一个随机试验都是在某些基本条件下进行的,在这些基本条件下某个事件的发生具有某种概率. 但如果除了这些基本条件外还有附加条件,所得概率就可能不同.这些附加条件可以看成是另外某个事件发生.
条件概率这一概念是概率论中的基本工具之一. 给定一个概率空间,并希望知道某一事件发生的可能性大小. 尽管我们不可能完全知道试验结果,但往往会掌握一些与事件相关的信息,这对我们的判断有一定的影响. 例如,投掷一均匀骰子,并且已知出现的是偶数点,那么对试验结果的判断与没有这一已知条件的情形有所不同. 一般地,在已知另一事件发生的前提下,事件发生的可能性大小不一定再是.
已知事件发生条件下事件发生的概率称为事件关于事件的条件概率(conditional probability),记作.
在某种情况下,条件的附加意味着对样本空间进行压缩,相应的概率可在压缩的样本空间内直接计算.
例1  盒中有球如右表1-2. 任取一球,记={取得蓝球},={取得玻璃球}, 显然这是古典概型.包含的样本点总数为16,包含的样本点总数为11,故
.
表1-2
玻璃           木质
总计


2             3
4             7
5
11
总计
6            10
16
如果已知取得为玻璃球,这就是发生条件下发生的条件概率,记作. 在发生的条件下可能取得的样本点总数应为“玻璃球的总数”,也即把样本空间压缩到玻璃球全体. 而在发生条件下包含的样本点数为蓝玻璃球数,故
.
一般说来,在古典概型下,都可以这样做.但若回到原来的样本空间,则当,有
 .
这式子对几何概率也成立. 由此得出如下的一般定义.
定义1   对任意事件,若,则“在事件发生的条件下的条件概率”,记作P(A | B),定义为
.                                                                 (1)
反过来可以用条件概率表示的乘积概率,即有乘法公式
,则,                             (2)
同样有
,则.                           
从上面定义可见,条件概率有着与一般概率相同的性质,即非负性,规范性和可列可加性. 由此它也可与一般概率同样运算,只要每次都加上“在某事件发生的条件下”即成.
两个事件的乘法公式还可推广到个事件,即

                      (3)
具体解题时,条件概率可以依照定义计算,也可能如例1直接按照条件概率的意义在压缩的样本空间中计算;同样,乘积事件的概率可依照公式(2) 或计算,也可按照乘积的意义直接计算,均视问题的具体性质而定.
例2   张彩票中有一个中奖票.
① 已知前面个人没摸到中奖票,求第个人摸到的概率;
② 求第个人摸到的概率.
解  问题 ① 是在条件“前面个人没摸到”下的条件概率. ② 是无条件概率.
={第个人摸到},则 ① 的条件是. 在压缩样本空间中由古典概型直接可得
① P()=
② 所求为,但对本题,, 由(3)式及古典概率计算公式有
()


.
这说明每人摸到奖券的概率与摸的先后次序无关.
例3  甲乙两市位于长江下游,根据一百多年的记录知道,一年中雨天的比例,甲为20%,乙为18%,两市同时下雨的天数占12%. 求:
① 乙市下雨时甲市也下雨的概率;② 甲乙两市至少一市下雨的概率.
解  分别用记事件{甲下雨}和{乙下雨}. 按题意有,.
① 所求为
.
② 所求为

.
二、全概率公式,贝叶斯(Bayes)公式
对于较为复杂的事件,需要综合运用上面提到的一些基本公式.  先介绍一个基本概念.
定义2  若事件组满足下列两条件:①,两两互不相容,且;②, 则称的一个完备事件组,也称是的一个分割.
最简单的完备事件组是.
全概率(total probability)公式  设是一个完备事件组,则有
.                                            (4)
证  注意到,故=1,2,…. 因此由可列可加性得

.
公式(4)意味着“全”部概率被分解成了一些部分之和. 如果在较复杂的情况下不易直接计算,但总是随某个伴出,而又易于计算,我们就可应用全概率公式去计算.
例4  有5个乒乓球,其中3个新的2个旧的.  每次取一个,无放回地取两次,求第二次取时得新球的概率.
解  记={第一次取时得新球},={第二次取时得新球},因为第二次得新球这事件的概率与第一次是否得新球有关,即事件可以与完备事件组联系起来. 又,且,故由从公式(4)有
.
例5  播种用的一等小麦种子中混合2 % 的二等种子,1. 5 %的三等种子以及1%的四等种子. 用一、二、三、四等种子长出的穗含50颗以上麦粒的概率分别是0. 5,0. 15,0. 1,0. 05.  任选一颗种子,求它所结的穗含50颗以上麦粒的概率.
解  记 ={所选种子结穗含50颗以上麦粒},
={所选种子是第等},=1,2,3,4.
构成一完备事件组,已知, , 故
.
例6  求上例中“任选一颗种子,发现其所结穗确含有50颗以上麦粒,求它是第一等种子”的概率.
解  这相当于求. 按条件概率定义,并利用公式和(4),可得

.
同理可求出它是第二等、第三等、第四等种子的概率.
从这个例子引出一个与全概率公式密切相关的公式——贝叶斯公式.  设是一个完备事件组,则
=1,2,…               (5)
是在没有进一步的信息(不知是否发生)的情况下人们对发生可能性大小的认识,称为先验(Priori)概率;现在有了新的信息(知道发生),人们对发生的可能性大小有了新的估计,得到条件概率,称为后验(Posteriori)概率.
如果把看成“结果”,看成导致这一结果的可能的“原因”.  则全概率公式可以看成为“由原因推结果”,而贝叶斯公式正好相反,可以看成是“由结果推原因”. 现在一个结果发生了,那么导致这一结果的各种不同的原因的可能性大小就可由贝页斯公式求得.
例7  用血清甲胎蛋白法诊断肝癌.  用表示被检验者确实患有肝癌的事件,表示判断被检验者患肝癌的事件,已知
.
现若有一人被此法诊断患有肝癌,求此人真正患肝癌的概率.
解  所求为
.                         (6)



将这些数值与已知值代入(6)式,得
.
条件中表示确实患肝癌的人被确诊有肝癌的概率,
=0.95,及两式表明这检验法还是相当可靠的. 但若有一人被诊断患肝癌,而实际上他真患肝癌的概率并不大. 如果在分析问题时不运用概率论的思想,是很难理解这一结论的. 事实上因为人群中真正患肝癌的人很少,由于检验方法并不完全准确,在大批健康人中还会有一定数量的人被误诊为肝癌. 另一方面,真正肝癌患者在全人口中占很小比例,即使全部被检出,在这两部分被检验为患肝癌的总人数中也只小部分.
例8  为判断某木材是桦木还是桉木,先考察它们的某一特征(例如平均亮度)的某个值,以分别表示该木是桦木还是桉木,事先掌握了,,,由公式(5)得
=1,2.
,则认定该木是桦木.
上述方法称为贝叶斯决策,在模式识别等学科中这种方法有重要的应用, 并有很好的发展前景.
三、事件独立性
1.  两个事件的独立性
事件发生与否可能对事件发生的概率有影响,但也有相反的情况,即有时有
.                                                        (7)
这时,. 反过来,若
,                                             (8)

.
这种情况称统计独立(statistical independence),或独立. 不独立也叫统计相依(statistical dependence).  当时,(7)式与(8)式是等价的,一般情况下独立的定义来用(8)式,因为在形式上它关于对称,且便于推广到个事件.  (8)式也取消了的条件. 事实上,若, 则, 同时就有,此时不论是什么事件,都有(8)式,亦即任何事件都与独立.  同理任何事件也与必然事件独立.
例9  口袋中有只黑球只白球,连摸两次,每次一球. 记={第一次摸时得黑球},={第二次摸时得黑球}. 问是否独立?就两种情况进行讨论:① 有放回;② 无放回.
解  因为,我们可以用是否等于来检验独立性. 对于情况 ①,利用古典概型,有,再利用全概率公式,得

.
相互独立.
对于情况 ②,此时, 再利用全概率公式,有


不独立.
例10  求证:若互不相容,且, 则一定不独立.
证 不相容,则, 故不独立.
反之,当相容时,可能独立,也可能不独立.
例11  已知独立,求证,也独立.
证  设相互独立,则, 从而

,
所以也独立. 利用这个结果,则的逆事件也独立;同理独立.
很多实际问题中,利用(7)或(8)式来判断的独立性是比较困难的,这时往往根据独立的含义直观判断. 例如一个电路系统中两个不同元件出现故障可以认为是相互独立的;但是某一地区的气温和降雨量就不能认为是独立的了.
定义3  两个,被称为关于是独立的,如果对任意事件都有
.
例如,令
,,
那么独立当且仅当独立.
2. 多个事件的独立性
个事件,除考虑两两的独立性以外,还得考虑其整体的相互独立性. 以三个事件,,为例.
定义4  若
                                    (9)

                                           (10)
则称,,相互独立.
(9)式表示,,两两独立,所以独立包含了两两独立. 但,,的两两独立并不能代替三个事件相互独立,因为还有(10)式. 那么(9)式是否包含(10)式呢?回答是否定的,有例如下:
例12  一个均匀的正四面体,其第一面染成红色,第二面为白色,第三面为黑色,第四面红白黑三色都有. 分别用,,记投一次四面体时底面出现红、白、黑的事件. 由于在四面体中有两面出现红色,故;同理,;同时出现两色或同时出现三色只有第四面,故
,
因此
,


(9)式成立,,,两两独立. 但
,
即(10)式不成立.
反过来,也有例子说明从(10)式也不能推出(9)式,因此,,的相互独立必需(9)式与(10)式同时成立.
类似地,个事件相互独立的定义如下:
定义5  若对一切可能的组合,有
                       (11)
就称相互独立.
(11)式中共有个等式.  并且表明,若n个事件相互独立,则它们中任意k (2)个事件也相互独立.
例13  设相互独立,=1,2,…,.  求:
(1) 所有事件全不发生的概率;
(2) 这些事件中至少发生一个的概率;
(3) 恰好发生其中一个事件的概率.
解  先把所求各事件表示成的和、积、逆等形式,再利用概率的运算公式.
(1) 所有事件全不发生=,类似于例11,可证也是相互独立的,故所求为

.
(2)个事件中至少发生一个=,它是(1)中事件的逆事件,故

.
当然这里也可以用个事件的和的概率公式(§3的 (7) 式),但不如上面的算法容易.
(3) 恰好发生其中一个事件=
,上面式子中,每一项作为一个事件,各项互不相容,其中每一项中各个事件又是相互独立的,故所求为



.
例14  一个系统能正常工作的概率称为该系统的可靠性.  现有两系统都由同类电子元件,,所组成,如图1-4.每个元件的可靠性都是,试分别求两个系统的可靠性.

图1-4
解  以分别记两个系统的可靠性,以,,分别记相应元件工作正常的事件,则可认为,,相互独立,有



,

.
显然.
可靠性理论在系统科学中有广泛的应用,系统的可靠性的研究具有重要意义.
3.  试验的独立性
与事件的独立性密切相关的是随机试验的独立性. 一般来说,若有个试验,…,,每个试验的每个结果都是一个事件. 如果的任一事件与的任一事件与…与的任一事件相互独立,就说,…,相互独立.
的样本空间为. 为描述这次试验,要构造复合试验
,对应的样本空间个样本空间的直积.  而中的样本点, 其中.
应该把的任一事件放到复合的样本空间中,成为复合事件, 不妨仍记作. 这样,试验独立可表示为,对一切,…,均有
.                        (12)
次有放回摸球是个试验相互独立的例子,并且这里==…=,而且各次试验中同样事件的概率相同,这种试验称为次重复独立试验,在概率的统计定义中曾提到过.次不放回摸球则是个试验不独立的例子.
下面研究一种重要的重复独立试验模型.
四、贝努里概型
如果一次随机试验只有两种相反的结果(掷一枚硬币,只出现“正面”或“反面”;考察一条线路,只有“通”与“不通”;传递一个信号,只有“正确”与“错误”;播下一颗种子,了解它“发芽”与否;观察一台机器“开动”与否…),这种随机试验称为贝努里(Bernoulli)试验.  有时试验的结果虽有多种,但如果只考虑某事件发生与否,也可作为贝努里试验,例如抽检一个产品,虽有各种质量指标,但如果只考虑合格与否,就是贝努里试验.  我们可以用代表“成功” 而代表“失败”,这种抽象的说法来描述贝努里试验. 它的样本空间,其中,,事件域.  给定, (), 则,就给出了一次贝努里试验的所有事件的概率.
常常讨论的是在次重复独立的贝努里试验中的情况,这种概率模型称为贝努里概型.  如上一段末所述,它的样本点是,其中,样本点总数为. 各样本点出现的概率不全相同,故虽是有限样本空间,却不是古典概型.
贝努里概型中,每个样本点即是一个基本事件,由它们又可组成很多复合事件. 利用事件的运算公式和概率的运算公式,可以计算这些事件的概率.
例15  某人射击5次,每次命中的概率是0. 8,求事件{前两次命中,后三次不命中}的概率.
解  5次射击可看成5次重复独立的贝努里试验. 记={一次射击时命中},则,.  所考虑事件=,其中
,由独立事件乘积的概率计算,所求概率=.
例16  求重贝努里概型中={事件恰好发生次}的概率.
解  与上题不同的是这里只指定发生的次数,而没有限定在哪几次发生,也即可以是头上次,也可以是中间某次,也可能是最后次.  在不致引起误会的前提下,每种基本事件可记为的乘积,而则为这些基本事件的和事件,即

,                            (13)
它共有项,各项互不相容,每一项中各事件又是相互独立的. 任一项的概率都是. 由有限加法定理,,记作
,
=0,1,2,…,                                    (14)
它是二项展开式的各项(其和恰好为1),故称为二项分布. 这是贝努里概型中最重要的概率,由它可推出很多事件的概率.
例17 台同类机器,每台在某段时间内损坏的概率为,求在这段时间内不少于台能正常使用的概率.
解  每台机器能在这段时间内正常使用的概率. 又
{不少于m台能正常使用}=,
和式中各项互不相容,故所求概率为
.
重新考虑§2的例9:每一次从口袋中拿牙签不是拿甲盒就是拿乙盒,记={拿甲盒},={拿乙盒},共拿()次,是贝努里概型. 若发现甲盒先用完,则()次抽用的全部过程可看成
{前次抽次甲盒()次乙盒}∩{最后一次抽甲盒},
这种情况的概率=,发现乙盒先用完的概率相同.  所述事件的概率为
.
注  如果每次试验的可能结果有两种以上,就不是贝努里试验,但可用类似的分析方法处理. 设一次试验的可能结果为, (), 它们构成一完备事件组,,. 则在次重复独立试验中分别出现次的概率为
浙江大学数学系版权所有 │ 数学系:0571-87953680 支持邮箱:xulinrong@zju.edu.cn