
概率公式c
-rrqqq
2023年2月16日发(作者:季风环流)第1章随机事件及其概率
(1)排列
组合公式
)!(
!
nm
m
Pn
m
从m个人中挑出n个人进行排列的可能数。
)!(!
!
nmn
m
Cn
m
从m个人中挑出n个人进行组合的可能数。
(2)加法
和乘法原
理
加法原理(两种方法均能完成此事):m+n
某件事由两种方法来完成,第一种方法可由m种方法完成,第二种方法可由n
种方法来完成,则这件事可由m+n种方法来完成。
乘法原理(两个步骤分别不能完成这件事):m×n
某件事由两个步骤来完成,第一个步骤可由m种方法完成,第二个步骤可由n
种方法来完成,则这件事可由m×n种方法来完成。
(3)一些
常见排列
重复排列和非重复排列(有序)
对立事件(至少有一个)
顺序问题
(4)随机
试验和随
机事件
如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,
但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试
验。
试验的可能结果称为随机事件。
(5)基本
事件、样本
空间和事
件
在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有
如下性质:
①每进行一次试验,必须发生且只能发生这一组中的一个事件;
②任何事件,都是由这一组中的部分事件组成的。
这样一组事件中的每一个事件称为基本事件,用
来表示。
基本事件的全体,称为试验的样本空间,用表示。
一个事件就是由中的部分点(基本事件
)组成的集合。通常用大写字母
A,B,C,…表示事件,它们是的子集。
为必然事件,Ø为不可能事件。
不可能事件(Ø)的概率为零,而概率为零的事件不一定是不可能事件;同理,
必然事件(Ω)的概率为1,而概率为1的事件也不一定是必然事件。
(6)事件
的关系与
运算
①关系:
如果事件A的组成部分也是事件B的组成部分,(A发生必有事件B发生):
BA
如果同时有BA,AB,则称事件A与事件B等价,或称A等于B:
A=B。
A、B中至少有一个发生的事件:AB,或者A+B。
属于A而不属于B的部分所构成的事件,称为A与B的差,记为A-B,也可
表示为A-AB或者BA,它表示A发生而B不发生的事件。
A、B同时发生:A
B,或者AB。A
B=Ø,则表示A与B不可能同时发生,
称事件A与事件B互不相容或者互斥。基本事件是互不相容的。
-A称为事件A的逆事件,或称A的对立事件,记为
A
。它表示A不发生
的事件。互斥未必对立。
②运算:
结合率:A(BC)=(AB)CA∪(B∪C)=(A∪B)∪C
分配率:(AB)∪C=(A∪C)∩(B∪C)(A∪B)∩C=(AC)∪(BC)
德摩根率:
11i
i
i
iAA
BABA,BABA
(7)概率
的公理化
定义
设
为样本空间,
A
为事件,对每一个事件
A
都有一个实数P(A),若满
足下列三个条件:
1°0≤P(A)≤1,
2°P(Ω)=1
3°对于两两互不相容的事件1A
,2A
,…有
1
1
)(
i
i
i
iAPAP
常称为可列(完全)可加性。
则称P(A)为事件
A
的概率。
(8)古典
概型
1°
n
21
,,
2°
n
PPP
n
1
)()()(
21
。
设任一事件
A
,它是由
m
21
,组成的,则有
P(A)=)()()(
21m
=)()()(
21m
PPP
n
m
基本事件总数
所包含的基本事件数A
(9)几何
概型
若随机试验的结果为无限不可数并且每个结果出现的可能性均匀,同时样本空
间中的每一个基本事件可以使用一个有界区域来描述,则称此随机试验为几何
概型。对任一事件A,
)(
)(
)(
L
AL
AP。其中L为几何度量(长度、面积、体积)。
(10)加法
公式
P(A+B)=P(A)+P(B)-P(AB)
当P(AB)=0时,P(A+B)=P(A)+P(B)
(11)减法
公式
P(A-B)=P(A)-P(AB)
当B
A时,P(A-B)=P(A)-P(B)
当A=Ω时,P(B)=1-P(B)
(12)条件
概率
定义设A、B是两个事件,且P(A)>0,则称
)(
)(
AP
ABP
为事件A发生条件下,事
件B发生的条件概率,记为)/(ABP
)(
)(
AP
ABP
。
条件概率是概率的一种,所有概率的性质都适合于条件概率。
例如P(Ω/B)=1P(
B
/A)=1-P(B/A)
(13)乘法
公式
乘法公式:)/()()(ABPAPABP
更一般地,对事件A1,A2,…An,若P(A1A2…An-1)>0,则有
21(AAP
…
)nA)|()|()(213121AAAPAAPAP
……21|(AAAPn…
)1nA
。
(14)独立
性
①两个事件的独立性
设事件
A
、
B
满足
)()()(BPAPABP
,则称事件
A
、
B
是相互独立的。
若事件
A
、
B
相互独立,且
0)(AP
,则有
)(
)(
)()(
)(
)(
)|(BP
AP
BPAP
AP
ABP
ABP
若事件
A
、
B
相互独立,则可得到
A
与
B
、
A
与
B
、
A
与
B
也都相互独
立。
必然事件
和不可能事件Ø与任何事件都相互独立。
Ø与任何事件都互斥。
②多个事件的独立性
设ABC是三个事件,如果满足两两独立的条件,
P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A)
并且同时满足P(ABC)=P(A)P(B)P(C)
那么A、B、C相互独立。
对于n个事件类似。
(15)全概
公式
设事件nBBB,,,21
满足
1°nBBB,,,21
两两互不相容,
),,2,1(0)(niBPi
,
2°
n
i
iBA
1
,
则有
)|()()|()()|()()(2211nnBAPBPBAPBPBAPBPAP
。
(16)贝叶
斯公式
设事件1B
,2B
,…,nB
及
A
满足
1°1B
,2B
,…,nB
两两互不相容,
)(BiP
>0,
i
1,2,…,
n
,
2°
n
i
iBA
1
,
0)(AP
,
则
n
j
jj
ii
i
BAPBP
BAPBP
ABP
1
)/()(
)/()(
)/(,i=1,2,…n。
此公式即为贝叶斯公式。
)(
i
BP,(
1i
,
2
,…,
n
),通常叫先验概率。
)/(ABP
i
,(
1i
,
2
,…,
n
),通常称为后验概率。贝叶斯公式反映了“因果”的概率规律,并作出了
“由果朔因”的推断。
(17)伯努
利概型
我们作了
n
次试验,且满足
每次试验只有两种可能结果,
A
发生或
A
不发生;
n
次试验是重复进行的,即
A
发生的概率每次均一样;
每次试验是独立的,即每次试验
A
发生与否与其他次试验
A
发生与
否是互不影响的。
这种试验称为伯努利概型,或称为
n
重伯努利试验。
用
p
表示每次试验
A
发生的概率,则
A
发生的概率为
qp1
,用
)(kPn表
示
n
重伯努利试验中
A
出现
)0(nkk
次的概率,
knk
k
n
nqpkPC)(
,
nk,,2,1,0
。
第二章随机变量及其分布
(1)离散
型随机变
量的分布
律
设离散型随机变量
X
的可能取值为Xk(k=1,2,…)且取各个值的概率,即事
件(X=Xk)的概率为
P(X=xk)=pk,k=1,2,…,
则称上式为离散型随机变量
X
的概率分布或分布律。有时也用分布列的形
式给出:
,,,,
,,,,
|
)(21
21
k
k
kppp
xxx
xXP
X
。
显然分布律应满足下列条件:
(1)
0kp
,
,2,1k
,(2)
1
1
k
kp
。
(2)连续
型随机变
量的分布
密度
设
)(xF
是随机变量
X
的分布函数,若存在非负函数
)(xf
,对任意实数
x
,有
xdxxfxF)()(
,
则称
X
为连续型随机变量。
)(xf
称为
X
的概率密度函数或密度函数,简称概
率密度。
密度函数具有下面4个性质:
1°
0)(xf
。
2°
1)(dxxf
。
(3)离散
与连续型
随机变量
的关系
dxxfdxxXxPxXP)()()(
积分元dxxf)(在连续型随机变量理论中所起的作用与kkpxXP)(
在离
散型随机变量理论中所起的作用相类似。
(4)分布
函数
设X为随机变量,
x
是任意实数,则函数
)()(xXPxF
称为随机变量X的分布函数,本质上是一个累积函数。
)()()(aFbFbXaP可以得到X落入区间],(ba的概率。分布
函数)(xF表示随机变量落入区间(–∞,x]的概率。
分布函数具有如下性质:
1°,1)(0xFx;
2°)(xF是单调不减的函数,即21xx
时,有)(1xF)(2xF;
3°0)(lim)(
xFF
x
,1)(lim)(
xFF
x
;
4°)()0(xFxF,即)(xF是右连续的;
5°)0()()(xFxFxXP。
对于离散型随机变量,
xx
k
k
pxF)(;
对于连续型随机变量,
x
dxxfxF)()(。
(5)八大
分布
0-1分布P(X=1)=p,P(X=0)=q
二项分布
在
n
重贝努里试验中,设事件A发生的概率为p。事件A发生
的次数是随机变量,设为X,则X可能取值为n,,2,1,0。
knkk
n
nqpCkPkXP)()(
,其中
nkppq,,2,1,0,10,1,
则称随机变量X服从参数为
n
,p的二项分布。记为
),(~pnBX。
当1n时,kkqpkXP1)(,1.0k,这就是(0-1)分
布,所以(0-1)分布是二项分布的特例。
泊松分布
设随机变量X的分布律为
e
k
kXP
k
!
)(,0,2,1,0k,
则称随机变量X服从参数为的泊松分布,记为)(~X或
者P()。
泊松分布为二项分布的极限分布(np=λ,n→∞)。
超几何分布
),min(
,2,1,0
,)(
nMl
lk
C
CC
kXP
n
N
kn
MN
k
M
•
随机变量X服从参数为n,N,M的超几何分布,记为H(n,N,M)。
几何分布
,3,2,1,)(1kpqkXPk,其中p≥0,q=1-p。
随机变量X服从参数为p的几何分布,记为G(p)。
均匀分布
设随机变量
X
的值只落在[a,b],其密度函数
)(xf
在[a,b]
上为常数
ab
1
,即
,0
,
1
)(
ab
xf
其他,
则称随机变量
X
在[a,b]上服从均匀分布,记为X~U(a,b)。
分布函数为
xdxxfxF)()(
当a≤x1 ,xx )的概率为 ab xx xXxP 12 21 )(。 0,x , ab ax a≤x≤b 1,x>b。 a≤x≤b 指数分布 其中 0 ,则称随机变量X服从参数为 的指数分布。 X的分布函数为 记住积分公式: ! 0 ndxexxn 正态分布 设随机变量 X 的密度函数为 2 2 2 )( 2 1 )( x exf, x , 其中 、 0 为常数,则称随机变量 X 服从参数为 、 的正态分布或高斯(Gauss)分布,记为 ),(~2NX 。 )(xf 具有如下性质: 1° )(xf 的图形是关于 x 对称的; 2°当 x 时, 2 1 )(f为最大值; 若 ),(~2NX ,则 X 的分布函数为 dtexFx t 2 2 2 )( 2 1 )( 。。 参数 0 、 1 时的正态分布称为标准正态分布,记为 )1,0(~NX ,其密度函数记为 2 2 2 1 )( x ex ,x, 分布函数为 x t dtex2 2 2 1 )( 。 )(x 是不可求积函数,其函数值,已编制成表可供查用。 Φ(-x)=1-Φ(x)且Φ(0)= 2 1 。 如果X~ ),(2N,则 X ~)1,0(N。 12 21 )( xx xXxP。 )(xf ,xe0x , 0, 0x , )(xF ,1xe 0x , ,0 x<0。 (6)分位 数 下分位表: =)(XP; 上分位表: =)(XP。 (7)函数 分布 离散型 已知X的分布列为 ,,,, ,,,, )(21 21 n n ippp xxx xXP X , )(XgY的分布列()( ii xgy互不相等)如下: ,,,, ),(,),(),( )( 21 21 n n ippp xgxgxg yYP Y , 若有某些)(ixg相等,则应将对应的 i p相加作为)(ixg的概率。 连续型 先利用X的概率密度fX(x)写出Y的分布函数FY(y)=P(g(X)≤ y),再利用变上下限积分的求导公式求出fY(y)。 第三章二维随机变量及其分布 (1)联合 分布 离散型 如果二维随机向量(X,Y)的所有可能取值为至多可列 个有序对(x,y),则称为离散型随机量。 设=(X,Y)的所有可能取值为 ),2,1,)(,(jiyx ji , 且事件{= ),( ji yx }的概率为pij,,称 ),2,1,()},(),{(jipyxYXP ijji 为=(X,Y)的分布律或称为X和Y的联合分布律。联合分 布有时也用下面的概率分布表来表示: Y X y1y2…yj… x1p11p12…p1j… x2p21p22…p2j… xipi1… ij p … 这里pij具有下面两个性质: (1)pij≥0(i,j=1,2,…); (2).1ij ij p 连续型 对于二维随机向量),(YX,如果存在非负函数 ),)(,(yxyxf,使对任意一个其邻边 分别平行于坐标轴的矩形区域D,即D={(X,Y)|a 有 D dxdyyxfDYXP,),(}),{( 则称为连续型随机向量;并称f(x,y)为=(X,Y)的分布 密度或称为X和Y的联合分布密度。 分布密度f(x,y)具有下面两个性质: (1)f(x,y)≥0; (2) .1),(dxdyyxf (2)二维 随机变量 的本质 )(),(yYxXyYxX (3)联合 分布函数 设(X,Y)为二维随机变量,对于任意实数x,y,二元函数 },{),(yYxXPyxF 称为二维随机向量(X,Y)的分布函数,或称为随机变量X和Y的联合分布函 数。 分布函数是一个以全平面为其定义域,以事件 })(,)(|),{( 2121 yYxX的概率为函数值的一个实值函 数。分布函数F(x,y)具有以下的基本性质: (1);1),(0yxF (2)F(x,y)分别对x和y是非减的,即 当x2>x1时,有F(x2,y)≥F(x1,y);当y2>y1时,有F(x,y2)≥F(x,y1); (3)F(x,y)分别对x和y是右连续的,即 );0,(),(),,0(),(yxFyxFyxFyxF (4).1),(,0),(),(),(FxFyFF (5)对于,, 2121 yyxx 0)()()()( 11211222 yxFyxFyxFyxF,,,,. (4)离散 型与连续 型的关系 dxdyyxfdyyYydxxXxPyYxXP)()()(,,, (5)边缘 分布 离散型X的边缘分布为 ),2,1,()(• jipxXPP ij j ii ; Y的边缘分布为 ),2,1,()(• jipyYPP ij i jj 。 连续型X的边缘分布密度为 ;dyyxfxf X ),()( Y的边缘分布密度为 .),()( dxyxfyf Y (6)条件 分布 离散型在已知X=xi的条件下,Y取值的条件分布为 ; • i ij ijp p xXyYP)|( 在已知Y=yj的条件下,X取值的条件分布为 ,)|( j ij jip p yYxXP • 连续型在已知Y=y的条件下,X的条件分布密度为 )( ),( )|( yf yxf yxf Y ; 在已知X=x的条件下,Y的条件分布密度为 )( ),( )|( xf yxf xyf X (7)独立 性 一般型F(X,Y)=FX(x)FY(y) 离散型 jiij ppp •• 有零不独立 连续型f(x,y)=fX(x)fY(y) 直接判断,充要条件: ①可分离变量 ②正概率密度区间为矩形 二维正态分 布, 12 1 ),( 2 2 2 21 21 2 1 1 2 21 ))((2 )1(2 1 2 yyxx eyxf =0 随机变量的 函数 若X1,X2,…Xm,Xm+1,…Xn相互独立,h,g为连续函数,则: h(X1,X2,…Xm)和g(Xm+1,…Xn)相互独立。 特例:若X与Y独立,则:h(X)和g(Y)独立。 例如:若X与Y独立,则:3X+1和5Y-2独立。 (8)二维 均匀分布 设随机向量(X,Y)的分布密度函数为 其他,0 ),( 1 ),( Dyx S yxf D 其中SD为区域D的面积,则称(X,Y)服从D上的均匀分布,记为(X,Y)~ U(D)。 例如图3.1、图3.2和图3.3。 y 1 D1 O1x 图3.1 y 1 O2x 图3.2 y d c Oabx 图3.3 D 2 1 D 3 (9)二维 正态分布 设随机向量(X,Y)的分布密度函数为 , 12 1 ),( 2 2 2 21 21 2 1 1 2 21 ))((2 )1(2 1 2 yyxx eyxf 其中 1||,0,0, 21,21 是5个参数,则称(X,Y)服从二维正态分 布, 记为(X,Y)~N().,,,2 2 2 1,21 由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分 布, 即X~N().(~),,2 2,2 2 11 NY 但是若X~N()(~),,2 2,2 2 11 NY,(X,Y)未必是二维正态分布。 (10)函数 分布 Z=X+Y 根据定义计算:)()()(zYXPzZPzF Z 对于连续型,fZ(z)=dxxzxf ),( 两个独立的正态分布的和仍为正态分布(2 2 2 121 ,)。 n个相互独立的正态分布的线性组合,仍服从正态分布。 i ii C, i ii C222 Z=max,min( X 1 ,X 2 ,…X n ) 若 n XXX 21 ,相互独立,其分布函数分别为 )()()( 21 xFxFxF n xxx , ,则Z=max,min(X 1 ,X 2 ,…X n )的分布 函数为: )()()()( 21 max xFxFxFxF n xxx • )](1[)](1[)](1[1)( 21 min xFxFxFxF n xxx • 2分布 设n个随机变量 n XXX,,, 21 相互独立,且服从标准正态分 布,可以证明它们的平方和 n i i XW 1 2 的分布密度为 .0,0 ,0 2 2 1 )( 2 1 2 2 u ueu n uf un n 我们称随机变量W服从自由度为n的2分布,记为W~)(2n, 其中 . 20 1 2dxex n x n 所谓自由度是指独立正态随机变量的个数,它是随机变量 分布中的一个重要参数。 2分布满足可加性:设 ),(2 ii nY 则 ).(~ 21 1 2 k k i i nnnYZ t分布设X,Y是两个相互独立的随机变量,且 ),(~),1,0(~2nYNX 可以证明函数 nY X T / 的概率密度为 2 1 2 1 2 2 1 )( n n t n n n tf ).(t 我们称随机变量T服从自由度为n的t分布,记为T~t(n)。 )()( 1 ntnt F分布 设)(~),(~ 2 2 1 2nYnX,且X与Y独立,可以证明 2 1 / / nY nX F的概率密度函数为 0,0 0,1 22 2 )( 2 2 1 1 2 2 2 1 21 21 21 1 1 y yy n n y n n nn nn yf nn n n 我们称随机变量F服从第一个自由度为n1,第二个自由度为n2 的F分布,记为F~f(n1,n2). ),( 1 ),( 12 211nnF nnF 第四章随机变量的数字特征 (1) 一维 随机 变量 的数 字特 征 离散型连续型 期望 期望就是平均值 设X是离散型随机变量,其分布 律为P( k xX)=pk, k=1,2,…,n, n k kk pxXE 1 )( (要求绝对收敛) 设X是连续型随机变量,其概率密 度为f(x), dxxxfXE)()( (要求绝对收敛) 函数的期望Y=g(X) n k kk pxgYE 1 )()( Y=g(X) dxxfxgYE)()()( 方差 D(X)=E[X-E(X)]2, 标准差 )()(XDX, k kk pXExXD2)]([)( dxxfXExXD)()]([)(2 矩①对于正整数k,称随机变量X 的k次幂的数学期望为X的k 阶原点矩,记为vk,即 νk=E(Xk)= i i k i px, k=1,2,…. ②对于正整数k,称随机变量X 与E(X)差的k次幂的数学期 望为X的k阶中心矩,记为 k , 即 . ))((k k XEXE = i i k i pXEx))((, k=1,2,…. ①对于正整数k,称随机变量X的 k次幂的数学期望为X的k阶原点 矩,记为vk,即 νk=E(Xk)= ,)(dxxfxk k=1,2,…. ②对于正整数k,称随机变量X与 E(X)差的k次幂的数学期望为X 的k阶中心矩,记为 k ,即 . ))((k k XEXE = ,)())((dxxfXExk k=1,2,…. 切比雪夫不等式设随机变量X具有数学期望E(X)=μ,方差D(X)=σ2,则对于 任意正数ε,有下列切比雪夫不等式 2 2 )( XP 切比雪夫不等式给出了在未知X的分布的情况下,对概率 )(XP 的一种估计,它在理论上有重要意义。 (2) 期望 的性 质 (1)E(C)=C (2)E(CX)=CE(X) (3)E(X+Y)=E(X)+E(Y), n i n i iiii XECXCE 11 )()( (4)E(XY)=E(X)E(Y),充分条件:X和Y独立; 充要条件:X和Y不相关。 (3) 方差 的性 质 (1)D(C)=0;E(C)=C (2)D(aX)=a2D(X);E(aX)=aE(X) (3)D(aX+b)=a2D(X);E(aX+b)=aE(X)+b (4)D(X)=E(X2)-E2(X) (5)D(X±Y)=D(X)+D(Y),充分条件:X和Y独立; 充要条件:X和Y不相关。 D(X±Y)=D(X)+D(Y)±2E[(X-E(X))(Y-E(Y))],无条件成立。 而E(X+Y)=E(X)+E(Y),无条件成立。 (4) 常见 分布 期望方差 0-1分布),1(pB p )1(pp 的期 望和 方差 二项分布),(pnB np )1(pnp 泊松分布)(P 几何分布)(pG p 1 2 1 p p 超几何分布),,(NMnH N nM 1 1 N nN N M N nM 均匀分布),(baU 2 ba 12 )(2ab 指数分布)(e 1 2 1 正态分布),(2N 2 分布2n2n t分布0 2n n (n>2) (5) 二维 随机 变量 的数 字特 征 期望 • n i ii pxXE 1 )( • n j jj pyYE 1 )( dxxxfXE X )()( dyyyfYE Y )()( 函数的期望 )],([YXGE= ij ijji pyxG),( )],([YXGE= -- dxdyyxfyxG),(),( 方差 • i ii pXExXD2)]([)( • j jj pYExYD2)]([)( dxxfXExXD X )()]([)(2 dyyfYEyYD Y )()]([)(2 协方差 对于随机变量X与Y,称它们的二阶混合中心矩 11 为X与Y的协方 差或相关矩,记为),cov(YX XY 或,即 ))].())(([( 11 YEYXEXE XY 与记号 XY 相对应,X与Y的方差D(X)与D(Y)也可分别记为 XX 与 YY 。 相关系数对于随机变量X与Y,如果D(X)>0,D(Y)>0,则称 )()(YDXD XY 为X与Y的相关系数,记作 XY (有时可简记为)。 ||≤1,当||=1时,称X与Y完全相关:1)(baYXP 完全相关 ,时负相关,当 ,时正相关,当 )0(1 )0(1 a a 而当0时,称X与Y不相关。 以下五个命题是等价的: ①0 XY ; ②cov(X,Y)=0; ③E(XY)=E(X)E(Y); ④D(X+Y)=D(X)+D(Y); ⑤D(X-Y)=D(X)+D(Y). 协方差矩阵 YYYX XYXX 混合矩 对于随机变量X与Y,如果有)(lkYXE存在,则称之为X与Y的 k+l阶混合原点矩,记为 kl ;k+l阶混合中心矩记为: ].))(())([(lk kl YEYXEXEu (6) 协方 差的 性质 (i)cov(X,Y)=cov(Y,X); (ii)cov(aX,bY)=abcov(X,Y); (iii)cov(X1+X2,Y)=cov(X1,Y)+cov(X2,Y); (iv)cov(X,Y)=E(XY)-E(X)E(Y). (7) 独立 和不 相关 (i)若随机变量X与Y相互独立,则0 XY ;反之不真。 (ii)若(X,Y)~N(,,,,2 2 2 121 ), 则X与Y相互独立的充要条件是X和Y不相关。 第五章大数定律和中心极限定理 (1)大数定律 X 切比雪 夫大数 定律 设随机变量X1,X2,…相互独立,均具有有限方差,且被同一 常数C所界:D(Xi) .1)( 11 lim 11 n i i n i i n XE n X n P 特殊情形:若X1,X2,…具有相同的数学期望E(XI)=μ, 则上式成为 .1 1 lim 1 n i i n X n P 伯努利 大数定 律 设μ是n次独立试验中事件A发生的次数,p是事件A在 每次试验中发生的概率,则对于任意的正数ε,有 .1lim p n P n 伯努利大数定律说明,当试验次数n很大时,事件A发生 的频率与概率有较大判别的可能性很小,即 .0lim p n P n 这就以严格的数学形式描述了频率的稳定性。 辛钦大 数定律 设X1,X2,…,Xn,…是相互独立同分布的随机变量序列,且E (Xn)=μ,则对于任意的正数ε有 .1 1 lim 1 n i i n X n P (2)中心极限定 理 ),( 2 n NX 列维- 林德伯 格定理 设随机变量X1,X2,…相互独立,服从同一分布,且具有 相同的数学期望和方差: ),2,1(0)(,)(2kXDXE kk ,则随机变量 n nX Y n k k n 1 的分布函数Fn(x)对任意的实数x,有 x t n k k n n n dtex n nX PxF. 2 1 lim)(lim2 1 2 此定理也称为独立同分布的中心极限定理。 棣莫弗 -拉普 拉斯定 理 设随机变量 n X为具有参数n,p(0 任意实数x,有 x t n n dtex pnp npX P. 2 1 )1( lim2 2 (3)二项定理 若当),(,不变时knp N M N,则 knkk n n N kn MN k MppC C CC )1().(N 超几何分布的极限分布为二项分布。 (4)泊松定理 若当0,npn时,则 e k ppC k knkk n! )1( ).(n 其中k=0,1,2,…,n,…。 二项分布的极限分布为泊松分布。 第六章样本及抽样分布 (1)数理 统计的基 本概念 总体在数理统计中,常把被考察对象的某一个(或多个)指标的全 体称为总体(或母体)。我们总是把总体看成一个具有分布的随 机变量(或随机向量)。 个体总体中的每一个单元称为样品(或个体)。 样本 我们把从总体中抽取的部分样品 n xxx,,, 21 称为样本。样本 中所含的样品数称为样本容量,一般用n表示。在一般情况下, 总是把样本看成是n个相互独立的且与总体有相同分布的随机 变量,这样的样本称为简单随机样本。在泛指任一次抽取的结 果时, n xxx,,, 21 表示n个随机变量(样本);在具体的一次 抽取之后, n xxx,,, 21 表示n个具体的数值(样本值)。我们 称之为样本的两重性。 样本函数和 统计量 设 n xxx,,, 21 为总体的一个样本,称 ( n xxx,,, 21 ) 为样本函数,其中为一个连续函数。如果中不包含任何未 知参数,则称( n xxx,,, 21 )为一个统计量。 常见统计量 及其性质 样本均值. 1 1 n i i x n x 样本方差 n i i xx n S 1 22.)( 1 1 样本标准差.)( 1 1 1 2 n i i xx n S 样本k阶原点矩 n i k ik kx n M 1 .,2,1, 1 样本k阶中心矩 n i k ik kxx n M 1 .,3,2,)( 1 )(XE , n XD 2 )( , 22)(SE,22 1 )*( n n SE , 其中 n i i XX n S 1 22)( 1 *,为二阶中心矩。 (2)正态 总体下的 四大分布 正态分布 设 n xxx,,, 21 为来自正态总体),(2N的一个样本,则样 本函数 ).1,0(~ / N n x udef t分布 设 n xxx,,, 21 为来自正态总体),(2N的一个样本,则样 本函数 ),1(~ / nt ns x tdef 其中t(n-1)表示自由度为n-1的t分布。 分布2设 n xxx,,, 21 为来自正态总体),(2N的一个样本,则样 本函数 ),1(~ )1( 2 2 2 n Sn wdef 其中)1(2n表示自由度为n-1的2分布。 F分布 设 n xxx,,, 21 为来自正态总体),(2 1 N的一个样本,而 n yyy,,, 21 为来自正态总体),(2 2 N的一个样本,则样本 函数 ),1,1(~ / / 21 2 2 2 2 2 1 2 1nnF S S F def 其中 ,)( 1 1 2 1 1 2 1 1 n i i xx n S;)( 1 1 2 1 2 2 2 2 n i i yy n S )1,1( 21 nnF表示第一自由度为1 1 n,第二自由度为 1 2 n的F分布。 (3)正态 总体下分 布的性质 X与2S独立。 第七章参数估计 (1)点 估计 矩估计 设总体X的分布中包含有未知数 m ,,, 21 ,则其分布函数可以表成 ).,,,;( 21m xF它的k阶原点矩),,2,1)((mkXEvk k 中也 包含了未知参数 m ,,, 21 ,即),,,( 21mkk vv。又设 n xxx,,, 21 为总体X的n个样本值,其样本的k阶原点矩为 n i k i x n 1 1 ).,,2,1(mk 这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩” 的原则建立方程,即有 n i m imm n i im n i im x n v x n v x n v 1 21 1 2 212 1 211 . 1 ),,,( , 1 ),,,( , 1 ),,,( 由上面的m个方程中,解出的m个未知参数),,,( 21 m 即为参数 ( m ,,, 21 )的矩估计量。 若 为的矩估计,)(xg为连续函数,则) ˆ (g为)(g的矩估计。 极大似 然估计 当总体X为连续型随机变量时,设其分布密度为 ),,,;(21m xf,其中 m ,,,21 为未知参数。又设 n xxx,,,21 为总体的一个样本,称 ),,,;(),,,( 1 1122 n i mim xfL 为样本的似然函数,简记为Ln. 当总体X为离型随机变量时,设其分布律为 ),,,;(}{21m xpxXP,则称 ),,,;(),,,;,,,( 1 111222 n i mimn xpxxxL 为样本的似然函数。 若似然函数 ),,,;,,,( 2211mn xxxL在m ,,,21处取 到最大值,则称 m ,,,21分别为 m ,,,21 的最大似然估计值, 相应的统计量称为最大似然估计量。 mi L i i i n,,2,1,0 ln 若 为的极大似然估计,)(xg为单调函数,则) ˆ (g为)(g的极大 似然估计。 (2)估 计量的 评选标 准 无偏性 设),,,( 21n xxx 为未知参数的估计量。若E( )=,则称 为的无偏估计量。 E(X)=E(X),E(S2)=D(X) 有效性 设),,,,( 21 11 n xxx 和),,,,( 21 22 n xxx 是未知参数 的两个无偏估计量。若)()( 21 DD,则称 21 比有效。 一致性 设 n 是的一串估计量,如果对于任意的正数,都有 ,0)|(|lim n n P 则称 n 为的一致估计量(或相合估计量)。 若 为的无偏估计,且),(0) ˆ (nD则 为的一致估计。 只要总体的E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相 应总体的一致估计量。 (3)区 间估计 置信区 间和置 信度 设总体X含有一个待估的未知参数。如果我们从样本 n xxx,,,, 21 出 发,找出两个统计量 ),,,,( 2111n xxx与 ),,,,( 2122n xxx)( 21 ,使得区间],[ 21 以 )10(1的概率包含这个待估参数,即 ,1}{ 21 P 那么称区间],[ 21 为的置信区间,1为该区间的置信度(或置 信水平)。 单正态 总体的 期望和 方差的 区间估 计 设 n xxx,,,, 21 为总体),(~2NX的一个样本,在置信度为1 下,我们来确定2和的置信区间],[ 21 。具体步骤如下: (i)选择样本函数; (ii)由置信度1,查表找分位数; (iii)导出置信区间],[ 21 。 已知方差,估计均值(i)选择样本函数 ).1,0(~ / 0 N n x u (ii)查表找分位数 .1 / 0 n x P (iii)导出置信区间 n x n x00, 未知方差,估计均值(i)选择样本函数 ).1(~ / nt nS x t (ii)查表找分位数 .1 / nS x P (iii)导出置信区间 n S x n S x, 方差的区间估计(i)选择样本函数 ).1(~ )1( 2 2 2 n Sn w (ii)查表找分位数 .1 )1( 2 2 2 1 Sn P (iii)导出 的置信区间 S n S n 12 1 , 1 第八章假设检验 基本思想假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是 不会发生的,即小概率原理。 为了检验一个假设H0是否成立。我们先假定H0是成立的。如果根据这个假 定导致了一个不合理的事件发生,那就表明原来的假定H0是不正确的,我们拒 绝接受H0;如果由此没有导出不合理的现象,则不能拒绝接受H0,我们称H0是 相容的。与H0相对的假设称为备择假设,用H1表示。 这里所说的小概率事件就是事件 }{ RK,其概率就是检验水平α,通 常我们取α=0.05,有时也取0.01或0.10。 基本步骤假设检验的基本步骤如下: (i)提出零假设H0; (ii)选择统计量K; (iii)对于检验水平α查表找分位数λ; (iv)由样本值 n xxx,,, 21 计算统计量之值K; 将与 K进行比较,作出判断:当)(|| KK或时否定H0,否则认为H0 相容。 两类错误第一类错误当H0为真时,而样本值却落入了否定域,按照我们规定的 检验法则,应当否定H0。这时,我们把客观上H0成立判为 H0为不成立(即否定了真实的假设),称这种错误为“以真 当假”的错误或第一类错误,记为犯此类错误的概率,即 P{否定H0|H0为真}=; 此处的α恰好为检验水平。 第二类错误当H1为真时,而样本值却落入了相容域,按照我们规定的 检验法则,应当接受H0。这时,我们把客观上H0。不成立判 为H0成立(即接受了不真实的假设),称这种错误为“以假 当真”的错误或第二类错误,记为犯此类错误的概率, 即 P{接受H0|H1为真}=。 两类错误的关系人们当然希望犯两类错误的概率同时都很小。但是,当 容量n一定时, 变小,则变大;相反地,变小,则 变大。取定 要想使变小,则必须增加样本容量。 在实际使用时,通常人们只能控制犯第一类错误的概 率,即给定显著性水平α。α大小的选取应根据实际情况而 定。当我们宁可“以假为真”、而不愿“以真当假”时,则 应把α取得很小,如0.01,甚至0.001。反之,则应把α取 得大些。 单正态总体均值和方差的假设检验 条件零假设统计量 对应样本 函数分布 否定域 已知2 00 :H n x U / 0 0 N(0,1) 2 1 || uu 00 :H 1 uu 00 :H 1 uu 未知2 00 :H nS x T / 0 )1(nt )1(|| 2 1 ntt 00 :H)1( 1 ntt 00 :H)1( 1 ntt 未知222 0 :H 2 0 2)1( Sn w )1(2n )1( )1( 2 2 1 2 2 nw nw 或 2 0 2 0 :H)1(2 1 nw 2 0 2 0 :H)1(2nw