概率论

本文最后更新于 2024年8月20日 下午

【MachoMeng:由于服务器在国外,加载可能会有些缓慢,请耐心等待】

欢迎关注

前言:

力学如力耕,勤惰尔自知。但使书种多,会有岁稔时。

于万千的人群中,于无际涯的时光里,没有早一步,也没有晚一步,我们在此处相遇。有几许命运,也有几分注定。在下面六十四个学时里,望我们彼此尊重,互相帮助,共同努力,共同进步!

——李庆芳老师寄语

绪论:

内容太多,挑了一个有意思的:

《红楼梦》第六十二回 憨湘云醉眠芍药裀 呆香菱情解石榴裙【探春笑道:“倒有些意思,一年十二个月,月月有几个生日。人多了,便这等巧,也有三个一日、两个一日的。】

问题:生日,只论某月某日,不论某年,假定一年有365天,问366个人中至少有两个人在同一天过生日的可能性有多大?那64个人中至少有两个人在同一天过生日的可能性又有多大? (大还是小?)

结果:大

生日问题


目录(默认关闭,点击展开):

展开目录找的更快

点击展开目录

第一章:基本概念

一、随机试验:

1、随机现象

  1. 确定性现象:在一定条件下必然发生的现象称为确定性现象.
  2. 随机现象:在一定条件下可能出现也可能不出现的现象称为随机现象.

2、随机试验

  1. 可以在相同的条件下重复地进行;
  2. 每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果
  3. 进行一次试验之前不能确定哪一个结果会出现。

二、样本空间、随机事件

1、样本空间

  1. 随机试验 \(E\) 的所有可能结果组成的集合称为 $E $ 的样本空间。记为\(S\)

2、样本点

  1. 样本空间的元素,即试验\(E\) 的每一个结果,称为样本点.

3、随机事件

  1. 随机试验 \(E\) 的样本空间 \(S\) 的子集称为 \(E\) 的随机事件, 简称事件。
  2. 每次实验中,当且仅当这一子集中的一个样本点出现时称这一事件发生.由一个样本点组成的单点集, 称为基本事件.
  3. 样本空间\(S\)包含所有的样本点. 它是\(S\)自身的子集,在每次实验中它总是发生的,\(S\) 称为必然事件
  4. 空集\(\varnothing\)不包含任何点。它也作为样本空间的子集,它在每次实验中都不发生,\(\varnothing\)称为不可能事件

必然事件的对立面是不可能事件,不可能事件的对立面是必然事件, 它们互称为 对立事件.

4、对立事件和互斥事件

互斥事件:事件\(A\)\(B\)的交集为空,\(A\)\(B\)就是互斥事件,也叫互不相容事件。也可叙述为:不可能同时发生的事件。

对立事件:其中必有一个发生的两个互斥事件叫做对立事件。非此即彼!

对立一定是互斥的,但互斥不一定是对立。即对立是互斥的特殊形式。

5、随机事件间的关系及运算

设试验\(E\)的样本空间为\(S\),而\(A,B,A_k(k=1,2……)\)\(S\)的子集.

符号 解释 含义
\(A\subset B\) 事件B包含事件A(或者事件A含于事件B) A发生必然导致B发生
\(A\subset B\)\(B\subset A\) 事件A和事件B相等 A=B
\(A\cup B\) 当且仅当AB至少一个发生 和事件
\(A\cap B\) 当且仅当AB同时发生 积事件
\(A-B\) 当且仅当A发生B不发生 差事件
\(A\cap B=\varnothing\) 事件AB不能同时发生 AB互斥
\(A\cup B=S\)\(A\cap B=\varnothing\) \(\overline A= B=S-A\) AB对立,互为逆事件

6、德摩根律

\(\overline{A \cup B}={\overline A}\cap {\overline B}\)

\(\overline { A\cap B}={\overline A}\cup {\overline B}\)

口诀:长线变短线,开口变方向。

三、频率与概率

1、频率的定义

在相同条件下,进行了\(n\)次试验,在这\(n\)次试验中,事件\(A\)发生的次数\(n_A\)称为事件A发生的频数,比值\(\frac{n_A}{n}\)称为事件\(A\)发生的频率,记为\(f_n(A)\)

2、频率的性质

\(A\)是随机试验\(E\)的任一事件,则

  1. \(0\leq f_n(A)\leq 1\)
  2. \(f_n(S)=1\)
  3. \(A_1,A_2,...\)是两两互不相容,则\[f_n(A_1\cup A_2\cup ...A_k)=f_n(A_1)+f_n(A_2)+.....f_n(A_k)\]

频率大小表示事件A发生的频繁程度.频率大事件A发生就越频繁,这就意味着事件A在一次试验中发生的可能性就越大。

3、概率的定义

定义 :设\(E\)是随机试验,\(S\)是它的样本空间。对于\(E\)的每一事件\(A\)赋予一个实数,记为\(P(A)\),称为事件\(A\)的概率。如果集合函数 P(·)满足条件:

  1. 非负性:对于每一个事件\(A\),有\(P(A)\geq0\);
  2. 规范性:对于必然事件\(S\),有\(P(S)=1\);
  3. 可列可加性:设\(A_1,A_2,…\)是两两互不相容的事件,即对于\(A_iA_j=\varnothing,i≠j,i,j=1,2,…,\)\(P(A_1\cup A_2\cup...)= P(A_1)+P(A_2)+...\)

4、概率的性质(重要)

  1. \(P(\varnothing)=0\)
  2. 有限可加性:若\(A_1,A_2,...A_n\)是两两互不相容事件,则有\[P(A_1\cup A_2\cup ...A_k)=P(A_1)+P(A_2)+.....P(A_k)\](互斥事件和事件的概率=概率和)
  3. \(A,B\)是两个事件,若\(A\subset B\),则有\(P(B-A)=P(B)-P(A)\);
  4. 性质3的推广:一般性减法公式:\(P(B-A)=P(B)-P(AB)\)
  5. \(P(S)=1\)
  6. \(P(\overline A)=1-P(A)\)
  7. 一般性加法公式:\(P(A\cup B)=P(A)+P(B)-P(AB)\)
  8. 一般性加法公式推广:加奇减偶\(P(A\cup B\cup C)=P(A)+P(B)+P(C)-P(AB)-P(AC)-P(BC)+P(ABC)\)
  9. 特殊性加法公式:当\(A\)\(B\)\(C\)互斥时:\(P(A\cup B\cup C)=P(A)+P(B)+P(C)\)

四、等可能概型

注:此处排列组合只做简单介绍,详细相关内容请移步:

1
https://www.cnblogs.com/1024th/p/10623541.html

1、排列

  1. 排列:\(A_{n}^{k}=\frac{n!}{(n-k)!}=n(n-1)(n-2)(n-3)...(n-k+1)\)
  2. 全排列:\(A_n^{n}=n!\)

2、组合

  1. 组合:\(C_{n}^{k}=\frac{A_{n}^{K}}{k!}=\frac{n!}{k!(n-k)!}=\dbinom{n}{k}=\frac{A_{n}^{k}}{A_{k}^{k}}=\frac{n(n-1)(n-2)...(n-k+1)}{k!}\)
  2. \(C_n^{0}=C_n^{n}=1\)

3、加法原理

绿色\(n\)种方法,浅紫色\(m\)种方法,完成共\(n+m\)种方法。

加法

4、乘法原理

第一步\(n\)种,第二种\(m\)种,共\(nm\)种方法。

乘法

5、古典概型

  1. 定义
  • 试验的样本空间只包含有限个元素;
  • 试验中每个基本事件发生的可能性相同;

​ 2.古典概型计算公式

  • \(P(A)=\frac{k}{n}=\frac{A包含的基本事件}{S中基本事件的总数}\)
  1. 抛硬币
  2. 摸球
  3. 分球入盒(生日问题)
  4. 抽签模型(第一个人和第n个人概率一样)
  5. 随机取数(最小公倍数)
  6. 平均分配问题
  7. 几何概型

五、条件概率

1、定义

\(A,B\)是两个事件,且\(P(A)>0\),称\(P(B|A)=\frac{P(AB)}{P(A)}\)为在事件\(A\)发生的条件下事件\(B\)发生的概率.

2、性质

大部分和前面的类似,就是多加了一个条件

  1. 非负性
  2. 规范性
  3. 可列可加性
  4. 一般性:\(P(B-C|A)=P(B|A)-P(BC|A)\)
  5. \(P(\overline A|B)=1-P(A|B)\)或者\(P(\overline A|\overline B)=1-P(A|\overline B)\)(注意条件一样即可)
  6. 乘法定理:\(P(AB)=P(A)P(B|A)=P(B)P(A|B)\)
  7. 乘法定理推广:\(P(ABC)=P(A)P(B|A)P(C|AB)\)

3、全概率公式

样本空间的划分

\(P(A)=P(B_1)P(A|B_1)+P(B_2)P(A|B_2)+...+P(B_n)P(A|B_n)\)

思想:化整为零,由因求果

4、贝叶斯公式

样本空间的划分

\(P(B_i|A)=\frac{P(B_i)P(A|B_i)}{\sum_{j=1}^{n}P(B_j)P(A|B_j)},i=1,2,3..n\)

六、独立性

1、定义

\(A,B\)两事件,若满足\(P(AB)=P(A)P(B)\)\(A,B\)相互独立。

注意:相互独立和互斥不能同时独立

2、定理

  1. \(A,B\)是两个事件且\(P(A)>0\)\(A,B\)相互独立,则\(P(B|A)=P(B)\),反之亦然
  2. 若事件\(A\)和事件\(B\)相互独立,则\(A\)\(\overline B\)\(\overline A\)\(B\)\(\overline A\)\(\overline B\)也相互独立。

3、三个事件独立

设A,B,C为三个事件,若满足以下:

\(P(AB)=P(A)P(B)\)

\(P(AC)=P(A)P(C)\)

\(P(BC)=P(B)P(C)\)

\(P(ABC)=P(A)P(B)P(C)\)

则ABC相互独立

注意:三个事件相互独立$ $三个事件两两相互独立

4、\(n\)个事件相互独立(推广 )

\(A_1,A_2,…,A_n\)\(n\)个事件,如果对于任意\(k(1<k≤n)\),任意\(1≤i_1<i_2,<…<i_k≤n\),具有等式\(P(A_{i_{1}} A_{i_{2}} …A _{i_{k}})=P(A_{i_{1}} )P(A_{i_{2}})...P(A_{i_{k}} )\),则称\(A_1,A_2,…,A_n\) 为相互独立的事件,

注意:\(n\)个事件相互独立$ $\(n\)个事件两两相互独立

第二章:一维随机变量及其分布

一、随机变量

1、定义

设随机试验的样本空间\(S=\{e\}\),\(X=X(e)\)是定义在样本空间\(S\)上的单值实值函数称\(X=X(e)\)为随机变量.

样本点与实数对应示意图

二、离散型随机变量及其分布律

1、定义

若随机变量X的所有可能取值是有限多个或可列无限多个, 则称\(X\)为离散型随机变量.

2、分布律

设离散型随机变量\(X\)所有可能取的值为\(x_k(k=1,2,…)\)\(X\)取各个可能值的概率,即事件\({X=x}\)的概率,为\(P\{X=x\}=P_k\) \(k=1,2,…..\)称此为离散型随机变量\(X\)的分布律

3、分布律的表示方法

  1. 解析式法
  2. 列表法
  3. 矩阵法
  4. 图表法

4、\((0-1)\)分布(两点分布)

定义:

设随机变量X只可能取\(0\)\(1\)两个值,其分布是:\(P=\{X=k\}=P^K(1-P)^{1-k},k=0,1(0<P<1)\)则称\(X\)服从以\(p\)为参数的\((0-1)\)分布(两点分布)

分布律:

两点分布分布律

5、伯努利试验

设试验\(E\)\(A\)\(\overline A\)\(P(A)=P,P(\overline A)=1-P\)独立可重复进行\(n\)次,称为\(n\)重伯努利试验.

独立:前一次的结果,不影响后一次的概率

可重复:概率相同

5、二项分布

二项分布为两点分布的推广形式,记为\(X\)服从\(b(n,p)\)\(C_{n}^{k}P^{k}(1-p)^{n-k}\)。特别的,当n=1时,为两点分布。

分布律:

img

二项式定理:可以证明二项分布的规范性

\((a+b)^{n}=\displaystyle\sum _{k=0}^{n}C_{n}^{k}a^{k}b^{n-k}\)

6、泊松分布

设随机变量\(X\)所有可能的取值为\((0,+\infty)\)而各个值的概率为\(P\{X=k\}=\frac{λ^{k}e^{-λ}}{k!},k=0,1,2...\)其中\(λ>0\)是常数,则称\(X\)服从参数为\(λ\)的泊松分布,记为\(X~π(λ)\)

证明其规范性需要用到泰勒公式

泊松定理:

\(λ>0\)是一个常数,\(n\)是任意正整数,设\(np_n=λ\),则对于任一固定的非负整数\(k\), \(\displaystyle\lim _{n\rightarrow \infty}C_{n}^{k}P^{k}(1-p)^{n-k}=\frac{λ^{k}e^{-λ}}{k!}\)

二项分布的极限是泊松分布

三、随机变量的分布函数

1、引入

对于随机变量\(X\), 我们不仅要知道\(X\) 取哪些值, 要知道 \(X\) 取这些值的概率 ; 而且更重要的是想知道 \(X\) 在任意有限区间\((a,b)\)内取值的概率.。

2、定义

\(X\)是一个随机变量,\(X\)是任意实数,函数\(F(x)=P\{X≤x\},-\infty<x<\infty\),称为X的分布函数。

几何意义

3、性质

  1. \(F(x)\)是一个不减函数
  2. \(0≤F(x)≤1\)\(F(-\infty)=0,F(\infty)=1\)
  3. \(F(x+0)=F(x)\)\(F(x)\)是右连续的
跳跃值就是间断点的概率值

4、重要公式

  1. \(P\{x_1<x≤x_2\}=P(x_2)-P(x_1)\)
  2. \(P\{x>a\}=1-F(a)=1-P(x≤a)\)

四、连续型随机变量及其概率密度

1、概率密度

对于随机变量\(X\)的分布函数\(F(x)\)存在非负可积函数\(f(x)\)使得对任意实数\(x\)\(F(x)=\int_{-\infty}^{x}f(t)dt\)则称\(X\)为连续型随机变量,\(f(x)\)为概率密度。

2、概率密度性质

  1. 非负性:\(f(x)\geq0\)
  2. 规范性:\(\int _{-\infty}^{\infty}f(x)dx=1\)
  3. 对于任意的\(x_1\),\(x_2\)\((x_1,x_2)\)\(P\{x_1<X\leq x_2\}=\int_{x_1}^{x_2}f(x)dx\)
  4. \(f(x)\)在点\(x\)处连续,则有\(F'(x)=f(x)\)

注意:对于连续型随机变量\(X\)来说,它取任一指定实数值\(a\)的概率均为0

3、均匀分布

\(X·U(a,b)\)

区间长度的倒数

\(f(x)=\frac{1}{b-a},\)\((a<x<b)\)

\(f(x)=\frac{1}{π},(-1<x<1)(-1<y<1)\)

4、指数分布

\(X·{E(θ)}\)

若连续型随机变量X的概率密度为:\(f(x)=\frac{e^{-\frac{x}{θ}}}{θ},x>0\)其中\(θ>0\)为常数,则称\(X\)服从参数为\(θ\)的指数分布。

\(θ\)越大,曲线越平

重要性质:无记忆性。对于任意\(s,t>0\),有\(P\{X>s+t|X>s\}=P\{X>t\}\)

5、正态分布

\(X·N(μ,σ^2)\)

若连续型随机变量X的概率密度为:\(f(x)=\frac{1}{\sqrt{2π}σ}e^{-\frac{(x-μ)^2}{2σ^2}}\)\(x \in R\)

概率积分:\(\int_{-\infty}^{\infty}e^{-x^2}dx=\sqrt{π}\)

  1. 对称轴:\(x=μ\)
  2. \(x=μ\)时取得最大值为\(\frac{1}{\sqrt{2π}σ}\)
  3. \(x=μ\pmσ\)处曲线有拐点
  4. \(μ\)是位置参数,\(σ\)是形态参数(\(σ\)越小,图像瘦高;\(σ\)越大,图像胖矮)

6、标准正态分布

\(μ=0,σ^2=1\)

\(f(x)=\frac{1}{\sqrt{2π}}e^{-\frac{x^2}{2}}\)

一般正态分布\(\rightarrow\)标准正态分布:

\(X\)服从\(N(μ,σ)\),则\(Z=\frac{X-μ}{σ}\)服从\(N(0,1)\)

五、随机变量的函数分布

1、离散型

逐点代入,有重复,便合并

2、连续型

  • 分布函数求导法

\(F_{X}(x)\)表示待求的\(F_{Y}(y)\)

\(F_{Y}(y)\)关于y求导

  • 套公式法

\(F_{Y}(y)=f_{x}[h(y)]|h'(y)|,a<y<b\)其中\(h(y)\)\(g(x)\)的反函数

第三章:多维随机变量及其分布

一、二维随机变量

\(E\)是一个随机试验,它的样本空间是\(S=\{e\}\),设\(X=X(e)\)\(P=Y(e)\)是定义在\(S\)上的随机变量,由它们构成的一个向量(X,Y),叫做二维随机向量或二维随机变量.

1、定义

\((X,Y)\)是二维随机变量,对于任意实数\(x,y\)二元函数: \(F(x,y)=P\{(X≤x)\cap (Y≤y)\}\)\(=\)\(P\{X≤x,Y≤y\}\)称为二维随机变量\((X,Y)\)的分布函数,或称为随机变量\(X\)\(Y\)的联合分布函数.

几何意义

2、性质

  1. 不减函数
  2. \(0\leq F(x,y)\leq1\)对于任意固定的\(y\)\(F(-\infty,y)=0\),对于任意固定的\(x\)\(F(x,-\infty)=0\)
  3. \(F(-\infty,-\infty)=0\),\(F(+\infty,+\infty)=1\)
  4. 关于\(x\)右连续,关于\(y\)右连续
  5. \(F(x_2,y_2)-F(x_2,y_1)+F(x_1,y_1)-F(x_1,y_2)\geq 0\)

3、联合分布律

  1. 定义:设随机变量\((x,y)\)的所有可能的取值为\((x_i,y_j),ij=1,2…\)取相应值的概率为\(P\{X=x_i,Y=y_i\}=p_{ij},i,j=l,2…\)称上式为二维离散型随机变量\((x,y)\)的分布律,或称为\(X\)\(Y\)的联合分布律.

    img

4、二维连续型随机变量

  1. 定义:设二维随机变量\(F(x,y)=P\{X≤x,Y≤y\}\)若存在非负可积函数\(f(x,y)\),使得对任意实数\(x,y\)若有\(F(x,y)=\int_{-\infty}^{y}\int_{-\infty}^{x}f(u,v)dudv\)则称\((X,Y)\)为二维连续型随机变量,称\(f(x,y)\)\((X,Y)\)的概率密度函数,或称为\(X\)\(Y\)的联合概率密度。
  2. 性质:非负性、规范性
  3. 对于平面上任一区域G:二重积分的几何意义是曲顶柱体的体积。

5、$n $维随机变量的概念(推广)

  1. 定义:

\(E\)是一个随机试验,它的样本空间是\(S={e}\),设\(X_1=X_1(e),X_2=X_2(e),...,X_n=X_n(e)\)是定义在\(S\)上的随机变量,由它们构成的一个\(n\)维随机向量或\(n\)维随机变量。

对于任意\(n\)个实数\(x_1,x_2,…,x,n\)元函数\(F(x_1,x_2,..x_n)=P\{X_1≤x_1,X_2≤x_2,…,X_n≤x_n\}\)称为n维随机变量\((X_1,X_2,…,X_n)\)的分布函数或随机变量\(X_1,X_2…,X_n\)的联合分布函数.

二、边缘分布

1、边缘分布函数

  • 定义

\(F(x,y)\)为随机变量\((X,Y)\)的分布函数,如\(F(x,y)=P\{X≤x,Y≤y\}\)\(y \rightarrow \infty\),称\(P\{X≤x\}=\)\(P\{X≤x,Y<\infty \}=F(x,\infty)\)为随机变量\((X,Y)\)关于\(X\)的边缘分布函数。记为\(F_X(x)=F(x,∞)\) 同理令\(x \rightarrow \infty\),得: \(F(y)=F(\infty,y)=\)\(P\{X<∞,Y≤y\}= P\{Y ≤y\}\)为随机变量\((XY)\)关于\(Y\)边缘分布函数。

2、离散型随机变量的边缘分布律

  • 定义

设二维离散型随机变量\((X,Y)\)的联合分布律为\(P\{X=x,Y=y\}=p_{ij},i,j=1,2,...\)

\(p_{i·}=\displaystyle\sum_{j=1}^{\infty}p_{ij}=p\{X=x_{i}\},i=1,2,...\)

\(p_{·j}=\displaystyle\sum_{i=1}^{\infty}p_{ij}=p\{Y=y_{j}\},j=1,2,...\)

分别称\(p_{i·}(i=1,2...)\)\(p_{·j}(j=1,2,…)\)\((X,Y)\)关于\(X\)和关于\(Y\)的边缘分布律。

  • 离散型随机变量关于X和Y的边缘分布函数分别为:

\(F_X(x)=F(x,\infty)=\displaystyle\sum_{x_i\leq x}\sum_{j=1}^{\infty}p_{ij}\)

\(F_Y(y)=F(\infty,y)=\displaystyle\sum_{y_i\leq y}\sum_{i=1}^{\infty}p_{ij}\)

边缘分布律

3、连续型随机变量的边缘分布

  • 定义

对于连续型随机变量\((X,Y)\),设它的概率密度为\(f(x,y)\),由于 \(F_X (x)= F(x,∞)\)\(=\int_{-\infty}^{\infty}\int_{-\infty}^{x}f(x,y)dxdy\)\(=\int_{-\infty}^{x}[\int_{-\infty}^{\infty}f(x,y)dy]dx\)

\(f_X(x)=\int_{-\infty}^{\infty}f(x,y)dy\)

称其为随机变量\((X,Y)\)关于\(X\)的边缘概率密度。

同理可得:随机变量\((X,Y)\)关于\(Y\)的边缘概率密度为\(f_Y(y)=\int_{-\infty}^{\infty}f(x,y)dx\)

  • 二重积分

口诀:求谁不积谁,不积先定限,限内画条线,先交写下限,后交写上限。

此处涉及到二重积分的相关高数知识,详情请看【点击这里

二维随机变量求解边缘概率密度
  • 特殊的二维正态分布

二维正态分布的两个边缘分布都是一维正态分布,并且都不依赖于参数\(ρ\)

  • 注意
关系

三、条件分布

1、离散型随机变量的条件分布

  • 定义

\((X,Y)\)是二维离散型随机变量 ,对于固定的\(j\)\(P\{Y=y_j\}>0\),则称 \(P\{X=x_i|Y=y_j\}\)\(=\frac{P\{X=x_i,Y=y_j\}}{P\{Y=y_j\}}\)\(=\frac{p_{ij}}{P_{·j}}\)\(i=1,2,…\) 为在\(Y=y_i\)条件下随机变量 X的条件分布律.

​ 同样,对于固定的\(i\)\(P\{X=x_i\}>0\),则称\(P\{Y=y_j|X=x_i\}\)\(=\frac{P\{X=x_i,Y=y_j\}}{p\{X=x_i\}}=\frac{p_{ij}}{P_{i·}}\)\(j=1,2,..\)为在\(X=x_i\)条件下随机变量\(Y\)的条件分布律。

关系
  • 条件分布律的性质
  1. 非负性
  2. 规范性

2、连续型随机变量的条件分布

  • 定义

设二维随机变量\((X,Y)\)的概率密度为\(f(x,y)\),\((X,Y)\)关于\(Y\)的边缘概率密度为\(f_Y(y)\).若对于固定的\(y\),\(f_Y(y)>0\)

则称\(\frac{f(x,y)}{f_Y(y)}\)为在\(Y=y\)的条件下\(X\)的条件概率密度,记为\(f_{x|Y}(x|y)=\frac{f(x,y)}{f_Y(y)}\)

\(\int_{-\infty}^{x}f_{x|y}(x|y)dx\)=\(\int_{-\infty}^{x}\frac{f(x,y)}{f_Y(y)}dx\)为在\(Y=y\)的条件下\(X\)的条件分布函数,记为\(P\{X≤x|Y=y\}\)\(F_{X|Y}(x|y)\)

类似地,

可以定义\(f_{Y|X}(y|x)=\frac{f(x,y)}{f_X(x)}\)\(F_{Y|X}(y|x)=\int_{-\infty}^{y}\frac{f(x,y)}{f_X(x)}dy\)

  • 性质
  1. 非负性
  2. 规范性

四、相互独立的随机变量

1、随机变量的相互独立性

  • 定义

\(X,Y\)是两个随机变量,若对任意的\(x,y\)\(P\{X\leq x,Y\leq y\}=P\{X\leq x\}P\{Y\leq y\}\)则称$X $和 $Y $相互独立 。

两事件 \(A , B\) 独立的定义是:若\(P(AB)=P(A)P(B)\)则称事件 \(A , B\) 独立 .

  • 相关性质

不论离散型还是连续型:联合\(=\)边缘X边缘

正态随机变量的独立性:二维正态随机变量相互独立的充要条件是\(ρ=0\)

2、二维随机变量的推广

  • 分布函数

\(n\)维随机变量\((X_1,X_2,...X_n)\)的分布函数定义为

\(F(x_1,X_2,..x_n)\)\(=P\{X_1\leq x_1,X_2≤x_2,...X_n\leq x_n \}\)其中\(x_1,x_2,…,x_n\)为任意实数。

  • 概率密度函数

若存在非负函数\(f(x_1,x_2...x_n),\)使对于任意实数\(x_1,x_2…,x_n\)

\(F(x_1,x_2,...,x_n)\)\(\int_{-\infty}^{x_{n}}\int_{-\infty}^{x_{n-1}}···\int_{-\infty}^{x_{1}}dx_{1}dx_2···dx_n\)则称\(f(x_1,x_2…,x_n)\)\((X_1,X_2,…,X_n)\)的概率密度函数。

  • 边缘分布函数

\((X_1,X_2,…,X_n)\)的分布函数\(F(x_1,x_2,…x_n)\)为已知,则\((X_1,X_2,…,X_n)\)\(k(1≤k<n)\)维边缘分布函数就随之确定.

  • 边缘概率密度函数

\(f(x_1,x_2,...,x_n)\)\((X_1,X_2…,X_n)\)的概率密度,则\((X_1,X_2,…,X_n)\)关于\(X_1\),关于\((X_1,X_2)\)的边缘概率密度分别为 \(f_{X_1}(x_1)=\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}···\int_{-\infty}^{\infty}f(x_1,x_2,...,x_n)dx_2,dx_3···dx_n\)

\(f_{X_1,X_2}(x_1,x_2)=\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}···\int_{-\infty}^{\infty}f(x_1,x_2,...,x_n)dx_3,dx_4···dx_n\)

······

  • 相互独立性

若对于所有的\(x_1,x_2,···,x_n\)\(F(x_1,x_2,···,x_n)=F_{X_1}(x_1)F_{X_2}(x_2)···F_{X_n}(x_n)\)则称\(X_1,X_2,···,X_n\)是相互独立的。

若对于所有的\(x_1,x_2,···,x_n\),\(y_1,y_2,···,y_m\)\(F(x_1,x_2,···,x_n,y_1,y_2,···y_m)=F_1(x_1,x_2,···,x_m)F_2(y_1,y_2,···,y_n)\)则称随机变量\(x_1,x_2,···,x_n\)\(y_1,y_2,···,y_m\)是相互独立的。

  • 重要结论定理

\((X_1,X_2,···,X_m)\)\((Y_1,Y_2…Y_n)\)相互独立,

\(X_i(i=1,2,…,m)\)\(Y_j(j=1,2,…,n)\)相互独立,

又若 \(h,g\)是连续函数,则\(h(X_1,X_2,,…,X_m)\)\(g(Y_1,Y_2…,Y_n)\)相互独立。

第四章:随机变量的数字特征

一、数学期望

1、随机变量数学期望的概念

1、离散型随机变量的数学期望

  • 定义

设离散型随机变量\(X\)的分布律为\(P\{X=x_k\}=p_k,k=1,2,...\)若级数\(\displaystyle\sum_{k=1}^{\infty}x_kp_k\)绝对收敛,则称级数\(\displaystyle\sum_{k=1}^{\infty}x_kp_k\)的和为随机变量\(X\)的数学期望,记为\(E(X)=\displaystyle\sum_{k=1}^{\infty}x_kp_k\)

数学期望简称期望,又叫均值。是一个实数,加权平均值,体现了随机变量\(X\)取可能值的真正的平均值。

2、连续型随机变量的数学期望

  • 定义

设连续型随机变量\(X\)的概率密度为\(f(x)\),若积分\(\int_{-\infty}^{\infty}xf(x)dx\)绝对收敛,则称积分\(\int_{-\infty}^{\infty}xf(x)dx\)的值为随机变量\(X\)的数学期望,记为\(E(X)\)即:\(E(X)=\int_{-\infty}^{\infty}xf(x)dx\)

2、随机变量的函数的数学期望

  • 离散型随机变量函数的数学期望

\(E(g(x))=\displaystyle\sum_{k=1}^{\infty}g(x_k)p_k\)

  • 连续型随机变量函数的数学期望

\(X\)是连续型的,它的分布密度为\(f(x)\)则:\(E(g(x))=\displaystyle\sum_{-\infty}^{\infty}g(x)f(x)dx\)

上面两个公式的重要性在于: 当我们求\(E[g(X)]\)时, 不必知道\(g(X)\)的分布,而只需知道\(X\)的分布就可以了. 这给求随机变量函数的期望带来很大方便.

  • 二维离散型随机变量函数的数学期望

\(X,Y\)为离散型随机变量,\(g(x,y)\)为二元函数,则\(E[g(X,Y)]\)\(=\displaystyle\sum_i\sum_jg(x_i,y_j)p_{ij}\)其中\((X,Y)\)的联合概率分布为\(P_{ij}\)

  • 二维连续型随机变量函数的数学期望

\(X,Y\)为连续型随机变量,\(g(x,y)\)为二元函数,则\(E[g(X,Y)]\)\(=\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}g(x,y)f(x,y)dxdy\).其中\((X,Y)\)的联合概率密度为\(f(x,y)\).

3、数学期望的性质

  1. \(C\)是常数,则有\(E(C)=C\)
  2. \(X\)是一个随机变量,\(C\)是常数,则有\(E(CX)=CE(X)\)
  3. \(X,Y\)是两个随机变量,则有\(E(X+Y)=E(X)+E(Y)\)可以推广到任意有限个随机变量之和的情况。
  4. \(X,Y\)是相互独立的随机变量,则有\(E(XY)=E(X)E(Y)\)可以推广到任意有限个随机变量之和的情况。但不能说明\(XY\)相互独立

4、总结

一维
一维函数
二维函数

二、方差

1、随机变量方差的概念

  • 定义

\(X\)是一个随机变量,若\(\{[X-E(X)]^2\}\)存在,则称\(\{[X-E(X)]^2\}\)\(X\)的方差。记为\(D(X)\)\(Var(X)\),即

\(D(X)=Var(X)=E\{[X-E(X)]^2\}\)

在应用上还引入量\(\sqrt{D(X)}\),记为\(σ(X)\),称为标准差或均方差。

  • 意义

按定义,随机变量\(X\)的方差表达了\(X\)的取值与其数学期望的偏离程度·若\(D(X)\)较小意味着\(X\)的取值比较集中在\(E(X)\)的附近,反之,若\(D(X)\)较大,则表示的取值较分散。因此,\(D(X)\)是刻画\(X\)取值分散程度的一个量,它是衡量\(X\)取值分散程度的一个尺度.

  • 计算

定义式:\(D(X)=E\{[X-E(X)]^2\}\)

计算式:\(D(X)=E(X^2)-[E(X)]^2\)

计算式移项也经常用于算\(E(X^2)\)

2、随机变量方差的性质

  1. \(C\)是常数,则\(D(C)=0\)
  2. \(X\)是一个随机变量,\(C\)是常数,则有\(D(CX)=C^2D(X)\)
  3. \(XY\)是两个随机变量,则有\(D(X+Y)=D(X)+D(Y)+2E\{(X-E(X))(Y-E(Y))\}\)
  4. 性质\(3\)的特殊情况:当\(XY\)相互独立时有:\(D(X+Y)=D(X)+D(Y)\)可以推广到\(n\)个随机变量相互独立时。
  5. \(D(X)=0\)充要条件是\(X\)取常数\(E(X)\)时的概率为\(1\)

3、标准化随机变量

◆ 设任意随机变量 \(X\)(不一定服从正态),若其期望\(E(X)\)方差\(D(X)\)都存在,且\(D(X)\neq0\),则称 \[ X^*=\frac{X-E(X)}{\sqrt{D(X)}} \]\(X\)的标准化随机变量。

标准化随机变量之后,期望为0,方差为1,即服从标准正态分布NO.1(南波湾)

4、重要概率分布的方差(P298)

符号 分布 参数 数学期望 方差
\((0-1)\) 两点分布 \(0<P<1\) \(p\) \(p(1-p)\)
\(b(n,p)\) 二项分布 \(n\geq1,0<P<1\) \(np\) \(np(1-p)\)
\(π(λ)\) 泊松分布 \(λ>0\) \(λ\) \(λ\)
\(U(a,b)\) 均匀分布 \(a<b\) \(\frac{a+b}{2}\) \(\frac{(b-a)^2}{12}\)
\(E(θ)\) 指数分布 \(θ>0\) \(θ\) \(θ^2\)
\(N(μ,σ^2)\) 正态分布 \(μ>0,σ>0\) \(μ\) \(σ^2\)

5、切比雪夫不等式

设随机变量\(X\)具有数学期望\(E(X)=μ\)方差\(D(X)=σ^2\)则对于任意正数\(ε\),不等式 \[ P\{|X-μ|\geq ε \}\leq \frac{σ^2}{ε^2} \] 成立。

也可以写为下面的形式: \[ P\{|X-μ|< ε \}\geq1- \frac{σ^2}{ε^2} \]

主要用于证明大数定律和粗糙的估计概率。

三、协方差及相关系数

1、协方差的定义

\(Cov(X,Y)=E\{(X-E(X))(Y-E(Y))\}\)

故方差的性质3就变成:\(D(X+Y)=D(X)+D(Y)+2E\{(X-E(X))(Y-E(Y))\}=D(X+Y)=D(X)+D(Y)+2Cov(X,Y)\)

\(X,Y\)相互独立,则\(Cov(X,Y)=0\)

2、协方差的计算式

  1. \(Cov(X,Y)=E\{(X-E(X))(Y-E(Y))\}\)
  2. \(Cov(X,Y)=E(XY)-E(X)E(Y)\)
  3. \(Cov(X,Y)=\frac{D(X+Y)-D(X)-D(Y)}{2}\)

3、协方差的基本性质

  1. \(Cov(X,Y)=Cov(Y,X)\)
  2. \(Cov(X,X)=D(X)\)
  3. \(Cov(X,C)=0\),其中\(C\)为常数
  4. 对于任意常数\(a,b\)\(Cov(aX,bY)=abCov(X,Y)\)
  5. \(Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y)\)

4、相关系数的定义

\(ρ_{XY}=Cov(X^*Y^*)=\frac{Cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}\)\(X\)\(Y\)的相关系数。

\(X\)\(Y\) 的相关系数又称为标准协方差,它是一个无量纲的量。

\(ρ_{(kX)(kY)}=\frac{Cov(kX,kY)}{\sqrt{D(kX)}\sqrt{D(kY)}}=\frac{Cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}\)

5、相关系数的性质

  1. \(|ρ_{XY}|\leq 1\)
  2. \(|ρ_{XY}|=1\)的充要条件是:存在常数啊\(a\)\(b\)使得\(P\{Y=a+bX\}=1\)

6、相关系数的含义

\(|ρ_{XY}|\)是一个用来表征\(X\),\(Y\)之间线性关系紧密程度的量,它刻画了\(X\),\(Y\)之间线性关系的强弱。

1°当 \(|ρ_{XY}|=1\) 时,\(X,Y\) 之间几乎就是线性关系:

​ 当\(|ρ_{XY}|=1\)时,称\(X\)\(Y\)正相关,此时\(b>0\)

​ 当\(|ρ_{XY}|=-1\)时,称\(X\)\(Y\)负相关,此时\(b<0\)

2°当\(|ρ_{XY}|=0\)时,\(X,Y\) 没有线性关系,即:不相关

7、相互独立与不相关

相互独立与不相关的关系图

相互独立与不相关的特例:二维正态分布(P107)

特例

四、矩、协方差矩阵

1、矩的概念

\(X\)\(Y\)是随机变量:

  1. \(E(X^k)\),\(k=1,2.…\)存在,称它为\(X\)\(k\)阶原点矩,简称k阶矩,(数学期望\(E(X)\)是一阶原点矩,即一阶矩)
  2. \(E\{[X-E(X)^k]\}\),\(k=2,3\),存在,称它为\(x\)\(k\)阶中心矩(方差\(D(X)\)是二阶中心矩)
  3. \(E(X^kY^l)\),\(k,l=1,2,…\)存在,称它为\(X\)\(Y\)\(k+l\)阶混合矩
  4. \(E\{[X-E(X)]^k[Y-E(Y)]^l\}\)存在,称它为\(X\)\(Y\)\(k+l\)阶混合中心矩(协方差是\(Cov(XY)\)\(X\)\(Y\)的二阶混合中心矩)

其中:三阶中心矩\(E\{[X-E(X)]^3\}\)主要用来衡量随机变量的分布是否有偏 四阶中心矩\(E\{[X-E(X)]^4\}\)主要用来衡量随机变量的分布在均值附近的陡峭程度如何。

2、协方差矩阵

\(n\)维随机变量\((X_1,X_2,,…,X_n)\)的二阶混合中心矩(协方差)

\(c_{ij}=Cov(X_i,X_j)\)\(=E\{[X_i-E(X_i)][X_j-E(X_j)]\}\),\(i,j=1,2,…,n\)都存在,则称矩阵:

\[ \begin{bmatrix} c_{11} & c_{12} &... & c_{1n} \\ c_{21} & c_{22} &... & c_{2n} \\ & & \cdots & \\ c_{n1} & c_{n2} & \dots & c_{nn} \end{bmatrix} \]

\(n\)维随机变量的协方差矩阵。

第五章:大数定律和中心极限定理

一、依概率收敛

依概率收敛就是随机变量序列的极限

1、依概率收敛的定义

定义:设\(\{X_n\}\)为一随机变量序列,\(a\)是一个常数,则对任意正数\(ε\),有\(\displaystyle\lim_{n\to \infty}\{|X_n-a|<ε\}=1\)则称序列\(\{X_n\}\)依概率收敛于\(a\)记为$ X_n^Pa(n)$

注:\({X_n}\)依概率收敛于\(a\),意味着对任意正数\(ε\),当\(n\)充分大时,事件\(|X_n-a|<ε\)的概率很大,接近于1,但这并不排除事件\(|X_n-a|\geq ε\)的发生,而只是说其发生的概率很小。

2、依概率收敛的性质

\(X_n\to a\),\(Y_n \to b\),又设函数\(g(x,y)\)在点\((a,b)\)连续,则\(g(X_n,Y_n)\to g(a,b)\)

二、基本定理

1、弱大数定律(辛钦大数定律)

\(X_1,X_2,…\)是相互独立,服从同一分布的随机变量序列,且具有数学期望:\(E(X_k)=μ,(k=1,2…)\),作前\(n\)个变量的算术平均\(\frac{1}{n} \displaystyle \sum_{k=1}^{n}X_k\),则对于任意\(ε>0\),有: \[ \lim_{n\to \infty}P\{|\frac{1}{n}\sum_{k=1}^{n}X_k-μ|<ε\}=1 \] 解释

也就是当n很大时,随机变量\(X_1,X_2,…\)的算术平均值\(\displaystyle\frac{1}{n}\sum_{k=1}^{n}X_k\)接近于数学期望,即\(E(X_1)=E(X_2)=...=E(X_k)=μ\)

另外一种表述:设随机变量\(X_1,X_2...X_n...\)相互独立,服从同一分布且具有数学期望\(E(X_k)=μ (k=1,2,…)\)则序列\(\frac{1}{n} \displaystyle \sum_{k=1}^{n}X_k\)依概率收敛于\(μ\)

2、伯努利大数定理

\(f_A\)\(n\)次独立重复试验中事件\(A\)发生的次数,\(p\)是事件\(A\)在每次试验中发生的概率,则对于任意正数\(ε>0\),有 \[ \lim_{n\to\infty}p\{|\frac{f_A}{n}-p|<ε\}=1 \]

\[ \lim_{n\to\infty}p\{|\frac{f_A}{n}-p|\geqε\}=0 \]

伯努利定理表明事件发生的频率\(\frac{f_A}{n}\)依概率收敛于事件的概率\(p\),它以严格的数学形式表达了频率的稳定性 因而当\(n\)很大时,事件发生的频率与概率有较大偏差的可能性很小。在实际应用中,当试验次数很大时,便可以用事件发生的频率来代替事件的概率。

三、中心极限定理

1、独立同分布的中心极限定理

设随机变量\(X_1,X_2,...X_n,…\)相互独立,服从同一分布,且具有数学期望和方差\(E(X_i)=μ\),\(D(X_i)=σ^2>0(i=1,2,)\)则这些随机变量之和\(\displaystyle\sum_{i=1}^{n}X_i\)的标准化随机变量 \[ Y_n=\frac{\displaystyle\sum_{i=1}^{n}X_i-E(\sum_{i-1}^{n}X_i)}{\sqrt{D(\displaystyle\sum_{i=1}^{n}X_i)}}=\frac{\displaystyle\sum_{i=1}^{n}X_i-nμ}{\sqrt{n}σ},(n=1,2,...) \] 的分布函数\(F_n(x)\)对任意\(x\)满足: \[ \lim_{n\to\infty}F_n(X)=\lim_{n\to\infty}P\displaystyle\{\frac{\displaystyle\sum_{i=1}^{n}X_i-nμ}{\sqrt{n}σ}\leq x\}=\displaystyle\int_{-\infty}^{x}\frac{1}{\sqrt{2π}}e^{-\frac{t^2}{2}}dt=Φ(x) \] 该定理表明:当\(n\to\infty\),随机变量序列\(Y_n\)的分布函数收敛于标准正态分布的分布函数。

结论:当\(n\)充分大时,有:\(F_n(x)\approx Φ(x)\)

即:\(Y_n\)近似服从\(N(0,1)\)

也就是:\(\frac{\displaystyle\sum_{i=1}^{n}X_i-nμ}{\displaystyle\sqrt{n}σ}\)近似服从\(N(0,1)\)

从而得出:\(\displaystyle\sum_{i=1}^{n}X_i\)近似服从\(N(nμ,nσ^2)\)

进一步由:\(\overline{X}=\frac{1}{n}\displaystyle\sum_{i=1}^{n}X_i\)

得:\(\overline{X}\)近似服从\(\displaystyle N(μ,\frac{σ^2}{n})\)

2、李雅普诺夫定理

没讲太多,本质是表明无论各个随机变量服从什么分布,只要满足定理的条件,它们的和\(\displaystyle\sum_{i=1}^{n}X_i\),当\(n\)很大时,近似的服从正态分布。

3、棣莫弗-拉普拉斯定理

设随机变量\(η_n(n=1,2,…)\)服从参数为\(n,p(0<p<1)\)的二项分布,则对于任意\(x\),恒有: \[ \lim_{n\to \infty}P\{\frac{-np}{\sqrt{np(1-p)}}\leq x\}=\int_{-\infty}^{x}\frac{1}{\sqrt{2π}}e^{-\frac{t^2}{2}}dt=Φ(x) \] 意义:正态分布是二项分布的极限分布, 当n充分大时,可以利用该定理来计算二项分布的概率。

结语:

依照高等学校教材《概率论与数理统计》浙江大学版+自己上课听课的笔记+课件\(\to\)做出的可以方便观看的博客文章

But,我们专业是没有安排学习数理统计部分的!(交通运输)Transportation

概率论与数理统计
欢迎关注
  1. 全部文字在知识共享 署名-相同方式共享 4.0协议之条款下提供使用。 ↩︎

概率论
https://machomeng.pages.dev/9/
作者
Macho Meng
发布于
2024年6月15日
更新于
2024年8月20日
许可协议