Geeks_Z の Blog Geeks_Z の Blog
首页
  • 学习笔记

    • 《HTML》
    • 《CSS》
    • 《JavaWeb》
    • 《Vue》
  • 后端文章

    • Linux
    • Maven
    • 汇编语言
    • 软件工程
    • 计算机网络概述
    • Conda
    • Pip
    • Shell
    • SSH
    • Mac快捷键
    • Zotero
  • 学习笔记

    • 《数据结构与算法》
    • 《算法设计与分析》
    • 《Spring》
    • 《SpringMVC》
    • 《SpringBoot》
    • 《SpringCloud》
    • 《Nginx》
  • 深度学习文章
  • 学习笔记

    • 《PyTorch》
    • 《ReinforementLearning》
    • 《MetaLearning》
  • 学习笔记

    • 《高等数学》
    • 《线性代数》
    • 《概率论与数理统计》
  • 增量学习
  • 哈希学习
GitHub (opens new window)

Geeks_Z

AI小学生
首页
  • 学习笔记

    • 《HTML》
    • 《CSS》
    • 《JavaWeb》
    • 《Vue》
  • 后端文章

    • Linux
    • Maven
    • 汇编语言
    • 软件工程
    • 计算机网络概述
    • Conda
    • Pip
    • Shell
    • SSH
    • Mac快捷键
    • Zotero
  • 学习笔记

    • 《数据结构与算法》
    • 《算法设计与分析》
    • 《Spring》
    • 《SpringMVC》
    • 《SpringBoot》
    • 《SpringCloud》
    • 《Nginx》
  • 深度学习文章
  • 学习笔记

    • 《PyTorch》
    • 《ReinforementLearning》
    • 《MetaLearning》
  • 学习笔记

    • 《高等数学》
    • 《线性代数》
    • 《概率论与数理统计》
  • 增量学习
  • 哈希学习
GitHub (opens new window)
  • 线性代数

  • 概率论与数理统计

    • 事件与概率
    • 随机变量及其分布
      • 随机变量及其分布
        • 随机变量的概念
        • 离散型随机变量及其分布
        • 连续型随机变量及其分布
        • 多维随机变量(随机向量)
        • 条件分布和随机变量的独立性
        • 随机变量的函数的概率分布
    • 随机变量的数字特征
  • 矩阵

  • 分布

  • 数学笔记
  • 概率论与数理统计
Geeks_Z
2022-12-26
目录

随机变量及其分布

随机变量及其分布

随机变量的概念

  1. 随机变量(Random variable) :值随机会而定的变量,研究随机试验的一串事件。可按维数分为一维、二维至多维随机变量。按性质可分为离散型随机变量以及连续型随机变量。
  2. 分布(Distribution) :事件之间的联系,用来计算概率。
  3. 示性函数(Indication function) :反之IA(ω)={1ω∈A0 反之,事件A 随机变量IA 示出来,IA 为事件A 示性函数。

离散型随机变量及其分布

  1. 离散型随机变量 :设X 一随机变量,如果X只取有限个或可数个值,则称X 一个(一维)离散型随机变量。

  2. 概率函数 :设X 一随机变量,其全部可能值为{a1,a2,...},则pi=P(X=ai),i=1,2,... 为X 概率函数。

  3. 概率分布 :离散型随机变量的概率分布可以用分布表来表示:

    可能值 a1 a2 ... ai ...
    概率 p1 p2 ... pi ...
  4. 概率分布函数 :

    • 定义 :设X 一随机变量,则函数
F(X)=P(X≤x)(−∞<x<∞)

称为X 分布函数。(注:这里并未限定X 离散型的,它对任何随机变量都有定义。)

  • 性质 :

    • 是单调非降的:当F(x)是单调非降的:当x1<x2 ,有F(x1)≤F(X2).
    • 当x→∞ ,F(x)→1;当x→−∞ ,F(x)→0.
  • 离散型随机变量分布函数 :

    对于离散型随机变量,F(X)=P(X≤x)=∑{i|ai≤x}pi,pi=P(X=i)=F(i)−F(i−1)。

  1. 二项分布(Bionomial distribution):

    • 定义 :设某事件A 一次试验中发生的概率为p,先把试验独立地重复n次,以X A 这n次试验中发生的次数,则X 值0,1,...,n,且有

      P(X=k)=(nk)pk(1−p)n−k,k=0,1,...,n

      称X 从二项分布,记为X∼B(n,p).

    • 服从二项分布的条件 :1. 各次试验的条件是稳定的,即事件A 概率p 各次试验中保持不变;2. 各次试验的独立性

  2. 泊松分布(Poisson distribution) :

    • 定义 :设随机变量X 概率分布为

      P(X=i)=λii!e−λ,i=0,1,2,...,λ>0

      则称X 从参数为λ Poisson分布,并记X∼P(λ).

    • 特点 :

      • 描述稀有事件发生概率

      • 作为二项分布的近似。若X∼B(n,p),其中n 大,p 小,而np=λ 太大时(一般n>30,np≤5),则X 分布接近泊松分布P(λ).

        推导 :

        若事件A∼B(n,p),且n 大,p 小,而np=λ 太大时,设λ=np,

        P(X=i)=limn→∞(ni)(λn)i(1−λn)n−i=λilimn→∞(ni)nilimn→∞(1−λn)n−i=λie−λlimn→∞n(n−1)(n−2)...(n−i+1)i!ni=λie−λlimn→∞(1−1n)(1−2n)...(1−i−1n)i!=λii!e−λ

连续型随机变量及其分布

  1. 连续型随机变量 :设X 一随机变量,如果X不仅有无限个而且有不可数个值,则称X 一个连续型随机变量。

  2. 概率密度函数 :

    • 定义 :设连续型随机变量X 概率分布函数F(x),则F(x) 导数f(x)=F′(x) 为X 概率密度函数。

    • 性质 :

      • 对于所有的−∞<x<+∞,有f(x)≥0;
      • ∫−∞+∞f(x)dx=1;
      • 对于任意的−∞<a≤b<+∞,有P(a≤X≤b)=F(b)−F(a)=∫abf(x)dx.
    • 注 :

      • 对于任意的−∞<x<+∞,有P(X=x)=∫xxf(u)du=0.
      • 假设有总共一个单位的质量连续地分布在a≤x≤b ,那么f(x) 示在点x 质量密度且∫cdf(x)dx 示在区间[c,d] 的全部质量。
  3. 概率分布函数 :设X 一连续型随机变量,则

    F(x)=∫−∞xf(u)du,−∞<x<+∞
  4. 正态分布(Normal distribution) :

    • 定义 :如果一个随机变量具有概率密度函数

      f(x)=12πσe−(x−μ)22σ2,−∞<x<+∞

      其中−∞<μ<+∞,σ2>0,则称X 正态随机变量,并记为X∼N(μ,σ2).特别地,μ=0,σ=1 正态分布成为标准正态分布。用Φ(x) ϕ(x) 示标准正态分布N(0,1) 分布函数和密度函数。

    • 性质 :

      • 正态分布的密度函数是以x=μ 对称轴的对称函数,μ 为位置参数,密度函数在x=μ 达到最大值,在(−∞,μ) (μ,+∞) 严格单调。
      • σ 大小决定了密度函数的陡峭程度,通常称σ 正态分布的形状参数。
      • 若X∼N(μ,σ2),则Y=(X−μ)/σ∼N(0,1).
      • Φ(−k)=1−Φ(k)
    • 图像(密度和分布函数图) :

  1. 指数分布(Exponential distribution) :

    • 定义 :若随机变量X 有概率密度函数

      f(x)={λe−λxx>00x≤0=λe−λxI(0,∞)(x)

      其中λ>0 常数,则称X 从参数为λ 指数分布。

    • 概率分布函数 :F(x)={1−e−λxx>00x≤0=(1−e−λx)I(0,∞)(x)

    • 性质 :

      • 无后效性,即无老化,要来描述寿命(如元件等)的分布。

        证明 :

        “无老化”就是说在时刻x 常工作的条件下,其失效率总保持为某个常数λ>0,与x 关,可表示

        证:P(x≤X≤x+h|X>x)/h=λ(h→0)证:limh→0P(x≤X≤x+h|X>x)h=limh→0P(x≤X≤x+h,X>x)P(X>x)h=limh→0P(x<X≤x+h)P(X>x)h=limh→0−e−λt|xx+h−e−λt|x∞h=limh→0e−λx−e−λx−λhe−λxh=limh→01−1exhh=limh→0λe−λh=λ
      • λ 失效率,失效率越高,平均寿命就越小。

    • 图像(密度函数) :

  2. 均匀分布(Uniform distribution) :

    • 定义 :设a<b,如果分布F(x) 有密度函数

      其它f(x)={1b−aa≤x≤b0其它=1b−aI(a,b)(x)

      则该分布为区间[a,b] 的均匀分布。

    • 概率分布函数 :F(x)={0x≤ax−ab−aa<x≤b1x>b

    • 性质 :∀R(c,d)⊂R(a,b),P(c<X<d)=d−cb−a

多维随机变量(随机向量)

  1. 随机向量 :设X={X1,...,Xn}.如果每个Xi 是一个随机变量,i=1,...,n,则称X n 随机变量或者随机向量。

  2. 离散型随机向量的分布 :如果每一个Xi 是一个离散型随机变量,i=1,...,n,则称X={X1,...,Xn} 一n 离散型随机变量。设Xi 所有可能取值为{ai1,ai2,...},i=1,...,n,则称

    p(j1,...,jn)=P(X1=a1j1,...,Xn=anjn),j1,...,jn=1,2,...

    为n 随机变量X 概率函数,这也是其联合分布。

    其具有下列性质:

    • p(j1,...,jn)≥0,ji=1,2,...,i=1,2,...,n;
    • ∑j1,...,jnp(j1,...,jn)=1.

    注 :对于高维离散型随机变量,一般不使用分布函数

  3. 多项式分布

    • 定义 :设A1,A2,...,An 某一试验之下的完备事件群,分别以p1,p2,...,pn 事件A1,A2,...,An 概率,则pi≥0,p1+...+pn=1.将试验独立地重复N ,以Xi 在这N 试验中事件Ai 现的次数(i=1,...,n),则X=(X1,...,Xn) 一个n 随机向量。该分布记作M(N;p1,...,pn).

    • 概率分布函数 :P(X1=k1,X2=k2,...,Xn=kn)=N!k1!k2!...kn!p1k1p2k2....pnkn

  4. 连续型随机向量的分布 :X={X1,...,Xn} n 连续型随机变量,如果存在\Rn 的非负函数f(x1,...,xn),使得对任意的−∞<a1≤b1<+∞,...,−∞<an≤bn<+∞,有

    P(a1≤X1≤b1,...,an≤Xn≤bn)=∫anbn...∫a1b1f(x1,...,xn)dx1...dxn

    则称为f X 概率密度函数。有

    P(a1≤X1≤b1,...,an≤Xn≤bn)=F(x1,...,xn)

    则称为F X (联合)分布函数。其中分布函数F(X1,...,Xn) 有下述性质:

    • F(x1,...,xn) 调非降;
    • 对任意的1≤j≤n,有limxj→−∞F(x1,...,xn)=0;
    • limx1→∞,...,xn→∞F(x1,...,xn)=1
  5. 边缘分布 :因为X 每个分量Xi 是一维随机变量,故它们都有各自的分布Fi(i=1,...,n),这些都是一维分布,称为随机向量X 其分布F 边缘分布。

    • 离散型随机向量

      行和与列和就是边缘分布。即固定某个xi,即可计算边缘分布,故有

      pX(xi)=P(X=xi)=∑jmP(X=xi,Y=yj)=∑jmpij=pi⋅,i=1,2,...,npY(yi)=P(Y=yi)=∑imP(X=xi,Y=yj)=∑impij=pj⋅,j=1,2,...,n
    • 连续型随机向量

      为求某分量Xi 概率密度函数,只需把f(x1,...,xn) 的xi 定,然后对x1,...,xi−1,xi+1,...,xn −∞ ∞ 间做定积分,如

      (X,Y)∼f(x,y)fX(u)=∫−∞+∞f(u,v)dvfY(u)=∫−∞+∞f(u,v)du

注 :二维正态分布N(a,b,σ12,σ22,ρ) 边缘分布密度分别是一维正态分布N(a,σ12) N(b,σ22)。因此联合分布可推边缘分布,而边缘分布不可推联合分布。

条件分布和随机变量的独立性

  1. 离散型随机变量的条件分布 :设(X,Y) 二维离散型随机变量,对于给定的事件{Y=yj},其概率P(Y=yj)>0,则称

    P(X=xi|Y=yj)=P(X=xi,Y=yj)P(Y=yj)=pijp⋅j,i=1,2,...

    为在给定Y=yj 条件下X 条件分布律。类似的,称

    P(Y=yi|X=xj)=P(X=xi,Y=yj)P(X=xj)=pijpi⋅,j=1,2,...

    为在给定X=xj 条件下Y 条件分布律。

  2. 连续型随机变量的条件分布 :设(X,Y) 二维连续型随机变量,对于给定条件Y=y 的条件概率密度为

    fX|Y(x|y)=f(x,y)fY(y),fY(y)>0.

    类似的,在X=x 的条件概率密度为

    fY|X(y|x)=f(x,y)fX(x),fX(x)>0.

    二维正态分布ρ=0 ,其联合密度分布等于条件密度分布的乘积。

  3. 随机变量的独立性

    称随机变量X1,...,Xn 互独立,

    • 离散型随机变量

      则联合分布律等于各自的边缘分布律的乘积,即

      P(X1=x1,...,Xn=xn)=P(X1=x1)...P(Xn=xn)

      其中(x1,...xn) (X1,...,Xn) 值域中的任意一点。

    • 连续型随机变量

      则联合密度等于各自的边缘密度的乘积,即

      f(x1,...,xn)=f1(x1)...fn(xn),∀(x1,...,xn)∈\Rn
    • 更具一般地

      设X1,...,Xn n 随机变量,如果它们的联合分布函数等于各自边缘分布函数的乘积,即

      F(X1,...,xn)=F1(x1)...Fn(xn),∀(x1,...,xn)∈\Rn

      则称随机变量X1,...,Xn 互独立。

    一些重要的结论

随机变量的函数的概率分布

  最简单的情形,是由一维随机变量X 概率分布去求其一给定函数Y=g(X) 分布。较为常见的,是由(X1,X2,...,Xn) 分布去求Y=g(X1,X2,...,Xn) 分布。更一般地,由(X1,X2,...,Xn) 分布去求(Y1,Y2,...,Ym) 分布,其中Yi=gi(X1,X2,...,Xn),i=1,2,...,m.

  1. 离散型分布的情形 :设X 分布律为P(X=xi)=pi,i=1,2,...

    g:R→R,令Y=g(X),则Y 分布律为

    P(Y=yj)=P(g(X)=yj)=∑xi:g(xi)=yjP(X=xi)=∑i:g(xi)=yjpi

    即把Y=g(X1,...,Xn) 以取的不同值找出来,把与某个值相应的全部(X1,...,Xn) 的概率加起来,即得Y 这个值的概率。

  2. 连续型分布的情形

    • 一个变量的情况

      设X 密度函数f(x).设Y=g(x),g 一个严格单调的函数,即当x1<x2 ,必有g(x1)<g(x2) 当x1>x2 ,必有g(x1)>g(x2).又设g 导数g′ 在。由于g 严格单调性,其反函数X=h(Y) 在,且h 导数h′ 存在。有g(X) 密度函数l(y)

      l(y)=f(h(y))|h′(y)|.
    • 多个变量的情形

      以两个为例,设(X1,X2) 密度函数f(x1,x2),Y1,Y2 是(X1,X2) 函数:

      Y1=g1(X1,X2),Y2=g2(X1,X2),

      要求(Y1,Y2) 概率密度函数l(y1,y2).假定(X1,X2) (Y1,Y2) 一一对应变换有逆变换:

      X1=h1(Y1,Y2),X2=h2(Y1,Y2)

      即雅可比行列式

      J(y1,y2)=|∂h1/∂y1∂h1/∂y2∂h2/∂y1∂h2/∂y2|

      不为0.在(Y1,Y2) 平面上任取一个区域A,变换后到(X1,X2) 面的区域B,则有

      P((Y1,Y2)∈A)=P((X1,X2)∈B)=∬Bf(x1,x2)dx1dx2P((Y1,Y2)∈A)=∬Af(h1(y1,y2),h2(y1,y2))|J(y1,y2)|dy1dy2
    • 随机变量和的密度函数

      设(X1,X2) 联合密度函数为f(x1,x2),Y=X1+X2 密度函数:

      • 一般的,l(y)=∫−∞∞f(x1,y−x1)dx1=∫−∞∞f(x,y−x)dx.
      • 若X1,X2 立,则l(y)=∫−∞∞f1(x)f2(y−x)dx=∫−∞∞f1(y−x)f2(x)dx.

      两个独立的正态变量的和仍服从正态分布,且有关的参数相加,其逆命题也成立。

    • 随机变量商的密度函数 设(X1,X2) 联合密度函数为f(x1,x2),Y=X1/X2 密度函数:

      • 一般的,l(y)=∫0∞x1f(x1,x1y)dx1.
      • 若X1,X2 立,则l(y)=∫0∞x1f1(x1)f2(x1y)dx1.
  • 统计学三大分布

    引入两个重要的特殊函数:

    Γ(x)=∫0∞e−ttx−1dt(x>0) 和 B(x,y)=∫01tx−1(1−t)y−1dt(x>0,y>0)

    其中,Γ(1)=1,Γ(1/2)=π,Γ(n)=(n−1)!

    B(x,y)=Γ(x)Γ(y)/Γ(x+y)

    • 卡方分布,记作χn2

      密度函数 :kn(x)=1Γ(n22n/2)e−x/2x(n−2)/2I(0,∞)(x)

      性质 :1. 设X1,X2 立,X1∼χm2,X2∼χn2,则X1+X2∼χm+n2

      ​ 2. 若X1,...,Xn 立,且都服从指数分布,则X=2λ(X1+...+Xn)∼χ2n2

    • t 布,记作tn

      设,X1,X2 立,X1∼χn2,X2∼N(0,1),而Y=X2/X1/n,则Y∼tn.

      密度函数 :tn(y)=Γ((n+1)/2)nπΓ(n/2)(1+y2n)(n+12)

      性质 :密度函数关于原点对称,其图形与正态分布N(0,1) 密度函数的图形相似。

    • F 布,记作Fmn

      设X1,X2 立,X1∼χn2,X2∼χm2,而Y=m−1X2/(n−1X1),则Y∼Fmn

      密度函数 :fmn(y)=mm/2nn/2Γ(m+n2)Γ(m2)Γ(n2)ym/2−1(my+n)−(m+n)/2(y>0)

    三大分布的几个重要性质

    1. 设X1,...,Xn 立同分布,有公共的正态分布N(μ,σ2).记X¯=(X1+...+Xn),S2=∑i=1n(Xi−(¯X))2/(n−1).则(n−1)S2/σ2=∑i=1n(Xi−X¯)2/σ2∼χn−12.

    2. 设X1,...,Xn 假定同1,则n(X¯−μ)/S∼tn−1

    3. 设X1,...,Xn,Y1,...,Ym 立,Xi 有分布N(μ1,σ12),Yj 有分布N(μ2,σ22),则

      [∑j=1m(Yj−Y¯)2/(σ22(m−1))]/[∑i=1n(Xi−X¯)2/(σ12(n−1))]∼Fm−1,n−1

      若σ12=σ22,则

      nm(n+m−2)n+m[(X¯−Y¯)−(μ1−μ2)]/[∑i=1n(Xi−X¯)2+∑j=1m(Yj−Y¯)2]1/2∼tn+m−2

#概率论与数理统计
上次更新: 2025/06/25, 11:25:50
事件与概率
随机变量的数字特征

← 事件与概率 随机变量的数字特征→

最近更新
01
帮助信息查看
06-08
02
常用命令
06-08
03
学习资源
06-07
更多文章>
Theme by Vdoing | Copyright © 2022-2025 Geeks_Z | MIT License
京公网安备 11010802040735号 | 京ICP备2022029989号-1
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式