Geeks_Z の Blog Geeks_Z の Blog
首页
  • 学习笔记

    • 《HTML》
    • 《CSS》
    • 《JavaWeb》
    • 《Vue》
  • 后端文章

    • Linux
    • Maven
    • 汇编语言
    • 软件工程
    • 计算机网络概述
    • Conda
    • Pip
    • Shell
    • SSH
    • Mac快捷键
    • Zotero
  • 学习笔记

    • 《数据结构与算法》
    • 《算法设计与分析》
    • 《Spring》
    • 《SpringMVC》
    • 《SpringBoot》
    • 《SpringCloud》
    • 《Nginx》
  • 深度学习文章
  • 学习笔记

    • 《PyTorch》
    • 《ReinforementLearning》
    • 《MetaLearning》
  • 学习笔记

    • 《高等数学》
    • 《线性代数》
    • 《概率论与数理统计》
  • 增量学习
  • 哈希学习
GitHub (opens new window)

Geeks_Z

AI小学生
首页
  • 学习笔记

    • 《HTML》
    • 《CSS》
    • 《JavaWeb》
    • 《Vue》
  • 后端文章

    • Linux
    • Maven
    • 汇编语言
    • 软件工程
    • 计算机网络概述
    • Conda
    • Pip
    • Shell
    • SSH
    • Mac快捷键
    • Zotero
  • 学习笔记

    • 《数据结构与算法》
    • 《算法设计与分析》
    • 《Spring》
    • 《SpringMVC》
    • 《SpringBoot》
    • 《SpringCloud》
    • 《Nginx》
  • 深度学习文章
  • 学习笔记

    • 《PyTorch》
    • 《ReinforementLearning》
    • 《MetaLearning》
  • 学习笔记

    • 《高等数学》
    • 《线性代数》
    • 《概率论与数理统计》
  • 增量学习
  • 哈希学习
GitHub (opens new window)
  • 线性代数

  • 概率论与数理统计

  • 矩阵

  • 分布

    • 统计量及其分布
    • 参数估计
    • 假设检验
      • 六、假设检验
        • 6.1 假设检验的基本思想和概念
    • 先验分布与后验分布
    • 分布度量
    • 交叉熵
    • 最优运输概述
    • Wasserstein距离
    • 基于最优传输的分类损失函数
    • 最优传输之生成模型
    • 最优传输之梯度流
    • 两个多元正态分布的KL散度巴氏距离和W距离
  • 数学笔记
  • 分布
Geeks_Z
2022-12-26
目录

假设检验

六、假设检验

6.1 假设检验的基本思想和概念

  1. 基本思想

    以“女士品茶”为例,对于该女士有没有品茶的能力,有两种假设:该女士没有品茶能力和该女士有品茶能力。在统计上这两个非空不相交参数集合称作统计假设,简称假设。通过样本对一个假设作出对与不对的判断,则称为该假设的一个检验。若检验结果否定该命题,则称拒绝这个假设,否则就**接受(不拒绝)**这个假设。

    假设可分为两种:1. 参数假设检验,即已经知道数据的分布,针对总体的某个参数进行假设检验;2. 非参数假设检验,即数据分布未知,针对该分布进行假设检验。

  2. 假设检验的基本步骤

    建立假设—>选择检验统计量,给出拒绝域形式—>选择显著性水平—>给出拒绝域—>做出判断

    Step 1:建立假设

    主要针对参数假设检验问题

    设有来自某分布族{F(x,θ)|θ∈Θ} 样本x1,...,xn,其中Θ 参数空间,设Θ0∈Θ,且Θ0≠ϕ,则命题H0:θ∈Θ0 为原假设或零假设(null hypothesis),若有另一个Θ1(Θ1∈Θ,Θ1Θ0=ϕ,常见的一种情况是Θ1=Θ−Θ0),则命题H1:θ∈Θ1 为H0 对立假设或备择假设(alternative hypotheis),当H0 简单假设,即Θ0 含一个点时,备择假设有三种可能:H1′:θ≠θ0,H1″:θ<θ0,H1‴:θ>θ0。

    Step 2:选择检验统计量,给出拒绝域形式

    根据样本计算统计量Z(如样本均值、标准差等,称为检验统计量),并基于某个法则既可以决定接受H0 是拒绝H0,具体地,当统计量在拒绝域W 即拒绝H0,在接受域W― 即接受H0。由此可见,一个拒绝域W 一确定一个检验法则,反之,一个检验法则也唯一确定一个拒绝域。

    注:不能用一个样本(例子)证明一个命题(假设成立),但是可以用一个样本(例子)去推翻一个命题。此外,拒绝域与接受域之间有一个模糊域,即统计量恰好符合法则,通常将模糊域归为接受域,因此接受域是复杂的。

    Step 3:选择显著性水平

    假设检验基于小概率事件,即小概率事件在一次试验中几乎不会发生,因此选择一个很小的概率值α,令拒绝为真p(拒绝H0|H0为真)≤α,表示Z∈W 一个小概率事件,在一次试验中不应该发生。如果通过样本得到的统计量z∈W,即不该发生的小概率事件竟然发生了,那么应该拒绝H0。

    由于向本是随机的,通常做检验时可能做出错误判断,由此引入了两个错误,分别为第一类错误和第二类错误,如下表所示。

    观测数据情况 总体情况 总体情况
    H0 真 H1 真
    接受H0 第一类错误(拒真) 正确
    拒绝H0 正确 犯第二类错误(取伪)

    犯第一类错误概率:α=P(X∈W|H0),即拒绝为真α=P(拒绝H0|H0为真);

犯第二类错误概率:β=P(X∈W―|H1),即接受为假β=P(接受H0|H0为假)。

可以证明的,在一定样本量下,两类错误概率无法共同减小,但是当样本增加时,可以同时减小。

证明该问题需要引入是函数,下面将简单介绍势函数,但不对上述结论证明。

定义:设检验问题H0:θ∈Θ0vsH1:θ∈Θ1 拒绝域为W,则样本观测值X 在拒绝域W 的概率称为该检验的势函数,记为

g(θ)=Pθ(X∈W),θ∈Θ=Θ0∪Θ1g(θ)={α(θ)θ∈Θ01−β(θ)θ∈Θ1

第一类错误概率α 为初始设定的很小的概率,称为置信水平,称该检验时显著性水平为α 显著性检验,简称水平为α 检验。为了尽量减少两类错误,可简单的将其简化为减小第一类错误概率(第二类错误概率难求)。常用的α=0.05 时也选择 0.1 或 0.01。

Step 4:给出拒绝域

为了使得第一类错误的概率尽可能小,给定一个较小的α,并选择一个数k,设定若Z≥k 绝H0,使得P(u=|z−μσ/n|≥k)≤α,所以k=uα/2。

注:算拒绝域时,需基于标准正态分布。

Step 5:做出判断

通过样本计算统计量,若统计量在拒绝域中,则拒绝原假设,否则接受原假设。

  1. **检验的p **

    不同置信水平α 取值,可能会存在不同的结果。因此引入新的指标,即利用样本观测值能够作出拒绝原假设的最小显著水平,称为**检验的p **。由检验的p 与心目中的显著性水平α 行比较,可以容易做出检验结论:

    • 若α≥p,则在显著性水平α 拒绝H0;
    • 若α<p,则在显著性水平α 接受H0.

    注:一般以p<0.05 为有统计学差异, p<0.01 为有显著统计学差异,p<0.001 有极其显著的统计学差异。

#概率论与数理统计
上次更新: 2025/06/25, 11:25:50
参数估计
先验分布与后验分布

← 参数估计 先验分布与后验分布→

最近更新
01
帮助信息查看
06-08
02
常用命令
06-08
03
学习资源
06-07
更多文章>
Theme by Vdoing | Copyright © 2022-2025 Geeks_Z | MIT License
京公网安备 11010802040735号 | 京ICP备2022029989号-1
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式