生物统计学-Chapter 9 方差分析
00 分钟
2024-9-14
2024-11-19
type
status
date
slug
summary
tags
category
icon
password

方差分析的目的

  • 用于两个及两个以上样本均数差别的显著性检验
  • 多次使用两两t检验的问题:
    • 检验的过程会变得繁琐,n 个样本就需要执行 次检验。
    • 误差只能在每次比较的两个样本范围内进行估计,精确性相对较低,进而造成检验的 灵敏性不达预期。换句话说,多次俩俩 t 检验需要样本平均数之间具有更大的差异, 才能被检验方法判定为有显著差异。
    • 多次使用俩俩 t 检验,犯第一类错误的概率会增加,推断的可靠性会降低。

方差分析的基本原理

对于任何一个试验产生的观测值,造成他们取值差异的主要原因有二:试验因素带来的处理效应(TE)和试验过程中偶然性因素带来的误差效应(EE),即
  • 方差分析的数学模型
    • notion image
      代表每种处理下的小总体的总体平均数,代表随机误差,那么表中任意观测值可以表示为:
      大总体的总体平均数.
      之间的偏差,也就是A因素的第个水平的处理效应,记作,即,则有:,即单因素试验资料的线性模型
      若用样本的估计来替代所涉及的总体参数,则有,即样本的线性模型
      观测值的线性模型可分为三种: 1. 固定效应模型 指模型所涉及的处理效应都是固定的常量。而且因为,所以。固定效应模型中的处理是根据试验目的在试验前由试验人员人为选定。 2. 随机效应模型 指模型中所涉及的处理效应都是相互独立的随机变量,且服从正态分布。换句话说,每次试验得到的处理效应相当于从正态分布中随机抽取一个观测值。 3. 混合效应模型
  • 平方和与自由度分解
    • 平方和分解 SS = , 即总离均差平方和SS被成功分解为以下两个部分: 1. ,组内离均差平方和(),反应随机误差带来的差异. 2. ,组间偏差平方和(),反应k个小总体的样本平均数之间的偏差程度.
    • 自由度分解 处理效应的样本方差 误差效应的样本方差
  • 不同效应方差的数学期望
    • 误差效应:
    • 处理效应:,如果符合固定效应模型:,如果符合随机效应模型
  • 显著性检验
    • F检验 在检验中,零假设假定
  • 多重比较
    • 对于固定效应,F 检验得出有显著差异的结论,仅仅意味着 。究竟是哪个或哪些处理带来了不为 0 的效应值。为了解决这个问题,需要引入多重比较法
    • 最小显著差数法 比较两个样本平均数时,标准化统计量为。当$H_0$成立时,,有检验统计量。显著性水平的双尾检验需要,故,平均数差异达到显著水平的最小差数为
      • 缺点:LSD 法虽然摆脱了俩俩 t 检验在操作上复杂性,但是犯第一类错误可能性高的问题并没有解决。
      • 解决:Bonferroni 不等式(称为 Bonferroni 法)的近似计算公式:
    • 最小显著极差法
      • Tukey's HSD法 Tukey’s HSD 法需要计算出每两组之间的平均数差数和标准误,然后根据学生化极差分布来确定哪些组之间存在显著差异 ,与LSD法类似:
  • 方差分析的基本条件
    • 效应的可加性 方差分析的数学模型规定了,可见总效应等于处理效应和误差效应之和,这就是效应的可加性要求
    • 误差分布的正态性 方差分析首先要求试验误差服从正态分布,即。即每一个观测值应该围绕平均数呈正态分布
    • 误差方差的同质性 试验误差要求在不同的处理下都有相同的方差。
  • 单因素方差分析
    • 组内观测值数量相等
    • 组内观测值数量不相等
    • F 检验与 t 检验的关系 比较在例题 8.8中我们执行 t 检验的结果,会发现 t 检验的 P 值和 F 检验的 P 值完 全相等。之所以会如此,是因为自由度为 n − 1 的 t 分布的平方等于自由度为 (1, n − 1) 的 F 分布。将 t 检验所得的 t 值平方后刚好等于此处 F 检验所得的 F 值。
上一篇
NumPy学习笔记(一)前置知识、NumPy简介和环境配置
下一篇
测序基本原理