生物统计学-Chapter 13 非参数检验
00 分钟
2024-9-14
2024-11-19
type
status
date
slug
summary
tags
category
icon
password
  • 定义
    • 关于样本平均数、样本方差的假设检验,包括方差分析、回归分析和相 关分析(仅限 Pearson 相关分析),都是关于总体参数的检验。因此,统计学上将它们统称为参数检验(parametric test)。
      对于非正态的、未知的总体,则须用非参数检验(non-parametric test)。 它是一类与总体分布无关的检验方法,对总体分布的具体形式不作任何限制性的假定,不以总体参数的具体数值估计或检验为目的。
  • 卡方检验
    • 适合性检验 or 其中代表观测频数,表示理论频数。 对一组具体的样本算出后,如果零假设成立,即理论值与观测值相等,或称拟合,出现像这么大的差异或更大的差异的概率就是拟合优度。 计算值需要注意以下两点:
        1. 任一理论频数值都必须大于5。如果,统计量会明显偏离分布。
        1. 时,相应的分布有自由度。需要对统计量进行连续性矫正,矫正公式为:
    • 独立性检验 列联表是观测数据按两个或更多属性(定性变量)分类时所列出的频数表。如图所示:
      • notion image
        检验统计量为:
  • 符号检验
    • 单样本的符号检验 假设有一个未知分布的总体,其中位数为 。现在从该总体中随机抽取个观测值,记作。令。 记个符号中“+”的个数为的概率为:
    • 成对数据的符号检验 对于成对数据,也可使用符号检验来完成比较。将数据按照配对关系做减法,记录差值的符号。问题就转化为了单样本的符号检验,成对的 t 检验判断的是差值的总体平均数是否等于 0,而符号检验判断的是差值的总体中位数是否等于 0。
  • 秩和检验
    • 通过将观测值由小到大排列,每一个观测值按照次 序排列中的位置编号,也就是秩(rank),重新编码。然后计算出秩和(rank sum) 进行检验。秩和检验效率高于符号检验,因为它除了比较差值的符号外,还比较差值的秩大小。
    • 成组数据的秩和检验 e.g. 随机选取 4 块地不允许有杂草,其它 4 块地每行间正好有 3 株羊角芹。 实验得玉米产量 (kg/mu): 无杂草地块 700.14, 723.24, 693.00, 742.98(记作 A 组); 少量杂草地块 666.12, 740.88, 643.02, 655.20(记作 B 组)643.02 655.20 666.12 693.00 700.14 723.24 740.88 742.98 将以上排序队列中的数字转换成位置编号,也就是秩,得 1 2 3 4 5 6 7 8
      • 再将 A 组和 B 组的秩分别求和,得秩和 13 23
        假设少量杂草对产量没有影响(零假设 ),我们应当看到 。 但是,当前的实际情况是 ,偏离了零假设成立时的理论值 18。
    • 成组数据的符号秩检验 为克服符号检验未充分用数据信息的缺点,Wilcoxon 对其进行了改进, 提出了符号秩检验(signed rank test),也称 Wilcoxon 配对检验。 将所有负差值的秩求和得 ,将所有正差值的秩求和得 。两个秩和中的较小者,即为Wilcoxon 符号秩统计量。
      • notion image
上一篇
NumPy学习笔记(一)前置知识、NumPy简介和环境配置
下一篇
测序基本原理