一、独立性检验的定义和基本方法
1、定义
在2×2列联表中,利用随机变量$K^2$来判断“两个分类变量有关系”的方法称为独立性检验。
随机变量$K^2=frac{n(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d))}$,其中$n=a+b+c+d$为样本容量。
2、独立性检验一般用来判断两类因子彼此相关或相互独立。
3、独立性检验的基本方法
利用公式求出$K^2$的观测值,查表确定临界值$k_0$,再根据临界值表得出结论:
(1)如果$k<2.706$,就认为没有充分证据显示$X$与$Y$有关系;
(2)如果$k≥2.706$,就有90%的把握认为$X$与$Y$有关系;
(3)如果$k≥3.841$,就有95%的把握认为$X$与$Y$有关系;
(4)如果$k≥6.635$,就有99%的把握认为$X$与$Y$有关系;
(5)如果$k≥10.828$,就有99.9%的把握认为$X$与$Y$有关系。
注:(1)独立性检验的关键是正确列出$2×2$列联表,并计算出$K^2$的值;
(2)弄清判断两变量有关的把握性与犯错误概率的关系,根据题目要求作出正确的回答;
(3)$K^2$的值越大,说明“$X$与$Y$有关系”成立的可能性越大。
二、独立性检验的相关例题
下列关于回归分析与独立性检验的说法正确的是___
A.回归分析和独立性检验没有什么区别
B.回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系
C.独立性检验可以100%确定两个变量之间是否具有某种关系
D.回归分析是研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验
答案:D
解析:回归分析是指将具有相关关系的两个变量之间的数量关系进行测定,通过建立数学表达式进行统计估计和预测的统计研究方法。独立性检验是对两个变量之间是否具有某种关系的分析,并且可以分析这两个变量在多大程度上具有这种关系,但不能100%肯定这种关系。根据以上定义,可知A、B、C均错误,故选D。