卡方的原理及python代码实现

** 卡方检验的原理 **

卡方检验（chi-square test）是一种用于验证两个分类变量之间是否存在相关性的统计方法。它的基本思想是比较观察值与期望值之间的差异是否显著，如果差异显著大，则可以拒绝两个变量之间独立的假设。卡方检验可以用于分析两个分类变量之间的关联性，也可以用于衡量实际观测值与理论分布之间的拟合程度。

**1. 计算卡方统计量 **
在进行卡方检验之前，首先需要计算卡方统计量。卡方统计量的计算公式如下：
χ² = Σ[(O_i - E_i)² / E_i]
其中，O_i 表示观察到的频次，E_i 表示期望的频次。

**2. 计算自由度 **
计算卡方统计量后，需要计算自由度。自由度的计算公式为：
df = (行数 -1) * (列数 -1)
其中，行数表示变量的行数，列数表示变量的列数。

**3. 查找临界值 **
接下来，需要查找卡方统计量的临界值。我们可以根据自由度和显著性水平（通常为 0.05 或 0.01）在卡方分布表中查找相应的临界值。

**4. 判断结果 **
最后，根据卡方统计量与临界值的比较结果来判断是否拒绝原假设。如果卡方统计量大于临界值，则拒绝原假设，可以认为两个变量之间存在相关性；反之，接受原假设，认为两个变量之间独立。

**Python 代码实现 **

下面是使用 Python 实现卡方检验的示例代码：

import numpy as np
from scipy.stats import chi2_contingency

# 构造原始观察矩阵
observed = np.array([[10, 20, 30],
                    [20, 30, 40],
                    [30, 40, 50]])

# 进行卡方检验
chi2, p, dof, expected = chi2_contingency(observed)

# 输出结果
print("卡方统计量：", chi2)
print("自由度：", dof)
print("期望频次：", expected)
print("p 值：", p)

以上代码使用了 numpy 数组模块和 scipy 统计模块中的 chi2_contingency 函数。首先，我们构造了一个原始观察矩阵，其中的数字代表了不同变量的频次。然后，使用 chi2_contingency 函数进行卡方检验，返回了卡方统计量、自由度、期望频次和 p 值等结果。最后，打印了这些结果。

卡方的原理及python代码实现

微信分享二维码

猜您想看

制定杀敌计划以获得更多击杀

Python中怎么爬取各种文档类型

如何在MySQL中使用备份表？

SQL Server如何修改分区表中的数据

python urllib.parse的常用方法有哪些

JAVA之sleep/wait/notify/notifyAll的作用有哪些

评论区(暂无评论)

啊哦，评论功能已关闭～