Excel 协方差解读

与相关系数一样,协方差也是用于描述两个测量值变量之间离散程序的指标。当需要对一组个体进行观测而获得了N个不同的测量值变量时,“相关系数”和“协方差”工具可以在相同设置下使用,两者都会提供一张输出表,其中分别显示每对测量值变量之间的相关系数或协方差。不同之处在于相关系数的取值在-1和+1之间(包括-1和+1),而协方差则没有限定的取值范围。

“协方差”工具为每对测量值变量计算工作表函数COVAR的值。在“协方差”工具的输出表中的第i行、第i列的对角线上的输入值是第i个测量值变量与其自身的协方差,这正好是用工作表函数VARP计算得出的变量的总体方差。

提示:可以使用“协方差”工具来检验每对测量值变量,以便确定两个测量值变量是否趋向于同时变动,即一个变量的较大值是否趋向于与另一个变量的较大值相关联(正相关);或者一个变量的较小值是否趋向于与另一个变量的较大值相关联(负相关);或者两个变量中的值趋向于互不关联(协方差近似于零)。

应用COVAR函数计算协方差

COVAR函数用来计算协方差,即每对数据点的偏差乘积的平均数,利用协方差可以决定两个数据集之间的关系。例如,可利用它来检验教育程度与收入档次之间的关系。COVAR函数的语法如下。


COVAR(array1,array2)

其中参数array1为第一个所含数据为整数的单元格区域,array2为第二个所含数据为整数的单元格区域。

【背景知识】协方差计算公式为:

其中x和y是样本平均值AVERAGE(array1)和AVERAGE(array2),且n是样本大小。

【典型案例】某工厂统计了不同加工条件(数据1)下设备的成品数量(数据2),需要计算两组数据的协方差。基础数据如图16-11所示。

步骤1:打开例子工作簿“COVAR.xlsx”。

步骤2:在单元格A8中输入公式“=COVAR(A2:A6,B2:B6)”,用于计算协方差,即上述每对数据点的偏差乘积的平均数。计算结果如图16-12所示。

图16-11 原始数据

图16-12 计算结果

【使用指南】参数必须是数字,或者是包含数字的名称、数组或引用。如果数组或引用参数包含文本、逻辑值或空白单元格,则这些值将被忽略,但包含零值的单元格将计算在内。如果array1和array2所含数据点的个数不等,则函数COVAR返回错误值“#N/A”。如果array1和array2当中有一个为空,则函数COVAR返回错误值“#DIV/0!”。

Excel 协方差分析

与相关系数一样,协方差也是用于描述两个测量值变量之间离散程序的指标。当需要对一组个体进行观测而获得了N个不同的测量值变量时,“相关系数”和“协方差”工具可以在相同设置下使用,两者都会提供一张输出表,其中分别显示每对测量值变量之间的相关系数或协方差。不同之处在于相关系数的取值为-1~+1(包括-1和+1),而协方差则没有限定的取值范围。

“协方差”工具为每对测量值变量计算工作表函数COVAR的值。在“协方差”工具的输出表中的第i行、第i列的对角线上的输入值是第i个测量值变量与其自身的协方差,这正好是用工作表函数VARP计算得出的变量的总体方差。

可以使用“协方差”工具来检验每对测量值变量,以便确定两个测量值变量是否趋向于同时变动,即,一个变量的较大值是否趋向于与另一个变量的较大值相关联(正相关);或者一个变量的较小值是否趋向于与另一个变量的较大值相关联(负相关);或者两个变量中的值趋向于互不关联(协方差近似于零)。

Excel 计算协方差:COVAR函数实例图解

COVAR函数用来计算协方差,即每对数据点的偏差乘积的平均数,利用协方差可以决定两个数据集之间的关系。例如,可利用它来检验受教育程度与收入档次之间的关系。COVAR函数的语法如下:


COVAR(array1,array2)

其中,array1参数为第1个所含数据为整数的单元格区域,Array2参数为第2个所含数据为整数的单元格区域。

协方差计算公式为:

其中x和y是样本平均值AVERAGE(array1)和AVERAGE(array2),且n是样本大小。下面通过实例详细讲解该函数的使用方法与技巧。

某工厂统计了不同加工条件(数据1)下设备的成品数量(数据2),需要计算两组数据的协方差。打开“COVAR函数.xlsx”工作簿,切换至“Sheet1”工作表,本例中的原始数据如图18-12所示。具体的操作步骤如下所示。

选中A8单元格,在编辑栏中输入公式“=COVAR(A2:A6,B2:B6)”,用于计算协方差,即上述每对数据点的偏差乘积的平均数,输入完成后按“Enter”键返回计算结果,如图18-13所示。

图18-12 原始数据

图18-13 计算协方差

参数必须是数字,或者是包含数字的名称、数组或引用。如果数组或引用参数包含文本、逻辑值或空白单元格,则这些值将被忽略;但包含零值的单元格将计算在内。如果array1参数和array2参数所含数据点的个数不等,则函数COVAR返回错误值“#N/A”。如果array1参数和array2参数当中有一个为空,则函数COVAR返回错误值“#DIV/0!”。

Excel 2019协方差分析图解

与相关系数一样,协方差是描述两个测量值变量之间的离散程度的指标,即用来衡量两个样本之间的相关性有多少,也就是一个样本的值的偏离程度会对另外一个样本的值的偏离产生多大的影响。下面以实例具体说明如何计算协方差。

STEP01:打开“协方差分析.xlsx”工作簿,切换到“数据”选项卡,然后在“分析”组中单击“数据分析”按钮,打开如图7-55所示的“数据分析”对话框。在“分析工具”列表框中选择“协方差”选项,然后单击“确定”按钮。

STEP02:随后会打开

图7-55 选择协方差分析工具

“协方差”对话框,在“输入”列表区域设置输入区域为“$A$3:$C$12”,在“分组方式”列表中单击选中“逐列”单选按钮,并勾选“标志位于第一行”复选框,在“输出选项”列表中单击选中“输出区域”单选按钮,设置输出区域为“$E$3”单元格,最后单击“确定”按钮,如图7-56所示。此时,可在从E3开始的单元格中看到分析的结果,如图7-57所示。

设置协方差属性参数

图7-56 设置协方差属性参数

协方差分析结果

图7-57 协方差分析结果