Excel 相关系数解读

相关系数与协方差一样是描述两个测量值变量之间的离散程度的指标。与协方差的不同之处在于,相关系数是成比例的,因此它的值与这两个测量值变量的表示单位无关。例如,如果两个测量值变量为重量和高度,当重量单位从磅换算成千克时,相关系数的值并不改变。任何相关系数的值都必须介于-1和+1之间(包括-1和+1)。

提示:可以使用相关系数分析工具来检验每对测量值变量,以便确定两个测量值变量是否趋向于同时变动,即,一个变量的较大值是否趋向于与另一个变量的较大值相关联(正相关);或者一个变量的较小值是否趋向于与另一个变量的较大值相关联(负相关);或者两个变量的值趋向于互不关联(相关系数近似于零)。

下面通过实例说明如何进行相关系数分析。

步骤1:将要处理的数据按图22-27所示输入到工作表中。

步骤2:单击“数据”选项卡,然后单击“分析”组中的“数据分析”命令,打开“数据分析”对话框。

步骤3:选中“分析工具”列表中的“相关系数”,如图22-28所示。

图22-27 输入将要处理的数据

步骤4:单击“确定”按钮,打开“相关系数”对话框。

步骤5:按如图22-29所示设置各选项。

图22-28 选中“分析工具”列表中的“相关系数”

图22-29 设置相关系数选项

步骤6:单击“确定”按钮,即可看到分析的结果,如图22-30所示。

图22-30 相关系数分析结果

提示:如果要指定输入区域中的数据是按行还是按列排列,则在“分组方式”右侧选择“逐行”或“逐列”单选按钮。

从相关系数分析结果可以看出,月销售额与销售成本之间的相关系数达到了0.990317,说明两者之间呈现良好的正相关性。

Excel 相关系数分析图解

相关系数与协方差一样是描述两个测量值变量之间的离散程度的指标。与协方差的不同之处在于,相关系数是成比例的,因此它的值与这两个测量值变量的表示单位无关。例如,如果两个测量值变量为重量和高度,当重量单位从磅换算成千克时,相关系数的值并不改变。任何相关系数的值都必须为-1~+1(包括-1和+1)。

可以使用相关系数分析工具来检验每对测量值变量,以便确定两个测量值变量是否趋向于同时变动,即,一个变量的较大值是否趋向于与另一个变量的较大值相关联(正相关);或者一个变量的较小值是否趋向于与另一个变量的较大值相关联(负相关);或者两个变量的值趋向于互不关联(相关系数近似于零)。

下面通过实例说明如何进行相关系数分析。

STEP01:打开“相关系数分析.xlsx”工作簿,将要处理的数据输入工作表中,本例中的原始数据如图22-38所示。

STEP02:选中工作表中的任意一个单元格,如B3单元格,切换至“数据”选项卡,然后在“分析”组中单击“数据分析”按钮,打开如图22-39所示的“数据分析”对话框。在“分析工具”列表框中选择“相关系数”选项,然后单击“确定”按钮。

图22-38 原始数据

选择“相关系数”分析工具

图22-39 选择“相关系数”分析工具

STEP03:随后会打开“相关系数”对话框,在“输入”列表区域设置输入区域为“$B$4:$G$5”,在“分组方式”列表下单击选中“逐行”单选按钮。然后在“输出选项”列表区域中单击选中“输出区域”单选按钮,并设置输出区域为“$A$7”单元格,最后单击“确定”按钮返回工作表,如图22-40所示。

STEP04:此时,工作表中会显示“相关系数”的分析结果,如图22-41所示。

图22-40 设置相关系数参数

相关系数分析结果

图22-41 相关系数分析结果

从相关系数分析结果可以看出,月销售额与销售成本之间的相关系数达到了0.990317,说明两者之间呈现良好的正相关性。

Excel 计算数据集间相关系数:CORREL函数

CORREL函数用于计算单元格区域array1和array2之间的相关系数。使用相关系数可以确定两种属性之间的关系。例如,可以检测某地的平均温度和空调使用情况之间的关系。CORREL函数的语法如下:


CORREL(array1,array2)

其中,array1参数为第1组数值单元格区域,array2参数为第2组数值单元格区域。下面通过实例详细讲解该函数的使用方法与技巧。

打开“CORREL函数.xlsx”工作簿,切换至“Sheet1”工作表,本例中的原始数据如图18-76所示。该工作表中记录了两组数据集,要求计算这两个数据集的相关系数。具体的操作步骤如下。

选中A8单元格,在编辑栏中输入公式“=CORREL(A2:A6,B2:B6)”,用于计算两个数据集的相关系数,输入完成后按“Enter”键返回计算结果,如图18-77所示。

图18-76 原始数据

图18-77 计算相关系数

如果数组或引用参数包含文本、逻辑值或空白单元格,则这些值将被忽略;但包含零值的单元格将计算在内。如果array1参数和array2参数的数据点的个数不同,函数CORREL返回错误值“#N/A”。如果array1参数或array2参数为空,或者其数值的s(标准偏差)等于零,函数CORREL返回错误值“#DIV/0!”。相关系数的计算公式为:

其中x和y是样本平均值AVERAGE(array1)和AVERAGE(array2)。

Excel 2019相关系数分析图解

相关系数是描述两个测量值变量之间的离散程度的指标。利用相关系数,可以判断两个测量值变量的变化是否相关。下面以具体实例详细讲解如何利用相关系数,来分析数据的具体应用技巧。

STEP01:打开“相关系数分析.xlsx”工作簿,切换到“数据”选项卡,然后在“分析”组中单击“数据分析”按钮,打开“数据分析”对话框,如图7-51所示。

STEP02:打开“数据分析”对话框后,在“分析工具”列表框中选择“相关系数”选项,然后单击“确定”按钮,如图7-52所示。

图7-51 单击“数据分析”按钮

图7-52 选择相关系数分析工具

STEP03:随后会打开“相关系数”对话框,在“输入”列表区域设置输入区域为“$A$3:$C$12”,在“分组方式”列表中单击选中“逐列”单选按钮,并勾选“标志位于第一行”复选框,在“输出选项”列表中单击选中“输出区域”单选按钮,设置输出区域为“$E$3”单元格,最后单击“确定”按钮,如图7-53所示。此时,即可在从E3开始的单元格中看到分析的结果,如图7-54所示。

 设置相关系数属性参数

图7-53 设置相关系数属性参数

相关系数分析结果

图7-54 相关系数分析结果