“回归”分析工具通过对一组观察值使用“最小二乘法”直线拟合来执行线性回归分析。本工具可用来分析单个因变量是如何受一个或几个自变量的值影响的。例如,观察某个运动员的运动成绩与一系列统计因素(如年龄、身高和体重等)的关系。可以基于一组已知的成绩统计数据,确定这3个因素分别在运动成绩测试中所占的比重,然后使用该结果对尚未进行过测试的运动员的表现进行预测。“回归”工具使用工作表函数LINEST。
下面通过实例说明如何进行回归分析。
STEP01:打开“回归分析.xlsx”工作簿,将要处理的数据输入工作表中,本例中的原始数据如图22-54所示。
STEP02:选中工作表中的任意一个单元格,如B1单元格,切换至“数据”选项卡,然后在“分析”组中单击“数据分析”按钮,打开如图22-55所示的“数据分析”对话框。在“分析工具”列表框中选择“回归”选项,然后单击“确定”按钮。
图22-54 原始数据
图22-55 选择“回归”分析工具
STEP03:随后会打开“回归”对话框,在“输入”列表区域中设置Y值输入区域为“$A$4:$A$13”,设置X值输入区域为“$B$4:$B$13”,勾选“标志”复选框与“置信度”复选框,并设置置信度为“95%”。然后在“输出选项”列表区域中单击选中“新工作表组”单选按钮,在“残差”列表区域中依次勾选“残差”、“残差图”、“标准残差”及“线性拟合图”复选框,最后在“正态分布”列表区域中勾选“正态概率图”复选框。设置完成后单击“确定”按钮即可返回工作表,如图22-56所示。
图22-56 设置回归参数
根据需要设置以下选项。
1)Y值输入区域:输入对因变量数据区域的引用,该区域必须由单列数据组成。
2)X值输入区域:输入对自变量数据区域的引用,Excel将对此区域中的自变量从左到右进行升序排列。自变量的个数最多为16。
3)置信度:如果需要在汇总输出表中包含附加的置信度信息,则选中此复选框。在右侧的框中输入所要使用的置信度,默认值为95%。
4)常数为零:如果要强制回归线经过原点,则选中此复选框。
5)输出区域:输入对输出表左上角单元格的引用。汇总输出表至少需要有6列,其中包括方差分析表、系数、y估计值的标准误差、r2值、观察值个数以及系数的标准误差。
6)残差:如果需要在残差输出表中包含残差,则选中此复选框。
7)标准残差:如果需要在残差输出表中包含标准残差,则选中此复选框。
8)残差图:如果需要为每个自变量及其残差生成一张图表,则选中此复选框。
9)线性拟合图:如果需要为预测值和观察值生成一张图表,则选中此复选框。
10)正态概率图:如果需要生成一张图表来绘制正态概率,则选中此复选框。
STEP04:此时,“Sheet1”工作表前会自动新建一张新的工作表“Sheet4”,工作表中会显示回归分析的具体结果,如图22-57所示。
图22-57 回归分析结果