失拟检验是一种用来判断回归模型是否可以接受的检验。判断模型好坏主要通过残差分析,而残差是由两部分组成的;一部分是随机的,即使模型拟合得再好,它也消除不了,称为随机误差或纯误差;另一部分与模型有关,模型合适,这部分的值就小,模型不合适,这部分的值就大,称为失拟误差。失拟检验就是以失拟误差对纯误差的相对大小来作判断的:倘失拟误差显著地大于纯误差,那么就放弃模型;如并不显著地大于纯误差,那么就可以接受该模型。失拟检验的前提是要求在自变量x的若干值处进行重复试验1。

基本介绍

在研究因变量y与自变量x的相关关系表达形式时,若在同一x有重复试验或观察时,可以对回归函数是否为x的线性函数进行检验,称为失拟检验。即要检验的假设为

设这时所收集的观察数据为,其中至少一个

,记,则可以先对N组数据建立y关于x的一元线性回归方程,并作平方和分解SST=SSR+SSE,那么检验假设(1)的统计量是

拒绝域为

其中

分别称为误差的偏差平方和与它的自由度,而

分别称为失拟平方和与它的自由度,而。2

例题分析

为研究某种合金的抗拉强度y(kg/mm2)与合金中的碳含量x的关系,收集了92组数据,建立了一元线性回归方程:

并得残差平方和为SSE=612.5145,在92组数据中,仅有24个不同的x值,不同的x值下的重复试验次数及对应于每一个x值的个数据的偏差平方和列在表1中,试进行失拟检验.()

表1 不同的x值对应的重复次数mi及相应的偏差平方和
偏差平方和
10.0310
20.0426.1250
30.0544.1875
40.0620.1250
50.0737.1667
60.0870.3571
70.0 91241.7500
80.101045.2250
90.11515.7000
100.12740.4286
110.131157.0455
120.14442.1875
130.154124.6875
140.1646.1875
150.1710
160.1810
170.20310.5000
180.2138.1667
190.2310
200.2436.0000
210.2510
220.2610
230.2910
240. 3210

解: 由表1知

又由(5)知

则由(2)知

对给定的显著性水平,由于,因此可以认为是x的线性函数2。

本词条内容贡献者为:

刘军 - 副研究员 - 中国科学院工程热物理研究所

失拟检验

图文简介

失拟检验是一种用来判断回归模型是否可以接受的检验。判断模型好坏主要通过残差分析,而残差是由两部分组成的;一部分是随机的,即使模型拟合得再好,它也消除不了,称为随机误差或纯误差;另一部分与模型有关,模型合适,这部分的值就小,模型不合适,这部分的值就大,称为失拟误差。失拟检验就是以失拟误差对纯误差的相对大小来作判断的:倘失拟误差显著地大于纯误差,那么就放弃模型;如并不显著地大于纯误差,那么就可以接受该模型。失拟检验的前提是要求在自变量x的若干值处进行重复试验。