在这里,
- n表示数据集中的数据点数量
- k表示自变量的个数
- R代表模型确定的R方值
因此,如果R方在增加一个新的自变量时没有显著增加,那么调整R方值实际上会减少。
另一方面,如果增加新的自变量,我们看到R方值显著增加,那么调整R方值也会增加。
如果我们在模型中加入一个随机自变量,我们可以看到R方值和调整R方值之间的差异。
如你所见,添加随机独立变量无助于解释目标变量的变化。我们的R方值保持不变。因此,给我们一个错误的指示,这个变量可能有助于预测输出。然而,调整R方值下降,表明这个新变量实际上没有捕捉到目标变量的趋势。
显然,当回归模型中存在多个变量时,最好使用调整R方。这将使我们能够比较具有不同数量独立变量的模型。
结尾
在这篇文章中,我们研究了R方统计值是什么,它在哪里不稳定。我们还研究了调整R方。
希望这能让你更好地理解事情。现在,你可以谨慎地确定哪些自变量有助于预测回归问题的输出。
,