某个偏相关系数不显著的情况下如何求其他的偏相关系数
多谢大侠百忙之中的热情支持。 (一)您在上次回答提到:“多元线性回归分析中,因变量y与各个自变量偏相关关系是否显著,互相之间是不影响的”。我看到的例子好像不是这样的。 莫惠栋编的《农业试验统计》(上海科学技术出版社,1984年)第521页“最优多元线性回归方程的统计选择——逐步回归法”,在“1.逐个淘汰不显著自变数的回归方法”的例14.7,X1是小麦的每株穗数,X2每穗中能结实的小穗数,X3是百粒重,X4是株高,Y是每株籽粒产量,求回归方程,结果是,因X1、X2、X3和X4 的偏回归MS值分别是102.158、8.597、20.57和0.66,F值分别是55.47、4.67、1.17和<1。 第526页写道:四元回归是极显著的,但X2、X4的偏回归不显著,其中以X4的偏回归平方和最小,所以剔除X4再做第二步分析,得Y=2.01X1+0.67X2+7.83X3-46.96,因X1、X2、X3 的偏回归MS值分别是101.51、9.27、20.76,F值分别是58.53、5.34、11.97,又写道:“三元回归和三个自变数的偏回归都是极显著或显著,不需再作第三步回归了。” 我的理解是:在本例中,做四元回归时,X2的偏回归不显著,但去掉X4后做三元回归,X2就显著了,也就是说X4会影响X3偏回归的显著性,所以必须将X4去掉,重新求回归的显著性(跟您的说法有矛盾)。 问题:本例中X4去掉,重新求三元回归方程,假如X2的偏回归仍不显著,以此类推,就必需去掉X2再求二元回归方程吗? (二)我碰到的问题是如何求偏相关系数。 (1)该书549页“偏相关系数及假设检验”的例14.14,沿用上面小麦籽粒的例子,作者在题目就直接写“(X4已剔除,不参加分析)”。例题的结论是各r的显著性和各X的偏回归显著性是一致的。 问题:例中求偏相关时为什么要剔除X4呢?是必须的吗? (2)我做过类似的题目,y与x1,x2,x3的偏相关系数r1,r2,r3,其中r1极显著,后二者都不显著,去掉x3数据再算得r1’和r2’,其中r1’仍极显著,r2’仍不显著,去掉x2数据求偏相关,r1’’仍极显著。 问题(A)r1极显著,就可以下最后结论即y与x1偏相关极显著,无需这么麻烦再求r1’和r1’’了,对吗? (B)y与x1的偏相关系数是以r1或以r1’和r1’’为准?(这是我始终要知道的答案,我看了不少应用统计的书,都没有这方面的例题,谢谢) 我的邮箱fpliu5334@
实际上,统计学并不属于数学的范畴,所以这个问题在这里问,很少有人回答的。 (一)逐步回归的思想是试图在众多的自变量中,找出对因变量影响最显著的少数几个自变量,建立回归方程。好处是建立的回归方程比较简单,但同时也因此损失了很多信息,有可能最后得到的回归方程是与实际情形不符的。好在搞应用数学工作的还会有最后一个工作环节:到实际中去检验得到的结论是否正确。 剔除一个或几个相关不显著的自变量以后,成了一个全新的题目,一切都需要重新再来。 逐步回归的思想就是想剔除一些自变量,这是它现在主要做的事情,这里并不是在检验相关显著性,你把两件事混在一起了。 (二)检验相关显著性是不需要剔除任何自变量的,你应该看“逐步回归”以前的例题,逐步回归的工作就是为了尽可能多地剔除自变量,最后建立比较简洁的回归方程。
答:详情>>
答:详情>>