आर में एलएम और एनोव के बीच सूचित पी-मूल्यों में अंतर


12

निम्नलिखित aovऔर lmकॉल में पी-वैल्यू में अंतर क्या बताते हैं? क्या अंतर केवल विभिन्न प्रकार के रकम-वर्गों की गणना के कारण है?

set.seed(10)
data=rnorm(12)
f1=rep(c(1,2),6)
f2=c(rep(1,6),rep(2,6))
summary(aov(data~f1*f2))
summary(lm(data~f1*f2))$coeff

जवाबों:


13

summary(aov)तथाकथित I (क्रमिक) वर्गों के योगों का उपयोग करता है। summary(lm)तथाकथित III प्रकार के वर्गों का उपयोग करता है, जो अनुक्रमिक नहीं है। देखें गुंग के जवाब जानकारी के लिए।


ध्यान दें कि आपको कॉल करने की आवश्यकता है lm(data ~ factor(f1) * factor(2))( aov()स्वचालित रूप से कारकों के आरएचएस को धर्मान्तरित करता है)। फिर रेखीय प्रतिगमन में सामान्य स्थैतिक के लिए भाजक पर ध्यान दें ( आगे स्पष्टीकरण के लिए यह उत्तर देखें ):टी

टी=ψ^-ψ0σ^सी'(एक्स'एक्स)-1सी

प्रत्येक परीक्षण किया के लिए अलग हैβक्योंकि वेक्टर गुणांक बदल जाता है। इसके विपरीत, एनोवाएफमें भाजकसी'(एक्स'एक्स)-1सीβसीएफ -est में हर हमेशा MSE होता है।


1
मुझे लगता है कि इस उत्तर का पहला वाक्य गलत है। विभिन्न प्रकार के वर्गों के योग के कारण अंतर ठीक प्रतीत होता है : अर्थात्, I बनाम टाइप II / III। टाइप I अनुक्रमिक है, जो कि lmरिपोर्ट करता है, जबकि टाइप II / III नहीं है। यह @ गंग के उत्तर में काफी कुछ विस्तार से बताया गया है जिससे आप जुड़े हुए हैं।
अमीबा का कहना है कि मोनिका

@amoeba आप उत्तर को सही करने के लिए क्या सुझाव देते हैं?
कारकल

मैंने पहले पैराग्राफ को संपादित किया है, देखें कि क्या आप एडिट के साथ ठीक हैं, और जैसा आप चाहें वैसा ही इसे बदलने के लिए स्वतंत्र महसूस करें।
अमीबा का कहना है कि मोनिका

2
set.seed(10)
data=rnorm(12)
f1=rep(c(1,2),6)
f2=c(rep(1,6),rep(2,6))
summary(aov(data~f1*f2))
            Df Sum Sq Mean Sq F value Pr(>F)
f1           1  0.535  0.5347   0.597  0.462
f2           1  0.002  0.0018   0.002  0.966
f1:f2        1  0.121  0.1208   0.135  0.723
Residuals    8  7.169  0.8962               
summary(lm(data~f1*f2))$coeff
               Estimate Std. Error    t value  Pr(>|t|)
(Intercept)  0.05222024   2.732756  0.0191090 0.9852221
f1          -0.17992329   1.728346 -0.1041014 0.9196514
f2          -0.62637109   1.728346 -0.3624106 0.7264325
f1:f2        0.40139439   1.093102  0.3672066 0.7229887

ये दो अलग-अलग कोड हैं। Lm मॉडल से आपको गुणांक की आवश्यकता होती है। जबकि aov मॉडल से आप केवल भिन्नता के स्रोतों को सारणीबद्ध कर रहे हैं। कोड का प्रयास करें

anova(lm(data~f1*f2))
Analysis of Variance Table

Response: data
          Df Sum Sq Mean Sq F value Pr(>F)
f1         1 0.5347 0.53468  0.5966 0.4621
f2         1 0.0018 0.00177  0.0020 0.9657
f1:f2      1 0.1208 0.12084  0.1348 0.7230
Residuals  8 7.1692 0.89615   

यह भिन्नता के स्रोतों का सारणीकरण देता है जिससे समान परिणाम प्राप्त होते हैं।


2
यह प्रश्न का उत्तर देने के लिए प्रकट नहीं होता है, जो पूछता है कि आपके शीर्ष पैनल के दो सारांशों में पी-मान क्यों f1और f2भिन्न हैं। ऐसा लगता है कि आप केवल दिखा रहे हैं कि summary(aov(...))और anova(lm(...))में Rसमान उत्पादन की है।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.