आर: एनोवा और रैखिक प्रतिगमन


9

मैं आंकड़ों के लिए नया हूं और मैं एनोवा और रैखिक प्रतिगमन के बीच के अंतर को समझने की कोशिश कर रहा हूं। मैं इसका पता लगाने के लिए R का उपयोग कर रहा हूं। मैंने विभिन्न लेखों के बारे में पढ़ा कि एनोवा और प्रतिगमन अलग-अलग क्यों हैं, लेकिन फिर भी समान हैं और कैसे कल्पना की जा सकती है आदि। मुझे लगता है कि मैं वहां बहुत सुंदर हूं लेकिन एक बिट अभी भी गायब है।

मैं समझता हूं कि एनोवा समूह के बीच भिन्नता वाले समूहों के बीच भिन्नता की तुलना यह निर्धारित करने के लिए करता है कि परीक्षण किए गए समूहों में से कोई अंतर है या नहीं। ( https://controls.engin.umich.edu/wiki/index.php/Factor_analysis_and_ANOVA )

रैखिक प्रतिगमन के लिए, मुझे इस फोरम में एक पोस्ट मिली, जिसमें कहा गया है कि जब हम परीक्षण करते हैं कि क्या बी (ढलान) = 0. का परीक्षण किया जा सकता है ( तो ANOVA को क्यों सिखाया / इस्तेमाल किया जाता है जैसे कि यह रैखिक प्रतिगमन की तुलना में एक अलग शोध पद्धति है? )

दो से अधिक समूहों के लिए मुझे एक वेबसाइट मिली जिसमें कहा गया था:

अशक्त परिकल्पना है: H0:µ1=µ2=µ3

रैखिक प्रतिगमन मॉडल है: y=b0+b1X1+b2X2+e

हालांकि, रैखिक प्रतिगमन का आउटपुट है, फिर एक समूह के लिए अवरोधन और अन्य दो समूहों के लिए इस अवरोधन का अंतर। ( http://www.real-statistics.com/multiple-regression/anova-use-regression/ )

मेरे लिए, यह ऐसा दिखता है कि वास्तव में अंतर की तुलना की जाती है और ढलान की नहीं?

एक और उदाहरण जहां वे ढलानों के बजाय इंटरसेप्ट्स की तुलना करते हैं, यहां पाया जा सकता है: ( http://www.theanalysisfactor.com/why-anova-and-linear-regression-are-the-same-analysis/ )

मैं अब यह समझने के लिए संघर्ष कर रहा हूं कि रेखीय प्रतिगमन में वास्तव में क्या तुलना है? ढलान, इंटरसेप्ट या दोनों?


जवाबों:


16

ऐसा लगता है कि वास्तव में अंतर की तुलना की जाती है और ढलान की नहीं?

वहां आपका भ्रम इस तथ्य से संबंधित है कि आपको इस बारे में स्पष्ट होने के लिए बहुत सावधान रहना चाहिए कि आप किस अर्थ और ढलान का अर्थ रखते हैं (किस का अवरोधन? क्या ढलान?)।

एक प्रतिगमन में 0-1 डमी के गुणांक की भूमिका को ढलान और अंतर के अंतर के रूप में माना जा सकता है ।

दो-नमूने के मामले पर विचार करके, जहां तक ​​संभव हो चीजों को सरल बनाएं।

हम अभी भी दो नमूनों के साथ एक-तरफ़ा एनोवा कर सकते हैं लेकिन यह अनिवार्य रूप से दो-पूंछ वाले दो नमूना टी-टेस्ट (समान विचरण मामले) के समान है।

यहाँ जनसंख्या की स्थिति का एक चित्र है:

दो समूह का अर्थ है प्रतिगमन, जनसंख्या की स्थिति

यदि , तो जनसंख्या रैखिक मॉडल हैδ=μ2μ1

y=μ1+δx+e

ताकि जब (जो कि जब हम समूह 1 में हो), तो का अर्थ और जब (जब हम समूह 2 में हों) का मतलब ।x=0yμ1+δ×0=μ1x=1yμ1+δ×1=μ1+μ2μ1=μ2

यह ढलान का गुणांक है ( इस मामले में ) और साधनों में अंतर (और हो सकता है कि आप उन साधनों के बारे में सोचते हों) समान मात्रा है।δ

संक्षिप्तता में मदद करने के लिए, यहाँ दो नमूने हैं:

Group1:  9.5  9.8 11.8
Group2: 11.0 13.4 12.5 13.9

वो कैसे दिखते हैं?

नमूना साजिश

साधनों में अंतर का परीक्षण कैसा दिखता है?

टी-टेस्ट के रूप में:

    Two Sample t-test

data:  values by group
t = -5.0375, df = 5, p-value = 0.003976
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -4.530882 -1.469118
sample estimates:
mean in group g1 mean in group g2 
             9.9             12.9 

एक प्रतिगमन के रूप में:

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   9.9000     0.4502  21.991 3.61e-06 ***
groupg2       3.0000     0.5955   5.037  0.00398 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Residual standard error: 0.7797 on 5 degrees of freedom
Multiple R-squared:  0.8354,    Adjusted R-squared:  0.8025 
F-statistic: 25.38 on 1 and 5 DF,  p-value: 0.003976

हम प्रतिगमन में देख सकते हैं कि अवरोधन शब्द समूह 1 का माध्य है, और समूह 2 गुणांक ('ढलान' गुणांक) समूह साधनों में अंतर है। इस बीच प्रतिगमन के लिए पी-मान टी-टेस्ट (0.003976) के लिए पी-मूल्य के समान है


इस अत्यंत सहायक उदाहरण के लिए बहुत बहुत धन्यवाद। मुझे बस एहसास हुआ कि अभी भी एक खुला सवाल है। मुझे समझ नहीं आ रहा है कि ढलान को μ2? Μ1 के रूप में क्यों दर्शाया गया है? क्या ढलान को m = डेल्टा Y / डेल्टा X के रूप में परिभाषित नहीं किया गया है?
पॉल

2
यह है; लेकिन और और इसलिए । संक्षेप में, जब आप 0/1 के रूप में कोड करते हैं, तो ढलान अंतर होता है। Δx=10=1Δy=(μ1+δ×1)(μ1+δ×0)=δ=μ2μ1Δy/Δx=(μ2μ1)/1=μ2μ1
Glen_b -Reinstate मोनिका

+1 ढलान क्यों ढलान पर अंतर के बराबर है पर चित्रण उदाहरण ने मुझे बहुत मदद की !!
हाइताओ डू
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.