वे सभी एक ही मूल सांख्यिकीय पद्धति के संस्करण कैसे हैं?
वे सभी एक ही मूल सांख्यिकीय पद्धति के संस्करण कैसे हैं?
जवाबों:
इस बात पर विचार करें कि वे सभी एक प्रतिगमन समीकरण के रूप में लिखे जा सकते हैं (शायद उनके पारंपरिक रूपों की तुलना में थोड़ी भिन्न व्याख्याओं के साथ)।
प्रतिगमन:
t-test:
ANOVA:
प्रोटोटाइप प्रतिगमन साथ एक सतत चर के रूप में अवधारणा है । हालांकि, बारे में वास्तव में बनाई गई एकमात्र धारणा यह है कि यह ज्ञात स्थिरांक का एक वेक्टर है। यह एक सतत चर हो सकता है, लेकिन यह एक डमी कोड (यानी, के & वेक्टर का भी संकेत हो सकता है) जो इंगित करता है कि क्या अवलोकन एक संकेतित समूह का सदस्य है - जैसे, एक उपचार समूह)। इस प्रकार, दूसरे समीकरण में, ऐसा डमी कोड हो सकता है, और पी-वैल्यू वैसा ही होगा जैसा कि अपने अधिक पारंपरिक रूप में टी-टेस्ट से। एक्स 0 1 एक्स
हालांकि, यहां दांव का मतलब अलग होगा। इस स्थिति में, नियंत्रण समूह का माध्यम होगा (जिसके लिए डमी चर में प्रविष्टियां 's) , और उपचार समूह और नियंत्रण के माध्य के बीच अंतर होगा। समूह। 0 β 1
अब, याद रखें कि केवल दो समूहों (हालांकि एक टी-परीक्षण अधिक सामान्य होगा) के साथ एक एनोवा को चलाने / चलाने के लिए यह पूरी तरह से उचित है, और आप तीनों जुड़े हुए हैं। यदि आप यह देखना पसंद करते हैं कि यदि आपके पास 3 समूहों के साथ एक एनोवा है तो यह कैसे काम करेगा; यह होगा: ध्यान दें कि आप जब कि समूहों, आप डमी कोड उन्हें प्रतिनिधित्व करते हैं। संदर्भ समूह (आमतौर पर नियंत्रण समूह) को सभी के लिए होने का संकेत दिया गया हैजी जी - 1 0 β 0 β 1 β 2
नीचे @ whuber की टिप्पणी के प्रकाश में, ये भी मैट्रिक्स समीकरण के माध्यम से व्यक्त किया जा सकता:
प्रतिनिधित्व इस तरह से, और लंबाई की वैक्टर हैं , और लंबाई का एक वेक्टर है । अब रो और कॉलम के साथ एक मैट्रिक्स है । एक प्रोटोटाइप प्रतिगमन में आप निरंतर चर और अवरोधन। इस प्रकार, आपका मैट्रिक्स कॉलम वैक्टर की एक श्रृंखला से बना होता है, जो कि प्रत्येक
वाई ε एन β पी + 1 एक्स एन ( पी + 1 ) पी एक्स एक्स एक्स 1
यदि आप इस तरह से समूहों के साथ एक एनोवा का प्रतिनिधित्व कर रहे हैं , तो याद रखें कि आपके पास समूह को इंगित करने वाले डमी चर होंगे, संदर्भ समूह द्वारा प्रत्येक डमी चर में अवलोकन से संकेत मिलता है । ऊपर के रूप में, आप अभी भी एक अवरोधन होगा। इस प्रकार, । जी - 1 0 पी = जी - 1
वे सभी सामान्य रैखिक मॉडल के विशेष मामलों के रूप में लिखे जा सकते हैं।
टी-परीक्षण एनोवा का दो-नमूना मामला है। यदि आप टी-टेस्ट स्टेटिस्टिक को स्क्वायर करते हैं तो आपको एनोवा में संबंधित मिलता है ।
एक एनोवा मॉडल मूल रूप से सिर्फ एक प्रतिगमन मॉडल है जहां कारक स्तरों को डमी (या संकेतक ) चर द्वारा दर्शाया जाता है ।
इसलिए यदि टी-टेस्ट के लिए मॉडल एनोवा मॉडल का सबसेट है और एनोवा कई प्रतिगमन मॉडल का एक उप-समूह है, तो प्रतिगमन स्वयं (और प्रतिगमन के अलावा अन्य चीजें) सामान्य लीनियर मॉडल का एक उप-समूह है , जो प्रतिगमन को एक में बदल देता है सामान्य प्रतिगमन मामले (जो कि 'स्वतंत्र' और 'समान-विचरण') की तुलना में त्रुटि शब्द का अधिक सामान्य विनिर्देश है, और को बहुस्तरीय करना है ।
यहां एक उदाहरण साधारण (समान-विचरण) दो नमूना- विश्लेषण और एक प्रतिगमन मॉडल में एक परिकल्पना परीक्षण दिखा रहा है , जो R में किया गया है (वास्तविक डेटा को युग्मित किया गया लगता है, इसलिए यह वास्तव में एक उपयुक्त विश्लेषण नहीं है) :
> t.test(extra ~ group, var.equal=TRUE, data = sleep)
Two Sample t-test
data: extra by group
t = -1.8608, df = 18, p-value = 0.07919
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-3.363874 0.203874
sample estimates:
mean in group 1 mean in group 2
0.75 2.33
उपरोक्त 0.079 के पी-मूल्य पर ध्यान दें। यहाँ एक ही रास्ता है:
> summary(aov(extra~group,sleep))
Df Sum Sq Mean Sq F value Pr(>F)
group 1 12.48 12.482 3.463 0.0792
Residuals 18 64.89 3.605
अब प्रतिगमन के लिए:
> summary(lm(extra ~ group, data = sleep))
(कुछ आउटपुट हटाया गया)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.7500 0.6004 1.249 0.2276
group2 1.5800 0.8491 1.861 0.0792 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 1.899 on 18 degrees of freedom
Multiple R-squared: 0.1613, Adjusted R-squared: 0.1147
F-statistic: 3.463 on 1 and 18 DF, p-value: 0.07919
'Group2' पंक्ति में पी-मान की तुलना करें, और अंतिम पंक्ति में एफ-परीक्षण के लिए पी-मूल्य भी। दो-पूंछ वाले परीक्षण के लिए, ये समान हैं और दोनों ही टी-टेस्ट परिणाम से मेल खाते हैं।
इसके अलावा, 'group2' का गुणांक दो समूहों के लिए साधनों के अंतर को दर्शाता है।
यह उत्तर जो मैंने पहले पोस्ट किया था वह कुछ हद तक प्रासंगिक है, लेकिन यह सवाल कुछ अलग है।
आप निम्नलिखित रेखीय मॉडल के बीच अंतर और समानता के बारे में सोचना चाह सकते हैं:
एनोवा उपचारों के बीच अज्ञात लेकिन समान भिन्नताओं की धारणा के तहत साधनों की समानता के लिए एक टी-टेस्ट के समान है। ऐसा इसलिए है क्योंकि एनोवा एमएसई टी-टेस्ट में उपयोग किए जाने वाले पूल-वेरिएंस के समान है। टी-टेस्ट के अन्य संस्करण भी हैं जैसे कि अन-बराबर वेरिएन्स और जोड़ी-वार टी-टेस्ट के लिए एक। इस दृष्टिकोण से, टी-टेस्ट अधिक लचीला हो सकता है।