टाइप I, टाइप II और टाइप III एनोवा और मैनोवा की व्याख्या कैसे करें?


45

मेरा प्राथमिक प्रश्न है कि टाइप I (अनुक्रमिक) एनोवा का संचालन करते समय आउटपुट (गुणांक, एफ, पी) की व्याख्या कैसे की जाए?

मेरी विशिष्ट शोध समस्या थोड़ी अधिक जटिल है, इसलिए मैं अपने उदाहरण को भागों में तोड़ूंगा। सबसे पहले, अगर मुझे प्लांट ग्रोथ (Y1) पर स्पाइडर घनत्व (X1) के प्रभाव में दिलचस्पी है और मैंने बाड़ों में रोपाई लगाई और स्पाइडर घनत्व में हेरफेर किया, तो मैं एक साधारण एनोवा या रैखिक संपीड़न के साथ डेटा का विश्लेषण कर सकता हूं। तब यह मायने नहीं रखता कि मैं अपने ANOVA के लिए टाइप I, II, या III सम वर्गों (SS) का उपयोग करता हूं। मेरे मामले में, मेरे पास 5 घनत्व स्तरों के 4 प्रतिकृति हैं, इसलिए मैं घनत्व को एक कारक के रूप में या एक निरंतर चर के रूप में उपयोग कर सकता हूं। इस मामले में, मैं इसे एक सतत स्वतंत्र (भविष्यवक्ता) चर के रूप में व्याख्या करना पसंद करता हूं। आरआई में निम्नलिखित चल सकते हैं:

lm1 <- lm(y1 ~ density, data = Ena)
summary(lm1)
anova(lm1)

एनोवा फ़ंक्शन को चलाने से बाद में उम्मीद के मुताबिक तुलना की जाएगी, इसलिए कृपया यहां की विषमता को अनदेखा करें। आउटपुट है:

Response: y1
          Df  Sum Sq Mean Sq F value  Pr(>F)  
density    1 0.48357 0.48357  3.4279 0.08058 .
Residuals 18 2.53920 0.14107 

अब, मान लीजिए कि मुझे संदेह है कि मिट्टी में अकार्बनिक नाइट्रोजन का शुरुआती स्तर, जिसे मैं नियंत्रित नहीं कर सकता, ने भी पौधे की वृद्धि को प्रभावित किया है। मैं इस प्रभाव में विशेष रूप से दिलचस्पी नहीं ले रहा हूं, लेकिन इसके कारण भिन्नता के लिए संभावित रूप से ध्यान देना चाहूंगा। वास्तव में, मेरा प्राथमिक हित मकड़ी के घनत्व (परिकल्पना: बढ़े हुए मकड़ी के घनत्व के कारण पौधों की वृद्धि में वृद्धि होती है - संभवतः शाकाहारी कीटों की कमी से होता है, लेकिन मैं केवल इस तंत्र के प्रभाव का परीक्षण कर रहा हूं)। मैं अपने विश्लेषण में अकार्बनिक एन के प्रभाव को जोड़ सकता हूं।

मेरे प्रश्न के लिए, आइए दिखाते हैं कि मैं इंटरेक्शन घनत्व * अकार्बनिक का परीक्षण करता हूं और यह गैर-महत्वपूर्ण है इसलिए मैं इसे विश्लेषण से हटा देता हूं और निम्नलिखित मुख्य प्रभाव चलाता हूं:

> lm2 <- lm(y1 ~ density + inorganicN, data = Ena)
> anova(lm2)
Analysis of Variance Table

Response: y1
           Df  Sum Sq Mean Sq F value  Pr(>F)  
density     1 0.48357 0.48357  3.4113 0.08223 .
inorganicN  1 0.12936 0.12936  0.9126 0.35282  
Residuals  17 2.40983 0.14175 

अब, यह एक फर्क पड़ता है कि मैं टाइप I या टाइप II SS का उपयोग करता हूं (मुझे पता है कि कुछ लोग टाइप I और II आदि पर आपत्ति करते हैं लेकिन एसएएस की लोकप्रियता को देखते हुए यह आसान शॉर्ट-हैंड है)। R aova {आंकड़े} डिफ़ॉल्ट रूप से टाइप I का उपयोग करता है। मैं अपने मुख्य प्रभावों के क्रम को उलट कर घनत्व के लिए II SS, F और P प्रकार की गणना कर सकता हूं या मैं डॉ। जॉन फॉक्स के "कार" पैकेज (एप्लाइड रिग्रेशन के साथी) का उपयोग कर सकता हूं। मैं बाद की विधि को पसंद करता हूं क्योंकि यह अधिक जटिल समस्याओं के लिए आसान है।

library(car)
Anova(lm2)
            Sum Sq Df F value  Pr(>F)  
density    0.58425  1  4.1216 0.05829 .
inorganicN 0.12936  1  0.9126 0.35282  
Residuals  2.40983 17  

मेरी समझ यह है कि टाइप II परिकल्पना होगी, "y1 पर X1 का कोई रेखीय प्रभाव नहीं है। y2 पर प्रभाव (स्थिरांक को पकड़े हुए) x2" और x2 के लिए समान है। मुझे लगता है कि यह वह जगह है जहां मैं भ्रमित हो जाता हूं। एनआईओए द्वारा टाइप II पद्धति का उपयोग करके परिकल्पना की तुलना में I (क्रमिक) विधि से ऊपर की परिकल्पना का परीक्षण किया जा रहा है?

वास्तव में, मेरा डेटा थोड़ा अधिक जटिल है क्योंकि मैंने पौधों की वृद्धि के कई मीट्रिक और साथ ही पोषक तत्व गतिकी और कूड़े के अपघटन को मापा। मेरा वास्तविक विश्लेषण कुछ इस तरह है:

Y <- cbind(y1 + y2 + y3 + y4 + y5)
# Type II
mlm1 <- lm(Y ~ density + nitrate + Npred, data = Ena)
Manova(mlm1)

Type II MANOVA Tests: Pillai test statistic
        Df test stat approx F num Df den Df  Pr(>F)    
density  1   0.34397        1      5     12 0.34269    
nitrate  1   0.99994    40337      5     12 < 2e-16 ***
Npred    1   0.65582        5      5     12 0.01445 * 


# Type I
maov1 <- manova(Y ~ density + nitrate + Npred, data = Ena)
summary(maov1)

          Df  Pillai approx F num Df den Df  Pr(>F)    
density    1 0.99950     4762      5     12 < 2e-16 ***
nitrate    1 0.99995    46248      5     12 < 2e-16 ***
Npred      1 0.65582        5      5     12 0.01445 *  
Residuals 16                                           

जवाबों:


71

nn11n12n21n22r=.1r'महत्वपूर्ण' है, यह पूरी आबादी है जिसकी आपको परवाह है)। आपके कारकों के सहसंबद्ध होने के साथ समस्या यह है कि ए और बी दोनों के साथ जुड़े वर्गों की रकम है । एनोवा (या किसी अन्य रैखिक प्रतिगमन) की गणना करते समय, हम वर्गों के योगों का विभाजन करना चाहते हैं । एक विभाजन वर्गों के सभी योगों को एक और केवल एक में रखता हैकई सबसेट के। (उदाहरण के लिए, हम SS को A, B और त्रुटि में विभाजित करना चाह सकते हैं।) हालाँकि, चूंकि आपके कारक (अभी भी A और B यहाँ हैं) रूढ़िवादी नहीं हैं, इन SS का कोई विशिष्ट विभाजन नहीं है। वास्तव में, बहुत सारे विभाजन हो सकते हैं, और यदि आप अपने SS को अंशों में विभाजित करने के लिए तैयार हैं (उदाहरण के लिए, "मैं .5 को इस बिन में और .5 को उस एक में डालूँगा"), अनंत विभाजन हैं। यह कल्पना करने का एक तरीका मास्टरकार्ड प्रतीक की कल्पना करना है: आयत कुल एसएस का प्रतिनिधित्व करता है, और प्रत्येक मंडल उस कारक के लिए एसएस का प्रतिनिधित्व करता है, लेकिन केंद्र में मंडलियों के बीच ओवरलैप को ध्यान में रखते हुए, उन एसएस को दिया जा सकता है। या तो सर्कल में।

यहाँ छवि विवरण दर्ज करें

सवाल यह है कि हम इन सभी संभावनाओं में से 'सही' विभाजन को कैसे चुनेंगे? आइए बातचीत को वापस लाएं और कुछ संभावनाओं पर चर्चा करें:

टाइप I SS:

  • एस एस (ए)
  • एस एस (बी | ए)
  • एस एस (ए * बी | ए, बी)

टाइप II एसएस:

  • एस एस (ए | बी)
  • एस एस (बी | ए)
  • एस एस (ए * बी | ए, बी)

प्रकार III एसएस:

  • एस एस (ए | बी, ए * बी)
  • एस एस (बी | ए, ए * बी)
  • एस एस (ए * बी | ए, बी)

ध्यान दें कि ये विभिन्न संभावनाएं कैसे काम करती हैं। केवल प्रकार I SS वास्तव में उन SS का उपयोग मास्टरकार्ड प्रतीक में मंडलियों के बीच अतिव्यापी भाग में करता है। है, एसएस है कि या तो ए या बी के लिए जिम्मेदार ठहराया जा सकता है, कर रहे हैं वास्तव में उनमें से एक के लिए जिम्मेदार ठहराया जब आप लिखते हैं मैं एस एस का उपयोग करें (विशेष रूप से, एक आप पहले मॉडल में प्रवेश)। दूसरे दृष्टिकोण के दोनों में, ओवरलैपिंग एसएस उपयोग नहीं कर रहे सब पर । इस प्रकार, टाइप I SS A के लिए सभी A के लिए जिम्मेदार SS को देता है (उन लोगों को भी शामिल किया जा सकता है, जो कहीं और से भी जिम्मेदार ठहराया जा सकता है), तो B को शेष सभी SS जो B के लिए उत्तरदायी हैं, तब A * B को देता है। की शेषएसएस जो ए * बी के लिए जिम्मेदार है, और बाएं ओवर को छोड़ देता है जिसे त्रुटि शब्द के लिए कुछ भी जिम्मेदार नहीं ठहराया जा सकता है।

टाइप III SS केवल A को वह SS देता है जो A के लिए विशिष्ट रूप से श्रेयस्कर होता है, उसी प्रकार यह केवल B को देता है और उन SS को जो कि उनके लिए विशिष्ट रूप से उत्तरदायी हैं, के साथ सहभागिता करता है। त्रुटि अवधि केवल उन एसएस को मिलती है जिन्हें किसी भी कारक के लिए जिम्मेदार नहीं ठहराया जा सकता है। इस प्रकार, उन 'अस्पष्ट' एसएस को जिन्हें 2 या अधिक संभावनाओं के लिए जिम्मेदार ठहराया जा सकता है, का उपयोग नहीं किया जाता है। यदि आप ANOVA तालिका में III SS टाइप करते हैं, तो आप देखेंगे कि वे कुल SS के बराबर नहीं हैं। दूसरे शब्दों में, यह विश्लेषण गलत होना चाहिए, लेकिन एक तरह से प्रासंगिक रूप से रूढ़िवादी तरीके से गलतियां करता है। कई सांख्यिकीविदों को यह दृष्टिकोण अहंकारी लगता है, हालांकि सरकारी फंडिंग एजेंसियों (मेरा मानना ​​है कि एफडीए) को उनके उपयोग की आवश्यकता है।

टाइप II दृष्टिकोण को पकड़ने का इरादा है कि टाइप III के पीछे विचार के बारे में क्या सार्थक हो सकता है, लेकिन इसकी अधिकता के खिलाफ कम करें। विशेष रूप से, यह केवल एक दूसरे के लिए ए और बी के लिए एसएस को समायोजित करता है, बातचीत नहीं। हालांकि, व्यवहार प्रकार II में एसएस का अनिवार्य रूप से कभी उपयोग नहीं किया जाता है। आपको इन सभी के बारे में जानना होगा और इन अनुमानों को प्राप्त करने के लिए अपने सॉफ़्टवेयर के साथ पर्याप्त समझदार होना चाहिए, और विश्लेषकों का मानना ​​है कि यह आमतौर पर चारपाई है।

अधिक प्रकार के एसएस हैं (मेरा मानना ​​है कि IV और V)। उन्हें कुछ स्थितियों से निपटने के लिए 60 के दशक के अंत में सुझाव दिया गया था, लेकिन बाद में यह दिखाया गया कि वे वह नहीं करते हैं जो सोचा गया था। इस प्रकार, इस बिंदु पर वे सिर्फ एक ऐतिहासिक फुटनोट हैं।

इन सवालों का जवाब देने के लिए, आपके पास मूल रूप से आपके प्रश्न में पहले से ही अधिकार है:

  • प्रकार I SS का उपयोग करने वाले अनुमान आपको बताते हैं कि Y द्वारा कितनी परिवर्तनशीलता को A द्वारा समझाया जा सकता है, B द्वारा अवशिष्ट परिवर्तनशीलता का कितना विस्तार बताया जा सकता है, शेष अवशिष्ट परिवर्तनशीलता में से कितने को अंतःक्रिया द्वारा समझाया जा सकता है, और इसी तरह से क्रम में
  • प्रकार III एसएस के आधार पर अनुमान आपको बताते हैं कि Y में अवशिष्ट परिवर्तनशीलता का कितना हिसाब लगाया जा सकता है, उसके बाद सब कुछ का हिसाब लगाया जा सकता है, और Y में अवशिष्ट परिवर्तनशीलता का कितना हिसाब बी के द्वारा लगाया जा सकता है, बाकी सब कुछ का हिसाब लगाने के बाद। साथ ही, और इसी तरह। (ध्यान दें कि दोनों पहले और अंतिम दोनों एक साथ चलते हैं; अगर यह आपके लिए समझ में आता है, और आपके शोध प्रश्न को सटीक रूप से दर्शाता है, तो III एसएस का उपयोग करें।)

2
बहुत उपयोगी उत्तर के लिए धन्यवाद। एक अन्य क्षेत्र जहां मैं उलझन में हूं, यदि "टाइप I SS का उपयोग करने वाला अनुमान आपको बताता है कि Y में परिवर्तनशीलता का कितना विवरण A द्वारा बताया जा सकता है, B द्वारा अवशिष्ट परिवर्तनशीलता का कितना समझाया जा सकता है, शेष अवशिष्ट का कितना भाग परिवर्तनशीलता को इंटरैक्शन द्वारा समझाया जा सकता है, और इसी तरह, क्रम में, "फिर अतिरिक्त चर को जोड़ने पर आँकड़े ए के परिवर्तन के साथ क्यों जुड़ते हैं? क्या यह इसलिए है क्योंकि परीक्षण एसएस (ए) / एसएस (त्रुटि) पर आधारित हैं और त्रुटि मॉडल की सभी शर्तों का एक फ़ंक्शन है? क्या मैं इस बारे में सही सोच रहा हूँ?
djhocking

1
"ए के साथ जुड़े आँकड़े" से, मैं आपको ए के मुख्य प्रभाव के लिए एफ और पी-मान का मतलब समझाता हूं। ए के लिए एफ-मूल्य ए के लिए मीन स्क्वायर का अनुपात (यानी, एसएसए / डीएफए) है। एमएस त्रुटि। जैसा कि आप अधिक कारक जोड़ते हैं, एसएस को त्रुटि शब्द से लिया जाता है और उन कारकों को दिया जाता है। सामान्य तौर पर, इसका मतलब है कि एमएस त्रुटि नीचे जाती है, और इस प्रकार अनुपात बढ़ जाता है। नतीजतन, ए के लिए एफ-मूल्य बड़ा हो जाता है और पी-मूल्य छोटा हो जाता है। क्योंकि स्वतंत्रता की डिग्री भी बदलती है यह इससे अधिक जटिल हो सकती है, लेकिन यह इसका सार है।
गंग -

उफ़ मैंने एफ स्टेटिस्टिक के लिए एमएस (ए) / एमएसई का मतलब किया था। वैसे भी, आपका जवाब सही है, आपकी सभी मदद के लिए फिर से धन्यवाद!
djhocking

मैं एक प्रकार का उपयोग करते समय व्याख्या के विवरणों के बारे में उत्सुक हूं। मेरे मामले में, घनत्व मेरी रुचि का एकमात्र चर है और केवल एक जिसे मैंने प्रयोगात्मक रूप से हेरफेर किया है। हालांकि दुर्भाग्यपूर्ण है कि घनत्व अपने आप में या मेरे दो अन्य चर (Npredators, प्रकार II या III में अकार्बनिक) के लिए लेखांकन के बाद महत्वहीन है। लेकिन क्योंकि अकार्बनिक स्पष्ट रूप से कुछ आश्रित चर में भिन्नता के बारे में बताते हैं, जब मैं इसे तीसरे चर के रूप में जोड़ता हूं तो यह अन्य 2 को अत्यधिक महत्वपूर्ण बनाता है। इसलिए, क्या घनत्व वास्तव में वाई पर एक महत्वपूर्ण प्रभाव पड़ता है? क्या यह उचित है?
djhocking

2
@JonBonJovi, मास्टरकार्ड सादृश्य केवल 2 कारक हैं। यदि आप 2 कारकों के साथ-साथ एक इंटरैक्शन चाहते हैं, तो आपको 3 क्षेत्रों की आवश्यकता होगी जो एक-दूसरे को कुछ हद तक ओवरलैप करते हैं। 3 क्षेत्रों के साथ एक यूलर आरेख खींचना निश्चित रूप से संभव है, लेकिन मैंने सिर्फ सादगी के लिए मास्टरकार्ड प्रतीक का उपयोग किया। एक बातचीत के लिए, एक 3 सर्कल की कल्पना करें जो पहले 2 को ओवरलैप करता है (उदाहरण के लिए, यह दाएं-से-बाएं केंद्रित हो सकता है, लेकिन ज्यादातर दूसरों के ऊपर); तो सब एक वृत्त (एस एस) के एक करने के लिए जाना होगा, बी में सब कुछ ओवरलैप एक जो ऐसा नहीं करता एक में बी को जाता है, और सब कुछ बी कि ओवरलैप नहीं करता है * या तो एक या बी बातचीत करने के लिए चला जाता है।
गंग -
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.